中断时间序列分析及其在公共卫生领域中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

图2干预作用水平改变和斜率改变中华流行病学杂志2015年9月第36卷第9期ChinJEpidemiol,September2015,Vol.36,No.9【关键词】中断时间序列;公共卫生Interruptedtime-seriesanalysisanditsapplicationinpublichealthShaoHua1,2,WangQiqi1,HuYuehua1,LiuWeiwei1,YuShicheng1,YaoHongyan1.1OfficeforEpidemiology,ChineseCenterforDiseaseControlandPrevention,Beijing102206,China;2TongliaoCenterforDiseaseControlandPreventionofInnerMongoliaAutonomousRegionCorrespondingauthor:YuShicheng,Email:shicheng_yu@163.comThisworkwassupportedbygrantsfromtheNationalScienceandTechnologySupportProjectofChina(No.2013BAI04B02)andEvaluationoftheImplementationEffectfortheIntegratedClinicalPathwayManagement:aStudyofthePilotAssessmentinDalian.【Keywords】Interrupttime-series;Publichealth中断时间序列(interruptedtime-series,ITS)设计是收集干预前后多个时间点的结果数据,在控制了结果变量干预前的下降或上升趋势后,用统计学模型评价干预措施的效果,包括干预点前后的水平变化和趋势变化。从研究设计的角度,ITS属准实验设计,在缺少有效对照的情况下,ITS设计能够得到稳健的估计结果。Box和Tiao[1]最早提出了ITS分析方法,由于ITS多应用常规收集的数据,使用干预前后对比,并不需要一个平行的对照,ITS在国外社会政策、药物政策和环境政策有广泛的应用[2],但在卫生政策、卫生项目和措施评价中应用并不多,在国内ITS还鲜为广大的卫生工作者熟知。1.基本原理:ITS分为单组ITS设计和带有比较组的ITS设计,因ITS设计主要用于常规收集时间间隔相等点的干预前后指标的比较,所以单组ITS设计更为常用,其设计原理见图1。横坐标为时间点,测量间隔相等,以○代表,如日、月、年等,X表示干预的时间点;纵坐标为测量某项指标的数或率,如脑卒中死亡数(率)、交通事故发生数(率)、交通伤害发生数或死亡数(率)、疫苗接种数(率)、住院或门诊就诊数(率)和分娩数(率)等。在统计分析时,ITS分析对干预实施前和实施后两个时间段进行线性回归分析,分析干预因素作用的水平改变和斜率改变,应用间断线性回归模型(segmentedlinearregressionmodel)[3],见图2。此分析可检验试验前后在干预点水平下降或升高的幅度是否有统计学意义,及在干预实施后某事件率或数随时间下降或上升的斜率是否与试验前不同,其主要优势是控制了试验前某事件率或数已随时间下降或上升的趋势。当时间序列数据在干预前和干预后呈现线性趋势时,可应用线性回归模型来拟合数据,探讨干预措施对结果变量的影响。ITS分析拟合分段的多重线性回归[4]。令X1是计数的时间变量,X1=1,2,3,…,n;X2指示干预,干预前的观察X2=0,干预后的观察X2=1;X3表示斜率,设X3=0指示干预前的观察,X3=X1指示干预后的观察。拟合水平和斜率改变模型如下:Yt=β0+β1X1+β2X2+β3X3+∑βjXj+εt∑βjXj表示一组协变量,这里暂不考虑协变量。将变量X1、X2和X3代入上式,试验前:X1=1,2,…,n,X2=X3=0,则模型为:Yt=β0+β1X1+εt学习·发现·交流中断时间序列分析及其在公共卫生领域中的应用邵华王琦琦胡跃华刘炜炜于石成么鸿雁DOI:10.3760/cma.j.issn.0254-6450.2015.09.023基金项目:国家科技支撑计划(2013BAI04B02);一体化临床路径管理实施效果大连现场预评估研究作者单位:102206北京,中国疾病预防控制中心流行病学办公室(邵华、王琦琦、胡跃华、刘炜炜、于石成、么鸿雁);内蒙古自治区通辽市疾病预防控制中心(邵华)通信作者:于石成,Email:shicheng_yu@163.com图1单组ITS设计示意图··1015中华流行病学杂志2015年9月第36卷第9期ChinJEpidemiol,September2015,Vol.36,No.9干预后:X2=1,X3=X1,则模型为:Yt=β0+β1X1+β2X2+β3X3+εt=β0+β1X1+β2×1+β3X1+εt=(β0+β2)+(β1+β3)X1+εt=β0*+β1*X1+εtβ0*和β1*称为调整参数。β1为干预前的斜率,β2是水平改变量,β3是斜率改变量,(β1+β3)是干预后的斜率;回归系数的假设检验就是水平改变量和斜率改变量的显著性检验。间断线性回归模型的应用条件除上面提到的结果变量在干预前后随时间呈线性趋势外,还要求序列不存在自相关。用Durbin-Watson(DW)法检验序列是否存在1阶自相关,DW值在0~4之间,其值接近2或4表明无自相关。如果序列存在自相关,两种方法处理:①使用广义最小二乘估计(generalizedleastsquareestimator),而非最小二乘估计,对于STATA,使用“paris”而非“reg”来执行线性回归;对于SAS,使用“procautoreg”而非“procreg”,同时选取校正方法(如Yule-Walker法)和指定滞后阶数(nlag)来控制自相关。②使用多水平统计模型(随机截距和随机系数)检验1阶自回归水平协方差结构[1]。2.实例分析:某市曾是乙型肝炎(乙肝)的高流行地区,从2002年开始,将乙肝疫苗纳入免疫规划,对新生儿、大学生、工人等重点人群实行扩大免疫规划策略,免费接种乙肝疫苗。1992-2013年发病率见表1,在2002年发病率达到了高峰(图3)。本例为单组ITS设计,2002年是实施扩大免疫规划策略开始,从图3可见乙肝发病率最高点出现在2002年。这个例子就是要回答扩大免疫规划策略是否影响时间序列的问题。即实施了某项干预措施或政策,时间序列被中断,为ITS设计。分析乙肝疫苗的扩大免疫规划策略对乙肝发病率的影响。(1)干预措施前后的乙肝发病率:干预措施前(1992-2002年)该市乙肝的平均发病率120.938/10万,干预措施后(2003-2013年)该市乙肝平均发病率81.419/10万,干预措施后平均发病率比干预措施前减少了39.519/10万。(2)水平改变模型:以1992-2002年为干预前,2003-2013年为干预后,X1、X2和X3的编码见表1。以发病率为因变量,X2为自变量,拟合简单线性回归模型:y^(发病率)=β^0+β^2x2=120.938-39.519x2X2=0时,干预前的乙肝发病率(/10万):y^0=β^0+β^2x2=120.938X2=1时,干预后的乙肝发病率(/10万):y^1=β^0+β^2x2=120.938-39.519=81.419回归系数-39.519给出了干预措施对乙肝发病率水平改变的影响,因为回归系数为负数,实际上干预措施后的乙肝发病率比干预措施前减少了39.519/10万,回归系数β^2的t检验,P<0.0001,差异有统计学意义,见图3。(3)水平和斜率改变模型:按表1编码,拟合多重线性回归,得到水平和斜率改变模型为:y^=β^0+β^1x1+β^2x2+β^3x3=102.193+3.124x1+82.299x2-9.187x3各自变量回归系数的t检验,β^1、β^2和β^3均<0.0001,差异有统计学意义。干预前斜率是3.124,呈上升趋势;干预后,斜率是+3.124-9.187=-6.063,呈下降趋势;斜率改变量为β^3=-9.187。干预前后乙肝发病率的改变量β^2=82.299,为正值,干预后发病率减少,见图4。3.总结:ITS研究收集的数据是干预措施前后多时间点的数据,能够定量的检测和评价干预措施是否有效,是时间序列数据中,评估干预措施效果最强的准实验设计,很难用随机对照试验评价干预措施的作用,ITS是非随机对照设置下强有力的统计分析方法,广泛应用于疾病监测数据分析,如果是单组ITS,不需设立对照组,可充分地利用监测资料得到可靠的估计结果[5-7]。ITS的优势在于干预措施实施后,评价干预效果从两个方面,一个是干预点前后下降幅度;进一步,ITS还可评价项目实施后的“长期趋势”的变化,即评价因变量的变化趋势。如某医院护士伤害发生干预效果评价,伤害发生率在干预前已呈下降的趋势,实施干预措施后,伤害发生率下降的斜率更陡,即斜率为负且与干预前相比,斜率差异有统计学意义,也说明干预措施有效,常用的统计方法如均值加环比和横断面观察研究等,达不到评价干预措施的目的,因没有控制干预前的趋势。ITS也形象的展示了干预表11992-2013年某市乙肝发病率(/10万)年份19921993199419951996199719981999200020012002干预措施前发病率101.41106.22111.72113.94121.30128.70127.21131.43121.29129.51137.59X11234567891011X200000000000X300000000000年份20032004200520062007200820092010201120122013干预措施后发病率111.72108.8094.4389.6394.3477.6283.2463.4668.4651.3452.57X11213141516171819202122X211111111111X31213141516171819202122图31992-2013年某市乙肝发病率水平改变模型··1016中华流行病学杂志2015年9月第36卷第9期ChinJEpidemiol,September2015,Vol.36,No.9措施是否是长期的或是暂时的作用及作用的强度,也能估计不同时间点的作用大小,估计时间作用趋势的变化[7]。ITS要求干预前后因变量的变化趋势为线性,此时可用前述的分段回归分析。但时间序列数据可能存在季节性和周期性,此时可用自回归移动平均(auto-regressiveintegratedmovingaverage,ARIMA)分析[8]。ARIMA模型常用于预测某指标,如手足口病和丙型肝炎的发病数(率),根据以前的时间序列数据建立的模型来预测未来。ARIMA模型通过捕捉序列数据中时间序列趋势来控制非平稳性(non-stationarity)或季节性(seasonality),以及控制序列的自相关。ARIMA模型在分析ITS数据上受到限制,因为①ARIMA模型拟合ITS数据比较复杂,要用到复杂的统计分析技术,尤其建立最好的简约模型比较困难。②通常使用100个时间序列点建立的ARIMA模型才稳定,但实际监测数据很难达到这一要求。③该方法是根据经济测量学发展起来的,多用于测量指标的预测而非解释测量指标。ITS应用的样本含量,一般认为使用ITS模型干预前后应各有20个观察点,且呈线性或近似线性关系;如使用ARIMA拟合ITS模型,干预前后应各有50点,如果序列太短,尤其差分后,模型没有足够的把握度,并且统计检验很难检出有差异的干预效应。在实际模型拟合时多采用间断线性回归模型,在序列非平稳或存在季节效应时才考虑使用ARIMA模型。另外,间断线性回归分析时引入月份哑变量调节时间序列的季节性变化;也可将异常的月份,将1月和2月设为哑变量(1

1 / 3
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功