循证医学中常用的统计指标一、概述数据资料可分为数值资料(计量)和分类资料(计数和等级)两大类。统计指标因而也分为数值资料与分类资料指标两类。统计指标可用于描述性的统计分析,也是反映数据基本特征的统计分析方法。并可使人们准确、全面地了解数据资料所包涵的信息,以便于在此基础上完成资料的进一步统计分析。可信区间(Confidenceinterval,CI)是循证医学中常用的统计指标之一。可信区间主要用于估计总体参数,从获取的样本数据资料估计某个指标的总体值(参数)。如,率的可信区间估计总体率,均数的可信区间估计总体均数。此外,可信区间还可用于假设检验,尤其是试验组与对照组某指标差值或比值的可信区间,在循证医学中更为常用。通常,试验组与对照组某指标差值或比值的95%可信区间与为0.05的假设检验等价,99%的CI与为0.01的假设检验等价。常用的可信区间有:率的可信区间、两率差值的可信区间、均数的可信区间、两均数差值的可信区间、相对危险度可信区间等。循证医学中常用的是率的可信区间、RR或OR的可信区间、均数的可信区间、两均数差值的可信区间等。二、分类资料的指标在循证医学的研究与实践中,除了有效率、死亡率、患病率、发病率等常用的指标外,相对危险度(RR)、比值比(OR)及由此导出的其他指标也是循证医学中富有特色的指标。目前,在循证医学中分类资料常用的描述性指标主要有EER、CER、OR、RR、RRR、ARR、NNT等。循证医学中预防和治疗性试验中,率可细分为EER和CER两类。1.EER与CEREER即试验组中某事件的发生率(experimentaleventrate,EER),如对某病采用某些防治措施后该疾病的发生率。CER即对照组中某事件的发生率(controleventrate,CER),如对某病不采取防治措施的发生率。2.RD(率差)及可信区间两个发生率的差即为率差,也称危险差(ratedifference,riskdifference,RD),如试验组发生率(EER)与对照组发生率(CER)的差,其大小可反映试验效应的大小。两率差的可信区间由下式计算:)(2121ppSEupp)(),(2121ppSEuRDppSEuRD两率差的标准误:22211121)1()1()(nppnppppSE两率差为0时,两组的某事件发生率没有差别。因而两率差的可信区间不包含0(上下限均大于0或上下限均小于0),则两个率有差别;反之,两率差的可信区间包含0,则无统计学意义。阿司匹林治疗心肌梗死的效果死亡未死亡例数阿司匹林治疗组15(a)110(b)125(n1)对照组30(c)90(d)120(n2)合计45200245阿斯匹林治疗心肌梗死的效果EER=15/125=12%,CER=30/120=25%,两率差的标准误:22211121)1()1()(nppnppppSE049.0120)25.01(25.0125)12.01(12.0该试验两率差(RD)的可信区间为:)(21ppSEuRD03.0~23.0049.096.1)25.012.0(该例两率差的可信区间为-0.23~-0.03,上下限均小于0(不包含0),两率有差别。可认为阿斯匹林可降低心肌梗死的病死率。3.RR及可信区间相对危险度RR(relativerisk,RR)是前瞻性研究中较常见的指标,它是试验组某事件发生率与对照组(或低暴露)的发生率之比,用于说明前者是后者的多少倍,常用来表示试验因素与疾病联系的强度及其在病因学上的意义大小。其计算方法为:CEREERPPRR//01当RR=1时,可认为试验因素与疾病无关;当RR≠1时,可认为试验因素与疾病有关;当RR>1时,可认为试验组发生率大于对照组;当RR<1时,可认为试验组发生率小于对照组。RR的可信区间,应采用自然对数进行计算,即应求RR的自然对数值In(RR)和In(RR)标准误SE(InRR),其计算公式如下:dcbacaInRRSE1111)(In(RR)的可信区间为:)()(InRRSEuRRInRR的可信区间为:)()(expInRRSEuRRIn由于RR=1时为试验因素与疾病无关,故其可信区间不包含1时为有统计学意义;反之,其可信区间包含1时为无统计学意义。RR计算的四格表组别发病未发病例数试验组a(r1)bn1对照组c(r2)dn2阿斯匹林治疗组的病死率对照组的病死率其RR和可信区间为:48.0120/30125/1501ppRRIn(RR)=In(0.48)=-0.73421211111)(nnrrInRRSE289.012011251301151RR的95%可信区间为:)(96.1)(expInRRSERRIn=exp(-0.734±1.96×0.289)=(0.272,0.846)该例RR的95%可信区间为0.272~0.846,使用阿斯匹林治疗的病人,其病死率小于对照组,可认为阿斯匹林可降低心肌梗死有效。4.OR及可信区间组别暴露非暴露例数病例组abn1非病例组cdn2odds1是病例组暴露率p1和非暴露率1-p1的比值,即odds1=p1/(1-p1)=odds0是对照组暴露率p0和非暴露率1-p0的比值,即odds0=p0/(1-p0)=)/()/(dcddcc)/()/(dabbaa以上两个比值之比即为比值比(oddsratio,OR),又称机会比、优势比等,公式为:OR=bcaddcddccbabbaapppp/)/()/()/()/()1()1(0011=当所研究疾病的发病率较低时,即a和c均较小时,OR近似于RR,故在回顾性研究中可用OR估计RR;由于前瞻性研究中,OR的可信区间与RR的可信区间很相近,且OR的计算更为简便,因此,常用OR可信区间的计算来代替RR的可信区间的计算。OR值的解释与RR相同。OR的可信区间同样需要采用自然对数计算,其In(OR)的标准误SE(InOR)按下式计算:dcbaInORSE1111)(In(OR)的可信区间为:)()(InORSEuORInOR的可信区间为:)()(expInORSEuORIn例如:前述阿斯匹林治疗心肌梗死的效果估计其OR的95%可信区间。409.0110309015ORIn(OR)=In(0.409)=-0.894OR的95%可信区间为:)(96.1)(expInORSEORIn=exp(-0.894±1.96×0.347)=(0.207,0.807)该例OR的95%可信区间为0.207~0.807,可认为阿斯匹林治疗心肌梗死有效。5.RRR及可信区间RRR为相对危险度减少率(relativeriskreduction),其计算公式为:RRR=∣CER-EER∣/CER=1-RRRRR的可信区间可由1-RR计算得到。如前例RR=0.48,其95%的可信区间为0.272~0.846,其RRR=1-0.48=0.52,RRR的95%可信区间为0.154~0.728。RRR反映了某试验因素使某结果的发生率增加或减少的相对量,但是,该指标无法衡量发生率增减的绝对量。如:试验人群中某病的发生率EER=39%,而对照组人群的发生率CER=50%,RRR=(CER-EER)/CER=(50%-39%)/50%=22%但是,若在另一研究中,试验组的疾病发生率为0.39/10万,对照组的疾病发生率为0.50/10万,其RRR仍为22%。6.RRIRRI,相对危险度增加率(relativeriskincrease,RRI),试验组中某不利结果的发生率为EERb,对照组某不利结果的发生率为CERb,RRI可按下式计算:bbbCERCEREERRRI/该指标可反映采用试验因素处理后,患者的不利结果增加的百分比。7.RBIRBI,相对获益增加率(relativebenefitincrease,RBI),试验组中某有益结果的发生率为EERg,对照组某有益结果的发生率为CERg,RBI可按下式计算:gggCERCEREERRBI/该指标可反映采用试验因素处理后,患者的有益结果增加的百分比。8.ARR及可信区间绝对危险度减少率(absoluteriskreduction,ARR),其计算公式为:ARR=∣CER-EER∣ARR的可信区间为:SEuARR),(SEuARRSEuARRARR的标准误:222111)1()1(nppnppSEARR的可信区间:),(SEuARRSEuARRSEuARR例如:试验组某病发生率为15/125=12%,而对照组人群发生率为30/120=25%,其ARR=25%-12%=13%,标准误为:222111)1()1(nppnppSE049.0120)25.01(25.0125)12.01(12.0其95%可信区间为:),(SEuARRSEuARRSEuARR=(0.13-1.96×0.049,0.13+1.96×0.049)=(3.4%,22.6%)该治愈率的95%可信区间为3.4%~22.6%9.ARI绝对危险度增加率(absoluteriskincrease,ARI),即试验组中某不利结果发生率EERb与对照组某不利结果发生率CERb的差值,不利结果(badoutcomes)如:死亡、复发、无效等,其计算公式为:bbCEREERARI该指标可反映采用试验因素处理后,患者的不利结果增加的绝对值。10.ABI绝对受益增加率(absolutebenefitincrease,ABI),即试验组中某有益结果发生率EERg与对照组某有益结果发生率CERg的差值,有益结果(goodoutcomes)如:治愈、显效、有效等,其计算公式为:ggCEREERABI该指标可反映采用试验因素处理后,患者的有益结果增加的绝对值。11.NNT、NNH及可信区间NNT(Thenumberneededtotreat)的临床含义为:对病人采用某种防治措施处理,得到一例有利结果需要防治的病例数(thenumberofpatientswhoneededtobetreatedtoachieveoneadditionalfavorableoutcome,NNT)。其计算公式为:NNT=1/∣CER-EER∣=1/ARR从公式可见,NNT的值越小,该防治效果就越好,其临床意义也就越大。NNT的95%可信区间,由于无法计算NNT的标准误,但NNT=1/ARR,故NNT的95%可信区间的计算可利用ARR的95%的可信区间来计算。NNT95%可信区间的下限:1/ARR的上限值NNT95%可信区间的上限:1/ARR的下限值例如某试验的ARR的95%CI为3.4%~22.6%,其NNT的95%CI下限为:1/22.6%=4.4;上限为:1/3.4%=29.4,即4.4~29.4。12.NNHNNH的临床含义为:对病人采用某种防治措施处理,出现一例副作用需要处理的病例数(thenumberneededtoharmonemorepatientsfromthetherapy,NNH)。其计算公式为:NNH=1/ARI从公式可见,NNH的值越小,某治疗措施引起的副作用就越大。13.LHHLHH,防治性措施受益与危害的似然比(likehoodofbeinghelpedvs.harmed,LHH),其计算公式为:LHH=NNH/NNT该指标反映了防治措施给受试者带来的受益与危害的比例,LHH1,利大于弊,反之,LHH1时,弊大于利。三、数值资料的指标1.WMD加权均数差(WMD,WeightedMeanDifference)某个研究的两均数差d可按下式计算:21XXd两均数差d的方差Var(d)(也可用S2表示),可按下式计算:212121222121)2()1()1()(nnnnnnnSnSdVar