循证医学中常用统计学指标与Meta分析的统计过程南华大学附属第一医院肾内科:邓进分类变量一、循证医学中常用统计学指标实例组别死亡未死亡合计试验组15(a)110(b)125(n1)对照组30(c)90(d)120(n2)合计45200245(N)阿司匹林治疗心肌梗死的效果相对危险度(RR)相对危险度(relativerisk,RR)是前瞻性研究中较常用的指标,它是试验组某事件发生率与对照组的发生率之比,用于说明试验组的发生率是对照组的多少倍。试验组的发生率为:a/(a+b)对照组的发生率为:c/(c+d)两个率的比值:RR=a/(a+b)÷c/(c+d)RR的意义当RR=1时,可认为试验组的发生率与对照组的发生率相同;当RR1时,可认为试验组的发生率大于对照组;当RR1时,可认为试验组的发生率小于对照组RR——实例分析该例的RR=15/125÷30/120=0.48说明试验组的病死率是对照组的0.48倍,即试验组的病死率低于对照组。组别死亡未死亡合计试验组15(a)110(b)125(n1)对照组30(c)90(d)120(n2)合计45200245(N)阿司匹林治疗心肌梗死的效果比值比(OR)在回顾性在回顾性研究(如病例对照研究中)往往无法得到某事件的发生率(如死亡率、病死率、发病率),也就无法估算出RR。但当该发生率很低时(如发生率小于或等于5%),可以计算出一个RR的近似值,该近似值称为OR,即是比值比(oddsratio)。发生率越小,OR越接近RR。回顾性研究实例病例组:暴露与未暴露的比值为a/b=29/205对照组:暴露与未暴露的比值为c/d=135/1607比值比:OR=a/b÷c/d=ad/bc=1.68组别暴露未暴露合计病例组29(a)205(b)234(n1)对照组135(c)1607(d)1742(n2)合计16418121975(N)心肌梗死与近期使用某口服避孕药关系的回顾性调查数据OR的意义当OR=1时,可认为病例组的比值与对照组的比值相同,即该暴露因素与该病的发生可能没有关系;当OR1时,可认为病例组的比值大于对照组,即该暴露因素可能与该病的发生有一定的关系;当OR1时,可认为病例组的比值小于对照组,即该暴露因素可能是该病的保护因素。可信区间(CI)在循证医学中常用两组指标的差值或比值的可信区间(confidenceinterval,CI),以此得出某指标的差值或比值有无统计学意义的结论。通常,试验组与对照组某指标差值或比值的95%CI与α为0.05的假设检验等价,99%CI与α为0.01等价。RR与OR可信区间的图示无统计学意义试验组对照组试验组对照组1无效线使用阿司匹林治疗的病人与对照组相比,其病死率的RR为0.48,其RR的95%CI为0.272-0.846。故可认为阿司匹林治疗组的病死率小于对照组,即阿司匹林治疗心肌梗死能降低病死率。数值变量一、循证医学中常用统计学指标单个数值变量研究的数据例数均数标准差niXiSi试验组n1`X1S1对照组n2`X2S2疗前疗后的数据治疗前治疗后例数均数标准差均数标准差试验组n11`X11S11`X12S12对照组n21`X21S21`X22S22例数差值的均数差值的标准差试验组n1`d1S1对照组n2`d2S2将上表中数据整理为下表,表中`d1和S1可用公式计算d1=X1-`X2;S12=S112+S122—2S11S12×0.4均数差MD均数差(MD)即为两均数的差值。该指标以试验原有的测量单位,真实地反映了试验效应,消除了绝对值大小对结果的影响。标准化均数差SMD标准化均数差StandardisedMeanDifference,SMDSMD可简单地理解为两均数的差值再除以合并标准差的商,它不仅消除了某研究的绝对值大小的影响,还消除了测量单位对结果的影响。该指标尤其适用于单位不同或均数相差较大的数值资料分析。MD和SMD的可信区间若选择MD或SMD为合并统计量时,其95%CI与假设检验的关系如下:若其95%CI包含了0,等价于P0.05,即合并效应量无统计学意义。若其95%CI的上下限均大于0或均小于0,等价于P0.05,即合并效应量有统计学意义。MD与SMD可信区间的图示无统计学意义试验组对照组试验组对照组0无效线二、Meta分析的统计学过程Meta分析的统计学过程异质性分析合并效应量合并效应量的检验:可信区间,Z检验其他:亚组分析、敏感性分析、发表偏倚分析异质性分析按统计原理,只有同质的资料才能进行合并或比较等统计分析,反之,则不能。因此,Meta分析过程需要对多个研究的结果进行异质性分析,尽可能消除导致异质性的原因,使之达到同质。种类包括:临床异质性、方法学异质性和统计学异质性。统计学异质性是指干预效果的评价在不同试验间的变异,它是研究间的临床和方法学上变异联合作用的结果。通常将Meta分析的统计学异质性简称为“异质性”,它是以各研究之间可信区间(CI)的重合程度来度量异质性的大小;多个研究间的CI重合程度越大,存在统计学异质性的可能性就越小,反之,各研究间存在统计学异质性的可能性就越大。异质性分析的意义:Meta分析的核心计算是合并(相加),按统计原理,只有同质的资料才能进行合并或比较等统计分析,反之则不能。异质性检验异质性检验(testsforheterogeneity)又称同质性检验(testsforhomogeneity)用假设检验的方法检验多个独立研究是否具有异质性(同质性),RevMan5.1软件中,用的是卡方检验。评价异质性的指标P值:若异质性检验结果为P0.10时,多个研究的异质性无统计学意义;若多个研究结果为P≤0.10时,多个研究的异质性有统计学意义。I2:可用于衡量多个研究结果间异质程度的大小。这个指标用于描述由各个研究间由非抽样误差所引起的变异(异质性)占总变异的百分比。I2越大,其异质性越大,越不可接受。在Cochrane系统评价中,只要I2不大于50%,其异质性可以接受。异质性的处理方法当异质性检验出现P≤0.10时,首先应找出产生异质性的原因,如疗程长短、用药剂量、病情轻重、对照选择等是否相同。由上述原因引起的异质性,可以使用亚组分析和Meta回归。合并统计量就是将多个独立研究的结果合并成一个汇总统计量,即用多个独立研究的某个指标的合并统计量反映其试验效应。固定效应模型:若多个研究具有同质性时(无统计学异质性),可使用固定效应模型。随机效应模型,若多个研究不具有同质性时(异质性有统计学意义),先对异质性原因进行处理,若异质性分析与处理后仍无法解决异质性时,可使用随机效应模型。关于随机效应模型是一种对异质性资料进行Meta分析的方法,但是,该法不能校正偏倚或减少异质性,更不能消除产生异质性的原因。是通过增大小样本资料的权重,减少大样本资料的权重来处理资料间的异质性,而这种处理存在着较大风险。随机效应模型处理的结果,可能消弱了质量好的大样本信息,增大了质量差的小样本信息,故应谨慎使用随机效应模型,对其结论也应当较为委婉。合并效应量的检验用假设检验的方法检验多个独立研究的总效应量是否具有统计学意义,其原理与常规的假设检验完全相同。两种方法:Z检验和卡方检验根据Z值或卡方值得到该统计量下概率(P)值。若P≤0.05,多个研究的合并效应量有统计学意义;若P0.05,多个研究的合并效应量没有统计学意义。合并效应量的可信区间在Meta分析中,常用可信区间进行假设检验,95%可信区间与α为0.05的假设检验等价,99%可信区间与α为0.01的假设检验等价。此外,森林图即是根据各个独立研究的95%可信区间及合并效应量的95%可信区间绘制的。实例1分类变量七个阿司匹林预防心肌梗死的研究资料K个研究阿司匹林安慰剂合计OR95%CI死亡数未死亡数死亡数未死亡数aibiciDiNi下限上限1495666755712390.720.4891.5092447146470715290.6810.4571.013310273012672416820.8030.6061.063432285382716260.8010.4861.3195857255235412160.7980.5531.15362462021219203845241.1330.9351.37371570701717206880171870.8950.8920.966合计21281205822861153128003表中ai,bi,ci,di为各研究四格表数,Ni为各个研究的样本例数RevMan5.1森林图(RR)方块:每个研究效应量的点估计值,大小表示每个研究的权重线段:每个研究效应量的可信区间,线段越长,可信区间越宽,结果越不精确垂直线(无效线)二分变量,OR或RR=1连续变量,SMD或MD=0菱形代表合并效应量,中心代表合并效应量的点估计值,宽代表合并效应量的可信区间。1.包含无效线,组间无统计学差异;2.完全在无效线右边,试验组的效应量大于对照组;3.完全在无效线左边,试验组的效应量小于对照组。RevMan5.1森林图(OR)实例2数值变量女童掌骨II皮质厚度的11个研究K个研究高氟区适氟区P值n1`X1S1n2`X2S21262.260.32422.330.33P›0.052552.390.31402.490.32P›0.053462.500.30502.670.35P‹0.054452.640.26502.900.45P‹0.055452.810.35452.930.36P›0.056522.950.46553.270.37P‹0.057463.150.39423.480.48P‹0.058453.470.46513.730.54P‹0.059453.630.38453.810.40P‹0.0510423.810.41454.160.42P‹0.0511443.990.56254.180.41P›0.05合计491490RevMan5.1森林图(MD法)RevMan5.1森林图(SMD法)亚组分析根据纳入研究的特点进行分组,进而在组内分析干预措施的效果。如根据性别、年龄、种族、疾病的严重程度、疗程长短、用药剂量、纳入研究的质量等等。在Meta分析中,是一种处理异质性的方法。在同一个系统评价中,不提倡使用太多的亚组分析。敏感性分析是指在定量合成的系统评价中,改变某些影响结果的重要因素,如纳入标准、研究质量的差异、失访情况、统计方法(固定或随机效应模型)和效应量的选择(OR或RR)后,观察合成结果和异质性是否发生变化,从而判断所获结果的稳定性的方法,目的是发现影响Meta分析结果的主要因素与产生原因。发表偏倚——漏斗图及用途漏斗图(funnelplots)最初是用每个研究的处理效应估计值为X轴,样本含量的大小为Y轴的简单散点图。漏斗图所基于的假设是治疗效应估计值的精度随着样本量的增加而增加。样本量小的研究,精度低,分布于漏斗图的底部,且向周围扩散;样本量大的研究,精度高,分布于漏斗图的顶部,且向中间集中。当没有发表偏倚时,其图形呈对称的倒漏斗状,故称之为“漏斗图”。漏斗图示例A:无偏倚的对称漏斗图;B:存在发表偏倚的不对称漏斗图;C:因纳入低质量小样本试验的不对称漏斗图。实例1的RevMan5.1漏斗图存在发表偏倚发表偏倚偏向无统计学意义的文章,说明该Meta分析的结论可信度很高。无统计学意义有统计学意义实例2的RevMan5.1漏斗图漏斗图的应用漏斗图主要用于观察某个系统评价或Meta分析结果是否存在偏倚,如发表偏倚或其他偏倚。如果资料存在偏倚,会出现不对称的漏斗图,不对称越明显,偏倚程度越大。漏斗图的不对称性主要与发表偏倚有关,但也存在其他原因,如选择性偏倚、语言偏倚、重复发表偏倚等。进入Meta分析的文献数较少时,不建议使用漏斗图,推荐文献数≥10时,可使用漏斗图。Meta分析的局限性目前,M