Meta-分析的统计过程赵亚双哈尔滨医科大学流行病学教研室2006年11月30日概述•60年代开始,在医学文献中,陆续出现了对多个独立研究的统计量进行合并的报道•76年,G.V.Glass首先将合并统计量对文献进行综合分析研究的这类方法称为“Meta-Analysis”•80年代末该方法传入我国,中文译名有荟萃分析,二次分析,汇总分析,集成分析等,但无论何种中文译名都有不足之处,因此,很多学者建议仍然使用“Meta-分析”这一名称Meta-分析的定义•Meta-Analysisisasystematicreviewthatusesquantitativemethodstosummarizetheresults•Meta-分析是运用定量方法去概括(总结)多个研究结果的系统评价《Evidence-BasedMedicine》---DavidSackett等,第247页的定义•Meta-Analysisisastatisticaltechniqueforassemblingtheresultsofseveralstudiesinareviewintoasinglenumericalestimate•Meta-分析是文献评价中,将若干个研究结果合并成一个单独的数字估计的统计学方法。《TheCochraneLibrary》第3页的定义Meta-分析的定义Meta-分析实例一K个研究阿司匹林.合计RR95%CI死亡数未死亡数死亡数未死亡数aibicidiNi下限上限1495666755712390.7200.4891.0592447146470715290.6810.4571.013310273012672416820.8030.6061.063432285382716260.8010.4861.3195857255235412160.7980.5531.15362462021219203845241.1330.9351.37371570701717206880171870.8950.8290.966合计21281205822861153128003七个阿斯匹林预防心肌梗死的研究资料(取自FleissJL)表中ai、bi、ci、di为各研究四格表数,Ni为各研究的样本例数,ai为处理组的实际阳性数Meta-分析实例二K个研究高氟区适氟区P值N1X1S1N2X2S21262.260.32422.330.330.052552.390.31402.490.320.053462.500.30502.670.350.054452.640.26502.900.450.055452.810.35452.930.360.056522.950.46553.270.370.057463.150.39423.480.480.058453.470.46513.730.540.059453.630.38453.810.400.0510423.810.41454.160.420.0511443.990.56254.180.410.05合计491490女童掌骨II型皮质厚度的11个研究方积乾医学统计学与电脑实验第二版上海科学技术出版社,2001,349-350传统文献综述的特点•在医学研究中,传统的文献综述在处理同一问题的多个结果报道时,通常是平等(等权重方法)对待每个研究结果而得出结论。•这种文献综述一般不进行文献评价,也不考虑文献的质量,主要是以某类结果文献数量的多少得出结论传统文献综述的主要问题•传统文献评价的结果必然存在两个问题–多个研究质量不相同–各个研究的样本含量的大小不相等•因此,传统文献综述的方法很难保证研究结果的真实性、可靠性和科学性,尤其当多个研究结果不一致时,容易让人产生困惑和误解Meta-分析的统计目的•增加统计功效由于单个临床试验往往样本较小,难以明确肯定某种效应,而这些效应对临床医生来说又可能是重要的。•解决各研究结果的不一致性。•寻求新的假说Meta-分析与系统评价•在系统评价中,当数据资料适合Meta-分析时,用Meta-分析可以克服传统文献综述的两大难题,其分析结果的可靠性更高•当数据资料不适合于作Meta-分析时,系统评价只能解决文献评价的问题,不能解决样本含量的问题,因此,对其分析结论应慎重•没有按系统评价标准操作规范实施,或未经严格文献评价的研究,即使用了Meta-分析也不一定是系统评价的研究,更难说是高质量的研究Meta-分析的统计分析过程•Meta-分析计算的主要步骤–计算每个研究的效应量和方差–计算每个研究效应量的权重–计算合并效应量–异质性检验–合并效应量的可信区间–合并效应量的检验单个研究的统计量•根据资料类型选择单个研究的统计量–分类变量可选择的统计量•比值比,OR(oddsratio)•相对危险度,RR(relativerisk)•率差,RD(ratedifference)–数值变量可选择的统计量•加权均数差WMD•标准化均数差SMD–由于描述各研究的实验结果,其结果解释与常规统计描述指标相同单个研究的方差•根据资料类型选择单个研究的统计量di的方差Var(di)单个研究统计量di的计算方法确定后,其方差的计算方法也随之确定•方差可用于可信区间和假设检验的计算异质性检验与异质性分析•Meta-分析前先做异质性分析;•只有同质的资料才能进行合并或比较等统计分析,•异质性检验(testsforheterogeneity)又称同质性检验(testsforhomogeneity)用假设检验方法检验多个独立研究是否具有异质性(同质性)异质性检验方法•目前,多用下面公式计算:•Wi为每个研究的权重,第i各研究的权重Wi按下式计算:•该检验统计量Q幅从自由度为K-1的卡方(x2)分布,因此,当计算得到Q后,需由卡方分析获取概率,故又将此检验叫做卡方检验(Chisquaretest,Chi2)iiiiiiiWdWdWddWQ222)()()(1iidVarW•若异质性检验结果为p>0.10时,多个研究具有同质性,可选择固定效应模型(fixedeffectmodel);•若多个研究的异质性检验结果为p≤0.10时,多个研究不具有同质性,首先应进行异质性分析和处理,若仍无法消除异质性的资料,可选择随即效应模型(randomeffectmodel)异质性检验方法I2及计算在revman中,I2可用于衡量多个研究结果间异质程度大小的指标。这个指标用于描述由各个研究所致的,而非抽样误差所引起的变异(异质性)占总变异的百分比.I2及计算•I2:异质性的定量分析•Qisthechi-squaredstatistic•dfisthedegreesoffreedom•I2值从0%至100%,0%时无异质性,I2值越大,异质性越大;•I2描述了去除抽样误差(机遇)后的异质性。I2=Q-dfQ•Howmuchistoomuchheterogeneity?•一般说来,用I2=25%,或50%,或75%将异质性划分为低,中,高;•但不宜机械应用;•I2大于50%可认为有实质性的异质性。异质性分析与处理的方法•当异质性检验出现p≤0.10时,首先应找出产生异质性的原因,如疗程长短、用药剂量、病情轻重、对照选择等是否相同•由上述原因引起的异质性,可使用亚组分析(subgroupanalysis),Breslow-Day法和回归近似法•根据Cochrane系统评价要求,在系统评价的计划书中尽可能地对一些重要的亚组间差异进行叙述,也就是说对重要的亚组分析,应在计划书中加以说明•此外,在同一个系统评价中,不提倡使用太多的亚组分析多个试验效应的合并•将多个独立研究的结果合并成某个单一的效应量或效应尺度,即用某个指标的合并统计量,以反映多个独立研究的综合效应•当多个独立研究的例数不等时,他们的综合效应不等于多个单独效应的平均数,如三个均数的总均数不等于这三个均属之和除以3•所以,怎样合理的对多个独立研究效应合并,是Meta-分析统计过程的主要问题合并统计量的两种模型•固定效应模型(fixedeffectmodel):若多个研究具有同质性时,可使用固定效应模型•随机效应模型(randomeffectmodel):若多个研究不具有同质性时,先对异质原因进行处理,若异质性分析与处理后仍无法解决异质性时,可使用随机效应模型分类变量(categorydichotomous)•固定效应模型:指标RR、OR1.Standardoddsratio法2.Mantel-Haenzel法3.Peto法•随机效应模型:指标RR、OR如:Dersimonian&Laird(D-L)法数值变量(continuous)•固定效应模型1.WMD,加权均数差法2.SMD,标准化均数差法•随机效应模型D-L法试验组与对照组舒张压改善值的比较例:WMD加权均数差法计算各研究的效应值、方差和权重ECdXX22(1)(1)2EECCECNSNSSNN2211()dECSSNN21dwS研究结果的效应值、方差和权重对各研究结果的效应值进行齐性检验H0:各研究的效应值相等。H1:各研究的效应值不相等。由于齐性检验的检验效能较低所以通常将检验水准定为=0.10。计算统计量QQ=29.694,df=15,p=0.013。Q服从自由度为M-1的2分布。2()iiQWdd计算合并的效应值•固定效应模型的合并效应值:(各研究的效应值相等)其方差为:iiiWddW21diSW计算合并的效应值•随机效应模型的合并效应值:(各研究的效应值不等)DerSimonianandLaird方法其方差为:**iiiDLWddW2*1dDLiSWDerSimonianandLaird方法中权重的计算方法其中为固定效应模型时效应值的方差,D为随机效应部分的方差。其中为固定效应模型时各研究的权重,Q为齐性检验时的统计量。*iW*21idWSD2(1)max,0iiiQkD研究结果的效应值、方差和权重WMD的问题•对临床的一些重要变化常常不能清楚地反映出来;•有严格的高质量的标准,标准差较小的研究有较大的权重;•相同的测量指标并不总是可比的,如美国和英国的医疗费用;•有些卫生政策可以左右“医疗过程”测量指标的变化。标准化均数差•如果各研究测量相同的指标而采用不同的量度,就需要在合并之前对不同量度进行转换;•在“转换系数”知道的情况下可直接进行转换;•“标准化”转换可使用:量度因子:每个研究中的标准差选择量度:自然标准差单位•“标准效应量”的计算:效应量=均数差值/平均标准差SMD的问题•难以用SD单位解释结果但是可以转化回不同的量度•对于重要的临床改变不清楚建议使用0.5SD,以及0.25SD•具有严格的高质量标准的研究效应量要增加•“自然变异”的估计不总是可用SD比较改变分值•有些研究分析“改变”而不是“终点值”•如果这种改变的SD是已知的,则可改变MA分值•但是常常只有在给出治疗前和治疗后的SD值才可使用•SD改变值取决于治疗前后的值,在没有此值时无法计算•给出与“改变分值”和“终点值”相应的权重标准差的计算•标准差可从以下途径计算:标准误可信区间t-检验从t-检验计算的P-值•标准差也可从以下途径估计:RangesInterquartileranges从非参数检验获得的P-值校对SD的方法•它是否可信?•它与其它SD是否不同?•该研究是否有很大的权重?•使用n的开方是否使它更加可信?•它是否报告显著性检验和P-值?资料类型与采用的计算方法资料类型合并统计量模型计算方法TypeofdataSummarystatisticModelMethod二分类变量OddsRatio固定Peto固定Mantel-Haenszel随机D-LRR固定Mantel-Haenszel随机D-LRD固定Mantel-Haenszel随机D-L数值变量WMD固定