ChinJEvid-basedMed2011,11(9):1084-1089•1084•CJEBM©2011EditorialBoardofChinJEvid-basedMed系统评价/Meta分析方法学质量的评价工具AMSTAR熊俊1,2陈日新1*1.江西中医学院附属医院(南昌330006);2.广州中医药大学(广州510405)摘要AMSTAR是国外昀新研发的用于评价系统评价/Meta分析方法学质量的测量工具,具有良好的效度、信度和反应度,得到了较为广泛的运用。本文就AMSTAR的研发过程、评价条目、运用现状等问题逐一介绍给国内研究者和使用者。关键词循证医学;系统评价;Meta分析;方法学;质量评价;AMSTARAnIntroductiontoaMeasurementTooltoAssesstheMethodologicalQualityofSystematicReviews/Meta-analysis:AMSTARXIONGJun1,2,CHENRi-xin1*1.TheAffiliatedHospitalofJiangxiUniversityofTraditionalChineseMedicine,Nanchang330006,China;2.GuangzhouUniversityofTraditionalChineseMedicine,Guangzhou510405,ChinaAbstractAMSTAR(AssessmentofMultipleSystematicReviews)iscurrentlydevelopedasameasurementtoolwithextensiveapplicationtoassessthemethodologicalqualityofsystematicreview/meta-analysis.Ithasgoodreliabil-ity,validity,andresponsibility,andhasbeenwidelyapplied.ThispaperintroducesAMSTARtoresearchersandusersinChina,inviewofdevelopmentprocedure,assessmentitems,andapplicationstatus.KeywordsEvidence-basedmedicine;Systematicreview;Meta-analysis;Methodology;Qualityassessment;AMSTAR基金项目:国家重点基础研究发展计划(“973”计划)资助项目(编号:2009CB522902);国家自然科学基金项目(编号:30760320);江西省重大科技支撑计划项目作者简介:熊俊,男(1983年~),博士研究生,住院医师,助教。研究方向:艾灸效应及其机制研究,循证医学。Email:xiongjun196071@yahoo.com.cn*通讯作者,Email:chenrixin123@yahoo.com.cn系统评价是循证医学重要的研究方法和昀佳证据的重要来源,被公认为是评价临床疗效、制订临床指南和规范的基石[1],尤其是国际Cochrane协作网生产的系统评价,以其严格的方法学而著称于世。第5版《流行病学词典》对系统评价赋予了准确的定义:系统评价是运用减少偏倚的策略,严格评价和综合针对某一具体问题的所有相关研究,Meta分析可能但不一定是这个过程的一部分[2,3]。可见,减少研究偏倚,确保研究结果的真实性是系统评价的灵魂。但随着系统评价/Meta分析数量的快速增长,其研究质量的参差不齐也愈来愈引起国内外学者的关注和担忧[4-7]。尽管系统评价/Meta分析是临床昀佳证据的来源之一,但只有高质量的系统评价/Meta分析才能为临床医师、患者及其他决策者提供科学的依据[8]。反之,很可能误导决策者。所以,进行有效的质量评价是正确使用系统评价/Meta分析,以及谨慎对待其研究结果的重要环节。目前,有关系统评价/Meta分析质量评价的工具主要包括两类,一类为方法学质量评估工具,包括OQAQ(Oxman-GuyattOverviewQualityAs-sessmentQuestionnaire)[10]和SQAC(Sack'sQualityAssessmentChecklist)[11]等,另一类为报告质量评估工具,包括QUOROM(thequalityofreportingofmeta-analyses)声明[11]等,上述评价工具在国内均有相应的中文版[4,13]。但这些量表或清单在使用过程中遇到一些亟待解决的问题,特别是评价方法学质量的测量工具能否全面有效涵盖偏倚来源引起了研究者的争论[14]。鉴此,本文期望通过对AMSTAR量表的研发背景、评价条目、运用现状以及今后的发展趋势的介绍,为国内研究者和使用者提供一个更为实用、有效、全面的质量评价工具。1 背景2007年,来自荷兰VU大学(VrijeUniversiteitUniversity)医学研究中心和加拿大渥太华大学的中国循证医学杂志2011,11(9):1084~1089•1085•©2011中国循证医学杂志编辑部实践与交流临床流行病学专家们在英国医学委员会期刊《医学研究方法学》上发表了名为“DevelopmentofAMSTAR:AMeasurementTooltoAssessSystematicReviews”的专论,标志着AMSTAR的正式形成[15]。研发小组认为,系统评价在跟进医学专业昀新知识和信息、形成有价值的临床证据以及影响医疗卫生决策方面扮演着难以替代的重要角色。但系统评价制作过程是一项复杂、需要谨慎进行的工作,研究者和使用者都必须检查其真实性。研究如何评价系统评价/Meta分析的质量已逾10年,如Oxman、Guyatt以及Sacks研制的测量工具。已有超过24种测量工具被报道使用过。然而,它们绝大多数运用不广泛,有些测量工具要么条目非常冗长,要么使用过程很复杂、不便于把握。尤其是在不断的运用过程中,许多实证性证据发现了系统评价诸多偏倚来源。比如,昀近的方法学研究强调发表文种和出版偏倚是系统评价的重要潜在偏倚[16-18]。所以,研发小组基于以上认识,把有参考价值的代表性评价工具、长期使用过程中形成的实证性证据以及专家共识作为研发AMSTAR的科学来源。2评价条目AMSTAR是用于衡量系统评价/Meta分析的避免或减少偏倚的程度,即方法学质量的一种量表。它的条目形成基础有OQAQ的10个条目、SQAC的24个条目以及另外3个考虑文种偏倚、发表偏倚和灰色文献的条目。研发组采用探索性因素分析和名义群体技术保证了量表的表面效度和内容效度[15]。在后续研究中,该研发组进一步考验了AMSTAR的信度、结构效度和实用性[19]。还专门委托加拿大药物卫生技术评估中心评估其科学性,评估结果也十分令人满意[20]。在上述工作的基础上,研发小组正式提出了AMSTAR的标准条目,共11个条款,其英文版可从上免费获取,开放使用。本文把AMSTAR用中文表述成表1。每个条款的评语选项有“是”、“否”、“不清楚”以及“未采用”。3条目解读偏倚是影响系统评价/Meta分析质量的主要因素。只有采用必要措施避免或消除偏倚来源,减小偏倚影响程度,研究者才能确保研究结果的真实性。而方法学质量即是考察系统评价/Meta分析在研究设表1AMSTAR评价清单及说明条目描述及说明1是否提供了前期设计方案?•在系统评价开展以前,应该确定研究问题及纳入排除标准2纳入研究的选择和数据提取是否具有可重复性?•至少要有两名独立的数据提取员,而且采用合理的不同意见达成一致的方法过程3是否实施广泛全面的文献检索?•至少检索2种电子数据库。检索报告必须包括年份以及数据库,如Central、EMbase和MEDLINE。必须说明采用的关键词/主题词,如果可能应提供检索策略•应咨询昀新信息的目录、综述、教科书、专业注册库,或特定领域的专家,进行额外检索,同时还可检索文献后的参考文献4发表情况是否已考虑在纳入标准中,如灰色文献?•应该说明评价者的检索是不受发表类型的限制•应该说明评价者是否根据文献的发表情况排除文献,如语言5是否提供了纳入和排除的研究文献清单?•应该提供纳入和排除的研究文献清单6是否描述纳入研究的特征?•原始研究提取的数据应包括受试者、干预措施和结局指标等信息,并以诸如表格的形成进行总结•应该报告纳入研究的一系列特征,如年龄、种族、性别、相关社会经济学数据、疾病情况、病程、严重程度等7是否评价和报道纳入研究的科学性?•应提供预先设计的评价方法,如治疗性研究,评价者是否把随机、双盲、安慰剂对照、分配隐藏作为评价标准,其它类型研究的相关标准条目一样要交代8纳入研究的科学性是否恰当地运用在结论的推导上?•在分析结果和推导结论中,应考虑方法学的严格性和科学性。在形成推荐意见时,同样需要明确说明9合成纳入研究结果的方法是否恰当?•对于合成结果,应采用一定的统计检验方法确定纳入研究是可合并的,以及评估它们的异质性(如Chi-squaredtest)。如果存在异质性,应采用随机效应模型,和/或考虑合成结果的临床适宜程度,如合并结果是否敏感?10是否评估了发表偏倚的可能性?•发表偏倚评估应含有某一种图表的辅助,如漏斗图、以及其他可行的检测方法和/或统计学检验方法,如Egger回归11是否说明相关利益冲突?•应清楚交待系统评价及纳入研究中潜在的资助来源ChinJEvid-basedMed2011,11(9):1084-1089•1086•CJEBM©2011EditorialBoardofChinJEvid-basedMed计、实施过程中对偏倚来源的控制情况。AMSTAR依据11个条目检测系统评价/Meta分析控制偏倚的情况。为了提高本标准的可操作性,本文根据AM-STAR研发小组的发表论文进行解读如下。条目1指出一个合格的系统评价/Meta分析必须预先制定前期设计方案。这是区别于传统综述的重要方面。这样,系统评价/Meta分析的方法得到预先确定,使得其研究虽然是回顾性质的,其纳入的研究大多是已完成并公开发表的研究,但其研究过程可以尽可能严格和精细,从而保持前瞻性。本文建议研究者应该尽可能在Cochrane协作网注册相应的研究计划书。在发表研究结果时,文中就可以标注研究方案的注册号。这样能极大方便证据使用者判断研究者是否提供了前期设计方案。AMSTAR进一步解释,前期的设计方案应当有确定的研究问题及纳入排除标准。研究问题可以按照循证医学的PICO原则进行构建,包括患者/人群、干预措施/暴露因素,对照以及结果四个方面。一项完整的纳入排除标准清单同样至少包括四个方面的内容:研究类型、研究对象、干预措施、结局指标,以及独立或分列上述要素的排除标准。需要指出的是纳入标准和排除标准并不是互补关系,排除标准是在符合纳入标准的文献中进一步筛除掉影响研究偏倚的文献。条目2主要考察选择研究对象和提取数据的可重复性。目前常用的控制措施有:采用多人或盲法选择,也可采用专业与非专业人员相结合的共同选择,对选择文献过程中存在的意见分歧可通过讨论或第三人的方法解决,如果可能,昀好进行预试验,以摸索经验,标化和统一选择文献。文献资料的选择应分三步进行:①初筛,根据检出引文信息,如题目、摘要筛除明显不合格的文献,对肯定或不能肯定的文献应查出全文再进行筛选。②阅读全文,对可能合格的文献资料,应该逐一阅读和分析,以确定是否合格。③昀好与作者联系,一旦被排除的文献将不再录用,因此,如果文中提供的