寇长贵流行病与卫生统计学教研室第4讲证据的分类、分级与推荐主要内容证据分类证据分级与推荐GRADE标准特点及应用本PPT内容参考了遵义医学院循证医学中心肖政的课件!1、飞速发展医疗科研(尤其是临床研究)导致大量科研成果产生(海量信息);全球23000余种生物医学期刊每年发表数百万篇文献2、教科书及专著升级更新速度远远落后于科研成果的产生3、有限个人精力:如365天每天阅读19篇文章,才能全面了解本领域进展。4、质量高低不一(技术、方法和手段???)如何认真、慎重地将在临床研究中得到的最新、最佳的证据用于处理各个个别的病人???循证医学证据分类、分级与推荐的标准和方法证据分类(引自李幼平,王莉.四川大学循证医学精品课程课件)一、按研究方法分类1、原始研究证据(primaryresearchevidence)指直接在受试者中进行单个有关病因、诊断、预防、治疗和预后等试验研究所获得的第一手数据,进行统计学处理、分析、总结后得出的结论观察性研究(未向受试者施加干预措施)试验性研究(给予受试者一定的干预措施)队列研究随机对照研究病例对照研究交叉试验横断面调查自身前后对照研究描述性研究非随机同期对照研究病例系列个案报道2、二次研究证据(secondaryresearchevidence)指尽可能全面收集某一问题的全部原始研究证据,进行严格评价、整合、分析、总结后所得出的综合结论,是对多个原始研究证据再加工后得的证据。–系统评价(systematicreview,SR)/Meta分析–临床实践指南(clinicalpracticeguidelines,GCP)–临床决策分析(clinicaldecisionanalysis)–临床证据手册(handbookofclinicalevidence)–卫生技术评估(healthtechnologyassessment,HTA)–实践参数(practiceparameter)二、按使用者需求分类政策制定者研究者卫生保健人员患者和公众人群政府官员、机构负责人、团体领袖等基础、临床、教学研究者等临床医生、护士、医学技术人员等普通民众、患病人群和健康人群来源法律、法规、报告原始研究证据为主(原始研究、方法学研究等)二次证据为主(指南、摘要、手册等)科普材料、健康教育材料、大众媒体为主(电视、广播、网络、报纸)特点关注宏观层面,侧重国计民生,解决复杂重大问题关注中观层面,侧重科学探索,解决研究问题关注微观层面,侧重实际应用,解决专业问题关注微观层面,侧重个人保健,解决自身问题证据分级与推荐证据分级与推荐要实现科学高效的决策,使用者不必花费大量时间和精力检索和评价证据质量(qualityofevidence),只需要充分利用研究人员预先确立证据分级标准和推荐意见,参考各种高质量证据帮助科学决策。证据使用者证据研究者研究人员在创建和推广证据分级标准和推荐意见时,必须力图避免偏倚和多变,以减少误导和滥用实现科学高效的决策20世纪60年代,美国两位社会科学家Campbell和Stanley首次提出了研究证据分级的思想,并引入内部真实性和外部真实性的概念。1972年,英国医生ArchieCochrane的经典著作《疗效与效益:健康服务中的随机反映》更是唤起了人们对医学决策科学性和卫生资源合理配置、高效使用的深刻反思。1979年,加拿大定期体检特别工作组(CanadianTaskForceonthePeriodicHealthExamination,CTFPHE)首次对研究证据进行分级并给出推荐意见。此后多个机构和组织分别对证据质量和推荐强度进行了规范,但方法各异,标准不一,甚至彼此矛盾。证据分级起源及问题一、CTFPHE标准水平定义级别定义Ⅰ至少一项设计良好的随机对照试验A考虑该疾病的证据充分Ⅱ1设计良好的队列或病例对照研究,尤其来自多个中心或研究组B考虑该疾病的证据尚可Ⅱ2在时间和地点上设置了对照的研究,不管是否有干预措施C考虑该疾病的证据缺乏Ⅲ基于临床研究、描述性研究或专家委员会的报告,或权威专家的意见D不考虑该疾病的证据尚可E不考虑该疾病的证据充分但该标准仍存在以下几点不足:①样本量小、质量低的RCT也属于Ⅰ级证据吗?②结果相互矛盾的RCT仍然属于Ⅰ级证据吗?③高质量的观察性研究仍属于Ⅱ级证据吗?二、ACCP标准水平定义级别定义Ⅰ有确定结果的大样本RCT(Ⅰ、Ⅱ型错误都较低)A至少一项Ⅰ级试验支持Ⅱ结果不确定的小样本RCT(Ⅰ、Ⅱ型错误都较高)B至少一项Ⅱ级试验支持Ⅲ非随机的同期对照试验C只有Ⅲ、Ⅳ、Ⅴ级证据支持Ⅳ非随机的历史对照试验Ⅴ无对照的系列病例报道点评:以上两套系统产生于20世纪70-80年代,此时正是国际临床流行病学和卫生技术评估产生\发展、医学科研方法逐渐成熟、医学继续教育空前繁荣的时代。加拿大研究人员首次从试验设计角度对证据进行分级,明确提出研究证据要优于专家意见,这不仅成为医学工作者决策的重要依据,也成为后来诞生的循证医学的基本理念之一。三、AHRQ标准1992年,美国卫生保健政策研究所(AgencyforCarePolicyandResearch,AHCPR,现更名AgencyforHealthcareResearchandQuality,AHRQ)制定的临床实践指南,将随机对照试验的Meta分析作为最高级别的证据,并向全国推广水平定义级别定义Ⅰa随机对照试验的Meta分析AⅠaⅠb至少1项随机对照试验ⅠbⅡa至少1项设计良好的非随机对照试验BⅡaⅡb至少1项设计良好的准实验性研究ⅡbⅢ设计良好的非试验性研究,如对照研究、相关性研究和病例研究CⅢⅣ专家委员会报告、权威意见或临床经验Ⅳ四、SIGN标准1996年,英格兰北部循证指南制定项目(NorthofEnglandEvidenceBasedGuidelinesDevelopmentProject,NEEBGDP)发布了其制定的证据分级标准和推荐强度,将RCT,Meta分析和系统评价共同作为最高级别的证据,这是英国继加拿大和美国之后较系统全面发布自己的分级标准。2001年,苏格兰院际指南网络(TheScottishIntercollegiateGuidelinesNetwork,SIGN)发布了更详细的证据分级和推荐强度(表3—8)。荷兰、新西兰、澳大利亚等国先后在临床指南中也引入或修订了各自的证据分级和推荐标准。局限性:局限于治疗方面,不适于预防、诊断等其他领域五、牛津大学循证医学中心标准1998年,由临床流行病学和循证医学专家BobPhilips,ChrisBall,DaveSackett等人共同循证制定新的分级标准,2001年5月正式发表于英国牛津循证医学中心的网络上。该标准首次在证据分级的基础上整合分类概念,涉及治疗、预防、病因、危害、预后、诊断、经济学分析七个方面,更具有针对性和适应性循证医学教学和循证临床实践中公认的经典标准循证教科书和循证期刊使用最为广泛的标准,由于其过于复杂和繁琐,初次接触循证医学的医生或学生难于理解和掌握。182020年1月20日【共同特点】:针对临床,用于指南,传播广泛,影响权威,推荐意见的强度与证据级别对应。但最大的不足时内容复杂、应用局限、标准各异。六、GRADE标准针对当前证据分级与推荐意见存在的不足,2000年,包括WHO在内的19个国家和国际组织共同创立“推荐分级的评价、制定与评估”(GradingofRecommendationsAssessment,DevelopmentandEvaluation,GRADE)工作组,由67名包括临床指南专家、循证医学专家、各个标准的主要制定者及证据研究人员构成。该工作组循证制定出国际统一的证据质量分级和推荐强度系统,并于2004年正式推出。评价:这是第一个从使用者角度制定的综合性证据分级和推荐强度标准,以易于理解、方便使用为特点。认可度:由于其更加科学合理,过程透明,适用性强,目前包括WHO和Cochrane协作网在内的28个国际组织、协会已经采纳GRADE标准,已成为证据发展史上的里程碑事件。2004年GRADE证据分级及推荐强度证据水平具体描述推荐级别具体描述高未来研究几乎不可能改变现有疗效评估结果的可信度强明确显示干预措施利大于弊或弊大于利中未来研究可能对现有疗效评估有重要影响,可能改变评价结果的可信度弱利弊不确定或无论质量高低的证据均显示利弊相当低未来研究很有可能对现有疗效评估有重要影响,改变评估结果可信度的可能性较大极低任何疗效的评估都很不确定GRADE标准特点及应用一GRADE标准特点证据质量指在多大程度上能够确信疗效评估的正确性;推荐强度指在多大程度上能够确信遵守推荐意见利大于弊;反映一项干预措施是否利大于弊的确定程度【GRADE标准的特点和优势】1.由一个具有广泛代表性的国际指南制定小组制定;2.明确界定了证据质量和推荐强度;3.清楚评价了不同治疗方案的重要结局;4.对不同级别证据的升级与降级有明确、综合的标准;5.从证据到推荐全过程透明;6.明确承认价值观和意愿;7.就推荐意见的强弱,分别从临床医生、患者、政策制定者角度作了明确实用的诠释;8.适用于制作系统评价、卫生技术评估及指南。二影响证据质量的因素可能降低证据质量的因素1)研究的局限性:研究的局限性包括隐蔽分组缺失、盲法缺失(特别是结局指标为主观性指标且对其评估极易受偏倚影响时)、失访过多、未进行意向性分析、观察到疗效就过早终止试验或未报道结果(通常是未观察到疗效的一些研究)。2)研究结果不一致:不同研究间大相径庭的疗效评估(异质性或结果的差异)意味着各种疗法的疗效确实存在差异。差异可能源于人群(如药物对重症人群的疗效可能相对显著)、干预措施(如较高药物剂量会使疗效更显著)或结局指标(如随时间推移疗效降低)。当结果存在异质性而研究者未能意识到并给出合理解释时,证据质量亦降低。可能降低证据质量的因素3)间接证据:第一类,如欲比较两种活性药物的疗效时,若无两药直接比较的随机对照试验,但有两药均与同一安慰剂比较的随机对照试验时,便可进行两药疗效的间接比较。但其证据质量比两药直接比较的随机对照试验低。第二类间接证据包括人群、干预措施、对照措施、预期结局及相关研究中类似的因素。4)精确度不够:当研究纳入的患者和观察事件相对较少而致置信区间较宽时,将降低该研究的证据质量。5)发表偏倚:若阴性结果的研究不能发表会减弱证据质量,典型情况是公开的证据仅限于少数试验且这些试验全部由企业赞助,此时不得不质疑存在发表偏倚。二影响证据质量的因素可能增加证据质量的因素1)效应值很大:当方法学严谨的观察性研究显示疗效显著或非常显著且结果一致时,将提高其证据质量。2)可能的混杂因素会降低疗效:例如研究证据显示营利性医院患者死亡率低于非营利性医院。但通常营利性医院卫生资源更多,就诊患者社会经济状况普遍较好、病情较轻。考虑到这些混杂因素,若得出营利性医院疗效更好,其证据强度将降低。3)剂量-效应关系:药物剂量及其效应大小间有明显关联。二影响证据质量的因素三影响推荐强度的因素推荐强度反映对一项干预措施是否利大于弊的确定程度。干预措施的有利方面包括降低发病率和病死率、提高生活质量、降低医疗负担和减少资源消耗。不利方面包括增加发病率和病死率,降低生活质量或增加资源消耗等。GRADE系统只有强弱两级推荐,为方便使用GRADE还为证据质量和推荐强度提供了首选的符号描述法,也为喜欢使用数字和字母形式的机构提供了首选的数字/字母描述法证据质量与推荐强度的表达方式证据质量表达方式推荐强度表达方式高质量⊕⊕⊕⊕或A支持使用某干预措施的强推荐↑↑或1中级质量⊕⊕⊕○或B支持使用某干预措施的弱推荐↑?或2低质量⊕⊕○○或C反对使用某干预措施的弱推荐↓?或2极低级质量⊕○○○或D反对使用某干预措施的强推荐↓↓或1证据强度解释1)强推荐的含义–对患者:在这种情况下,多数患者会采纳推荐方案,只有少数不会;此时若未予推荐,则应说明。–对临床医生:多数患者应该接受该推荐