文献筛选和数据提取李玲孙鑫四川大学华西医院中国循证医学中心/中国Cochrane中心临床研究与循证评价研究室2015年1月一、文献筛选2目的与步骤目的:找出你需要的研究分两步:(1)初筛:通过阅读题目和摘要,排除不相关文献(2)全文筛选:通过阅读全文,判断文献是否满足系统评价纳入要求3方法通常根据纳入、排除标准筛选文献,正式筛选前做预试验预先设计文献筛选表,并制定筛选说明两名评价员独立筛选文献不一致协商解决或第三方评判通常可采用Endnote、NoteExpress、Access、Distiller等软件筛选文献4纳入、排除标准通常根据PICOS原则制定纳入、排除标准:研究对象(Participant/population)干预措施(Intervention)对照(Comparison/control)结局指标(Outcome)*通常全文筛选时将其作为筛选标准研究设计(Studydesign)注意:在观察性研究中,“I”为“Exposure”;在诊断性试验中,“I”为待评价诊断标准,“C”为金标准。5练习实例研究问题:他汀类药物预防心脑血管事件的效果如何?1.在无心血管疾病但有心血管疾病危险因素的人群中,他汀类药物是否能降低总死亡率和主要的心脑血管事件?2.在无心血管疾病但有心血管疾病危险因素的人群中,他汀类药物的效果如何?3.他汀类药物是否能降低总死亡率和主要的心脑血管事件?6研究对象的选择Meta分析研究人群的选择可综合考虑以下4方面:研究目的临床意义人群差异的大小人群差异的相关特征是否真正导致结果改变若某一研究中既包含感兴趣的研究对象亚组,也包含其他患者亚组,是否纳入?7确定干预措施和对照若各研究的干预措施(如用药剂量、时间不同)或对照方式(如安慰剂、阳性对照、常规处理)有差异,是否应该都纳入到Meta分析?若某研究不仅包含了感兴趣的干预措施,也包含了其他干预措施,如何处理?Meta分析对同类药物该如何处理?8确定结局指标主要结局指标、次要结局指标在众多指标中,是否需要纳入所有指标?若不是,需要考虑哪些指标?根据研究目的和研究问题来确定若不同的研究报告不同的随访结果,需要纳入哪些结局?是否应限定随访时间?根据研究目的和临床意义判断9选择研究类型影响研究类型选择的因素包括:医疗干预措施的类型:药物、器械、手术、筛查、行为干预、康复等评价的领域:效果、危害疾病领域结局的特征:终点/中间指标随访时间事件发生率10Eg.Incretintreatmentandriskofpancreatitisinpatientswithtype2diabetesmellitusInclusioncriteria:aRCT,anon-randomizedcontrolledtrial,acohortstudy,oracase-controlstudyofhumansubjectsincludedanappropriatecomparison:DPP-4inhibitororaGLP-1agonistvs.placebo,lifestylemodification,oractiveanti-diabeticmedicationsstudydurationatleast12weeksorlongerincludedprimarilyadulttype2diabetespatientsreportedpancreatitisoutcome11Eg.Incretintreatmentandriskofpancreatitisinpatientswithtype2diabetesmellitusExclusioncriteria:across-overstudyacohortstudyoracase-controlstudywithsamplesizesmallerthan100acomparisonofdrugswithinaclassastudyexplicitlylabeledasapharmacokinetic/pharmaco-dynamicstudyastudyexplicitlylabeledasaphaseItrialaconferenceabstractastudyprotocolduplicatepublication12Eg.Incretintreatmentandriskofpancreatitisinpatientswithtype2diabetesmellitusTitlesandabstractsscreeningCriteriaforselectingastudy:1.Wasthestudydesignappropriate?Yesorunclear→gotoquestion2Absolutelyno→stopscreening,exclude(question5)2.Diditincludeaneligibleappropriatecomparison?Yesorunclear→gotoquestion3Absolutelyno→stopscreening,exclude(question5)3.Wasthestudydurationatleast12weeksorlonger?Yesorunclear→gotoquestion4Absolutelyno→stopscreening,exclude(question5)13Eg.Incretintreatmentandriskofpancreatitisinpatientswithtype2diabetesmellitusTitlesandabstractsscreeningCriteriaforselectingastudy:4.Wasthestudypopulationprimarilyadulttype2diabetes?Yesorunclear→gotoquestion5Other→definepopulation,andstopscreening(question5)5.DecisionIncludeforfull-textscreeningExclude14Eg.Incretintreatmentandriskofpancreatitisinpatientswithtype2diabetesmellitusTitlesandabstractsscreeningform15Eg.Incretintreatmentandriskofpancreatitisinpatientswithtype2diabetesmellitusFull-textscreeningCriteriaforselectingastudy:1.Wasthestudydesignappropriate?2.Diditincludeaneligibleappropriatecomparison?3.Wasthestudydurationatleast12weeksorlonger?4.Wasthestudypopulationprimarilyadulttype2diabetes?5.Doesthestudyreportusableinformationaboutpancreatitisoutcome?6.Decision16Eg.Incretintreatmentandriskofpancreatitisinpatientswithtype2diabetesmellitusFull-textscreeningform17重要概念在题目/摘要筛选表中,我们需要考虑哪些问题?在全文筛选表中,我们是否需要考虑所有问题?如何标化筛选流程?18其他文献筛选方法使用文献管理软件(如Endnote、NoteExpress)优缺点:易学、易用不易标化使用在线软件(如Distiller)优缺点:可在线实时管理,国内外合作更便捷可及性差19文献筛选流程图通常可根据PRISMA流程图制作文献筛选流程图20Pancreatitissafetyflowchart21二、数据提取表设计22需要收集什么信息?就像做一个临床研究(e.g.trial)那样去收集信息临床试验中最重要的信息是什么?患者治疗和对照措施随访和结局系统评价可收集相似信息,但期望收集更多……并不是一个数据提取表可适用于所有纳入研究的资料提取23系统评价中的数据收集研究基本信息:研究编号、研究设计、多中心RCT的中心数、纳入/排除标准、随访时间、资助来源……偏倚风险:随机产生、分配隐藏、盲法……患者基线特征:年龄、性别、合并症、实验室检查结果……干预和对照具体干预、剂量、时间,人数……结局数据:根据数据类型分别设计提取表24系统评价和临床试验中数据的区别在系统评价中,通常可能无法收集到单个患者数据,而只能获得每个研究的汇总数据不同试验报告的数据报告方式可能不同如血糖测量(FPGvs.A1c)心血管事件:不同研究收集的心血管事件种类不同可能无法提取所有需要的数据如治疗前后收缩压的改变值可以提取基线和随访结束时的血压值25结果数据类型二分类数据(binarydata):如是否发生心梗连续性数据(continuousdata):如体重变化有序数据(ordinaldata):如病情的轻、中、重离散数据(discretedata)/计数数据(countdata):如心梗发生次数时间事件数据(time-to-eventdata):如肿瘤患者的生存时间26不同数据类型的数据提取二分类数据:需提取四格表数据,即试验组和对照组的事件数、样本量连续性数据:各组的均数、标准差、样本量有序数据:转换为二分类或连续性数据?直接提取原始数据用于数据分析?27不同数据类型的数据提取离散数据/计数数据:事件发生率低:提取试验组和对照组事件数(n)、样本量(N)、随访时间(T),RR=(ne/(Ne×Te)/(nc/(Nc×Tc)事件发生生率高:看做连续T性变量,提取各组单个患者发生事件数的均数,计算组间均数差时间事件数据:通常需联系原始研究者获得单个病例数据(individualpatientdata,IPD)进行Meta分析28数据提取表1.研究设计292.偏倚风险评价303.干预与对照314a.分类资料基线特征324b.连续性资料基线特征335a.二分类结局数据345b.连续性变量结局数据35其他数据收集方法使用Excel收集数据优缺点相对易学易用比较适用于纳入研究数量较少时但易出错36三、数据提取37数据提取方法38数据来源:已发表文献、联系研究者获取信息、单个患者数据通常根据预先设计的数据提取表提取数据;正式提取前做预试验,根据预试验结果完善数据提取表两名评价员独立提取数据不一致协商解决或第三方评判通常可采用Excel、Access、Distiller等软件提取数据数据提取中的特殊问题从同一个研究的多篇文献中提取数据同一个临床试验可能会发表不同随访时间的文章,如何提取数据?不同数据单位的转换对于同一指标,不同研究报告不同的数据单位(如FPG、LDL-C),提取数据时转换单位,还是后期再统一处理?缺失数据的处理联系原始研究者获取缺失数据估算缺失数据只分析可得数据(忽略缺失数据)39缺失数据估算常见的缺失数据估算是连续性变量中试验组或对照组的标准差(standarddeviation,SD)由样本均数标准误(standarderror,SE)和置信区间(confidenceinterval,CI)计算标准差由均数差的标准误、置信区间、t值和P值计算标准差由治疗前后差值估算治疗前后差值均数的标准差40不良事件(adverseevent)药物或其它医疗干预措施(如手术、器械等)导致的有害或不希望发生的事件有时,称为危