临床研究中常见偏倚及其控制福建医科大学公共卫生学院许能锋副教授一、概述二、选择偏倚及其控制三、信息偏倚及其控制四、混杂偏倚及其控制提纲(一)临床研究中的一些基本概念(二)抽样及其抽样误差(三)偏倚的定义、特性和分类(四)机遇与偏倚的区别(五)真实性(六)研究偏倚的意义一、概述1.总体:同质个体所构成的全体。2.目标人群:又称靶人群,是样本人群来源的总体,即样本人群研究结果用以说明或推广应用的总体人群。3.样本:从总体中取出的部分个体。(一)临床研究中的一些基本概念1.抽样从总体中取出部分个体进行研究的过程。2.抽样的原因1)我们不可能获得总体的全部资料;2)我们没有足够的人力、物力研究总体。3.抽样误差样本与总体之间由于抽样过程引起的差异,在统计学上称为抽样误差。(二)抽样及其抽样误差1.定义:偏倚是指在流行病学研究的设计、实施或资料分析阶段,由于设计者、操作者的人为因素,在选择观察对象、收集资料、处理数据、分析资料或解释结果时产生的各种系统误差。2.特性:偏倚是从样本研究中所得结果不能如实反映目标人群真实结果的一种系统误差,具有一定的方向性。3.分类:选择偏倚、信息偏倚、混杂偏倚(三)偏倚的定义、特性和分类1.本质区别:1)机遇:是观察结果的精确性及可重复性受到影响;机遇是一种随机误差。2)偏倚:观察结果系统地、向一个方向(或大、或小)发生偏差而不能反映真实情况;偏倚是一种系统误差。(四)机遇与偏倚的区别2.机遇与偏倚反映了一项研究或测量结果的两方面:精确性(随机误差)和真实性(系统误差)真实度高真实度低精确度高精确度低3.机遇对研究结果的影响1)假阳性:如实际上两种方法治疗疗效相同,如少数病人的抽样研究发现甲、乙两方法疗效不同,这是由于机遇的影响而发生的假阳性错误,统计上称一类错误,用α表示。弃真2)假阴性:如实际两种治疗一种比另一种好,但由于抽样研究中机遇的影响,两者疗效十分相近而作出假阴性的错误判断;统计上称二类错误,用β表示。取伪3)可信区间是表明机遇所致的围绕真实值变动的范围,通常用95%或99%可信区间表示;用于直接估计机遇在临床研究中的作用大小;变动范围越窄,真实值越稳定。真实性是指一项研究或观察所作推论的正确及可靠程度,即结果反映研究对象的真实情况。内部真实性:能正确反映研究人群或靶人群真实状况的研究结果,称之为具有内部真实性;它受研究环境条件、研究对象范围(类型的多少)等因素影响。外部真实性:有内部真实性的结果推广到靶人群以外的其他人群仍然有效,称之为具有外部真实性。它受研究人群与其他人群临床特点的差异、研究对象类型等因素的影响。具有内部真实性的结果未必都有外部真实性,当没有内部真实性的结果一定也没有外部真实性。临床研究中经常将只有内部真实性而无外部真实性的结果任意推广应用至靶人群以外的其他人群,导致张冠李戴、南辕北辙、贻误患者治疗时机。(五)真实性样本内部真实性和外部真实性样本偏倚机遇研究结论内部真实性外部真实性:外推到样本所属总体或其他人群病人总体(包括其他设施中的人群)研究对象是143例30~73岁退役军人,平均舒张压115~129mmHg,均无高血压并发症。研究设计严谨,采用随机分组、双盲观察,研究对象始终配合很好,统计学处理正确。研究结果发现采用双氢克尿噻与利血平联合用药能明显降低心、脑、肾等并发症。该研究全过程采取措施防止了偏倚发生,因而公认其结论内部真实性较高。但是,该结论对于女性或非退役军人是否有效?对于舒张压不在115~129mmHg范围内或已有高血压并发症的病人是否也有效呢?该研究是无法解决这些问题的。实例:美国退伍军人高血压治疗临床试验临床流行病学研究中少不得“中庸之道”,即不偏不倚。偏倚可发生在研究设计、实施、分析以至推论的各个阶段。加大样本量并不能使之减少。只有深入研究,才能了解、认识各类偏倚,以便在研究过程中尽量加以避免或控制,从而保证研究结果的真实性。(六)研究偏倚的意义(一)选择偏倚概念(二)选择偏倚产生环节与原因(三)常见选择偏倚(四)选择偏倚的控制二、选择偏倚及其控制选择偏倚:是指所选择的研究对象(样本)与所研究的目标人群之间在某些特征方面存在的系统误差。本质:是研究对象缺乏代表性。常见于病例对照研究、临床试验和横断面调查。(一)选择偏倚概念产生环节:主要发生于研究设计阶段,亦可发生于资料收集阶段。产生原因:被选入对象同落选对象间在与研究有关的特征方面有系统差别,同时在比较组间除研究因素外,其他一些有关因素存在差别亦导致结果偏离真实情况。(二)选择偏倚产生环节与原因(三)常见选择偏倚1.入院率偏倚(Berkson偏倚)2.检出征候偏倚(detectionsignalbias)3.存活病例偏倚(Neyman偏倚)4.无应答偏倚(non-respondentbias)5.志愿者偏倚(volunteerbias)6.失访偏倚(withdrawbias)7.健康工人(效应)偏倚(healthyworkerbias)8.转组偏倚(migrationbias)9.非同期对照偏倚(noncontemporarybias)10.异地对照偏倚11.易感性偏倚(susceptibilitybias)12.时间效应偏倚(timeeffectbias)13.领先时间偏倚(leadtimebias)14.选择性转诊偏倚15.集合偏倚(assemblybias)16.零点偏倚(zerotimebias)17.排除偏倚(exclusivebias)18.错误分类偏倚(miscassificationbias)19.成员偏倚(menbershipbias)20.诊断机会偏倚diagnosticenterbias)1)概念:指利用医院就诊病人作为研究对象时,由于入院率不同而导致的偏差。2)本质:入院率不同→暴露率变化→联系强度变化3)原因:(1)不同医院的技术专长;(2)患者疾病的严重程度;(3)患者的经济状况;(4)就诊的方便程度等。4)常发生此偏倚的研究设计类型:病例对照研究,尤其是以医院为基础的病例对照研究。1.入院率偏倚(Berksonbias)1)研究某危险因素是否与A病有关,A病来源于住院病人,对照为同期住院的其他病人(B病);2)A病与B病由于各种因素在该医院入院率不同;3)危险因素具有一定独立性,存在与疾病无关的入院率。4)例如,A病:糖尿病;B病:肿瘤;危险因素:高血压病种有C因素无C因素总人数A病75042505000B病75042505000OR=(750×4250)/(4250×750)=1人群A、B两病及C因素分布病种有C因素无C因素总人数A病750×60%=4504250×60%3120750×40%×40%=120=570=2550B病750750×25%=1884250×25%1476750×75%×40%=225=413=1063OR=(570×1063)/(2550×413)=0.575假设:A病入院率60%,B病25%,危险因素C的入院率40%1)概念:指某因素与某病在病因学上虽无关联,但由于该因素的存在而引起该疾病症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群较高的检出率,以至得出该因素与该疾病相关联的错误结论。2)本质:病例发现机会(时间)不同→联系强度变化3)原因:某因素如果能引起或促进某症候的出现,使患者因此去就医,这就提高了该病的检出机会。4)常发生此偏倚的研究设计类型:在对肿瘤、动脉硬化、结石等采用病例对照研究进行病因学研究时容易发生。2.检出症候偏倚1)病例组:子宫内膜癌患者,对照:无子宫内膜癌患者;2)结果:子宫内膜癌患者口腹雌激素比例高;3)结论:口服雌激素是子宫内膜癌的危险因素。4)偏倚:无症状早期子宫内膜癌病人服雌激素后易致出血就诊。即病例入选受暴露因子影响,具有该暴露因子的病例会早期出现临床症状,入选病例与未入选病例之间存在系统差别。实例:口服雌激素与子宫内膜癌病例对照研究1)概念:指采用现患病例作为研究对象时由于现患病例与总体病例对某因素的暴露率不同而导致的系统误差。以称存活偏倚或患病率发病率偏倚。2)本质:暴露率不同→联系强度变化3)原因:(1)病死率高,病程短的严重致死性疾病,如心梗;(2)病程短许多患者已痊愈;(3)轻型不典型病例;4)常发生此偏倚的研究设计类型:病例对照研究。3.存活病例偏倚(Neyman偏倚)病例组:医院心梗病人;对照组:医院非心梗病人;结果:大量饮用咖啡与心梗无关偏倚:调查对象为存活者,只是一般饮用咖啡或减少饮用量,入院前死亡病人多是大量饮用咖啡者。实例:大量饮用咖啡与心梗关系的病例对照研究1)概念:无应答者是指研究对象中那些没有按照研究设计对被调查的内容予以应答者。某个特定样本中的无应答者的患病状况、暴露情况与应答者可能不同而产生的偏倚称为无应答偏倚。2)原因:造成无应答的原因是多方面的,如身体健康状况、对健康的关心程度、对调查内容是否感兴趣、年龄、受教育程度等。4)常发生此偏倚的研究设计类型:在观察性与实验性研究中均可发生。4.无应答偏倚人群调查表返回:男性回答率90%以上;女性回答率50%,且多数为女性吸烟者未回答。结果:低估女性吸烟率。实例:调查吸烟在男女人群中的比例1)概念:一般来说志愿者参加研究,入选研究对象,而非志愿者常落选,由于两者在生活行为习惯及对疾病健康的态度不同而互相间均不具备代表性从而引起偏倚。前瞻性研究研究2)常发生此偏倚的研究设计类型:队列研究和临床试验等。5.志愿者偏倚研究组:志愿者;对照组:非志愿者;结论:体锻减少冠心病发生。偏倚:志愿参加研究者更关心自己的健康,注意饮食及营养,禁烟酒、坚持体锻。实例:体锻与冠心病队列研究1)概念:失访是一种无应答,只发生在前瞻性研究(如队列研究、干预研究)中;2)内容:包括失访或退出;3)主动失访常常与暴露因素或结果有关。应减少到最小程度;研究中应了解退出的原因;处理时可做“最坏打算”校正或评价6.失访偏倚化学物质接触与白血病发生的队列研究研究组:接触苯的工人,对照组:普通工人;结果:两组发生白血病比例相似;结论:接触苯与白血病发生无关偏倚:进入研究组的工人是留下来不易患白血病人群,患病工人早已转出。7.健康工人(效应)偏倚研究运动与冠心病关系设计:码头工人,根据劳动强度分组,然后观察22年冠心病发生率;结论:运动(劳动强度)与冠心病发生无关。偏倚:劳动强度的变化。8.转组偏倚研究监护室建立在心梗中作用研究组:1999-2000年监护室建立后死亡率15%;对照组:1997-1998年监护室建立前死亡率25%;结果:建立监护室减少心梗死亡率。偏倚:没有考虑心梗诊断和治疗改进的作用。9.非同期对照偏倚抗凝药治疗心梗治疗组:甲医院;对照组:乙医院;结果:抗凝药减少或不能减少死亡率。偏倚:两家医院死亡率差别?10.异地对照偏倚溃疡病病因病例对照研究病例组:溃疡病人,调查发现:面食多;对照组:非溃疡病人,面食少;结论:多面食与溃疡发生有关。偏倚:溃疡发生在先,面食在后。11.易感性偏倚某饮食与原发性肝癌关系的病例对照研究病例组:原发性肝癌病人;对照组:同单位其他人。结果:该饮食与原发性肝癌发生无关。偏倚:许多慢性病,自接触有效暴露到出现临床症状,其间经过漫长过程。在此期间,他们实际是有暴露史但未出现症状,也未能用现有手段发现异常的病人。这类病人常被归入健康对照内。在遗传病研究中也存在同样(疾病发生的外显年龄)问题。研究结果的过低估计。12.时间效应偏倚研究肿瘤等慢性病,自症状出现,临床处理,平均存活12月;筛检诊断,临床处理,平均存活15月;结论:筛检措施能延长生存时间。偏倚:延长3月时间系提早发现及诊断时间。13.领先时间偏倚转诊病例多为重病或