医学科研中常见的偏倚类型及控制方法(BiasandControl)DepartmentofHealthStatistics,SMMU2012.06.09主要内容偏倚的类型混杂因素与交互作用偏倚的控制误差(error)?定义:指对事物某一特征的度量值偏离真实值的部分,即测量值与真实值之差。?分类:随机误差(randomerror)系统误差(systematicerror),即偏倚(bias)?举例:用动脉血压计测量某人血压(实际值为80mmHg),各次测量的均值为100mmHg。下图为系统误差和随机误差的示意图。随机误差80100舒张压(mmHg)系统误差发生频次血压计法测量舒张压值的分布随机误差?定义:指由于个体差异和在研究过程中许多微小的不可控制因素造成的误差(测量误差和个体差异)?特点:?不可避免?具有规律性,一般呈正态分布?重复是控制和缩小随机误差的主要方法偏倚(系统误差)?定义:指由于对实验因素或条件控制不严而发生的一种误差?特点:?研究结果系统的偏离真实情况?研究结果具有一定倾向性和周期性?研究过程中应加以控制甚至消除?分类:选择偏倚、信息偏倚、混杂偏倚一、选择偏倚(selectionbias)研究者在挑选研究对象时由于选择条件受限制或设计失误所致的系统误差。?常见种类:?就诊机会偏倚?现患病例-新发病例偏倚?诊断信息偏倚?……就诊机会偏倚?又称伯克森偏倚(Berksonratebias),或入院率偏倚,指利用医院门诊或住院病人作为研究对象时,由于患者就医机会不同导致研究结果的偏差?患者是否就医取决于就医条件和对某医疗单位的信任等多种因素,而患者就医机会不同将造成研究的结果不同?用住院病例进行研究时可能没有包括:?抢救不及时而死亡的病例?距离医院远的病例?无钱住院的病例?病情轻的病例表1呼吸道疾病与骨骼运动器官疾病的关系(一般人群)呼吸道疾病骨骼运动器官疾病OR有无合计发生率(%)有172072247.591.06无184237625607.19合计201258327847.2282400502.P,.???表1呼吸道疾病与骨骼运动器官疾病的关系(住院6个月以上病人)呼吸道疾病骨骼运动器官疾病OR有无合计发生率(%)有5152025.004.06无182192377.59合计232342578.9502708942.P,.???现患病例-新发病例偏倚?又称奈曼氏偏倚(Neyman'sbias),主要是由于研究中所用的病例类型不同所产生的差别?病例对照研究结果与队列研究的结果会有差异表2冠心病与高胆固醇血症的关系(病例对照研究)冠心病血胆固醇水平OR?2P高低合计发生率(%)有3811315125.171.160.290.589无3411715122.52合计7223030223.84表2冠心病与高胆固醇血症的关系(队列研究)血胆固醇水平冠心病RR?2P有无合计发病率(%)高8546254715.542.1835.500.001低116151116277.13合计201197321749.25诊断信息偏倚(detectionsignalbias)?指某疾病与暴露因素之外存在另外一个临床症状或体征,这种症状或体征不是该疾病的危险因素,但人们往往因为这种症状或体征就诊,从而间接提高了该疾病早期病例的检出率,但过高估计了暴露因素的程度,造成暴露因素和该疾病关系的偏倚表3a妇女绝经期服用雌激素与子宫内膜癌的关系(以阴道出血就诊的病例)子宫内膜癌服用雌激素OR有无合计发生率(%)有457211738.469.82无71101175.98合计5218223422.22001.0,70.352??P?表3b妇女绝经期服用雌激素与子宫内膜癌的关系(以刮宫和子宫切除的病例)子宫内膜癌服用雌激素OR有无合计发生率(%)有598914839.861.67无4210614828.38合计10119529634.12037.0,34.42??P?选择偏倚的控制?对研究过程中可能出现的偏倚有充分的了解,在设计时考虑周全?严格掌握研究对象的纳入和排除标准,保障较好的代表性?病例对照研究中首选新病例,对照组不应为慢性病病例?队列研究中增大样本量,降低失访,必要时将失访人群特征与未失访人群对照?采用多重对照二、信息偏倚(informationbias)在对研究对象的信息收集、测量时出现的系统误差?可以来自被研究对象?也可以来自研究者本身?非盲法研究较易发生信息偏倚常见的种类?无应答偏倚?回忆偏倚?说谎偏倚?诊断怀疑偏倚?沾染偏倚?测量偏倚来自被调查对象来自调查者本身来自研究对象的偏倚之无应答偏倚?无应答偏倚:研究对象拒绝回答或因研究对象失访而缺失答案所造成的偏倚?是否有无应答偏倚取决于无应答者在疾病暴露因素方面的特征是否与应答者有差异?美国曾采用邮寄问卷形式,调查美国退伍军人吸烟习惯。30天后总结收集的回复,结果发现,不吸烟者有85%回复了问卷,而吸烟者仅67%?对于一些敏感问题的调查,容易引起不应答偏倚,例如我国南方调查农村婴儿死亡原因,有28%的人拒绝提供婴儿死亡原因来自研究对象的偏倚之回忆偏倚?回忆偏倚:因研究对象的记忆失真或记忆不完整所造成的研究结果偏倚?病例对照研究和回顾性队列研究最容易出现回忆偏倚?回忆偏倚的产生与调查时间至事件发生时间、以及与事件的重要性有关,同时也与调查员的调查过程和询问技术有关?Wilcox等在调查流产回忆准确性时发现,调查10年前流产的有82%回忆完整,调查20年前流产的有73%回忆完整。在受孕前6周流产者能回忆起来的有54%,而在受孕13周流产者能回忆起来的有93%?病例组和对照组的回忆误差也可能不一致,病例组往往比对照组记忆准确。原因是调查事件的重要性对两组人是不一样的,选择不易忘记的指标做调查,并重视问卷和询问技术,有助于减少的回忆偏倚来自研究对象的偏倚之说谎偏倚?说谎偏倚:研究对象故意造成的?容易发生在敏感问题上,如吸毒史、性行为和中、小学生吸烟等?与研究对象个人目的有关来自研究者的偏倚之诊断怀疑偏倚?诊断怀疑偏倚:研究者已知研究对象的某些情况,因而在诊断过程中刻意寻求某种结果而造成的偏倚?非盲法研究和队列研究中容易发生?在研究口服避孕药与下肢血栓性静脉炎关系的队列研究中,观察者会对口服避孕药的妇女更加频繁、仔细的收寻静脉炎证据,尤其是对病情较轻,需仔细检查才能确诊的病例。而对未口服避孕药的妇女检查较马虎,造成暴露与疾病结果的偏倚?在开放性的药物临床试验中,也容易发生诊断怀疑偏倚来自研究者的偏倚之沾染偏倚?沾染偏倚:研究对象有意或无意地接受了研究内容不允许接受的措施而造成的研究结果偏倚?对照组接受试验组的措施,导致组间差异缩小?试验组接受更好的支持治疗,研究结果偏向试验因素,称为干扰偏倚来自研究者的偏倚之测量偏倚?测量偏倚:研究者对研究的指标和数据进行测量时产生的系统误差?常见的情况有:使用的仪器未校正、测定方法的标准和操作规范不统一、操作人员技术不熟练等信息偏倚的控制严格的调查设计和研究人员的科学态度,严格的质量控制措施尽量采用“盲法”收集资料尽量收集客观指标的资料采用调查技巧避免无应答、回忆和说谎偏倚收集资料的范围可以适当广泛些,借以分散调查人员和研究对象对某项因素的注意力,减少某些偏见带来的偏倚三、混杂偏倚(confounderbias)暴露因素与疾病发生的关联程度受到其他因素的歪曲或干扰而造成的系统误差?在研究设计阶段和资料分析阶段未能对混杂因素加以控制或未进行校正,使得研究结果与真实情况不符?混杂偏倚会影响病因研究的因果关系、疾病治疗的效果和预后因素的评价混杂因素存在的条件?混杂因素对研究结果有影响?混杂因素与暴露因素伴随存在?混杂因素在比较人群中的分布不均衡表4心梗与维生素E的关系的队列研究维生素E心梗RR有无服4006000.67不服600400表5维生素E与吸烟的关系维生素E吸烟有无服270(27%)730(73%)不服880(88%)120(12%)001000802.,.??P?0010337612.,.??P?表7控制吸烟因素后心梗与维生素E的关系维生素E吸烟不吸烟心梗RR心梗RR有无有无服240301.351605701.32不服58030020100表6控制维生素E因素后心梗与吸烟的关系吸烟用维生素E不用维生素E心梗RR心梗RR有无有无吸烟240304.065803003.95不吸160570201000010343682.,.??P?0010691062.,.??P?001032532.,.??P?19207012.,.??P?交互作用?暴露因素按第三个因素分层后,暴露因素和疾病的关联强度在层间明显不同,此时称第三个因素有交互作用,称为效应修正因子(effect-modificationfactor)表8暴露与疾病的关系暴露疾病RR有无有2008004.00无50950表9a暴露与疾病的关系(F因素不存在)暴露疾病RR有无有1947061.03无2179表9b暴露与疾病的关系(F因素存在)暴露疾病RR有无有6941.86无298710010861022.,.??P?89800202.,.??P?15200622.,.??P?表10某疾病与暴露因素的关系暴露疾病RR有无有20018001.00无4003600表11a疾病与暴露的关系(F因素不存在)暴露疾病RR有无有951553.00无3802620表11b疾病与暴露的关系(F因素存在)暴露疾病RR有无有10516453.00无2098000010002.,.??P?0010681182.,.???P?001047232.,.???P?混杂因子和交互因子的区别?概念区别:混杂因子歪曲了暴露因素与疾病的关系,应防止和控制;交互因子揭示了某种效应,应加以挖掘?识别方法:分层分析?下结论前应进行统计学检验偏倚可出现在整个研究过程,应当在各个阶段进行控制,将偏倚的影响减少到最低程度,力求研究结论的真实可靠偏倚的控制设计阶段控制:限制、随机分组和配对测量和结果判断的控制:盲法资料分析阶段的控制:分层分析、标准化分析、多因素分析设计阶段的控制?限制(restrict):指在设计阶段对研究对象的纳入标准加以限制?使研究对象选取限制在一定范围内,范围越窄,研究对象彼此的差别越小,越利于观察因素作出结论?由于对混杂因素进行限制,研究的结果使得研究者不可能对暴露与混杂因素的交互作用加以分析和度量,只能对暴露和疾病之间的关系进行研究?限制的缺点还在于,在限制混杂因素的同时,对暴露和疾病发生的范围也进行了限制,不能观察到疾病影响的全貌设计阶段的控制?随机分配(randomizedallocation):主要适用实验研究,即将研究对象随机分配到试验组和对照组?随机分配的目的:使研究对象的非处理因素和混杂因素在各组间趋于均衡,组间基线情况有良好的可比性,而使得处理因素的真实差别得以显示设计阶段的控制?配对或匹配(matching):?配对是控制混杂因素常用的方法,特别在病例-对照研究中较常用?匹配病例组和对照组的研究对象,匹配的特征一般包括年龄、性别、病情等因素?配对的缺点:?配对因素较多会使部分病例找不到对照,致使信息的浪费?过度配对会掩盖暴露的真实作用?不能对配对掉的混杂因子及交互作用做分析测量和结果判断的偏倚控制?盲法(blinding):是指病人、医生或研究者不知道病人接受的是治疗药或对照药的前提下,观察或测量研究对象结果的方法?盲法是避免观察者和被观察对象发生信息偏倚最有效的方法。特别是判断结果是主观的评价指标(头痛、腹痛、乏力)尤为重要资料分析混杂因素的控制?分层分析:是资料分析阶段控制混杂因素常用的方法。即将观察对象按照相似性的特点,分成亚组后再进行试验组和对照组的比较?分层因素主要为与比较指标有关的因素,如年龄、性别、病情等。按某混杂因素分层后,再用相应的统计方法进行处理Table12CharacteristicsofrespondentswithhypertensionIndexHypertensionYesNoORP-va