实习8偏倚及其控制

peterhu007
1 ℃
2020-04-29

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

偏倚及其控制•目的：了解偏倚的类型及常见偏倚的测量与控制方法•时间：3-6学时•内容：大课回顾、实习题目•误差的概念一般地讲，真实值与研究结果（实际测量值）之间的差异。•误差的种类随机误差：随机误差主要来源于研究的抽样过程。系统误差：由研究设计(方法的本身特点、设计的缺陷等)与实施过程的失误所致。流行病学调查研究中的各种系统误差又称偏倚。误差（error）errorinmedicalresearchSystematicRandomErrorSamplingMeasurement随机误差(randomerror)•定义由于某事件发生的概率造成的测量值和真实值之间的误差，是随机性的，通常造成的差异在真实值的两侧波动，并且是较小的误差，可以通过统计学中计算标准误的方法估计其大小。•随机误差主要与研究对象的变异程度、抽样方法、样本大小等有关。•随机误差是流行病学研究中的精确性(precision)问题。由于随机误差难以避免，所以流行病学研究的精度具有相对性。系统误差（systematicerror）•定义人为造成的错误，是由于研究设计、实施和分析不正确造成的测量值与真实值之间的差异。误差向量的方向一致或基本一致。•系统误差是流行病学研究中的真实性（validity）问题。•通常把流行病学研究中的各种系统误差称称为偏倚(bias)。RandomerrorandBiasRandomerrorBias偏倚（bias）•偏倚的定义：指在研究中所获得的结果系统地偏离真实值的情况。•偏倚的大小：偏倚的大小通常以相对数表示。设OR’:实际测量值;OR:真实值BIAS=（OR’–OR）/OR则若该值为0,无偏倚若该值为正,正偏倚若该值为负,负偏倚•偏倚的分类（1）选择偏倚（Selectionbias）（2）信息偏倚（Observationbiasorinformationbias)（3）混杂偏倚（Confoundingbias）选择偏倚•定义在流行病学研究中，由于选择研究对象的方法不当，使得被选择的对象在某些特征上与没有被入选者之间相差很大，或是两组或几组研究对象的选择标准不统一，而致使研究结果偏离真实情况。选择偏倚的分类•入院率偏倚•现患-新发病例偏倚•检出症候偏倚•无应答偏倚•易感性偏倚（以健康工人效应为例）•排除偏倚•志愿者偏倚•迁移性偏倚•非同期对照偏倚•入院率偏倚（AdmissionratebiasorBerkson’sbias)是指在进行病因研究、临床试验、预后判断等研究时，利用医院就诊或住院病人作为研究对象，病例与对照入院率或就诊机会不同而导致的偏倚。因不同住院率而住院的A、B病患者及其与因素X的关系疾病暴露于X者非暴露于X者合计X暴露率(%)ORP实际人群A（对照）20080010002011B（病例）200800100020合计4001600200020住院率（对照A=50%；病例B=20%；暴露于因素X者40%）A（对照）14040054025.91.860.001B（病例）10416026439.4合计24456080430.4200×0.5+100×0.4800×0.5200×0.2+160×0.4800×0.2造成不同疾病入院率不同的原因：医院技术特长；患者疾病严重程度、经济状况,就诊方便程度等（医院病人双向选择）。•现患-新发病例偏倚（Prevalence-incidencebiasorNeyman’sbias)是指病例对照或现况研究中的病例为现患典型病例，不包括死亡、病程短、轻型等病例。因此对估计暴露因素的作用会有一定偏倚；或病例因疾病改变了生活习惯，从而低估了暴露因素的作用。•检出症候偏倚（Detectionsignalbias）某因素本与疾病无关，但可引起所研究疾病的症状或体征，从而促使患者早就诊，提高了早期病例检出率，过高的估计了暴露程度。例：病例对照研究发现：服用雌激素与子宫内膜癌发病有正关联。原因：雌激素促进子宫内膜生长，导致出血，频繁接受检查，促使早期发现子宫内膜癌患者。•无应答偏倚（Non-responsebias）研究对象未按要求回答调查内容，而无应答者的患病或因素的暴露情况与应答者又不同，从而造成该偏倚。•健康工人效应在研究某些职业暴露的危害而以一般人群作参比时，由于职业工人相对于一般人群健康，从而降低了暴露因素与疾病之间的真实联系。•非同期对照偏倚（noncontemporarybias）例：当前用口服红霉素治疗猩红热，其治愈率优于40年前青霉素等药综合治疗的结果，但这种现象并非由于红霉素的疗效真正优于青霉素所致，而是因为猩红热的病原体随着时间的推移发生变异，毒力减弱所致。TotalpopulationSampledpopulationEligiblesubjectsSubjectsaskedtoparticipateparticipantsCompletestudyExclusionsLosttofollow-upNon-participantsSamplingschemeInclusioncriteriaInformedconsent信息偏倚•定义指在流行病学调查、采集各种信息资料的过程中，由于测量暴露或结局的方法有缺陷，使所获得的信息偏离真实值的一种结果。信息偏倚的分类•回忆偏倚（recallbias）•诱导偏倚（inducementbias）•报告偏倚（reportingbias）•测量偏倚(detectingbias)•临床资料遗漏偏倚(missingclinicaldatabias)•家庭信息偏倚(familyinformationbias)•暴露怀疑偏倚（exposuresuspicionbias）•诊断怀疑偏倚（diagnosticsuspicionbias）•报告偏倚(reportingbias)由于研究对象有意扩大或缩小某些信息造成的偏倚。例：缩小信息：性乱史；青少年吸烟史扩大偏倚：职业危害（为获取福利）•暴露怀疑偏倚（ExposureSuspicionbias）研究者事先了解研究对象的患病或结局，可能会对其以与对照组不可比的方法探询认为与某病或结局有关的因素。对同一组研究对象以不同的方法调查，结果会出现很大差异。•诊断怀疑偏倚（Diagnosticsuspicionbias）由于研究者事先了解被研究者的暴露情况，怀疑被研究者已经患某种与因素相关的疾病，因而在诊断或分析时做出带倾向性的判断。如对暴露组的检查细致程度大于对照组。混杂偏倚•定义在研究的设计阶段未能对混杂因素加以控制和在资料分析阶段未能进行正确校正所造成的偏倚。混杂因素（confoundingfactor）•定义指与研究因素和研究疾病均有关联，可以掩盖或夸大研究因素与疾病之间真正关联的因素。•特点混杂因素必须是所研究疾病的独立危险因素混杂因素必须与所研究暴露因素存在统计学联系混杂因素不应是暴露因素与疾病因果链中的一个环节或中间变量如何判断混杂因素几种情况：EEEEE:研究因素DDDDD:疾病FFFfFF:外来因子EEEEf:伴随因子DDDD:因果关系FFFF:一般相关（1-3混杂成立，4-8混杂不成立）混杂因素的测量暴露或特征f+f-病例对照病例对照有a1b1a2b2无c1d1c2d2合计a1+c1b1+d1a2+c2b2+d2暴露或特征病例对照有ab无cd合计a+cb+d•根据表1计算的OR为粗OR（cOR）按混杂因素分层后，计算各层OR:OR(f+)OR(f-)1.如果OR(f+)=OR(f-)=cOR，f不是混杂因素。2.如果OR(f+)=OR(f-)≠cOR，f为可疑混杂因素，计算aOR，若aOR≠cOR，则f是混杂因素。3.如果OR(f+)≠OR(f-)，应对分层OR进行同质性检验，若无显著性差异，计算aOR，如aOR≠cOR，则f为混杂因素；若差异有显著性，认为各层资料不属同质资料，考虑f为效应修饰因素。偏倚的控制选择偏倚的控制措施•随机化•设立多种对照•严格掌握研究对象的诊断、入选、排除标准•提高应答率，减少失访（失访率20%）信息偏倚的控制措施•采用盲法收集资料•收集客观指标的资料•使用统一的标准收集资料•保证研究人员的科学态度•适当采用一些调查技巧回忆偏倚资料的校正举例因素真实分布实测结果病例对照病例对照暴露ABab非暴露CDcd合计n1n2n1n2真实情况实测结果合计暴露非暴露暴露a1c1a1+c1非暴露a2c2a2+c2合计aca+c以病例组回忆偏倚为例Se=a1/(a1+c1)Sp=c2/(a2+c2)灵敏度(Se):真阳性率。实际有病而按该筛选试验的标准被正确地判为有病的百分比•设：按一定的Se，Sp获得暴露的测量结果，也可以得到一个测得的OR值，我们可以根据以下公式计算出该暴露的真实分布，从而求得真实的OR（aOR）•A=（Sp×n1-c）/(Sp+Se-1)•B=（Sp×n2-d）/(Sp+Se-1)•C=n1-A•D=n2-B•由这些数据就得到了暴露的真实分布，并求其aOR，并可按前述公式进一步求得回忆偏倚的值。•（课后习题四及此类题型，待会不再详述）混杂偏倚的控制措施设计阶段•限制•匹配•随机化分析阶段•分层分析•标准化•多因素分析实习题目课题一表8-1不同来源研究对象估计药物与疾病关系OR值药物疾病研究对象社区人群医院病例水杨酸类药过敏1.150.18水杨酸类药疲乏2.090.72轻泻药运动骨骼系统疾病1.535.07轻泻药关节炎风湿病1.485.00安眠药循环系统疾病6.383.27维生素类药过敏1.760.00维生素类药外伤0.611.92心脏病类药循环系统疾病30.6519.17心脏病类药关节炎风湿病3.4649.92问题•如何解释表8-1中两种不同来源研究对象研究结果的差异？原因？•据表显示，与以社区人群为研究对象相比，对以医院为研究对象研究结果所产生的偏倚大小与方向予以测量•如何控制该偏倚答案提示•该差异由于入院偏倚•根据前面所给公式分别计算各类药物OR值的偏倚•设多组对照，其中一个应来自社区人群，如果通过不同对照组所获得的差异不大，则可认为无入院偏倚；相反，则提示有此偏倚存在课题二（表略）•考查点：以“健康工人效应”为例讨论易感性偏倚•课题背景：某些报道显示，橡胶行业工人不但总死亡率较一般人群高，而且肿瘤、心血管等疾病死亡率也有升高的趋势。但本次研究结果显示橡胶行业工人全死因及其他一些死因观察死亡数低于期望死亡数。问题•如何解释此现象？能否说明橡胶行业职业暴露对人类健康不但没有危害而且还有保护性作用？•在研究某些职业暴露的危害时，以一般人口作参比易受“健康工人效应”的影响，如何控制？答案提示•问题1提示：暴露组期望死亡数=暴露组实际人口数×一般人口标准死亡率期望死亡数是以一般人口死亡率作参比计算所得，因此，如果暴露组与一般人口在影响疾病或死亡的人群特征上（如年龄、性别、疾病易感性等）构成不一致时，计算出的期望死亡数不能反映其真实的理论死亡水平。职业工人相对于一般人群是健康的，即对疾病的易感性低，所以，观察死亡数低于期望死亡数不能说明职业暴露是保护因素。•问题2提示•不以一般人群作对照，设立的对照组最好能使除了研究因素之外的其它影响疾病发病或死亡的因素与暴露组一致•以一般人群作对照，所选人群应与暴露组相同地区、相同年代、相同人群构成等•通过实际观察获得能够代表本地区的职工和一般人群死亡率的比值，以此为校正系数乘以研究人群各亚组预期死亡数进行校正课题三表8-5干预组应答者与无应答者随访死亡人数死因应答者（n=7455）无应答者（n=2501）冠心病1712肿瘤1010意外事故56自杀54其他1420感染25脑血管病61酒精中毒24慢性呼吸系统疾病21非冠心病心脏病13肝硬化04肺拴塞10尿毒症01消化性溃疡穿孔01合计5152问题•根据7455例应答者的资料能否反映干预组的情况？为什么？•提示：通过考虑无应答率，及两组的总死亡率和死因别死亡率是否有差异，来推断无应答者对研究的影响是否重大•可能产生无应答偏倚的原因有哪些？•如何控制和处理此偏倚？调查者调查方