第九章常见偏倚及其控制

yjc1221
2 ℃
2019-12-21

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第九章常见偏倚及其控制(BiasesandTheirControl）第一节研究结果的变异性1、研究结果的变异性（Variability）数据（指标）的变动或波动。它可存在于不同水平，包括个体水平，群体水平和样本（研究）水平。2、变异性的来源：⑴生物学（真实）变异和测量变异：物学变异反映真实的客观变异，测量变异反映测量过程的误差。⑵随机变异和系统变异：随机变异（误差）的绝对值和方向（符号）交错变化，并呈有界范围的正态分布。系统变异（误差）的绝对值和方向保持恒定。测量误差分为随机误差和系统误差。3变异的水平：⑴个体水平的变异性：指某个体特征测量值的变化，它可以是个体真值随时间的改变，也可以是由于测量误差引起的变化⑵群体水平的变异性：可以看成是各个体的累计变异，因为构成群体的各个体具有不同的遗传素质并受到不同的环境影响。群体的变异程度常常大于个体的变异。也受到测量误差的影响。⑶样本水平的变异性：指通过不同样本的研究所得结果的差异性。第二节研究的真实性一、概述研究真实性或效度（Validity）指研究收集的数据、分析结果和所得结论与客观实际的符合程度。研究误差是研究真实性的反面。研究误差的两种常见类型：随机误差(randomerror)系统误差(systematicerror)随机误差(randomerror)：指随机抽样所得统计量与总体参数的差异由抽样（机遇）所致，通常与测量过程及其它变量的影响无关，无方向性可通过统计学方法估计和评价是不可避免的，但通过合理的设计、正确的抽样（加大样本量等）可使之减小系统误差(systematicerror)随机误差以外的误差，任何研究都有发生的可能在流行病学调查研究中系统误差又叫偏倚（bias）可以通过严格的设计、实施、分析来尽可能地控制重复试验及增加样本含量并不能减小系统误差研究的可靠性或信度（reliability）亦称精确度（precision），就是反映研究结果中随机误差大小的程度，随机误差小则研究信度高。二、内部真实性内部真实性internalvalidity指研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。改善措施：限制研究对象的类型和研究的环境条件。三、外部真实性外部真实性（externalvalidity）研究结果与推论对象真实情况的符合程度，又称为普遍性（generalizability）。它回答一个研究能否推广应用到研究对象以外的人群。改善措施：增加研究对象的异质性，使得研究对象的代表性范围扩大。如：多中心临床试验的开展第三节研究的偏倚1946年，Berkson做最著名的偏倚研究并给予证实，又称为Berkson偏倚。选择偏倚1976年，Miettinen详细讨论了偏倚的定义，并给出分类框架，分三类信息偏倚混杂偏倚一、选择偏倚（selectionbias）㈠定义：研究对象的选取过程中，由于选取方式不当，导致入选对象与未入选对象之间存在系统差异，由此造成的偏倚称为选择偏倚。例如研究对象采用志愿者，方便样本，或者研究对象的无应答或失访等。㈡常见的种类：1、入院率偏倚（admissionratebias）也叫Berkson偏倚，当利用医院病人作为病例和对照时，由于各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异而导致的系统误差常见于以医院为基础的病例对照研究、临床防治试验、预后判断等。2、现患病例—新病例偏倚（prevalence-incidencebias）也称奈曼偏倚（Neyman’sbias）在病例对照研究或现况研究中，用于研究的病例一般是现患病例或存活病例，由于形成的病例样本与单纯由新病例构成的样本暴露特点等不同，致使调查结果出现的系统误差在病例对照和现况研究中产生此偏倚的原因：⑴用于研究的病例一般是研究时的存活者-现患病例（暴露特点和死亡病例不同）⑵某些病人在患病后，可能会改变其原来某些因素的暴露状况3、检出征候偏倚（detectionsignalbias）在疾病和暴露之外存在一个征候因素，即一种临床症状或体征；这种症状或体征不是疾病的危险因素，但人们因具有这种征候去就诊，从而提高了早期病例的检出率；致使过高地估计了暴露程度，因而发生了系统误差，最终可能得出该征候因素与该疾病有联系的错误结论4、无应答偏倚和志愿者偏倚(non-respondentandvolunteerbias)：无应答者是指研究对象中那些因为各种原因不能回答调查研究工作所提出的问题的人。一项研究工作中的无应答者可能在某些重要特征或暴露上与应答者不同，由此产生的偏倚称为无应答偏倚。常见于现况研究和队列研究。大学生健康状况调查志愿者偏倚是与无应答偏倚相对的情况5、时间效应偏倚：㈢选择偏倚控制方法1、建立健全的健康信息系统（healthinformationsystem,HIS）2、采用严格的科学的研究设计，了解整个研究中可能出现的选择偏倚严格掌握研究对象纳入排除标准取得研究对象合作，减少无应答、失访病例对照研究中尽量选择新诊断的病人作研究对象；用医院病人作研究对象时，尽量采用多种对照二、信息偏倚（informationbias）㈠定义又称测量偏倚（measurementbias）或观察偏倚（observationbias），是来自于测量或资料收集方法的问题，使得获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量，所以信息偏倚又可称为错误分类（错分）偏倚（misclassificationbias）。表现为研究对象的特征被错误分类由于所收集的有关暴露或疾病的信息不准确或不完整，造成对研究对象的归类错误差异错分（differentialmisclassification）暴露或疾病的错误分类同研究分组有关，各比较组间存在差异；由于错误分类组间存在差异的偏向可能不同,所以造成高估或低估研究效应值无差异错分（non-differentialmisclassification）暴露或疾病的错误分类同研究分组无关，各比较组间不存在差异；在多数情况下模糊了研究组的差异，一般使研的效应值偏低(OR趋向1)㈡差异性信息偏倚的两种常见类型回忆偏倚（recallbias）产生于研究对象记忆过去活动和暴露能力的差异。不可避免调查者偏倚（interviewerbias）产生于调查者对研究对象有差异性地收集信息。采取盲法，可以降低调查者偏倚。㈢信息偏倚的控制：①明确资料收集方法和严格质量控制②尽可能采用“盲法”收集资料③尽量收集客观指标的资料铅暴露④采用调查技巧避免回忆偏倚⑤严格的调查设计和研究人员的科学态度⑥调查之前应开展预调查三、混杂偏倚（confoundingbias）㈠定义是指暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。混杂的本来含义是“混合掺杂”(mixingtogether)，这里是指暴露因素对疾病的独立效应与混杂因素的效应混在一起，造成对暴露因素效应的估计偏差。㈡混杂因素的判断条件：必须同时具备以下三个条件：①必须是所研究疾病的独立危险因素②必须与所研究的暴露因素存在统计学联系以上是判断可疑混杂因素的两项基本条件③不应是暴露因素与疾病因果链中的一个环节或中间变量（否定或排除条件）（饮酒-肝硬化-肝癌）㈢混杂偏倚引起的假关联Ⅰ继发关联（secondaryassociation）是一种纯粹由混杂偏倚产生的关联。即怀疑的病因（暴露）E与疾病D并不存在因果关系，而是由于两者（E,D）有共同的原因C，E,D同C存在关联，从而继发产生E与D的关联。Ⅱ直接因果关联的歪曲:如果怀疑的病因（暴露）E与疾病D既存在直接关联，又存在间接关联或与其他危险（保护）因素F存在相关，E与D的总关联等于E-D直接关联同E-F-D间接关联之和。如果直接关联与间接关联混在一起，而将其作为直接关联的估计，就会出现混杂偏倚。㈣判定原则：比较混杂因素调控前后的暴露因素效应估计值，如果存在专业上有意义的差异（注意不是统计学的显著性差异），就产生了混杂偏倚。㈤混杂偏倚的控制设计阶段：采用随机化(randomization）、限制(restriction)进入或匹配(matching)分析阶段：采用分层分析、标准化率分析、多变量分析四、混杂偏倚的分层分析M-H(Mantel-Haenszel)分层分析方法的步骤对可能的混杂因素进行分层判定层间RR或OR是否相等或相近得到控制混杂后的调整RR或OR再将调整RR或OR与分层前的粗RR或粗OR（cRR或cOR）进行比较五、混杂偏倚与其它偏倚（选择及信息偏倚）的异同相同：是一种系统误差，不能通过增大样本量来控制不同：①后两种偏倚主要都限于样本内，即人群中实际无此误差。②而混杂偏倚不止是样本的问题。首先是某第三因子在目标人群中同所研究的结果变量存在固有的联系。③一般偏倚（选择及信息偏倚）是一种错误，所造成的误差是我们不愿看到的，因此应尽量避免。④对混杂偏倚来说，它告戒我们在下结论时应特别谨慎，但同时它在认识整个病因网的过程中起了一定的作用。因为混杂因子往往正是某个结果变量的危险因子，应尽量去发现。⑤有时受科学知识的限制，在设计和分析阶段未对其作适当的处理，结论仍会有第三因子、第四因子的混杂。