队列研究cohort概述队列研究是将一个范围明确的人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究方法。特定人群范围内的研究对象出现某种结局不出现某种结局暴露状况研究开始前瞻性地收集结局事件发生的资料图2队列研究的结构模式图出现某种结局不出现某种结局暴露组非暴露组研究类型前瞻性队列研究历史性队列研究双向性队列研究暴露组非暴露组暴露组非暴露组回顾性地收集已有的历史资料回顾性地收集已有的历史资料暴露组非暴露组前瞻性收集资料历史性队列研究继续收集资料双向性队列研究前瞻性队列研究过去某时点现在将来某时点图3队列研究类型示意图设计与实施-确定研究因素研究因素在队列研究中常称为暴露因子或暴露变量,在研究中要考虑如何选择、规定和测量。一般应对暴露因素进行定量,除了暴露水平以外,还应考虑暴露的时间,以估计累积暴露剂量。同时还要考虑暴露方式。设计与实施-确定研究结局结局变量(outcomevariable)也叫结果变量,简称为结局。是指随访观察中将出现的预期结果事件,也即研究者希望追踪观察的事件。结局就是队列研究观察的自然终点,它与观察期的终止不是一个概念。设计与实施-确定研究现场有足够数量的符合条件的研究对象当地的领导重视群众理解和支持最好是当地的文化教育水平较高,医疗卫生条件较好,交通较便利。设计与实施-研究人群暴露人群的选择对照人群的选择设计与实施-确定样本大小影响样本含量的几个因素1.一般人群(对照人群)中所研究疾病的发病率p02.暴露组与对照组人群发病率之差3.要求的α值4.效力(power)又称把握度(1-β)设计与实施-确定样本大小(续)样本含量的计算式中p1与p0分别代表暴露组与对照组的预期发病率,为两个发病率的平均值,q=1-p,Zα和Zβ为标准正态分布下的面积,可查表求得。201211002ppqpqpzpqzn设计与实施-收集基线资料基线资料一般包括待研究的暴露因素的暴露状况,疾病与健康状况,年龄、性别、职业、文化、婚姻等个人状况,家庭环境、个人生活习惯及家族疾病史等。获取基线资料的方式一般有下列四种:1、查阅记录或档案2、访问研究对象或其它能够提供信息的人3、对研究对象进行体格检查和实验室检查4、环境调查与检测设计与实施-随访随访对象与方法失访者对暴露组和对照组应采取相同的随访方法,且在整个随访过程中,随访方法应保持不变。随访内容一般与获取的基线资料内容一致,但次处收集的重点是结局变量设计与实施-随访(续)观察终点观察终点(end-point)就是指研究对象出现了预期的结果,达到了这个观察终点,就不再对该研究对象继续随访。观察的终止时间:观察终止时间是指整个研究工作截止的时间。资料的整理与分析-人时的计算常用的人时单位是人年,常用的人年计算方法有下列三种。以个人为单位计算暴露人年用近似法计算暴露人年用寿命表法计算人年资料的整理与分析-率的计算常用指标:累积发病率(cumulativeincidence)发病密度(incidencedensity)标化比资料的整理与分析-效应的估计相对危险度(RR)也叫危险比(riskratio)或率比(ratesratio)式中Ie和Io分别代表暴露组和非暴露组的率。RR表明暴露组发病或死亡的危险是非暴露组的多少倍。010ncnaIeIRR资料的整理与分析-效应的估计归因危险度(AR)又叫特异危险度、率差(ratedifference,RD)和超额危险度(excessrisk),是暴露组发病率与对照组发病率相差的绝对值,它表示危险特异地归因于暴露因素的程度。资料的整理与分析-效应的估计010ncnaIIARe00,IRRIIIRRee1000RRIIIRRAR资料的整理与分析-效应的估计归因危险度百分比(AR%)又称为病因分值(etiologicfraction,EF),是指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。资料的整理与分析-效应的估计人群归因危险度(populationattributablerisk,PAR)与人群归因危险度百分比(PAR%)后者也叫人群病因分值(populationetiologicfraction,PEF)。PAR是指总人群发病率中归因于暴露的部分,而PAR%是指PAR占总人群全部发病(或死亡)的百分比。资料的整理与分析-效应的估计PAR=It-I0It代表全人群的率,I0为非暴露组的率%100%0ttIIIPAR%100111%RRPRRPPARee偏倚选择偏倚(selectionbias)有人拒绝参加;有些人的档案丢失了或记录不全;研究对象由志愿者组成,他们往往或是较健康的或是有某种特殊倾向或习惯的;早期病人,在研究开始时未能发现等,后者又可称为错误分类偏倚。这些都是在抽样方法正确的基础上仍可能出现的偏倚。偏倚失访偏倚(losttofollow-up)这是队列研究中不可避免的偏倚。失访从本质上是破坏了原有样本的代表性,因而实质上属于选择偏倚。一项研究的失访率最好不超过10%。偏倚信息偏倚(informationbias)在获取暴露、结局或其他信息时所出现的系统误差或偏差叫信息偏倚。信息偏倚又称为错分偏倚(misclassificationbias)。优点1.资料可靠,一般不存在回忆偏倚。2.可以直接获得暴露组和对照组人群的发病或死亡率,可计算出RR和AR等反映疾病危险关联的指标,可以充分而直接地分析暴露的病因作用。3.检验病因假说的能力较强。4.有助于了解人群疾病的自然史。5.样本量大,结果比较稳定。6.有时还可能获得多种预期以外的疾病的结局资料,分析一因与多种疾病的关系。局限性1.不适于发病率很低的疾病的病因研究。2.对象不易保持依从性,容易产生各种各样的失访偏倚。3.研究耗费的人力、物力、财力和时间较多,其组织与后勤工作亦相当艰巨。4.由于消耗太大,故对研究设计的要求更严密,资料的收集和分析也增加了一定的难度,特别是暴露人年的计算较繁重。5.在随访过程中,未知变量引入人群,或人群中已知变量的变化等,都可使结局受到影响,使分析复杂化。