临床流行病学研究设计类型(三)——队列研究福建医科大学公共卫生学院许能锋2013年9月23日上街校区第6教室Cohort队列是指在相同时期内出生或生活经历相同的一批人,也可泛指共同暴露于(或未暴露于)某一因素、某一环境,或者具有(或不具有)某种共同特征的一组人群。固定队列(fixedcohort)是指人群都在某一固定时间或一个短时期之内进入队列,并对他们观察随访,直至观察期终止,不再加入新成员。动态人群(dynamicpopulation)是指在某一时期确定队列后,可以随时增加新的观察对象,在追踪随访中有可能有退出者。固定队列FixedCohort研究开始研究结束出现结局未出现结局动态队列DynamicCohort研究开始研究结束出现结局失访exposure暴露是流行病学常用术语,泛指研究对象接触过某物质,具有某特征或行为,或处于某种状态,这些因素、特征或状态即为暴露因素。研究者所关心的任何因素都可以叫暴露因素,暴露因素也叫研究变量。暴露因素可以是机体的特征,也可是体外的;可是先天的、人体固有的,也可是后天获得的;暴露因素对人体可以是有害的,也可以是有益的。提纲(一)定义、分类与用途(二)设计与实施(三)资料分析(四)优点与局限性(一)定义、特性、分类与用途1.定义队列研究(cohortstudy)又称定群研究,是在特定范围的人群中按其是否暴露于某因素分成两个队列或按不同暴露水平分成若干个队列,随访观察一定时间,比较两组或多组间的结局发生率,以检验暴露因素与结局发生有无联系。队列研究是一种以因推果的病因研究方法。目标人群未患某研究疾病代表性样本YesNoYesNo暴露组非暴露组时间顺序是否暴露某个危险因子结局(疾病)队列研究的结构模式图现在将来调查方向:收集未来资料表1母亲孕期服用反应停与儿童肢体缺陷的历史性队列研究分组肢体缺陷儿童数无肢体缺陷儿童数合计发病率(%)怀孕后8周内服用反应停史者10142442.00孕早期无服用反应停史者5121434214850.24合计612144821509RR=42.00%/0.24%=175McBrideWG(1963)MedAustralia,12:6892.特性1.属于观察法暴露是客观存在的,这是与实验研究的根本区别。2.设立对照组设立对照组以资比较,与病例对照研究相同,而有别于描述性流行病学。3.由因及果在探求暴露因素与疾病的先后关系上,先确知其因,再观察其果,与实验研究一致,与病例对照研究相反。4.能确证暴露与疾病的因果联系由于观察者能确切知道暴露的作用和疾病的发生,且能准确计算发病率。3.分类队列研究按研究对象进入队列时间分为3种类型。⑴前瞻性队列研究(ProspectiveCohortStudy)⑵历史性队列研究(Historical(Retrospective)CohortStudy)⑶双向性队列研究(Mixed(Ambispective)CohortStudy)时间顺序过去现在将来历史性队列研究双向性队列研究前瞻性队列研究回顾性收集已有的历史资料回顾性收集已有的历史资料继续前瞻性收集资料前瞻性收集资料队列研究类型示意图前瞻性队列研究ProspectiveCohortStudy要点:研究队列的确定是现在(concurrent)根据研究对象现在暴露分组需要随访(follow-up)结局在将来某时刻出现优点时间顺序增强病因推断可信度;直接获得暴露与结局资料,结果可信;能获得发病率。缺点所需样本量大,花费大,时间长;执行难度较大。应用条件已有明确的假设需验证;所研究疾病的发生率较高,一般不低于5‰;明确规定暴露因素和结局变量;可靠的测量手段;足够的观察人群和暴露情况;能完成随访的人群;足够的人、财、物力。历史性队列研究Historical(Retrospective)CohortStudy要点:根据研究开始时研究者掌握的有关研究对象在过去某时刻的暴露情况的历史材料分组不需要随访,研究开始时结局已出现优点短期内完成资料的收集和分析;时间顺序仍是由因到果;省时、省力、出结果快。缺点资料积累时未受到研究者的控制,内容上未必符合要求;需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料。双向性队列研究Mixed(Ambispective)CohortStudy要点:研究队列的确定是过去;根据研究对象过去某时刻的暴露情况分组;需要随访;结局可能已出现。4.用途⑴验证某种暴露因素对某病发病率或死亡率的影响,但它同时也可观察某种暴露因素对人群健康的多方面影响。⑵描述疾病的自然发展过程,包括疾病的易感期、临床前期、临床期到结局的全过程。(二)前瞻性队列研究的设计与实施1.确定研究目的2.暴露人群的选择3.非暴露人群的选择4.样本含量5.资料的收集1.确定研究目的(队列研究工作是否开展)⑴是否有明确的假设供检验,检验的因素是否已找准。⑵所研究疾病的发病率或死亡率高低,低于5‰不适宜。⑶是否规定了明确的暴露因素,暴露资料能否完整获得。⑷是否规定了明确的结局变量,有无简便可行手段获得结局材料。⑸有无足够的研究人群。⑹随访人、财、物有无保证,随访依从性如何?2.暴露人群的选择⑴职业暴露人群:常为队列研究的首选对象。在某些职业中常存在特殊暴露因素,在职业人群中引发疾病的发病率或死亡率高于一般人群,便于证实暴露因素与疾病的关联。如选择染料厂工人来研究联苯胺的致癌作用。⑵特殊暴露人群:如选择原子弹爆炸的受害者,接受过放射线治疗的病人,以研究射线与白血病的关系。2.暴露人群的选择⑶一般人群:即某地区的全体人群,选择其中暴露于所研究因素的人做暴露组。研究的因素和疾病往往在一般人群中比较常见,如人们生活环境中所存在的因素。美国富莱明汉地区的心脏病研究就属于这种情况。⑷有组织的团体:这是一般人群的特殊形式,如医学会会员,或机关、团体和学校的成员。选择这种人群主要是利用他们的组织系统便于有效地收集追访资料,而且他们的职业和经历往往是相同的,可使非暴露组与暴露组增加可比性。如在英国医师会员中选择吸烟和不吸烟的人群研究吸烟的危害。3.非暴露人群的选择设立非暴露是为了比较,没有比较就看不出暴露的作用,故其重要性不亚于暴露组。非暴露组的基本要求是有较高的可比性,即对照人群除未暴露于所研究的因素(暴露因素)外,其它各种因素的影响或人群的特征(年龄、性别、民族、职业等)都应尽可能地与暴露组相同。⑴外对照:职业人群及特殊暴露人群常需在该人群之外去寻找非暴露组,故名外对照。如以放射科医生为研究射线致病作用的暴露对象时,可选择不接触射线或接触射线极少的五官科医生为外对照。其优点是观察随访时可免受暴露组的影响,缺点是需费力去另外选择一个人群进行随访。3.非暴露人群的选择⑵人群对照:这可看作不设对照,它实际上并未与暴露组平行地设立一个对照组,而是利用了整个地区的现成发病或死亡的统计资料,进行对比分析。3.非暴露人群的选择⑶内对照:先选择一组人群,将其中暴露于所研究因素的对象作为暴露组,其余即为非暴露组。就是说在选定的研究对象内部就形成了对照组,而不需另外设立对照组。其优点是比较省事,且可以准确无误地反映该研究对象的发病率情况。当某项暴露定量地分成若干层次,则可以最低层次的人群为非暴露组。例如饮用水中的氟、血清胆固醇含量等。3.非暴露人群的选择⑷多重对照:用上述2种或2种以上的型式同时作非暴露组,以减少只用一种对照所带来的偏性。3.非暴露人群的选择公式法201200111112PPPPPPZPPZN4.样本含量P:暴露组、对照组发病率的平均值P1:暴露组预期发病率P0:对照组预期发病率已知p0=0.007,RR=2.5,α=0.05,β=0.1,计算样本量。根据上述条件Zα=1.96,Zβ=1.282,q0=0.993p1=p0×RR=0.0175,q1=0.9825代入公式得N=2310考虑到失访,实际上每组需扩大10%,即2541人。查表法条件已知α、β、p0、RR5.资料的收集⑴基础资料的收集⑵随访⑴基础资料的收集①查阅记录或档案:如医院的病历、工厂工作档案等;②调查询问:调查研究对象或其他能够提供信息的人,了解对象的暴露史和疾病史,以及其他有关资料;③对研究对象进行测定或检查:定期作体格检查和疾病的检查。如测定血压、血脂水平等;④环境调查与检测:根据不同的研究假设,可作不同暴露测量。如对水质进行化验、食物成分的测定。也可调查家庭环境、居住环境、工作环境和区域环境等。⑵随访①随访对象:所有被选定的研究对象,不论是暴露组或对照组,都一律同等时间随访至观察终点。观察终点是指研究的疾病发生和死亡或一项某水准的检测指标。观察终点必须事先明确规定,并始终保持不变。②随访内容与方法:同基线调查。③观察终止时间及随访间隔:观察终止时间可长可短,应以所研究疾病的自然史和潜伏期而定,但应缩短观察期,以节约人力、物力和减少失访。如果观察期较短,在观察终止时一次搜集资料即可。反之需要多次随访,其间隔与次数视具体研究的需求而定。④随访执行者:由经过统一专业培训的调查员进行随访,由操作技术规范化的技术人员和各项检验与测量工作。要求调查员在各暴露组中查找随访绺信息时应付出相同的努力。最好采用单盲或双盲方法随访。(三)资料分析1.率的计算2.联系强度的测量1.率的计算队列类型与描述指标固定队列——累积发病率动态队列——发病密度⑴累积发病率⑴累积发病率(cumulativeincidence):当研究人群的数量较多,且人口比较稳定,可用累积发病率来计算。表1队列研究资料整理表组别发病人数未发病人数合计发病率(死亡率)暴露组aba+ba/a+b非暴露组cdc+dc/c+d万万观察开始时群组人数观察期间发病人数累积发病率1010⑵发病密度(incidencedensity):若暴露人口不固定,人群产生了较大的变动,例如由于迁移他处、死于其他疾病、中途加入等,应将变动着的人群转变为人时数代替人数来计算,此种发病率称发病密度。观察人时数观察期间发病人数发病密度人年数计算(1)精确法:可以先计算出每个人实际随访人年数,再将每个人的随访人年数相加计算出总人年数。此法利用计算机程序计算很方便。人年数计算(2)近似法:计算原则是在某段观察期内剔除死亡、迁移及失访的人数,补充新加入的人数,这些人均按该观察期的一半折算人年。年龄(岁)观察人数人年数1954.11.11955.11.11956.4.135~94149710979613625.7545~73517215719110284.2555~644601505752436974.83合计21366219822223030884.8325.102841252)71917215(2)72157351(45~组观察人年数为:表3随访人数整理表人年数计算(3)寿命表:寿命表方法计算随访人年数,精确又方便,在大样本随访中广被采用。2)(XxxxxxWDNI1I2/)(LxxxxxWDNI人年数计算(3)寿命表(续):2)(X观察时间(年,x)年初人数(Ix)年内进入人数(Nx)年内结局人数(Dx)年内失访人数(Wx)观察人年数(Lx)11403794301425.521448452111464.03148060381504.54152952191521.051513107251502.0合计187417.0第3年的年初人数为:第3年的观察人年数为:5.15042/)8360(14802/)(L33333WDNI1480112451448I22223WDNI表4寿命表计算观察人年数观察人时数观察期间发病人数发病密度21212)(DPTDPTPTPTDPTa表5发病密度的计算组别发病数人时数发病密度暴露组aPT1a/P