流行病学谭红专中南大学第四章队列研究(CohortStudy)引言※病因和危险因素研究是流行病学研究的重要任务,病因研究的逻辑顺序应该是先有病因存在,然后有疾病发生,即先因后果。※那么,怎样的研究满足先因后果的逻辑顺序,能更有效地证实因果关系呢?※队列研究。引言※队列研究(cohortstudy)是分析流行病学研究中两大重要方法之一。※它通过直接观察暴露于某因素不同状况人群的结局来探讨该因素与所观察结局的关系。目录第一节:概述第二节:研究设计与实施第三节:资料的整理与分析第四节:常见偏倚及其控制第五节:优缺点及其他实践类型0102030405第一节概述概述※概念※基本原理※研究目的※研究类型1.暴露(exposure)指接触过某种物质、具备某种特征或处于某种状态2.队列(cohort)有共同经历或有共同暴露特征的一群人分为固定队列和动态队列3.危险因素(riskfactor)泛指能引起某特定不良结局(outcome),或使其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等多方面的因素(一)概念第一节概述第一节概述固定队列FixedCohort出现结局未出现结局研究开始研究结束第一节概述动态队列DynamicCohort出现结局研究开始研究结束失访根据研究对象是否暴露于某研究因素或其不同水平将研究对象分成暴露组(E)与非暴露组(Ē)随访一定时间,比较两组之间所研究结局(outcome)发生率的差异,以分析暴露因素与研究结局之间的关系(二)基本原理第一节概述第一节概述目标人群代表性样本暴露EĒ结局Y时间顺序(二)基本原理YNN主要特点观察法设立对照由因到果,符合时间顺序检验暴露与结局的因果联系能力较强(二)基本原理第一节概述(三)研究目的第一节概述1.检验病因假设(hypothesis)2.评价预防措施效果(effectofprevention)3.研究疾病的自然史(naturalhistoryofdisease)4.新药的上市后监测前瞻性队列研究(prospectivecohortstudy)历史性队列研究(historicalcohortstudy)双向性队列研究(ambispectivecohortstudy)(四)研究类型第一节概述第一节概述(四)研究类型过去现在将来回顾性收集已有的历史资料历史性队列继续前瞻性收集资料双向性队列前瞻性收集资料前瞻性队列时间顺序前瞻性队列研究(prospectivecohortstudy)研究队列的确定是现在(concurrent)根据研究对象现在的暴露分组需要随访(follow-up)结局在将来某时刻出现(四)研究类型第一节概述前瞻性队列研究(prospectivecohortstudy)优点时间顺序增强了病因推断的可信度直接获得暴露与结局资料,结果可信能获得发病率缺点所需样本量大,花费大,时间长影响可行性(四)研究类型第一节概述前瞻性队列研究的应用条件有明确的检验假设所研究疾病的发生率较高,一般不低于5‰明确规定暴露因素和结局变量有可靠的测量手段能获得足够的观察人群和他们的暴露情况大部分人群能完成随访有足够的人力、财力、物力(四)研究类型第一节概述历史性(回顾性)队列研究〔historical(retrospective)cohortstudy〕根据研究开始时研究者掌握的有关研究对象在过去某时刻的暴露情况的历史材料分组。不需要随访,研究开始时结局已出现。(四)研究类型第一节概述历史性(回顾性)队列研究〔historical(retrospective)cohortstudy〕优点短期内完成资料的收集和分析时间顺序仍是由因到果省时、省力、出结果快缺点资料积累时未受到研究者的控制,内容上未必符合要求需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料(四)研究类型第一节概述双向性队列研究〔mixed(ambispective)cohortstudy〕研究队列的确定是过去根据研究对象过去某时刻的暴露情况分组需要随访部分结局可能已出现(四)研究类型第一节概述双向性队列研究〔mixed(ambispective)cohortstudy〕优点是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式,因此兼有上述二类的优点。应用当基本具备进行历史性队列研究的条件下,如果从暴露到现在的观察时间还不能满足研究的要求(人时不够,未满足效应期),还需继续前瞻性观察一段时间时,则选用双向性队列研究。(四)研究类型第一节概述第二节研究设计与实施设计和实施※确定研究因素※确定研究结局※确定研究现场与研究人群※确定样本量※资料的收集与随访※质量控制主要暴露因素在描述和病例对照研究的基础上确定可能影响结局的因素混杂因素人口学特征等因素的测量需测量暴露的水平,暴露的时间,及暴露的方式。暴露的测量应采用敏感、精确、简单和可靠的方法性质定性(quality),定量(quantity)方法访谈,实验室检查,查阅记录(一)确定研究因素第二节研究设计与实施结局是研究队列中预期结果事件,是队列研究的自然终点(naturalend)。研究结局的确定应全面、具体、客观。可包括:发病、死亡、健康状况和生命质量终极结果(发病)或中间结局(血清变化)正面(生命延长)和负面(发病)定性或定量可多个或多方面(二)确定研究结局第二节研究设计与实施一次研究可有多个结局(二)确定研究结局第二节研究设计与实施吸烟慢性支气管炎肺癌冠心病结局的测量采用国际或国内通用的标准研究现场有足够符合条件的研究对象领导重视、群众支持医疗条件较好,交通较便利发病率较高有代表性(三)确定研究现场与研究人群第二节研究设计与实施研究人群从目标人群中抽出的具有代表性的人未患所研究疾病分为暴露人群和非暴露人群(三)确定研究现场与研究人群第二节研究设计与实施暴露人群选择职业人群特殊暴露人群一般人群有组织的人群团体(三)确定研究现场与研究人群第二节研究设计与实施非暴露人群选择内对照(internalcontrols)一群研究对象内部外对照(externalcontrols)一群研究对象外部总人口对照(totalpopulationcontrols)整个地区现成的发病或死亡资料多重对照(multiplecontrols)两种或以上的对照形式(三)确定研究现场与研究人群第二节研究设计与实施计算样本量时需考虑的问题抽样方法暴露组与非暴露组的比例(1:1)失访率(四)确定样本量第二节研究设计与实施影响样本量的因素非暴露人群或全人群中所研究疾病的发病率p0暴露人群与对照人群疾病发病率之差p1-p0第一类错误概率α把握度(power)1-β(四)确定样本量第二节研究设计与实施样本大小的估计查表公式计算(条件暴露组和对照组样本含量相等)(四)确定样本量第二节研究设计与实施201200111112PPPPPPZPPZN:两个发病率的平均值P1:暴露组预期发病率P0:对照组预期发病率P样本大小的估计(四)确定样本量第二节研究设计与实施已知p0=0.003,RR=2.5,α=0.05,β=0.1计算样本量根据上述条件Zα=1.96,Zβ=1.282,q0=0.997p1=p0×RR=0.0075,q1=0.9925代入公式得N=5420考虑到失访,实际上每组再扩大10%,即每组需5962人基线资料随访资料收集(五)资料的收集与随访第二节研究设计与实施基线资料暴露的资料个体的其他信息(五)资料的收集与随访第二节研究设计与实施基线资料随访(follow-up)随访对象、内容和方法随访间隔随访者观察终点(研究对象出现了预期的结果)观察终止时间(整个研究工作截止的时间)(五)资料的收集与随访第二节研究设计与实施基线资料随访(follow-up)资料收集方式查阅纪录调查询问健康或疾病检查环境监测等(五)资料的收集与随访第二节研究设计与实施调查员选择调查员培训制定调查员手册监督(六)质量控制第二节研究设计与实施第三节资料的整理与分析资料的整理与分析※资料的基本整理模式※人时的计算※率的计算※显著性检验※效应估计(一)资料的基本整理模式第三节资料的整理与分析队列研究资料归纳整理表病例非病例合计暴露组aba+b=n1对照组cdc+d=n0合计a+c=m1b+d=m0a+b+c+d=t暴露组发病率=a/n1对照组发病率=c/n0精确法:逐日相加近似法:年头和年尾人数之和除以2寿命表法:当年内进入或退出队列的个人均作1/2人年计算(二)人时的计算第三节资料的整理与分析累积发病率发病密度标化死亡比标化比例死亡比(三)率和比的计算第三节资料的整理与分析累积发病率(cumulativeincidence)(三)率和比的计算第三节资料的整理与分析CI=观察期内发病(或死亡)人数观察开始时的人口数变化范围0~1适用条件样本大人口稳定整齐的资料(固定队列)报告时必须注明时间长短发病密度(incidencedensity)(三)率和比的计算第三节资料的整理与分析ID=观察人时数观察期内发病(或死亡)人数变化范围0~∞适用条件观察时间长人口不稳定存在失访标化死亡比(standardizedmortalityratio,SMR)(三)率和比的计算第三节资料的整理与分析期发病(死亡)数标准人口(全人口)预死亡)数研究人群中观察发病(SMR变化范围0~∞适用条件结局事件的发生率低不宜直接计算率时以全人群为对照预期发病(死亡)数的计算:全人口某病的发病(死亡)率×观察人口数标化死亡比(standardizedmortalityratio,SMR)(三)率和比的计算第三节资料的整理与分析SMR的意义被研究人群发生(死于)某病的危险性是标准人群的多少倍SMR=1研究人群某病发病(死亡)危险=标准人群SMR1研究人群某病发病(死亡)危险标准人群,是标准人群的SMR倍SMR1研究人群某病发病(死亡)危险标准人群标化比例死亡比(standardizedproportionalmortalityratio,SPMR)(三)率和比的计算第三节资料的整理与分析预期死亡数实际死亡数SPMR变化范围0~∞适用条件不能得到历年人口资料(无分母)仅有死亡人数、原因、日期和年龄预期死亡数计算=全人口中某病因死亡数全部死亡数×某单位实际全部死亡数U检验:当研究样本量较大,p和1-p都不太小直接概率法:率比较低,样本较小时二项分布检验泊松(Poisson)分布检验检验:居中计分检验(scoretest)(四)显著性检验第三节资料的整理与分析2相对危险度归因危险度归因危险度百分比人群归因危险度人群归因危险度百分比剂量反应关系(五)效应的估计第三节资料的整理与分析相对危险度(relativerisk,RR)通常包括了危险度比(riskratio)或率比(rateratio,RR)(五)效应的估计第三节资料的整理与分析010ncnaIIRRe暴露组率对照组率意义E发病或死亡的危险是Ē的多少倍RR值暴露的效应暴露与结局关联强度第三节资料的整理与分析实例乙肝病毒感染与PHCC关系的队列研究结果累积发病率7.749‰75.25‰暴露组5.10‰对照组14.75RR(五)效应的估计发病密度0.4959‰15.63意义乙肝病毒感染者发生PHCC的危险是非乙肝病毒感染者的14.75倍相对危险度(relativerisk,RR)(五)效应的估计第三节资料的整理与分析RR与关联强度很强10~<0.1强3.0~9.90.1~0.3中1.5~2.90.4~0.6弱1.2~1.40.7~0.8无1.0~1.10.9~1.0关联强度RR相对危险度(relativerisk,RR)(五)效应的估计第三节资料的整理与分析相对危险度(relativerisk,RR)RR95%CIWoolf法lnRR的95%CIln反自然对数即为RR95%CI(五)效应的估计第三节资料的整理与分析归因危险度(attributablerisk,AR)ac意义E与Ē人群比较,所增加的疾病发生数量AR值暴露因