第五章队列研究Cohortstudy•流行病学研究方法•病因那些能使人群发病概率升高的因素,就可认为是病因,其中某个或多个因素不存在时,人群疾病频率就会下降第一节概述一、概念与基本原理队列研究cohortstudy随访研究follow-upstudy前瞻性研究prospectivestudy发生率研究incidencestudy纵向研究longitudinalstudy将某一特定人群按是否暴露于某可疑因素或暴露程度分为不同的亚组(队列),追踪观察(随访)两组或多组成员的(预期/研究)结局发生情况,比较各组之间结局发生率的差异,从而判断暴露因素与结局之间有无因果关联及关联程度的一种观察性研究方法CauseEffect研究人群暴露组非暴露组结局发生结局未发生结局发生结局未发生时间间隔易感人群队列研究结构模式暴露结局CauseEffect暴露队列cohort•特定的研究人群组•有共同经历或共同状态的一群人–根据条件不同•出生队列:有相同的出生年代•暴露队列:有共同暴露或特征的一群人–根据实际进入研究的时间不同•固定队列fixedcohort-固定时间/短时期•动态队列dynamiccohort-不断退出与随时加入暴露exposure•研究对象接触过某种待研究的物质或具有某种待研究的特征或行为•在描述性研究和病例对照研究的基础上确定•与结局有关–危险因素:使发病率增加–保护因素:使发病率降低•根据暴露的普遍性–一般暴露:暴露在人群中较常见–职业暴露:职业人群中的暴露–特殊暴露:较为罕见的暴露结局outcome•研究队列中规定的、体现研究因素作用的预期结果事件–终末结局:发病或死亡–中间结果:健康状况或生命质量变化•通过随访得到,个体一旦出现结局则结束观察•一次队列研究可有一个或多个结局–一种疾病的多种状态或临床表现–多种疾病,提高研究效率•定义明确:采用国际或国内通用的标准比较基本思想:如果某因素是某事件发生的影响因素,暴露人群发生率一定与未暴露人群有差别•比较的范围:未患有研究疾病人群•比较的对象:暴露组和未暴露组•比较的内容:结局发生情况•比较的基础:基线和随访二、特点–属于观察法范畴–属于分析性研究的范畴•分析暴露与疾病的联系–因果研究,由因到果•前瞻性研究:结局发生前开始研究•时间顺序明确,因果关联的证实力强–研究对象按照暴露与否进行分组•计算发病率,比较差异,确证暴露的病因作用三、用途–检验病因假设•暴露因素与一种疾病的关联•暴露因素与多种疾病的关联——一因多果–评价预防效果考查自发预防措施的效果-人群自然实验–研究疾病自然史-临床、队列研究–新药临床实验上市后监测•大人群中,用药/不用药人群远期不良事件比较四、类型•根据研究对象过去暴露情况分组•确定研究队列的时间是过去•结局在研究开始时已经出现•无需随访•根据研究对象过去暴露情况分组•确定研究队列的时间是过去•结局在研究开始时可能已经出现,也可能在将来出现•需要随访•根据研究对象现在暴露情况分组•确定研究队列的时间是现在•结局在将来某时刻出现•需要随访(follow-up)+-+-前瞻性+-+-前瞻性特点–前瞻性:足够的人、财、物力来支持长期工作,并且所选观察人群相当稳定,可长期随访–历史性:足够数量完整可靠的历史记录和档案资料–双向性:满足历史性但需继续随访第二节研究设计与实施乙肝病毒感染与原发性肝细胞癌的队列研究一、研究目的检验病因假设,即暴露与疾病间的因果关联–提出假设:根据前期描述性研究、病例对照研究基础上,检验病因假设•乙肝病毒感染是原发性肝细胞癌的危险因素–确定研究因素/暴露:乙肝病毒感染–确定结局:原发性肝细胞癌死亡二、研究方法•观察法•实验法•数理法三、研究人群•确定研究现场:江苏省海门市—目标人群–研究目的、暴露特征–代表性–可行性:稳定、发病率高、组织管理方便•确定研究人群—研究对象–从目标人群中抽出的具有代表性、未患所研究疾病的人群–根据暴露情况分为•暴露人群•非暴露人群(一)暴露人群暴露于待研究因素的人群–具有暴露:暴露的定义明确•暴露水平•累计暴露时间•暴露方式–外部特征的限制:增强针对性及组间可比性暴露人群的选择–一般暴露人群:暴露与疾病在人群中均较常见•地区性人群中的暴露者作为暴露组•有组织的人群团体:便于组织、随访,职业和经历往往相同,可增加其同质性–特殊暴露人群:一般人群中罕见的特殊暴露–职业暴露人群:某种可疑的职业暴露因素与疾病或健康的关系(二)非暴露人群/对照组的选择–基本原则•未暴露于/低水平暴露于研究因素•可比性——除暴露因素与暴露组不同外,其它因素或人口学特征应尽可能与暴露组相同或一致–对照形式•内对照internalcontrol•外对照externalcontrol/平行对照parallelcontrol•总人口对照totalpopulationcontrol•多重对照multiplecontrols1.内对照在同一研究人群中,采用没有暴露的人群作为对照•形式–根据是否暴露分成暴露组与对照组-定性变量–将研究对象的暴露情况分级,最低水平的人群作为对照组-定量变量•特点–简单易行,可比性好–对研究人群的代表性强,对发病率的估计准确–可能存在“污染”,即对照组不可避免接受暴露2.外对照/平行对照–在暴露组所在的人群之外寻找对照组–在职业暴露、特殊暴露中常用–免受“污染“–注意可比性3.总人口对照/一般人群对照以现成的、整个地区发病或死亡资料为对照,相当于以全人群作为对照•节约时间和经费•对照中可能也存在暴露-常用于暴露比例小•可比性-资料的完整性和准确性差4.多重对照同时用两种或者两种以上的方式选择多个对照组•减少偏倚•增加工作量本例:•在一般人群中选择研究对象•整群抽取当地符合条件的居民90236人作为研究对象•两次检测HBsAg,阳性14338人作为暴露组,阴性75898人作为对照组四、研究类型•前瞻性•历史性•双向性五、抽样方法和样本含量估计•抽样方法与横断面研究相同-随机化原则•对照组样本量暴露组样本量•估计失访率,扩大样本量-增加10%或20%样本含量估计•样本量过大–人力、物力和时间上的浪费•样本量过小:抽样误差大–代表性差–假设检验时检验效能过低•估计的基本原则–足够代表性和检验效能前提下的最小样本量•比较暴露组与对照组结局(疾病)事件发生率的差异–已知条件•对照组发病率0•病例组的发病率1,或相对危险度RR•值及单双侧:一般取0.05双侧•检验效能(把握度)1-:一般要求不低于75%,常取80%或90%10RR•两组例数相等•两组例数不等2/2101021012,2ZZnn2/210121001111,1ZZcnccnnc本例:设=0.05(双侧),=0.10,根据文献,估计对照组发病率p0=0.003,暴露组发病率p1=0.0075=5420六、研究内容与资料收集方式研究目的转化成具体可测量的指标或项目–相关性:紧扣研究目的,做到少而精•与目的有关的指标不能少,且要细致-暴露剂量反应关系•定义明确,标准统一-结局判断–敏感性和特异性:真实反映暴露的效应–客观性–可行性:具体、可测量–可接受性:测量方法简单、可靠、易被接受1.基线资料baselineinformation每个对象在进入队列/研究开始时的情况–研究对象的一般特征–暴露情况:评定暴露状况,分组的依据•暴露定义明确:定量测量时应明确分类/分级标准•内容–暴露水平–暴露方式–累计暴露时间:累计暴露量–疾病与健康状况:研究对象为易感者•已患或疑似已患所研究疾病(结局)者•对暴露不易感者–可能的混杂因素信息本例:•年龄、性别、职业•血清HBsAg-酶标法半年内连续两次检测阳性•肝炎史、原发性肝细胞癌家族史•吸烟、饮酒、饮茶、水源类型、主食类型2.随访followup对研究对象进行定期追踪观察•随访内容:–基线资料:了解其随时间变化的情况•暴露:随访过程中对象的暴露变化,自发预防措施•一般人口学信息的变化–研究结局:重点•定义明确、标准统一•发生情况、发生时间•随访对象:所有被选定的研究对象•随访方法:相同、不变•观察终点:研究对象出现了预期的研究结局•观察终止时间:完成研究工作•随访期:潜伏期长、暴露与疾病关联强度•随访间隔:视随访期、研究结局的变化速度、研究的人力、物力等条件而定-慢性病1-2年失访losstofollow-up及失访原因没有获得研究结局的信息–失访:拒绝随访、失去联系或中途退出等(主动失访)–退出:死于与研究疾病无关的原因(竞争性失访)–研究终止:研究终止时观察对象仍然存活(被动失访)本例:•所有研究对象1992年进入队列•从1993年到2003年,每年随访一次•观察终点:原发性肝细胞癌死亡诊断依据-临床表现、影像学、病理学检查资料收集方式•问卷调查:对对象或知情人询问调查获得–面访–自填问卷–间接采访:电话采访、信访、网络访问等•直接观察–查阅记录或档案–体格检查或实验室检查–环境调查与检测七、现场实施办法及组织管理质量控制•调查员的选择:严谨、亲和力强、专业•调查员培训:研究目的、调查技巧、统一调查内容和态度•制定调查员手册:操作程序、注意事项、问卷说明•监督:复查、数据核查、调查员一致性检查八、资料整理及统计分析(一)资料的核查清理•保证数据的完整、准确1.抽样核查2.逻辑检查3.修正4.验收5.归档•资料编码,形成数据库(二)一般特征的描述•对两组人群的特征进行描述,从而了解资料的一般情况–两组的入组人数–失访人数、失访率及失访原因分析–研究对象的一般特征分组描述•年龄、性别、民族、地区等(三)均衡性分析•两组基线特征的可比性进行统计学检验–若假设检验P,认为两组在该特征上可比–若假设检验P,认为两组在该特征上不可比,应结合实际意义,考虑该因素为混杂因素•在发生率比较及RR计算时进行控制–分层分析–多因素分析(四)结局发生率的计算•结局发生率:说明暴露组和非暴露组结局事件的发生频度或强度的指标–累积发病/死亡率cumulativeincidence,CI–发病/死亡密度incidencedensity,ID–标化发病/死亡比standardizedmorbiditymortalityratio,SMR–标化比例死亡比standardizedproportionalmortalityratio,SPMR定性资料分组整理•根据暴露和结局进行交叉分组统计频数,形成列联表本例:定量资料分组整理•根据暴露分级情况和疾病状态进行交叉分组统计频数,形成列联表队列研究资料的列联表结局暴露分级合计E0E1E2…Ei发生a0(=c)a1a2…ain1未发生b0(=d)b1b2…bin0合计m0m1m2…mit40-59岁男子不同基线血清胆固醇水平冠心病6年发生情况冠心病基线血清胆固醇(mg/dl)合计210210~245~病例16295196非病例4384263731237合计45445542413331.累积发病率CI•研究期间队列人群中发生某病的频率–其实质为频率,故取值[0,1]–观察期越长,其值越大,报告时应注明时期本例10年累积发病率暴露组75.25‰对照组5.10‰–适用条件:稳定、大人群•固定队列•随访时间较短,失访人数较少•个体随访时间基本一致2.发病密度ID•以观察人时数为分母计算发病率•单位时间内发生疾病的速率•较准确的说明疾病发生强度–取值范围:0~+∞–单位:/时间•适用条件:–动态队列–随访时间长,失访人数较多–个体随访时间差别较大人时数的计算方法总人时:随访人群中所有个体暴露于研究因素的时间总和,常以人年为单位计算方法•精确法:已知每个个体的观察时间•近似法(含寿命表法):大人群时,已知观察期内每个随访间隔进入队列人数Nx、出现结局人数Dx、失访人数Wx=总人时每个研究对象的观察时间11=+2=+2xxxxIIII随访间隔即为单位时