1第五章队列研究第一节概述队列研究(cohortstudy)也称前瞻性研究prospectivestudy,随访研究follow-upstudy,纵向研究longitudinalstudy等。暴露结局(疾病)一、基本概念队列研究的重要概念队列cohort暴露exposure危险因素riskfactor保护因素protectivefactor1、队列的概念:拥有同一属性的某一组人。a)2013年南京市常住人口b)2010年到2014年南医大注册的所有学生c)出生队列birthcohort:出生于同一时期的人组成的特殊队列1)队列可以是流动(有人员出入)的,也可以是固定的(相对固定,没有人员流动,成员不可以同时是非成员)2、暴露的概念:研究对象接触过的某种待研究的物质,或具有某种待研究的特征或行为。(理解)物质:病原体、毒物。。。特征:年龄、性别、血压、血糖。。。行为:吸烟、饮酒、工作类型。。。二、基本原理选定一组研究人群,根据过去或目前的暴露情况进行分组有无暴露因素:暴露组和非暴露组暴露因素的水平:低、中、高剂量组随访观察各组的观察结局(发病或死亡)比较各组发病率或死亡率的差异,从而判定暴露因素与发病有无因果关联及关联大小队列研究的特点:1、研究对象是还没出现研究结局,但有可能出现研究结局的人群(susceptiblepopulation)需设立纳入及排除标准剔除已生病个体或明确不会生病的个体在进行传染病危险因素的研究时,需考虑个体被感染的几率2、属于观察性研究,根据暴露的自然存在状态分组,无人为控制,也不存在随机分组3、时间顺序:从“因”到“果”,可确定因果关系(疾病发生之前已经确定了研究对象的暴露情况)4、前瞻性研究,可计算发病率、死亡率等率的指标三、队列研究的用途检验病因假设是主要用途和目的评价预防效果2研究疾病的自然史新药的上市后监测四、队列研究的类型1、前瞻性队列prospectivecohort也称即时性或同步性(concurrent)队列开始研究时确定对象、分组,经随访得到结局优点:资料准确缺点:样本大,花费大,时间长建立队列时要特别考虑能否负担得起,能否获得想要的结果!2、回顾性队列retrospectivecohort也称历史性(historical)或非即时性(non-concurrent)队列研究开始时疾病结局已发生,研究对象是过去进入队列的,分组依据的是过去的暴露资料优点:省人、物、时缺点:依赖历史资料的完整与可靠,常缺乏混杂因素的资料3、双向性队列ambispectivecohort历史队列后继续进行前瞻性队列最适合于对人体健康同时具有短期和远期效应的暴露因素研究第二节研究设计与实施一、确定研究因素队列研究最主要的目的:进一步验证现况调查或病例对照研究中已发现的有特异影响、且在统计学上有联系的危险(或保护)因素。暴露因素分类:1)暴露水平:定量标准化,累积暴露2)暴露方式:短期/长期、直接/间接、持续/间隔二、确定研究结局结局变量outcomevariable也称结果变量,是随访中将出现的预期结果事件,也即研究者希望追踪的事件,是希望观察的自然终点,并非观察期的终止。(结局是队列研究观察的终点,也就是研究对象已达结局变量就停止对其的观察;观察期是整个队列研究的时长,整个队列中研究对象不止一个人)研究结局的确定应全面、具体、客观发病、死亡、指标变化。。。结局变量的测定应有明确统一的标准,并在研究全过程中严格遵守三、确定研究现场和研究人群(一)研究现场:可行性+可靠性+科学性有足量研究对象领导重视群众配合交通方便文化水平、医疗卫生条件好3(二)研究人群:即队列的建立人口相对稳定,方便进行随访医疗卫生记录较完整、容易查询无明显的环境污染被研究的疾病发病率较高被选择人群的合作程度好、领导支持1、暴露人群的选择一般人群:常见暴露因素研究特殊人群:对罕见因素暴露的高危人群如职业人群:联苯胺致膀胱癌——染料厂工人石棉致肺癌——石棉厂工人特殊暴露人群:放射线与白血病——原子弹爆炸受害者,放射治疗者等有组织的团体:一般人群的特殊形式2、对照人群的选择可比性内对照internalcontrol:先选择一组研究人群,然后根据暴露情况进行分组选择对照容易,但易受暴露污染(可比性好)外对照externalcontrol:选择职业人群或特殊暴露人群为暴露组,则需在该人群外去寻找平行的对照组可避免暴露污染,但难度较大总人口对照totalpopulationcontrol:以全人口率为对照,也称一般人群对照资料较易获得,但不与暴露组平行,可比性差,暴露组也可能包括在内使用时需进行率的标化多重对照multiplecontrols:同时采用上述多种对照可减少一种对照带来的偏倚,但工作量大四、确定样本量决定因素:1、一般人群(非暴露组的)所研究疾病的发病或死亡率(P0),P0越接近0.5,样本越大2、暴露组与对照组人群发病率之差d=P1-P0,暴露组疾病的发病或死亡率(P1),或相对危险度(RR)估算P1,d越大,样本越小3、显著性水平:第一类错误概率α4、把握度(1-β):β为第二类错误概率注意事项:一般对照组样本数≥暴露组的样本数估计失访对数据分析的影响,一般按估计样本量增加10%作为实际样本量五、资料的收集与随访1、基线资料收集baselinedata暴露的资料,个体的其他信息来源:1)查阅各种常规记录2)调查询问3)医学检查4)环境测量2、随访followup随访的目的确定分母的信息研究对象是否仍处于观察中4确定分子信息确定研究人群结局事件的发生相关资料的收集有关暴露和混杂因素的资料随访方法——以调查表为工具常规记录或档案定期调查,进行特殊安排的随访环境调查与检测观察终点(endpoint)、随访期限和时间间隔明确开始时间与终止时间失访(lossestofollow-up)的问题观察终点endpoint研究对象出现了预期的结果,可不再随访研究对象未出现预期结果,但无法继续随访,则认为失访失访的情况在资料分析时作为结尾数据(censoreddata)六、质量控制调查员的选择调查员培训制定调查员手册监督每一次随访都是一次现况调查第三节资料的整理与分析基本步骤描述性分析,描述研究对象的组成、随访的经过、随访时间、结局的发生情况、失访情况等,并对两组的一般情况做均衡性检验两组率的描述、比较,进行关联强度的计算根据上述结果和研究中可能存在的偏倚,作出解释一.队列发病率的计算1、累积发病率cumulativeincidence,CI定义:某一固定人群在一定时期内某病新发生例数(D)与时期开始时总人数(N)之比前提:研究人群数量比较多,人口比较稳定,资料整齐公式:NDCI组别发病数未发病数发病率暴露组ab)(baa非暴露组cd)(dcc合计)(Dcadb)/(dcbaD52、发病密度incidencedensity,ID前提:队列为一动态人群,人口不稳定,观察人数变动较大(失访、迁移、死于它病、中途加入等)发病密度(ID)=观察期内的发病人数/观察人年数人时的概念观察人数乘以随访单位时间的积人时是将人数和时间结合起来考虑的一种度量单位,它是观察人群中全部个体暴露于研究因素的时间总和时间单位常用年,故又称人年数(person-years)意义:既说明该人群发生的新病例数,又说明该人群的大小和发生这些例数所经历的时间3、标化比standardmortalityratio,SMR标准死亡率就是全人口的死亡率SMR1,说明暴露导致或促进了结局的发生SMR1,说明暴露预防或减少了结局的发生SMR=1,说明暴露与疾病没有关系(加不加暴露因素对于死亡率没有影响)EG:SMR=2/1=2说明该厂30~40岁工人死于肺癌的危险性是一般人群的2倍二、两组率差异的显著性检验三、暴露和疾病关联强度指标及计算比较暴露组和对照组的率的差值——绝对值比较暴露组和对照组的率的比值——相对值相对危险度归因危险度归因危险度百分比人群归因危险度人群归因危险度百分比1、相对危险度Relativerisk,RR概念:暴露组某病发病率(或死亡率)与非暴露组该病发病率(或死亡率)之比,是反映暴露因素和疾病关联强度的一个指标公式:意义:RR说明暴露组发病(死亡)的危险性是非暴露组的多少倍组别发病数观察人年数发病密度暴露组aPT1a/PT1非暴露组cPT0c/PT0合计a+c(=D)PTD/PT期死亡数标准人口(全人口)预研究人群中观察死亡数SMR)()(dccbaaIIRRoe6相对危险度判断标准RR95%可信区间(不包括1,说明暴露与疾病的关联有统计学意义,有关联)Woolf法RR=1,两组的发病率和死亡率没有差别RR>1,暴露组的发病率或死亡率高于非暴露组,暴露可增加发病或死亡的危险RR<1,暴露组的发病率或死亡率低于非暴露组,暴露可减少发病或死亡的危险RR值离1越远,表明暴露的效应越大,暴露与结局关联的强度越大。2、归因危险度Attributablerisk,AR概念:也称率差(ratedifference,RD)、特异危险度、超额危险度,为暴露组的发病(死亡)率与非暴露组的发病(死亡)率之差意义:AR表示暴露组中完全由暴露因素所致的发病(死亡)率,说明暴露的生物学效应公式:RR具有病因学的意义AR更具有疾病预防和公共卫生学的意义3.归因危险度百分比Attributableriskpercentage,ARP概念:又称病因分值,是指暴露人群中发病归因于暴露的成分占全部病因的百分比公式:4、人群归因危险度populationattributablerisk,PAR概念:人群中由于暴露于某因素导致的发病率或死亡率,说明暴露的社会效应公式:It为全人群某病发病(死亡)率;Io为非暴露组的某病发病(死亡)率5、人群归因危险度百分比Populationattributableriskpercentage,PARP或PAR%概念:人群中因暴露于某因素所致的发病(死亡)占人群发病(死亡)的百分比,也即说RR值范围联系性质和强度0-0.3强保护作用0.4-0.5中度保护作用0.6-0.8弱保护作用0.9-1.1无作用1.2-1.6轻度危害作用1.7-2.5中度危害作用2.5强危害作用(Greenberg,1984)dccbaaIIARoe)1(RRIARo%100)%(eoeIIIARPAR暴露组的死亡率%1001)%(RRRRARPARotIIPAR7明消除该因素后产生预防该病的效果占多大比重,具有公共卫生学意义,说明暴露的社会效应公式:PAR和PAR%既与RR和AR相关,也与人群中暴露者所占的比例相关□RR和AR很高,但PAR和PAR%不高,说明某因素对全人群影响不大,但对高危人群影响很大,可对高危人群重点防制□RR,AR,PAR和PAR%都很高,说明某因素对全人群的影响很大,宜全民防制Eg:AR%=(Ie-I0)/Ie=93.30%说明在感染HBV的男性中,93.30%的HCC死亡病例是由于感染了HBV造成的PAR=It-I0=1.38/10万人年说明在全人群中,因为HBV感染造成的HCC死亡率为1.38/10万人年PAR%=(It-I0)/It=66.67%说明在全人群中,66.67%的HCC死亡病例是由于感染了HBV造成的PAR=1.38/10万人年,说明如果能够消除HBV感染,可以减少的HCC死亡率为1.38/10万人年PAR%=66.67%,说明如果能够消除HBV感染,全人群中66.67%的HCC死亡病例可减少6、剂量-反应关系的分析率的趋势性检验有剂量-效应关系,暴露作为病因的可能性越大第四节队列研究的偏倚及控制1、选择偏倚selectionbias有人拒绝参加有些人档案丢失或记录不全早期病人在开始时未能发现研