第6版预防医学人民卫生出版社公共卫生学院流行病与卫生统计学系吴静第6版预防医学人民卫生出版社一、队列研究二、病例对照研究(二)分析流行病学第6版预防医学人民卫生出版社案例1959年至1961年间,西欧诸国特别是西德与英国,新生儿短肢畸形明显增加,形成了一次先天性短肢畸形的流行。流行期间,估计新发病例高达万例,遗留数千残疾儿童。什么原因导致了这一震惊世界的灾难性事件,众说纷纭产妇孕期病原微生物感染?产妇孕期某种化学物质中毒?遗传?经流行病学调查,认定孕妇妊娠期间服用反应停是罪魁祸首流行病学家是如何确定因果关系的?第6版预防医学人民卫生出版社病例对照研究(case-controlstudy)的概念–选择患有和未患有某特定疾病的人群分别作为病例组和对照组,调查各组人群过去暴露于某种或某些可疑危险因素的比例或水平,通过比较各组之间暴露比例或水平的差异,判断暴露因素是否与研究的疾病有关联及其关联程度大小的一种观察性研究方法–若病例组有暴露史的比例或暴露的程度显著高于对照组,且其差异有统计学意义,则可认为这种暴露与疾病存在关联二、病例对照研究第6版预防医学人民卫生出版社时间病例组对照组研究开始暴露暴露非暴露非暴露调查方向图3-1病例对照研究示意图(Greenberg2002)注:阴影区域代表暴露于所研究的危险因素的研究对象研究示意图第6版预防医学人民卫生出版社病例对照研究的特点–属于观察性研究只是客观地收集研究对象的暴露情况,而不给予任何干预措施–设立对照研究设立了独立的、由未患所研究疾病的人群组成的对照组,用来与病例组进行比较–观察方向由“果”至“因”已知研究对象患某病或未患某病,再追溯既往是否暴露于可疑危险因素,研究方向是回顾性的–难以证实因果关系由于研究是回顾性的观察法,只能推测暴露与疾病是否有关联,且只限于有统计学意义,难以证实暴露与疾病的因果关系第6版预防医学人民卫生出版社病例对照研究的用途–初步检验病因假设–提出病因线索–评价防制策略和措施的效果第6版预防医学人民卫生出版社病例对照研究的种类病例对照研究非匹配病例对照研究匹配病例对照研究频数匹配个体匹配第6版预防医学人民卫生出版社非匹配病例对照研究在病例和对照人群中分别选取一定数量的研究对象,仅要求对照数量等于或多于病例数量,除此之外再无其它规定第6版预防医学人民卫生出版社匹配病例对照研究匹配也称配比(matching),是以对研究结果有干扰作用的某些变量为匹配变量,要求对照组与病例组在匹配变量上保持一致的一种限制方法。–提高研究效率(studyefficiency),即每位研究对象提供的信息量增加,所需样本含量减少–控制混杂因素,以避免研究中存在混杂偏倚第6版预防医学人民卫生出版社偏倚、混杂偏倚的定义–偏倚(bias):从研究设计、实施、数据处理和分析的各个环节中产生的系统误差,以及结果解释、推论中的片面性,导致研究结果与真实值之间出现倾向性的差异,从而错误的描述暴露与疾病之间的联系。–混杂偏倚:当研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,这种现象称为混杂(confounding),该外来因素称为混杂因素(confoundingfactor),造成的偏倚称为混杂偏倚(confoundingbias)。第6版预防医学人民卫生出版社频数匹配(frequencymatching)要求匹配变量所占比例在病例组与对照组之间基本相同–离散变量要求各类别的构成比基本相同:例如病例组与对照组成员的性别构成比基本相同–连续变量可划定多个组段,要求各组段在病例组与对照组中的构成比基本相同:例如以5岁为一个年龄组,病例组与对照组中各年龄组所占比例基本相同第6版预防医学人民卫生出版社个体匹配(individualmatching)以病例和对照的个体为单位进行匹配–1个病例可匹配一个或一个以上对照,表示为1∶1、1∶2、1∶3、……1∶M。1∶1匹配也可称配对(pairmatching)–在每对病例与对照中匹配变量匹配到什么程度才可视为一致取决于变量的性质和实际需要。离散变量可以完全匹配,例如均为男性或均为女性。连续变量往往划定某个范围,要求病例与对照的匹配变量都在这一范围内Matching-exampleCaseControlcategoricalvariable:Race,sexContinuousVariable:Age第6版预防医学人民卫生出版社匹配病例对照研究的注意事项–慎重选择匹配因素匹配变量必须是已知的混杂因素,或有充分的理由怀疑为混杂因素,否则不应匹配。一旦对某个因子做了匹配,不但它与疾病的关系不能分析,而且它与其他因子对疾病的交互作用也不能分析。–避免“匹配过度(overmatching)”把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能徒然丢失信息,增加工作难度,反而降低了研究效率,这种情况称为匹配过度。–与匹配因素存在潜在关联的因素不要盲目进行匹配–比例一般为1:1,最多不超过1:4第6版预防医学人民卫生出版社研究对象的选择样本含量的估计资料的收集资料的整理与分析常见偏倚及其控制病例对照研究的设计与实施第6版预防医学人民卫生出版社病例的选择–疾病的规定:明确的得到公认的诊断标准,有时诊断标准中还要有疾病分期、分型的相应标准。需要自订标准时,应注意控制诊断标准的假阳性率和假阴性率。–病例其他特征的规定:明确规定人口学特征和其他外部外部特征,以控制非研究因素的干扰–限制:为更好地处理干扰因素,在选择研究对象时可以对某些特征加以限制;因匹配不当给研究结果带来的偏倚同样可出现在限制中一、研究对象的选择第6版预防医学人民卫生出版社病例的选择–病例的代表性:病例要在病情、疾病分型、人口学特征、社会环境、生活环境等方面代表总体–病例的类型•新发病例:回忆偏倚小,调查因素改变少,可获得较为全面而真实的信息;首选病例类型•现患病例:易于掺入疾病迁延及存活的因素;数量多,容易获得,常被选用•死亡病例:仅能从医学记录或他人代述获得资料,误差较大,极少利用第6版预防医学人民卫生出版社病例的来源–来源于医院的病例:该类病例为某一所或若干所医院在一定时期内诊断的全部病例或其随机样本–来源于社区的病例:在某一地区内,通过普查、疾病统计或医院资料汇总得到的全部病例或其随机样本比较合作资料易得到且比较可靠与对照的可比性好代表性差代表性好工作开展比较困难耗费人力物力第6版预防医学人民卫生出版社对照的选择–确认对照的标准对照应是经过与病例相同的诊断技术确认的不患所研究疾病的人–对照的代表性对照应是产生病例的人群中全体未患该病者的一个随机样本–对照与病例的可比性要求除了研究因素之外,所有与疾病发生有关的因素在病例与对照之间均有可比性–对照不应患有与所研究因素有关的其他疾病–可同时选择两种以上对照设立多组其他疾病的对照可加强研究结果的说服力第6版预防医学人民卫生出版社对照的来源–同一或多个医疗机构中诊断的其他疾病病例–社区人口中的非该病病例–病例的邻居中的非该病病人:有助于控制社会经济地位、居住环境等因素的混杂作用–病例的配偶、同胞、亲戚:可以均衡遗传因素的混杂作用–病例的同事:主要用于排除生活环境或工作环境的影响实现“对照代表病例来源的人群中未患所研究疾病者”的原则第6版预防医学人民卫生出版社二、样本含量的估计–研究因素在人群中(对照组)的暴露率p0–预期的该因素的效应强度,即RR或OR值(查阅文献或预调查获得)–α值–把握度1-β第6版预防医学人民卫生出版社非匹配设计且病例数与对照数相等–查表法–公式法:求病例对照研究样本含量的公式–或近似公式病例组暴露率对照组暴露率第6版预防医学人民卫生出版社例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。某市普通人群中吸烟率P0=30%OR=5.0α=0.05把握度=0.90问需要多少病例与对照?0.680.3)50.3(10.35)PORP(1PORP00010.4920.300.682ppp01第6版预防医学人民卫生出版社α、β值查表,Zα为1.64,Zβ为1.28代入公式得:病例组与对照组,各需28人。如代入近似公式计算,所得结果与原公式很接近(n=29.5)。6.27)30.068.0()30.01(30.0)68.01(68.028.1)49.01(49.0264.122N第6版预防医学人民卫生出版社非匹配设计且病例数与对照数不等病例数:对照数=1:c对照组例数为c*nc1)cp(pp)p(p)Z)(Zp(1pc11n01012βα第6版预防医学人民卫生出版社1:1匹配设计总对子数)p(1p)p(1ppRR)RR/(1OR)OR/(1p1/2)(pp)p(1Z/2Zmm/pM0110e22βαe第6版预防医学人民卫生出版社资料来源医院病案记录、疾病登记报告等摘录检测病人的标本或病人的环境获得对病例或对照的询问调查中取得三、资料来源与收集方法第6版预防医学人民卫生出版社调查表定义也称“调查问卷”,通过把拟收集的数据项目用恰当的措词构成一系列问题的答卷,是资料收集的最主要工具。内容–调查表的名称、编号–一般项目:姓名、性别、民族等–研究项目:研究变量、疾病史、暴露史等–结尾部分:调查员签名、调查日期等第6版预防医学人民卫生出版社第6版预防医学人民卫生出版社四、资料的整理与分析–统计描述•描述研究对象的一般特征:包括描述病例和对照在性别、年龄、职业、出生地、居住地、疾病类型等方面的分布特征。匹配资料还要描述匹配情况。•均衡性检验:检验病例组和对照组之间除研究因素以外的与疾病发生有关的各种特征是否均衡可比。第6版预防医学人民卫生出版社–统计推断•成组病例对照研究资料的分析•1:1配对资料的分析第6版预防医学人民卫生出版社成组病例对照研究资料的分析列出四格表:将病例组与对照组的资料按有无暴露分组列出四格表成组病例对照研究资料整理表暴露史病例对照合计有aba+b=n1无cdc+d=n0合计a+c=m1b+d=m0a+b+c+d=N第6版预防医学人民卫生出版社假设检验利用χ²检验推断病例组与对照组暴露率的差异是否有统计学意义。若两组差异有统计学意义,说明该暴露因素与疾病的关联很可能不是由抽样误差造成的。))()()(()(22dbcadcbanbcad第6版预防医学人民卫生出版社估计暴露与疾病的关联强度比值比(oddsratio,OR)也称比数比、优势比或交叉乘积比。所谓比值(odds)是指某事物发生的可能性与不发生的可能性之比。bcaddbcaORdbdbddbbcacaccaa///)/()/(/)/()/(对照组的暴露比值病例组的暴露比值对照组的暴露比值病例组的暴露比值第6版预防医学人民卫生出版社–OR值的意义OR与相对危险度(relativerisk,RR)有密切关联。RR是暴露组与非暴露组发病概率之比,含义为暴露于某因素者发生疾病的概率是不暴露于某因素者的多少倍。RR值越大,因素与疾病的关联强度越大。RR=1暴露组发病概率与非暴露组发病概率相等,暴露与疾病无关RR1暴露组发病概率大于非暴露组发病概率,暴露增加了发生疾病的危险,是疾病的危险因素RR1暴露组发病概率小于非暴露组发病概率,暴露减少了发生疾病的危险,是疾病的保护因素第6版预防医学人民卫生出版社–OR值的意义病例对照研究不能计算发病率,也就无法得到RR,只能以OR估计RR。OR的含义与RR相同。OR1疾病的危险度因暴露而增加,暴露与疾病正关联OR1疾病的危险度因暴露而减少,暴露与疾病负关联在不同患病率和不同发病率的情况下,OR与RR是有差别的。疾病率小于5%时,OR与RR的值较接近。第6版预防医学人民卫生出版社–OR值可信限估计当样本OR值不等于1,但其95%的可信区间包含了1时,说明总体的OR值有可能是1,即