临床流行病学研究设计类型(二)——病例对照研究福建医科大学公共卫生学院许能锋2011年9月18日上街校区第16/6教室分析性研究分析性研究(analyticalstudy)是检验病因假设的一种流行病学研究方法,它包括病例对照研究和队列研究。分析性研究与描述性研究同属观察性研究,但分析性研究设立了可供对比分析的对照组,而描述性研究未设立对照组。提纲(一)定义、特性及类型(二)实施原则(三)资料分析方法(四)优点与局限性(一)定义、特点及类型1.定义病例对照研究(case-controlstudy)是选择已具有所研究结局的人作为病例组,选择不具有所研究结局的人作为对照组,分别调查两组人群过去暴露于某个(些)暴露因素的比例,以判断暴露因素与该研究结局有无关联。这种方法在时间上是回顾性的,故又称回顾性研究(retrospectivestudy)。病例对照研究原理示意图调查方向:收集回顾性资料比较人数暴露结局(+)病例组(–)对照组+-+-acbd)(caa)(dbb现在过去孕期服用反应停与新生儿海豹样短肢畸形的病例对照研究母亲服用反应停病例组对照组合计有12214无3888126合计5090140服用反应停比例24.0%2.2%OR=24.0%/2.2%=13.9(OR95%CI2.8-131.2)χ2=16.94P0.001。WeickerHetal(1962)DtschmedWschr.87:1593病例对照研究应用实例暴露结局1儿童期养猫精神分裂症、分裂情感性疾患躁郁症【FullTorrey,etal.(2000)】2体重指数胰腺癌【SlvermanDTal.(2001)】3生理残疾地震死亡【OsakiY,etal.(2001)】4食道裂孔疝反流性食管炎【AvidanB,etal.(2001)】5染发结缔组织病【Freni-TitulaerLw,etal.(1989)】6带状疱疹病史系统系红斑狼疮【StromBL,etal.(1994)】7养猪尼帕病毒感染【AmalNM,etal.(2000)】8脐带残端涂覆印度酥油新生儿破伤风【TraversoHP,etal.(1989)】9食用腌制蔬菜食管癌【ChengKK,etal.(1992)】10跑到铺覆草皮赛马场上的肌肉骨骼损伤【HernandezJ,etal.(2001)】11直肠指检转移性前列腺癌【FriedmanGD,etal.(1991)】12他汀类药物降脂治疗痴呆【JickH,etal.(2000)】13使用对乙酰氨基酚卵巢癌【GramerDW,etal.(1998)】14植物雌激素乳腺癌【IngramD,etal.(1997)】15交叉路口上方安装反射镜铲车撞车所致损伤【CollinsJw,etal.(1999)】16男性使用安全套生殖器疣【WenLM,etal.(1999)】17锻炼身体卵巢癌【VerloopJ,etal.(2000)】18乙状结肠经筛查结肠癌【SlatteryML,etal.(2000)】19孕期补充大量叶酸和铁剂小头畸形【Abdel-SalamG,etal.(2000)】20流感疫苗复发性心肌梗死【NaghaviM,etal.(2000)】2.特性1.属于观察法2.设置对照组(有对照)3.观察方向,果→因(回顾性研究)4.通常难以证实因果联系3.分类1)按研究设计分为:⑴成组病例对照研究⑵配比病例对照研究2)按研究目的分为:⑴探索性病例对照研究⑵验证性病例对照研究3)按研究场所分为:⑴以人群为基础的病例对照研究⑵以医院为基础的病例对照研究(二)实施原则1.病例的选择⑴对疾病及其他特征的规定所选病例必须是患同一种疾病的病人。为此,疾病的诊断标准要明确统一。尽量采用国际通用或国内统一诊断标准。为了控制非研究因素的影响,增强两组的可比性,在病例的选择时,有时可对年龄、性别、民族等因素加以限制。有时还规定对象为存活病例并能清楚回答问题者,这是为了得到较可靠的信息。1.病例的选择⑵病例的来源病例选择要遵循的一个重要原则是病例的代表性。病例对照研究中病例主要有两种来源:一种是特定时间内在社区中通过疾病筛检获得的病例。其代表性强,但不易得到;另一种是一所或若干所医院在一定时期内确诊的住院或门诊病例。其疾病诊断相对准确,且较易得到、省经费,但它带有选择性,容易产生选择偏倚。在病例对照研究中,对照组的选择比病例组的选择更为复杂。对照组应该代表可能会发展为病例的人群(即产生病例的人群),必须是经过相同的诊断方法确认不患所研究的疾病,且不处于亚临床期或潜伏期的人。⑴对照的来源对照的来源有两种。一种是当病例来自社区时可以从该地区未患该病的人群中抽样作为对照;其优点是推断总体的结论可靠性好,但实行较困难,且无应答率高。另一种是从选择病例的同一医院内选择其他疾病的病人作对照,且病种愈复杂愈好。其优点是操作较方便,且对照的应答率和信息的质量均较高,但容易产生选择偏性。有时还可选两种对照,如既从社区人群中选择对照,又从医院其他病人中选择对照。两者研究结果一致,则增强了结论的可靠性。若结果不一致则可进一步分析其原因。2.对照的选择2.对照的选择⑵配比配比是选择对照的一种方法,它使对照组在某些特征上与病例组保持一致,这是一种限制混杂因素干扰结果的方法。这些特征称为配比变量。常见的配比变量有性别、年龄、种族、住址等。例如,让对照与病例同属一个年龄组,同性别等,这样,年龄和性别就不会影响研究结果。配比时不可能将一切研究因素以外的因素都进行配比,而且配比变量越多,选择对照越困难,易产生匹配过头。3.样本含量样本含量的大小取决于下列四个因素:⑴对照人群中所研究因素的估计暴露比例Po。⑵预期与该因素有关的比值比。⑶希望达到的检验显著性水准,即统计学检验中犯第一类错误的概率α。⑷希望达到的检验把握度(1-β),β则为统计学检验中犯第二类错误的概率。成组病例对照研究的样本含量计算公式如下:20121100)()2(PPQPQPZQPZN上式中N为病例组或对照组人数,Zα与Zβ分别为α与β相对应的标准正态分布的分位数,P0,P1分别为对照组及病例组估计的危险因素的暴露比例,有时P1较难估计,也可用下式计算:)1(0001PORPPORP式中Q0=1-P0,Q1=1-P1,2/)(10PPP,PQ1。4.研究因素的确定及资料收集⑴确定研究因素⑵收集资料⑴确定研究因素根据研究的目的确定研究因素的个数和具体变量。与目的有关的变量不但绝不可少,而且应该将该因素尽量分解,如吸烟与肺癌关系的研究中,除调查对象吸烟与否外,还要将吸烟再分解成吸烟持续时间、每日吸烟量、烟的种类及是否戒烟等。与目的无关的变量则一个都不要。⑴确定研究因素对每个变量要有明确的定义,尽可能采用国际或国内统一的标准。确定变量的测量方法。应尽量利用定量或半定量的测量,这样取得的信息较丰富,客观性好,且便于统计分析中进行定量分析。在调查时,还要收集姓名、性别、年龄、住址等一般资料。由一般项目、研究因素项目及调查者项目(调查人员及日期等)构成一份调查表。调查表是病例对照研究中获取信息的主要来源。⑵收集资料资料的收集方法主要采用现场询问方式填写调查表通过通信或电话填写调查表查询登记报告或医疗记录等手段收集资料收集资料应实行质量监督以保证收集过程顺利进行和所收集信息的质量对病例组和对照组要采取同样的认真态度收集资料,以免影响结果的正确性(三)资料分析方法资料收集后要进行审核、纠正,并对原始数据作适当的分组、归纳整理,并输入计算机待分析。资料可靠性检验。组间均衡性检验。1.成组病例对照研究资料分析⑴资料整理成组病例对照研究资料可按表2整理成四格表形式。表2病例对照研究资料整理表暴露或特征病例组对照组合计有aba+b无cdc+d合计a+cc+da+b+c+dχ2=()()()()()adbcnabacbdcd2(当n≥40,且T≥5时)χ2=()()()()()adbcnnabacbdcd22(当n≥40,且1≤T5时)例1一项研究介入性操作与医院感染关系的病例对照研究,调查了100例有感染病人作为病例组,同期在同病区调查100例无感染病人作为对照组,从诊疗史调查中得知病例组有64例和对照中有12例曾进行过介入性诊疗操作。这项资料整理成四格表如表3。表3介入性诊疗操作与医院感染的病例对照研究资料介入性诊疗操作感染病人非感染病人合计有641276无3688124合计100100200⑵病例组与对照组的暴露比的显著性检验,可用一般的四格表χ2检验或校正的χ2检验。若两组暴露比差异有统计学意义,应进一步计算比值比。本例数据代入χ2检验公式得:39.5712476100100200)36128864(22χ2=57.39χ20.01(1)=6.63,P0.01,表明进行过介入性诊疗操作与医院感染的发生有关。⑶计算比值比某暴露因素与疾病存在统计学联系,则应进一步估计暴露与疾病的联系强度。联系强度的指标是相对危险度(RR),RR是暴露组与非暴露组发病率之比,由于病例对照研究不能计算发病率,所以在病例对照研究中不能求得RR,而只能计算比值比(oddsratio,缩写为OR)来估计。比值比是指某事件发生的概率与不发生的概率之比。在病例对照研究中:cacaccaa)()(病例组的暴露比值=,dbdbddbb)()(对照组的暴露比值,病例组的暴露比值与对照组的暴露比值之比称为比值比,即:bcadOR比值比的含义是指暴露组的疾病危险性为非暴露组的多少倍。当OR1时,说明病例组的暴露概率大于对照组,即暴露有较高的发病危险性;反之,当OR1时,说明病例组的暴露概率低于对照组,即暴露有保护作用。疾病与暴露联系愈密切,比值比的数值愈大。在不同的患病率和发病率情况下,OR与RR是有差别的,但疾病率小于5%时,OR与RR近似相同。本例资料代入公式计算比值比:04.1336128864OR介入性操作与医院感染的OR=13.04,联系强度很强。⑷计算比值比的可信区间OR是联系强度的一个点估计值。虽然简单明了,但未考虑抽样误差,可用可信区间来估计。OR的可信区间按一定的概率来估计总体OR的范围,有助于进一步了解联系的性质及程度。可信区间不包括1.0,即可认为OR值在α水平上有显著性。如可信区间跨度大,则表明抽样误差较大。一般采用95%或99%的可信区间。估计95%的可信区间的计算公式为:)/96.11(2,ORORORUL本例OR的95%可信区间为:34.2571.604.13,)39.57/96.11(~ULOROROR的95%可信区间下限远大于1,如果进行多次研究,其OR值近似,则说明进行过介入性诊疗操作增加医院感染的发病危险。2.1:1配对病例对照研究资料分析1:1配对资料的分析程序与成组资料分析相似,但资料整理方法不同,计算也有其特定的专用公式。⑴资料整理资料整理的格式见表4。表41:1配对病例对照研究资料整理表病例对照有暴露史无暴露史合计(对子数)有暴露史aba+b无暴露史cdc+d合计(对子数)a+cB+da+b+c+d⑵配对χ2检验。cbcb22)(或cbcb22)1((b+c40时)⑶计算比值比其计算公式为:bcOR⑷计算比值比的可信区间。例2绝经期妇女患子宫内膜癌与用雌性激素的关系的病例对照研究,用1:1配对设计,结果见表5。表5绝经期妇女患子宫内膜癌与服用雌性激素的关系对照用过雌激素未用雌激素合计用过雌激素39113152病例未用雌激素15150165合计54263317资料代入公式计算χ2值,得:46.7515113)15113(22=χ2=6.58χ20.05(1)=3.84,P0.05。资料代入公式计算OR值,得:53.715113OR资料代入公式计算OR值的95%可信区间,得:87.