医学院流行病与卫生统计学教研室张东峰医学检验…内容第一节基本原理第二节研究类型第三节研究设计与实施第四节资料的整理与分析第五节常见偏倚及其控制第六节研究实例第七节优点与局限性及实施时应注意的问题第一节基本原理•基本原理•研究示意图•研究史基本原理以确诊患某种特定疾病的病人作为病例以不患该病但具有可比性的个体作为对照通过询问、实验室检查或复查病史,搜集既往危险因素暴露史测量并比较两组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联病例对照研究特点•1属于观察法研究者不给研究对象以任何干预,而只是客观地收集对象的暴露情况。病例对照是自然形成的。•2设立对照有单独设立的,由未患所研究疾病的人组成的,供病例组作比较的对照组。•3观察方向由“果”至“因”研究者面对的是病因作用的结果。•4研究方向是纵向的、回顾性的。暴露与否已成事实。研究者不能主动控制病例组和对照组对危险因素的暴露。•5难以证实因果关系。时间病例组对照组研究开始暴露暴露非暴露非暴露调查方向图5-1病例对照研究示意图(Greenberg2002)注:阴影区域代表暴露于所研究的危险因素的研究对象研究示意图研究简史•1843年Guy向统计学会报告-最早病例对照研究•分析职业暴露与肺结核发生的关系•1844年Louis的著作•最早出现病例对照研究的概念•1926年LaneClaypon报告•生殖因素与乳腺癌关系的研究•1947年Schreck和Lenowitz•包皮环切和性卫生与阴茎癌的关系•1947年Hartwell•输血与肝炎关系的研究•1950年Doll和Hill•吸烟与肺癌的研究•20世纪60年代以来•孕妇服用反应停(thalidomide)与婴儿短肢畸形•母亲吸烟与先天性畸形•早产儿吸入高浓度氧与晶体后纤维组织增生症•经期使用月经棉与中毒性休克综合征•小剂量电离辐射与白血病•母亲早孕期服用雌激素与少女阴道腺癌等之间的关系第二节研究类型•病例与对照不匹配•病例与对照匹配•衍生的研究类型病例与对照不匹配•从设计所规定病例和对照人群中,分别抽取一定量的研究对象•对照组人数≥病例组人数•选择对照没有特殊规定病例与对照匹配匹配/配比(matching)匹配或配比:要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰.分类频数匹配个体匹配频数匹配(又称成组匹配)匹配因素所占的比例在对照组与病例组一致个体匹配以病例和对照个体为单位进行匹配匹配法注意事项慎重选择匹配因素可疑病因不作为匹配因素比例一般为1:1,最多不超过1:4避免“匹配过度(overmatching)”匹配的目的提高研究效率控制混杂因素的作用病例对照研究的衍生类型•病例对照与队列研究作为病因研究的主要方法,有其各自的优势与不足,而且这些优势与不足相互补充,因此,在实践过程中产生了一些新的研究类型,结合使用这两种方法,扬长避短。•巢式病例对照研究•单纯病例研究•病例时间对照设计•病例-队列研究•病例交叉研究巢式病例对照研究(nestedcasecontrolstudy)基本原理按队列研究方式进行选择一队列,收集基线资料,采集所研究的生物学标志的组织或体液标本储存备用随访随访到出现能满足病例对照研究样本量的病例数为止匹配按病例进入队列的时间、疾病出现时间与性别、年龄等匹配条件,从同一队列选择1个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本资料处理按匹配病例对照研究方法处理资料1992年巢式病例对照研究:①上海地区肝癌与尿中黄曲霉素生物学标志关系②18244名中年男性队列中发现22例肝癌③每例配5或10个对照检测研究开始时的尿样:发现黄曲霉素B1及其代谢产物和DNA加成物的OR值经调整混杂因素后,为3.8(1.2~12.2)。黄曲霉素作为肝癌致病因素最直接的证据病例-队列研究(case-cohortstudy)基本原理研究开始时,在队列中随机选取一组样本作为对照组观察结束时,队列中出现被研究疾病所有病例作病例组与随机对照组进行比较这种研究模式,可同时研究几种疾病,不同疾病有不同病例组,但对照组都是同一组随机样本病例--队列与巢式病例对照研究的区别对照是随机选取,不与病例进行匹配随机对照组中成员如发生被研究疾病,既为对照,又同时为病例1个随机对照组可以同时和几个病例组比较分析病例--队列与巢式病例对照研究的优点因果关系清楚资料可靠论证强度高省时省力省钱适合于分子流行病学研究病例病例研究(casecasestudy)背景1994年Piegorseh、Begs等提出遗传与环境的关系交互作用病例对照研究和队列研究的效率费用•应用前提条件•在正常人群中基因型与环境暴露各自独立发生•所研究疾病为罕见病(此时可用OR来估计RR值)基本原理确定某一患者群体作为研究对象收集病人的一般情况、协变量、环境暴露资料,病收集生物标本采用分子生物学技术检测基因型根据某一基因型的有无将研究对象分为类病例组和类对照组统计分析,计算OR值、p值判断有无相乘模型交互作用及显著性意义若有,进一步判断为正相乘作用,抑或负相乘作用研究示意图单纯病例研究环境暴露基因型病人+-+-+-OR=ad/bc当ORge1时,有正相乘模型交互作用当ORge=1时,无相乘模型交互作用当ORge1时,有负相乘模型交互作用E+E-G-G+badc表5-1环境暴露与基因型病例交叉研究(case-crossoverdesign)解决问题1991年美国Maclure提出病例交叉设计1995年Suissa在Maclure的基础上提出了病例时间对照设计.日常生活中一些突发事件之后,常会伴随某些结果的发生。究竟是这些突发事件导致了结果的发生,还是仅仅由于机会所致?基本原理暴露与某急性事件有关比较相同研究对象暴露情况在急性事件发生前一段时间与未发生事件的某段时间如果暴露与少见的事件(或疾病)有关,那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。研究对象病例和对照,两部分的信息均来自于同一个体病例部分“危险期,疾病或事件发生前的一段时间“对照部分”对照期,危险期外特定的一段时间研究是对个体危险期和对照期内的暴露信息进行比较•应用病例-交叉设计研究移动电话使用与车祸发生关系。以699例车祸病例为研究对象,调查发现他们在车祸发生一周内共打过20513次电话,发生车祸前10min内(riskperiod)24.32%打过电话,车祸发生一周前的10min内(controlperiod)5.29%打过电话。配对分析结果OR值为6.5(95%CI:4.5~10.0)。表9打移动电话与车祸的发生关系riskperiod(车祸的发生期)未打电话次数曾打电话次数controlperiod未打电话次数505157对照期曾打电话次数2413注:OR=157/24=6.5(95%CI:4.5~10.0);3摘自NEJM,1997,336∶453245第三节研究设计与实施研究步骤病例与对照的选择样本含量的估计资料的来源与收集方法研究步骤提出假设根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,提出病因假设明确适宜的研究类型选择病例与对照比较的方法:用匹配或成组比较法如用匹配法,需确定病例与对照的比例及匹配条件如果研究目的是广泛地探索疾病的危险因素,可以采用不匹配或频数匹配的方法如果所研究的是罕见病,或所能得到的符合规定的病例数很少时,则选择个体匹配方法,因为匹配比不匹配的统计学检验效率高。以较小的样本量获得较高的检验效率。如1:R(或称1:M)的匹配方法。匹配可保证对照与病例在某些重要方面的可比性。对于小样本研究以及因为病例的某种构成(例如年龄、性别构成)特殊,随机抽取的对照组很难与病例组均衡可比,此时个体匹配特别有用。病例与对照的来源与选择对照的选择是整个研究的关键之一研究得出的结论是否可靠,首先要看对照的选择是否合理。病例与对照选择的基本原则:代表性可比性(往往更重要)选择方法抽样匹配病例的选择选择病例的要求诊断可靠使用金标准选择确诊的新病例回忆偏倚小代表性好容易合作被调查因素改变少来源总体人群中全部病例或总体随机样本人群中全部医院住院或门诊的病例代表性好工作开展比较困难耗费人力物力病例比较合作资料易得到且比较可靠与对照的可比性好代表性差对照的选择原则对照必须来自于产生病例的人群意味着对照一旦发生所研究的疾病,就能成为病例组的研究对象。对照与病例比较的方法成组比较法(groupcomparison)匹配法(matching)频数匹配个体匹配来源研究的总体人群或抽样人群医院中患有其它疾病的病人亲属、邻居、同事、同学等样本含量的估计有关参数人群中被研究因素的暴露率(exposurerate)RR或OR值(查阅文献或预调查获得)α值把握度方法查表法公式法:求病例对照研究样本含量的公式(病例组与对照组人数相等)病例组暴露率对照组暴露率22102()/()npqzzpp0101(1)pRRppRR100.5()ppp1qp例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。某市普通人群中吸烟率P0=20%OR=2.0α=0.05把握度=0.90问需要多少病例与对照?10.22/10.210.3330.20.333/20.26710.2670.733ppqα、β值查表,Zα为1.96,Zβ为1.282代入公式得:病例组与对照组,各需232人。2220.2670.7331.961.282/0.3330.2232n病例组与对照组例数不等时的公式:病例数:对照数=1:c对照组例数为c*n2210(11/)()/()ncpqzzpp10/1ppcpc1qp1:1匹配设计总对子数p0和p1分别代表目标人群中对照组与病例组的估计暴露率m为暴露状况不一致的对子数22/2(1)/(1/2)mzzppp/1/1pORORRRRR0110/Mmpqpq100/1(1)ppRRpRR111qp001qp•例如,研究口服避孕药与先天性心脏病的关系,设α=0.05(双侧),β=0.1,对照组的暴露比例为P0=0.3,估计的RR=2,估计样本含量对子数。•P0=0.46,3/2)21/(2)1/()1/(RRRRORORp186)/(;901100qpqpmMm•1:R匹配设计•先计算研究时需要的病例数,再求对照数,对照数为R×n)1/()()1/()()/(])1(/)1(1(/11([n01000120120011rrppppORppORppppprppzpprz其中:•上述例题如果1:4匹配,病例及对照各需要多少例数?200450504176.490261.0/2898.13.0,2,4,28.1z1.0(64.105.0005.0对照组为,则单侧检验);,npORrz研究因素的选定与测量变量的选定:根据研究的目的或具体的目标,确定调查变量的数目和每一个变量的具体项目。变量的定义:每项变量都要有明确的定义。采用国内外统一标准。变量的测定:研究中应尽可能地采用定量或半定量的量度。资料来源与收集方法资料的收集在病例对照研究中十分重要方式方法不恰当,收集的资料就不可靠统计处理无法纠正的系统误差资料来源医院病案记录疾病登记报告等摘录致病因素数据需检测病人的标本或环境获得询问调查获得第四节资料的整理与分析资料的整理描述性统计统计性推断成组比较法资料的分析1:1配对资料的分析混杂因素作用的估计与分层分析•资料的整理:•1.原始资料的核查•2.原始资料的录入描述性统计分析•1.描述研究对象的一般特征:•性别、年龄、职业、出生地、居住地、疾病的分型。频数匹配时应描述匹配