χ2检验(Chi-squaretest)(3学时)吴成秋公共卫生学院卫生统计学教研室χ2检验的应用1.推断两个(多个)总体率或构成比之间是否有差别2.多个样本率间的多重比较3.两个分类变量之间有无关联性4.频数分布拟合优度检验一、χ2检验的基本思想例7-1某医生用两种疗法治疗前列腺癌,出院后随访3年,甲疗法治疗86例。乙疗法治疗95例,结果见下表。问两种疗法治疗前列腺癌病人的3年生存率是否有差别?表10-7甲乙两种疗法治疗前列腺癌的3年生存率处理生存数死亡数合计生存率(%)甲疗法a52(46.09)b34(39.91)(a+b)8660.47乙疗法c45(50.91)d50(44.09)(c+d)9547.37合计(a+c)97(b+d)84(n)18153.59表中为基本数据,称为实际频数,用AR.C表示,表中是根据A计算得到的,称为理论频数,用TR.C表示。该资料称为四格表资料。5234455046.0939.9150.9144.09若假设两种疗法治疗前列腺癌病人的3年生存率相同,即H0:1=2=53.59%,则T1.1=86×97/181=46.09T1.2=86×84/181=39.91T2.1=95×97/181=50.91T2.2=95×84/181=44.09TR.C=nR×ncnχ2=∑(A-T)2υ=(R-1)(C-1)υ=(2-1)(2-1)=1T假如H0:π1=π2成立,则A、T不会相差太大,那么χ2会小;(A与T的差别是由抽样误差所致)反之若检验假设H0不成立,则A、T会相差很大,那么χ2会大;(抽样误差不能引起A与T如此大的差别)判断结果,根据自由度υ的大小查χ2界值表当χ2≥χ2α,υ时,P≤α,拒绝H0,接受H1当χ2<χ2α,υ时,P>α,不拒绝H0.χ2反映了实际频数与理论频数的吻合程度(一)、四格表的一般公式二、一般四格表的χ2检验χ2=∑(A-T)2υ=(R-1)(C-1)T以例10-7为例做χ2检验H0:π1=π2即两种疗法治疗前列腺癌的3年生存率相同H1:π1≠π2即两种疗法治疗前列腺癌的3年生存率不相同α=0.05T1.1=86×97/181=46.09T1.2=86×84/181=39.91T2.1=95×97/181=50.91T2.2=95×84/181=44.09χ2=∑(A-T)2=(52-46.09)2+(34-39.91)2+(45-50.91)2+(50-44.09)2=3.11υ=(2-1)(2-1)=1查χ2界值表得χ20.05,1=3.84,χ2χ20.05,1,P0.05。按α=0.05的水准,不拒绝H0,还不能认为两种疗法治疗前列腺癌的3年生存率不相同。T44.0950.9139.9146.09(二)、四格表的专用公式当n≥40,T≥5时,用χ2=(ad-bc)2n(a+b)(c+d)(a+c)(b+d)a、b、c、d为四格表的实际频数(a+b),(c+d),(a+c),(b+d)是四格表周边的合计数n=a+b+c+d,为总的样本含量对例10-7的计算χ2==3.11(52×50-34×45)2181(86×95×97×84)显然,计算结果与前相同,但该法避免了计算理论数的麻繁(三)、四格表的校正公式1.χ2检验的应用条件(1)当n≥40且T≥5时,用χ2检验的基本公式或四格表的专用公式;当P≈α时,改用四格表的确切概率法。(2)当n≥40时但有1≤T<5时,用四格表χ2的校正公式或用四格表的确切概率法(3)当n<40时,或T<1时,用四格表的确切概率法2.四格表χ2的校正公式χ2=∑(︱A-T︱-0.5)2Tχ2=(︱ad-bc︱-n/2)2n(a+b)(c+d)(a+c)(b+d)例7-2某医师用两种疗法治疗心绞痛,结果如表10-10,问两种疗法的疗效有无差别?表10-10两种疗法治疗心绞痛的效果率组别有效无效合计有效率(%)甲疗法236(4.42)2979.31乙疗法2733090.00合计5095984.75H0:π1=π2即两种疗法的疗效相等H1:π1≠π2即两种疗法的疗效不等α=0.05T=29×9/59=4.42(计算行合计和列合计均为最小的理论数)χc2==0.61υ=1,查χ2界值表得,P0.05。按α=0.05的水准不拒绝H0,尚不能认为两种两种疗法的疗效不等.(23×3-6×27-59/2)2×5929×30×50×9三、配对四格表资料的χ2检验配对四格表资料的χ2检验是对配对设计研究所获得的资料为计数资料进行比较。配对设计包括:①同一批样品用两种不同的处理方法②观察对象根据配对条件配成对子,同一对子内的不同个体分别接受不同的处理③在病因或危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种病因或危险因素。观察的结果只有阳性、阴性两种可能,清点成对资料时只有四种情况:a:甲+乙+b:甲+乙-c:甲-乙+d:甲-乙-列成下面四格表适用于配对设计的计数资料配对资料的结果有甲乙结果++a+-b-+c--d乙法合计甲法+-+aba+b-cdc+d合计a+cb+dn配对设计的计数资料χ2=(b-c)2/(b+c),υ=1,(b+c)≥40χc2=(b-c-1)2/(b+c),υ=1(b+c)<40例对120名确诊的乳腺癌病人,分别用甲乙两种方法来检测,甲方法检出阳性率为60%,乙方法检出阳性率为50%,甲乙一致检出阳性率为35%,问甲乙两方法检出阳性率有无差别?表:两种方法的检测结果甲方法乙方法合计+—+—合计42(a)30(b)18(c)30(d)72(a+b)48(c+d)60(a+c)60(b+d)120(a+b+c+d)H0:B=C(π1=π2)H1:B≠C(π1≠π2)α=0.05b+c=30+18=4840χ2=(30-18)2/(30+18)=3.0υ=1,查χ2界值表得P0.05。按α=0.05水准,不拒绝H0,还不能认为两种方法的检验结果不同。配对四格表资料的关联性检验(P761)H0:两种方法无关(无一致性)H1:两种方法有关(有一致性)α=0.052两种方法检测结果的相关系数rr必定等于kappa检验的kappa值2nadbcn2a+ba+cb+dc+d()adbcra+ba+cb+dc+dK0.75一致性好0.40≤k≤0.75一致性较好K0.40一致性差例7~3某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗体进行测定,结果见表7~3。问两种方法的检验结果有无差别?表7~3两种方法的检测结果免疫荧光法乳胶凝集法合计+—+—合计11(a)12(b)2(c)3(d)2335134558H0:B=CH1:B=Cα=0.05b+c=12+4=1440χc2=(12-2-1)2/(12+2)=5.79υ=1,查χ2界值表得0.01P0.025。按α=0.05水准拒绝H0,接受H1,认为两种方法的检验结果不同,免疫荧光法的阳性检出率较高。四、行×列表资料的χ2检验可以用于多个率及多个构成比资料的比较和双向无序分类资料关联性检验。其基本数据有三种情况:1、多个样本率比较。有R行2列,称为R×2表2、两个样本的构成比比较,有2行C列,称为2×C表3、多个样本的构成比比较,以及双向无序分类资料关联性检验,有R行C列,称为R×C表行列表检验的专用公式χ2=n(∑A2/nRnC-1)υ=(R-1)(C-1)(一)多个样本率的比较例7-6某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别?表7-8三种疗法有效率的比较疗法有效无效合计有效率(%)物理疗法组199720696.60药物治疗组1641818290.11外用药膏组1182614481.94合计4815153290.41H0:π1=π2=π3,即三种疗法的有效率相等H1:三种疗法的有效率不全相等α=0.05χ2=532(1992/206×481+72/206×51+…+262/144×51-1)=21.04υ=(3-1)(2-1)=2查χ2界值表:得P0.005.按α=0.05拒绝H0,接受H1,可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。(二)样本构成比的比较例7-7某医师在研究血管紧张素转化酶(ACE)基因I/D多态与2型糖尿病肾病(DN)的关系时,将249例Ⅱ型糖尿病患肾病分为两组,资料见表7~9。问两组Ⅱ型糖尿病患者的ACE基因型总体分布有无差别?表7-9DN组与无DN组Ⅱ型糖尿病患者ACE基因型分布组别DDIDII合计DN组无DN组合计42(37.8)48(43.3)21(18.9)11130(21.7)72(52.2)36(26.1)13872(28.9)120(48.2)57(22.9)249H0:两组2型糖尿病患者ACE基因型的总体构成比相同H1:两组2型糖尿病患者ACE基因型的总体构成比不同α=0.05按公式(7~10)计算χ2=249(422/111×72+482/111×120+…+362/138×57-1)=7.91υ=(2-1)(3-1)=2查χ2界值表得0.01P0.025。按α=0.05拒绝H0,接受H1,认为DN与无DN的2型糖尿病患者的ACE基因型分布不同。(三)双向无序分类资料的关联性检验例7-8测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?表7-10某地5801人的血型ABO血型MN血型合计MNMNO4314909021823A3884108001598B4955879502032AB13717932348合计1451166626845801H0:两种血型系统间无关联H1:两种血型系统间有关联α=0.052=5801[4322/(1823×1451)+4902/(1823×1666)+…+322/(348×2684)-1]=213.16υ=(4-1)(3-1)=6查2界值表得P0.005。按α=0.05拒绝H0,接受H1,认为两种血型系统间有关联。若需进一步分析关系的密切程度时,可计算Pearson列联系数CC取值范围在0~1之间。0表示独立:1表示完全相关;愈接近于0,关系愈不密切,愈接近于1,关系愈密切。22cn(四)、行×列表资料检验的注意事项1、理论频数T不应太小;不宜有1/5以上的格子1≤T5;不宜有一个格子的T1若出现上述情况,处理的方法有:(1)最好是增加样本的含量(继续观察),使T增加(2)根据专业知识,考虑能否删去T太小的行或列,或T太小的行间或列间,进行合理的合并组别痊愈好转无效恶化死亡甲T1T1乙(3)改用双向无序表的确切概率法2、多个率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较。3、对于有序的R×C表资料不宜用2检验(见后)(五)R×C表的分类及其检验方法的选择1、双向无序R×C表:R×C表中两个分类变量皆为无序分类变量,如表7-8、7-9、7-10。对于该类资料:①若研究目的为多个样本率(或构成比)的比较,可用R×2表资料的2检验②若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用R×C表资料的2检验以及Pearson列联系数进行分析。2、单向有序R×C表:有两种形式①R×C表中的分组变量是有序的(如年龄),而指标变量是无序的(如传染病的类型),其研究目的通常是分析不同年龄组各种传染病的构成情况,此种单向有序R×C表资料可用行×列资料的2检验。②R×C表中的分组变量为无序的(如疗法),而指标变量是有序的(如疗效按等级分组),其研究目的为比较不同方法的疗效,此种单向有序R×C表资料宜用秩和检验进行分析。3、双向有序属性相同的R×C表:R×C表中的两分类变量皆为有序且属性相同。实际上是2×2配对设计的扩展,即水平数≥3的诊断试验配伍设