1χ2检验chi-squaretest四川大学华西医院循证医学与临床流行病学教研室刘关键χ2检验的用途Àχ2检验(chi-squaretest)是一种用途较广的假设检验方法,现在主要用于:À①两个率或两个构成比的比较À②多个率或多个构成比的比较À③两个分类变量的相关关系À④频数分布的拟合优度检验χ2检验的基本公式Àχ2检验是通过统计量χ2值来进行推断的,χ2值可用如下基本公式来进行计算:χ2=Σ(A-T)2T式中:A为实际频数(ActualFrequency)即某结果的实际发生频数。T为理论频数(TheoreticalFrequency)À理论频数T可用下式计算:TRC=nRnC/NÀ式中,nR表示相应行的合计,nC表示相应列的合计,N为总例数,TRC表示某个实际频数的理论频数。,如:第一个单元格的理论数:T11=(47×96)/131=34.44,余类推。两组降低颅内压有效率数据的实际数与理论数组别有效数无效数合计有效率%试验组99(90.48)5(13.52)10495.20对照组75(83.52)21(12.48)9678.13合计1742620087.00如:T11=nR1nC1/N=(174×104)/200=90.48T12=nR1nC2/N=(26×104)/200=13.52余类推。2χ2=(99-90.48)290.48+(5-13.52)213.52+(75-83.52)283.52+(21-12.48)212.48=12.86两组降低颅内压有效率比较的卡方值计算组别有效数无效数合计有效率%试验组99(90.48)5(13.52)10495.20对照组75(83.52)21(12.48)9678.13合计1742620087.00À从上可以见χ2值反映了实际频数和理论频数吻合的程度。À如果检验假设成立,则实际频数与理论频数之差一般不会很大,χ2值较小。À若χ2值较小,P较大,当P>α,则没有理由拒绝它À若χ2值较大,P较小,当P≤α(检验水准),我们就怀疑假设成立,因而拒绝它Àχ2与P值的对应关系可查χ2界值表。Àχ2值可利用χ2分布获取概率,若通过χ2界值表获取概率时应注意:Àχ2值的大小,不仅决定于A-T的差值,还取决于自由度的大小。若自由度愈大,χ2值也会愈大,只有排除了这种影响,χ2值才能正确反映A和T的吻合程度,因此在查表时要考虑自由度的大小。χ2的自由度计算:ν=(行数-1)(列数-1)四格表的卡方检验PearsonChi-squaretest用途和应用条件À四格表资料,可直接用专用公式来计算χ2值,若为了省去求理论数的过程,简化运算,可用四格表χ2检验的专用公式。其应用条件为:À①两个率或两个构成比的比较。À②任何一个格子的理论数大于或等于5,并且样本例数大于或等于40,即:T≥5且n≥40。À式中a、b、c、d分别为四格表的四个实际频数Àn为总例数n=a+b+c+d,其符号表示的数据如表所示。χ2=(ad-bc)2n(a+b)(c+d)(a+c)(b+d)四格表卡方检验的公式3实例分析À例:某医院比较某药降低颅内压的疗效,将200例颅内压增高患者随机分为试验组和对照组,试验数据如下表所示,问两种疗效的有效率有无差别?ÀH0:两组有效率相等,即π1=π2ÀH1:两组有效率不等,即π1≠π2Àα=0.05À本例每个格子的理论数大于5,且总例数大于40,可用四格表的卡方检验χ2=(ad-bc)2n(a+b)(c+d)(a+c)(b+d)=(99×21-5×75)2×200104×96×174×26=12.857两组降低颅内压有效率的比较组别有效数无效数合计有效率%试验组99(a)5(b)104(a+b)95.20对照组75(c)21(d)96(c+d)78.13合计174(a+c)26(b+d)200(N)87.00À得概率,下结论:À计算机软件χ2=12.857,P=0.000À查χ2界值表,得P0.05,按α=0.05水准,拒绝H0,接受H1,可认为两种药物的疗效有差别。校正四格表的卡方检验ContinuityCorrectionChi-square校正四格表卡方检验的意义À由于χ2界值表是根据连续性的理论分布计算出来的,即χ2界值表的连续性的理论分布。若是用非连续性的分类资料计算出的χ2值是不连续的。即在χ2检验中,由公式计算得到的χ2值与查表得到的χ2理论分布的界值间存在一定的误差,χ2值>χ2界值,所得概率偏小。4校正四格表卡方检验的意义À在观察例数(或理论数)较大时,χ2值与χ2分布的这种误差可忽略不计;但是若观察例数(或理论数)较小时,就需要对此χ2值与χ2分布间的误差进行校正。用途和应用条件À校正四格表χ2检验的应用条件为:À①两个率或两个构成比的比较À②任何一个格子的理论数1≤T5且n≥40时À式中a、b、c、d分别为四格表的四个实际频数Àn为总例数n=a+b+c+d,其符号表示的数据如前所述。计算公式χ2=(|ad-bc|-n/2)2n(a+b)(c+d)(a+c)(b+d)实例分析À例:某医师欲比较胞磷胆碱与神经酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分配为两组,其治疗结果如下表,问两种药物治疗有效率有无差别?ÀH0:两组有效率相等,即π1=π2ÀH1:两组有效率不等,即π1≠π2Àα=0.05À本例d格子的理论数小于5,即:T11=(26×14)/78=4.67À由于有一格子1T5,故应使用校正χ2检验。两种药物治疗脑血管病有效率的比较χ2=(|ad-bc|-n/2)2n(a+b)(c+d)(a+c)(b+d)=(│46×8-6×18│-78/2)2×7852×26×64×14=3.145ν=(2-1)(2-1)=1组别有效数无效数合计有效率%试验组4665288.46对照组188(4.67)2669.23合计64147882.055À得概率,下结论:À统计软件χ2=3.145,P=0.076À查χ2界值表,得0.10P0.05,按α=0.05水准不拒绝H0,尚不能认为两种药物的有效率有差别。À注意:本例若不用校正法,则χ2=4.353,P=0.037(0.05P0.01),可见未校正的P值偏低,据此将作出相反的结论。四格表的确切概率法Fisher'sExactTest用途和应用条件À四格表资料,即两个率或两个构成比的比较时,若任何一个格子的理论数T1或n40,不能使用卡方检验,可使用四格表的确切概率法(Fisher确切概率法)达到检验的目的。À四格表的确切概率法,其假设检验步骤与其他方法相同,但其计算方法较复杂配对四格表的卡方检验McNemarChi-square配对四格表的实例À某研究室用甲乙两种血清学方法检查93例确诊的鼻咽癌患者,得结果如下表,问两种检验结果之间有无差别?ÀH0:两总体b=cÀH1:两总体b≠cÀα=0.05若b+c≥40时,可用下式计算:χ2=(b-c)2b+cν=1若b+c40时,可用下式进行连续性校正:χ2=(│b-c│-1)2b+cν=16两种血清学检验结果乙法甲法+-合计+45(a)22(b)67-6(c)20(d)26合计514293χ2=(│22-6│-1)222+6=8.0367ν=1À得概率,下结论:À查χ2界值表,得P0.005,按α=0.05水准拒绝H0,接受H1,故可认为甲乙两种血清学阳性检出率不相同,据本资料可认为甲法的阳性检出率较高。四格表资料的统计方法np≥5且n(1-p)≥5:二项分布的u检验两个率或构成比n≥40且T≥5:四格表的χ2检验的比较n≥40且1≤T<5:校正四格表的χ2检验(完全随机设计)n<40或T<1:四格表的确切概率法b+c≥40:配对χ2检验{χ2=(b-c)2/(b+c)}配对四格表比较(配对设计)b+c<40:校正配对χ2检验{χ2=(|b-c|-1)2/(b+c)}行乘列的卡方检验PearsonR×CChi-squaretestÀR×C表的χ2检验用于R个率或构成比的比较,其χ2值的计算式可使用前述基本公式,但用专用公式计算更为方便,二式完全等价。χ2=n(ΣA2nCnR-1)式中符号的意义与基本公式相同。计算公式实例分析À例:某医师研究物理疗法、服用药物和外用膏药三种方法治疗周围性面神经麻痹的疗效,结果如后表所示,问三种疗法的有效率有无差别?7ÀH0:三种疗法的有效率相等ÀH1:三地疗法的有效率不等或不全相等Àα=0.05À本例最小的理论数为13.8,即:T32=(144×51)/532=13.8满足行乘列卡方检验的使用条件三种疗法的有效率比较疗法试验结果有效无效合计有效率(%)物理199720696.60口服1641818290.11外用1182614481.94合计4815153290.41χ2=532(1992206×481+72206×51+1642182×481+182182×51+1182144×481+262144×51-1)=21.04ν=(3-1)(2-1)=2À得概率,下结论:À统计软件χ2=21.04,P=0.000À查χ2界值表,得P0.005。按α=0.05水准拒H0,接受H1,故可认为三种疗法的有效率不等或不全相等。R×C表χ2检验的注意事项À1.R×C表的χ2检验要求表中格子的理论数不宜太小,否则将导致前述的偏性。具体的应用条件为:在R×C列联表中,不能有1/5以上格子的理论频数小于5;或不能有1个格子的理论频数小于1。不满足条件的处理方法À若理论数不满足条件时,最好使用R×C表的确切概率法。À若理论数不满足条件,也可也经下列方法处理后,再使用行乘列的χ2检验。8不满足条件的处理方法À三种处理方法:①最好增加样本例数以增大理论数。②将理论数太小的行或列与性质相近的邻行或邻列中的实际频数合并,使理论数增大。③删去上述理论数太小的行和列。À后两种处理方法,损失信息,损害样本的随机性,且不同方式的合并得到的结论可能不同。À2.当多个率(或构成比)比较的χ2检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别,这与前述多组资料比较的方差分析或秩和检验相同。R×C表χ2检验的注意事项多个率的两两(多重)比较À率的多重(两两)比较,在统计方法上目前尚无观点较为一致的方法,各种书籍的写法也各有不同,概括起来主要有以下几种方法:À通过计算两率之差的可信区间来进行比较,当计算得到任意两个率的差的可信区间,若其上下限不包含0(即上下限均大于0或均小于0),两个率有差别;若其上下限包含0,则两率无差别。1.Scheffe可信区间法Scheffe法的计算(PA-PB)±χ2PA(1-PA)nA+PB(1-PB)nBScheffe可信区间法计算结果95%CI比较组PANAPBNBPA-PBχ0.05.2下限上限1与20.9662060.9011820.0652.4470.00260.12731与30.9662060.8191440.1472.4470.06220.23092与30.9011820.8191440.0822.447-0.01370.17709À1与2,1与3的可信区间不包含0,可认为物理疗法与外用法、药物疗法与外用法的有效率有差别;而物理疗法与药物疗法的有效率无统计学意义。Scheffe法实例结论À用α’=α/k,即:α’=“检验水准(0.05)/两两比较的次数”À使用前述的四格表χ2检验或校正四格表χ2检验,每次两两比较的检验水准定为α’。2.改变检验水准αÀ利用χ2值的可加性原理,把原来的R×C表分割为若干个分割表,这些分割表的自由度之和等于原R×C表的自由度,其χ2值之和十分接近原表的χ2值。3.χ2分割法À分割的方法是按最相近的原则,把阳性率(或构成比)相差不大的样本分割出来,计算其χ2值。当差异无显著性时,就把它合并为一个样本,再把它与另一较相近的样本比较,如此进行下去直到结束。常用分类资料的统计方法二全部格子T>5或少于R×C表χ2检验