1第八章2检验Chi-squaretest2掌握内容:几种常见设计类型资料的卡方检验熟悉的内容卡方检验的适用范围了解内容1.四格表资料的Fisher精确概率法3用样本信息推论总体特征的过程。包括:参数估计:运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。4统计描述统计推断应用计量资料频数分布集中趋势离散趋势统计图表抽样误差、标准误tuF检验正常值范围区间估计计数资料相对数及其标准化统计图表标准误2检验率的区间估计人口统计疾病统计相关与回归rb统计图表t检验5在总体率为π的二项分布总体中做n1和n2抽样,样本率p1和p2与π的差别,称为率抽样误差。已知π0nP5,n(1-P)5ppu06例为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见下表,问铅中毒病人与对照人群的尿棕色素阳性率差别有无统计学意义?表两组人群尿棕色素阳性率比较组别阳性数阴性数合计阳性率(%)铅中毒病人2973680.56对照组9283724.32合计38357352.0572检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法。82检验的用途用途较为广泛的假设检验方法,本章仅介绍用于分类计数资料的假设检验,用于检验两个(或多个)率或构成比之间差别是否有统计学意义,配对2检验检验配对计数资料的差异是否有统计学意义。92检验的基本思想检验实际频数(A)和理论频数(T)的差别是否由抽样误差所引起的。也就是由样本率(或样本构成比)来推断总体率或构成比。10处理有效无效合计有效率(%)A药62(56.67)a23(28.33)b85(a+b)72.94(p1)B药8(53.33)c32(26.67)d80(c+d)60.00(p2)合计110(a+c)55(b+d)165(n)66.67表7-1两种药物治疗胃溃疡有效率的比较目的:推断是否π1=π2?11本例资料经整理成下表形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。62a23b48c32d12表7-1完全随机设计两样本率比较的四格表处理组属性合计阳性阴性1A11(T11)A12(T12)n1(固定值)2A21(T21)A22(T22)n2(固定值)合计m1m2n13衡量理论频数与实际频数的差别RCRCRCTTA22)(ARC是位于R行C列交叉处的实际频数,TRC是位于R行C列交叉处的理论频数。(ARC-TRC)反映实际频数与理论频数的差距,除以TRC为的是考虑相对差距。所以,2值反映了实际频数与理论频数的吻合程度,2值大,说明实际频数与理论频数的差距大。2值的大小除了与实际频数和理论频数的差的大小有关外,还与它们的行、列数有关。即自由度的大小。ν=(行-1)×(列-1)14理论频数的计算nnnTCRRCnR是ARC所在行的合计,nC是ARC所在列的合计,是两个样本例数的合计15理论频数是根据检验假设且用合并率来估计而定的。T012:Hcp如本例,无效假设是A药组与B药组的总体有效率相等,均等于合计的阳性率66.67%(110/165)。那么理论上,A药组的85例中阳性人数应为85(110/165)=56.67,阴性人数为85(55/165)=28.33;同理,B药组的80例中阳性人数应为80(110/165)=53.33,阴性人数为80(55/165)=26.67。16χ2检验的基本公式)1)(1(1)()(222CRTTATTA上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”。1722分布是一种连续型分布(Continuousdistribution),v个相互独立的标准正态变量(standardnormalvariable)的平方和称为变量,其分布即为分布;自由度(degreeoffreedom)为v。2,...3,2,1,0)2()2(21)(2212222ef2182分布是一种连续型分布(Continuousdistribution),v个相互独立的标准正态变量(standardnormalvariable)的平方和称为2变量,其分布即为2分布;自由度(degreeoffreedom)为v。0.00.10.20.30.403691215v=1v=4v=6v=9),,2,1(iui192分布的形状依赖于自由度ν的大小:①当自由度ν≤2时,曲线呈“L”型;②随着ν的增加,曲线逐渐趋于对称;③当自由度ν→∞时,曲线逼近于正态曲线。20如果假设检验成立,A与T不应该相差太大。理论上可以证明(A-T)2/T服从x2分布,计算出x2值后,查表判断这么大的x2是否为小概率事件,以判断建设检验是否成立。21附表8χ2界值表概率,P自由度υ0.9950.990…0.1000.0500.025…0.00512.713.845.02…7.8820.010.02…4.615.997.38…10.6030.070.11…6.257.819.35…12.8440.210.30…7.789.4911.14…14.8650.410.55…9.2411.0712.83…16.7560.680.87…10.6412.5914.45…18.5570.991.24…12.0214.0716.01…20.2881.341.65…13.3615.5117.53…21.952220.05,10.05/21.96u在υ=1,22自由度一定时,P值越小,x2值越大,反比关系。当P值一定时,自由度越大,x2越大。=1时,P=0.05,x2=3.84P=0.01,x2=6.63P=0.05时,=1,x2=3.84=2,x2=5.9923第一节四格表资料χ2检验B1B2合计A1aba+bA2cdc+d合计a+cb+dn=a+b+c+d一般四格表的基本形式24表7-1完全随机设计两样本率比较的四格表处理组属性合计阳性阴性1A11(T11)A12(T12)n1(固定值)2A21(T21)A22(T22)n2(固定值)合计m1m2n25四格表2检验的专用公式))()()(()(22dbcadcbanbcadn≥40,T≥5为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:(四格表专用公式)基本公式:;1))()()(()())(())(())(())(())(())(()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA271.建立检验假设:,两总体率不等:,两总体率相等0H211H2105.0检验统计量χ2值反映了实际频数与理论频数的吻合程度。28若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量χ2不应该很大。如果χ2值很大,即相对应的P值很小,若P≤α,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。292.计算检验统计量(1)当总例数n≥40且所有格子的理论频数T5时:用检验的基本公式或四格表资料检验的专用公式;基本公式TTA22)(专用公式))()()(()(22dbcadcbanbcad30(2)当总例数n≥40且有一个格子1≤T5时:用校正公式;或改用四格表资料的Fisher确切概率法。TTAc22)5.0())()()(()(222b+da+cc+da+bn|ad-bc|-=nc312分布是一连续型分布,而四格表资料属离散型分布,由此计算得的2统计量的抽样分布亦呈离散性质。为改善2统计量分布的连续性,则需行连续性校正(correctionforcontinuity)。2连续性校正仅用于ν=1的四格表资料,当ν≥2时,一般不作校正。32(3)当n40,或T1时,不能用卡方检验,改用四格表资料的Fisher确切概率法。333.作出统计结论以=1查界值表,若,按检验水准拒绝,接受,可认为两总体率不同;若,按检验水准不拒绝,尚不能认为两总体率不同。205.0P05.00H1H05.0P05.00H34自由度ν愈大,χ2值也会愈大;所以只有考虑了自由度ν的影响,χ2值才能正确地反映实际频数A和理论频数T的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,ν=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。35例8.5某药品检验所随机抽取574名成年人,研究抗生素的耐药性(资料如表8-11)。问两种人群的耐药率是否一致?表8-11某抗生素的人群耐药情况用药史不敏感敏感合计耐药率(%)曾服该药18021539545.57未服该药7310617940.78合计25332157444.0836理论频数的计算18021573106174.10220.9078.90100.10实际数理论数372检验的步骤(1)建立假设并确定检验水准H0:两种人群对该抗生素的耐药率相同,即1=2;(两总体率相等)H1:两种人群对该抗生素的耐药率不同,即1≠2;(两总体不相等)=0.0538(2)计算检验统计量当总例数n且所有格子的理论频数T5时:用检验的基本公式或四格表资料检验的专用公式:2==23.1210.10010.10010690.22090.22021510.17410.17418022239(3)查2界值表(附表7)确定P值,P>0.05,得出结论。按0.05水准,不拒绝H0,可以认为两组人群对该抗生素的耐药率的差异无统计学意义。40例2某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患有职业性皮肤炎。后随机抽取15名工人穿新防护服,其余仍穿原用的防护服,一个月后检查两组工人的皮肤炎患病情况,资料见下表,问两组的患病率差别有无统计学意义?表穿新旧防护服工人的皮肤炎患病比较防护服种类皮肤炎症合计阳性数阴性数新1(3.84)14(11.16)15旧10(7.16)18(20.84)28合计11324341本例n40,因有一格子的理论数<5,因而要用校正2检验。H0:两组工人皮肤炎总体患病率相等,即1=2H1:两组工人皮肤炎总体患病率不等,即1≠2α=0.05校正2值为94.284.20)5.0|84.2018(|16.7)5.0|16.710(|16.11)5.0|16.1114(|84.3)5.0|84.31(|2222242以=1查界值表,,按检验水准不拒绝,接受,尚不能认为穿不同防护服的两组工人的皮肤炎患病率的差别有统计学意义;205.0P0H1H05.0注意:本例若不作连续性校正,则,得33.4205.0P,可见两者是有区别的。43注意:两样本率比较的资料,既可用检验也可用检验来推断两总体率是否有差别,且在不校正的条件下两种检验方法是等价的,对同一份资料有。u222u小结T≥5,用四格表专用公式n≥401≤T5,用连续性校正公式T1,用确