检验2卡方检验是英国统计学家K.Pearson于1900年提出的,以卡方分布和拟合优度为理论依据,一种用途较广的假设检验方法。常用于检验完全随机设计下两个或多个样本率(或构成比)之间有无差别,也可用于检验配对设计下两组频数分布差异,或者线性趋势卡方检验,推断两变量间有无相关关系等。第一节完全随机设计(独立样本)列联表资料的检验在抽样研究中,由于个体间存在变异,必然存在着抽样误差,率(或构成比)的抽样误差与均数的抽样误差概念相同。2例1将病情相似的169名消化道溃疡患者随机分成两组,分别用奥美拉唑与雷尼替丁两种药物治疗,4周后评价其疗效,结果见表1。问两药治疗消化道溃疡的愈合率有无差别?表1两药治疗消化道溃疡4周后疗效两组的愈合率不同有两种可能:1.两药的总体愈合率无差别,两样本率的差别仅由抽样误差所致。2.两种药物的总体愈合率确有不同。一、卡方检验的基本思想表1中,64、21、51、33是整个表的基本数据,其余数据都是从这四个基本数据相加而得的,这种资料是两组两分类资料,称为四格表(fourfoldtable),亦称2×2表(2×2table)。表两独立样本率比较的四格表无效假设H0为π1=π2,即两种药物治疗消化道溃疡的愈合率相同,两样本的愈合率的差别仅有抽样误差所致。由于此时总体情况未知,故用样本合计愈合率对总体愈合率进行估计,即H0为π1=π2=68.05%,在此基础上,可以推算每个格子的期望频数,称为理论频数(actualfrequency),用符号T表示;从样本观察到的频数称为实际频数(theoreticalfrequency),用符号A表示。若H0成立,则理论上:奥美拉唑组愈合人数:奥美拉唑组未愈合人数:雷尼替丁组愈合人数:雷尼替丁组未愈合人数:111158557.84169TTnnnRC12548527.16169T211158457.16169T22548426.84169T为相应行的合计为相应列的合计n为总例数。RCRCnnTnnRnC表1两药治疗消化道溃疡4周后疗效检验的基本公式:从基本公式可以看出,统计量值反映了实际频数和理论频数的吻合程度。如果假设检验H0(π1=π2)成立,则实际频数和理论频数之差一般不会相差太大,值相应也不会太大;反之,实际频数和理论频数之差相差很大,则值相应也会很大,相应的P值也就越小,当P≤,则有理由认为无效假设不成立,继而拒绝H0,作出统计推断。2222(AT)T22由统计量的公式(11.2)可以看出,,格子数越多,非负数之和,则卡方值越大,即卡方值的大小除了与A与T的差别大小有关外,还与格子数量有关。因而考虑卡方值大小的同时,应同时考虑格子数的多少。引入自由度v。式中,k为格子数,s为估计的参数个数,R为行数,C为列数。如本例中,4个格子,估计甲乙两药的有效率,则k=4,s=2,v=4-1-2=(2-1)(2-1)=1。2()0ATT21(1)(1)vksRC分布是一种连续型随机变量的概率分布。如果Z服从标准正态分布,那么Z2服从自由度为1的分布,其概率密度在(0,+∞)区间上表现为L型,取较小值的可能性较大,取较大值的可能性较小。设有v个相互独立的标准正态分布随机变量Z1,Z2,Zv,则的分布称为自由度为v的分布,记为。分布的形状依赖于自由度v的大小,当自由度v1时,随着v的增加,曲线逐渐趋于对称,当自由度v趋于∞22212vZZZ2v2222时,分布逼近正态分布。各种自由度的分布右侧尾部面积为时的临界值记为,列于附表8。2,av22二、2×2列联表资料的检验。(一)2×2列联表资料检验的步骤现以例1说明2×2列联表资料检验的步骤①建立假设H0:π1=π2H1:π1≠π2②确定检验水准α=0.05③计算统计量值2222④确定P值自由度=(行数-1)(列数-1)=(2-1)(2-1)=1,查界值表得P0.05。⑤下结论因为P0.05,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为两药治疗消化道溃疡的愈合率有差别,其中奥美拉唑的愈合率比雷尼替丁愈合率高。222(AT)T2222(6457.84)(2127.16)(5157.16)(3326.84)4.1357.8427.1657.1626.84(二)四格表的专用公式a、b、c、d分别为四格表中的四个实际频数,n为总例数。本例:22(ad-bc)n(ab)(cd)(ac)(bd)22(6433-2151)1694.13858411554(三)四格表统计量的连续性校正1.当n≥40,且T≥5时,不须校正,直接用基本公式(8-2)或专用公式(8-3)计算。2.任一格子的1≤T5,且n≥40时,需计算校正值,或使用四格表的确切概率法。3.任一格子的T1或n40时,需改用四格表确切概率法。2222(ad-bc-n/2)n(ab)(cd)(ac)(bd)22(AT0.5)T例2某研究欲比较甲、乙两药治疗下呼吸道感染的疗效,将65例下呼吸道感染者随机分为两组,进行随机双盲试验,结果见表2。两组纳入分析的病例数分别为32和33人。问两药治疗下呼吸道感染的有效率有无差别?表2两药治疗下呼吸道感染的效果①建立假设H0:π1=π2H1:π1≠π2②确定检验水准α=0.05③计算统计量值本例,而n40,故应计算校正的卡方值。2min1212T=TT32104.921565,22(ad-bc-n/2)nχ==(a+b)(c+d)(a+c)(b+d)2(242-831-65/2)n3.14032335510④确定P值自由度=(行数-1)(列数-1)=(2-1)(2-1)=1,查界值表得P0.05。⑤下结论因为P0.05,按α=0.05的水准,还不拒绝H0,即差异没有统计学意义。即还不能认为两药治疗下呼吸道感染的有效率有差别。注意:如果本例不校正,直接用公式(8-2)计算值,,则P0.05,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。结论相反。2220.05,14.7773.842例某医师用甲、乙两疗法治疗单纯消化不良,结果如下表,问两种疗法的治愈率有无差别?表两种疗法对单纯消化不良的治愈率比较①建立假设H0:π1=π2H1:π1≠π2②确定检验水准α=0.05③计算统计量值④确定P值υ=(2-1)(2-1)=1,查界值表得P0.05。2222(262-736-71/2)712.753338629⑤下结论因为P0.05,按α=0.05的水准,不拒绝H0,差异无统计学意义。尚不能认为甲、乙两疗法对小儿单纯性消化不良的治愈率不等。三、R×C列联表资料的检验。当基本数据的行数或列数大于2时,统称为行列表或RC表。RC表的检验主要用于多个样本率(或构成比)的比较。行列资料检验的专用公式n为总例数,A为每个格子的实际频数,nR为与A同行的行合计,nC为与A同列的列合计。2222RCAnnn2(1)(一)多个样本率的比较例3某研究者欲比较A、B、C三种方案治疗轻、中度高血压的疗效,将年龄在50~70岁的240例轻、中度高血压患者随机等分为3组,分别采用三种方案治疗。一个疗程后观察疗效,结果见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别?表3三种方案治疗轻、中度高血压的效果①建立假设H0:π1=π2=π3H1:三种方案治疗轻、中度高血压的有效率不等或不全等②确定检验水准α=0.05③计算统计量值22RCAnnn2(1)2227469240(...1)13.8688020380378037④确定P值υ=(3-1)(2-1)=2,查界值表得P0.01。⑤下结论因为P0.01,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为三种方案治疗轻、中度高血压的有效率不等或不全等2例某市重污染区、一般污染区和农村的出生婴儿的致畸情况如下表,问三个地区的出生婴儿的致畸率有无差别?表某市三个地区出生婴儿的致畸率比较①建立假设H0:π1=π2=π3H1:π1,π2,π3之间不等或不全等。②确定检验水准α=0.05③计算统计量值22RCAnnn2(1)2221143278827552281(...1)3392585339251696834251696167.11④确定P值υ=(3-1)(2-1)=2,查界值表得P0.01。⑤下结论因为P0.01,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为三个地区的出生婴儿的致畸率有差别。2例为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53名产妇随机分成三组,分别按三种不同剂量服用该药,镇痛效果如下表。试分析该药不同剂量的镇痛效果有无差别?表某药不同剂量的镇痛效果①建立假设H0:三种剂量的镇痛效果相同H1:三种剂量的镇痛效果不同或不全相同②确定检验水准α=0.05③计算统计量值22RCAnnn2(1)222312653(...1)7.584152615271827④确定P值υ=(3-1)(2-1)=2,查界值表得P0.05。⑤下结论因为P0.05,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为三种剂量的镇痛效果不同或不全相同。2(二)两个或多个构成比的比较例4为了解新型农村合作医疗对于农村贫困居民住院服务利用的影响,在经济条件相似的甲、乙两个国家级贫困县(其中甲县2006年已开展新型农村合作医疗,乙县2006年尚未开展)分别进行抽样调查,得到2006年应住院者未住院原因,见表11.5。问甲、乙两县应住院者未住院原因构成比是否不同?表4甲、乙两县应住院者未住院原因构成比(%)①建立假设H0:甲、乙两县应住院者未住院原因总体构成比相同同H1:甲、乙两县应住院者未住院原因总体构成比不同②确定检验水准α=0.05③计算统计量值22RCAnnn2(1)222293106639(...1)4.1703335753331930619④确定P值υ=(2-1)(4-1)=3,查界值表得P0.05。⑤下结论因为P0.05,按α=0.05的水准,还不拒绝H0,差异没有统计学意义。即尚不能认为甲、乙两县应住院者未住院原因总体构成比分布不同。2例51986年某地城市和农村20至40岁已婚妇女避孕方法情况如下表5,试分析该地城市和农村避孕方法的总体构成分布有无差别?表5某地城市和农村已婚妇女避孕方法情况①建立假设H0:城市和农村已婚妇女避孕方法的总体分布相同H1:城市和农村已婚妇女避孕方法的总体分布不全同②确定检验水准α=0.05③计算统计量值22RCAnnn2(1)2221533318847(...1)151.09939147339110845658④确定P值υ=(2-1)(4-1)=3,查界值表得P0.01。⑤下结论因为P0.01,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为城市和农村已婚妇女避孕方法的总体分布不同2例某医院研究急性白血病患者与慢性白血病患者的血型构成情况,其资料如下表,问两组血型构成比是否不同?表急性与慢性白血病患者的血型构成①建立假设H0:急性与慢性白血病患者的构成比相同。H1:急性与慢性白血病患者的构成比不相同。②确定检验水准α=0.05③计算统计量值22RCAnnn2(1)22258498295(...1)18410118476111261.84④确定P值υ=(2-1)(4-1)=3,查界值表得P0.05。⑤下结论因为P0.05,按α=0.0