第八章2χ检验一、教学大纲要求(一)掌握内容1.2χ检验的用途。2.四格表的2χ检验。(1)四格表2χ检验公式的应用条件;(2)不满足应用条件时的解决办法;(3)配对四格表的2χ检验。3.行×列表的2χ检验。(二)熟悉内容频数分布拟合优度的2χ检验。(三)了解内容1.2χ分布的图形。2.四格表的确切概率法。二、教学内容精要(一)2χ检验的用途2χ检验(Chi-squaretest)用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别2.两种属性或两个变量之间有无关联性3.频数分布的拟合优度检验(二)2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H(比如0H:12ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H的真实性,从而拒绝0H,接受H1(比如1H:12ππ≠)。2.基本公式:()22ATTχ−=∑,A为实际频数(ActualFrequency),T为理论频数(TheoreticalFrequency)。四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。(三)率的抽样误差与可信区间1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法:np)1(ππσ−=,π为总体率,或(8-1)nppSp)1(−=,p为样本率;(8-2)2.总体率的可信区间当n足够大,且p和1-p均不太小,p的抽样分布逼近正态分布。总体率的可信区间:(ppSupSup×+×−2/2/,αα)。(8-3)(四)2χ检验的基本计算中华统计学习网。表8-12χ检验的用途、假设的设立及基本计算公式资料形式用途0H、1H的设立与计算公式自由度四格表①独立资料两样本率的比较②配对资料两样本率的比较0H:两总体率相等1H:两总体率不等①专用公式))()()(()(22dbcadcbanbcad++++−=χ②当n≥40但1≤T<5时,校正公式))()()(()2/(22dbcadcbannbcad++++−−=χ③配对设计cbcb+−−=22)1(χ1R×C表①多个样本率、构成比的比较②两个变量之间关联性分析0H:多个总体率(构成比)相等(0H:两种属性间存在关联)1H:多个总体率(构成比)不全相等(0H:两种属性间存在关联)22(1)RCAnnnχ=−∑(R-1)(C-1)频数分布表频数分布的拟合优度检验0H:资料服从某已知的理论分布1H:资料不服从某已知的理论分布2()ATT−∑据频数表的组数而定(五)四格表的确切概率法当四格表有理论数小于1或n<40时,宜用四格表的确切概率法。(六)2χ检验的应用条件及注意事项1.分析四格表资料时,应注意连续性校正的问题,当1<T<5,n>40时,用连续性校正2χ检验;T≤1,或n≤40时,用Fisher精确概率法。2.对于R×C表资料应注意以下两点:(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5;(2)注意考察是否有有序变量存在。对于单向有序R×C表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R×C表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R×C表资料,为考察两种方法检测的一致性,应选用Kappa检验。三、典型试题分析(一)单项选择题1.下列哪项检验不适用2χ检验()A.两样本均数的比较B.两样本率的比较C.多个样本构成比的比较D.拟合优度检验答案:A【评析】本题考点:2χ检验的主要用途。2χ检验不能用于均数差别的比较。2.分析四格表时,通常在什么情况下需用Fisher精确概率法()A.1<T<5,n>>40B.T<5C.T1≤或n40≤D.T1≤或n100≤答案:C【评析】本题考点:对于四格表,当T1≤或n40≤时,不宜用2χ检验,应用Fisher精确概率法。3.2χ值的取值范围为中华统计学习网∞−<2χ<∞+B.+∞≤≤20χC.12≤χD.02≤≤∞−χ答案:B【评析】根据2χ分布的图形或2χ的基本公式可以判断2χ值一定是大于等于零且没有上界的,故应选B。(二)是非题两样本率的比较可以采用2χ检验,也可以采用双侧u检验。答案:正确。【评析】就两个样本率的比较而言,双侧u检验与2χ检验是等价的。(三)简答题1.四格表的2χ检验和u检验有何联系与区别?答案:相同点:凡是能用u检验进行的两个率比较检验的资料,都可用2χ检验,两者是等价的,即22χ=u;相异点:(1)u检验可进行单侧检验;(2)满足四格表u检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)2χ检验可用于2×2列联表资料有无关联的检验。2.R×C表2χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么?答案:R×C表2χ检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。(四)计算题1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。表8-2122对同胞兄弟静脉曲张发生情况肥胖正常体重发生未发生合计发生19524未发生128698合计3191122【评析】这是一个配对设计的资料,因此用配对2χ检验公式计算。H0:肥胖者与正常体重者的静脉曲张发生情况无差别H1:肥胖者与正常体重者的静脉曲张发生情况不同05.0=α22(1)bcbcχ−−=+=()251212.12512−−=+,1ν=2χ=2.11<20.05,1χ,P>0.05,尚不能认为静脉曲张与肥胖有关。2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。试对这三种措施的疗效作出评价。表8-3三种措施的近期有效率比较矫治方法有效人数无效人数合计有效率(%)夏天无眼药水518413537.78新医疗法6263218.75眼保健操5131827.78合计6212318533.51【评析】0H:三种措施有效率相等1H:三种措施有效率不相等或不全相等05.0=α中华统计学习网)1(22−=∑crnnAnχ=185×2222225184626513162135123135623212332621812318⎛⎞+++++−⎜⎟××××××⎝⎠=4.498,ν=(2-1)(3-1)=2查表得0.25>P>0.10,按0.05α=水准不拒绝0H,尚不能认为三种措施有效率有差别。3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?表8-44种镇痛方法的效果比较镇痛方法例数有效率(%)颈麻10041注药10094置栓10089对照10027【评析】为了应用2χ检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。表8-54种镇痛方法的效果比较镇痛方法有效例数无效例数合计颈麻4159100注药946100置栓8911100对照2773100合计2511494000H:4种镇痛方法的效果相同1H:4种镇痛方法的效果不全相同05.0=α22(1)rcAnnnχ=−∑=400222415973...1251100149100149100⎛⎞×+++−⎜⎟×××⎝⎠=146.175,ν=(4-1)(2-1)=3查表得P<0.05,按0.05α=水准拒绝0H,接受1H,即4种镇痛方法的效果不全相同。四、习题(一)单项选择题1.关于样本率p的分布正确的说法是:()。A.服从正态分布B.服从2χ分布C.当n足够大,且p和1-p均不太小,p的抽样分布逼近正态分布D.服从t分布2.以下说法正确的是:()。A.两样本率比较可用u检验B.两样本率比较可用t检验C.两样本率比较时,有2χ=u中华统计学习网.两样本率比较时,有22χ=t3.率的标准误的计算公式是:()。A.)1(pp−B.npp)1(−C.1−npD.npp)1(−4.以下关于2χ检验的自由度的说法,正确的是:()。A.拟合优度检验时,2nν=−(n为观察频数的个数)B.对一个43×表进行检验时,11ν=C.对四格表检验时,ν=4D.若220.05,0.05,νηχχ,则νη5.用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?()A.不能确定B.甲、乙法一样C.甲法优于乙法D.乙法优于甲法6.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,适当的方法是:()。A.分性别比较B.两个率比较的2χ检验C.不具可比性,不能比较D.对性别进行标准化后再做比较7.以下说法正确的是()。A.两个样本率的比较可用u检验也可用2χ检验B.两个样本均数的比较可用u检验也可用2χ检验C.对于多个率或构成比的比较,u检验可以替代2χ检验D.对于两个样本率的比较,2χ检验比u检验可靠(二)名词解释1.实际频数与理论频数2.2χ界值表3.拟合优度4.配对四格表5.双向有序分类资料6.率的标准误7.多个率的两两比较8.Fisher精确概率9.McNemar检验10.Yates校正(三)是非题四个样本率做比较,2)3(05.02χχ,可认为各总体率均不相等。(四)计算题1.121名前列腺癌患者中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症1人。试分析两种手术的合并症发生率有无差异?2.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料见表8-6。问两者是否存在一定的关系?表8-6冠心病诊断结果与眼底动脉硬化级别的关系眼底动脉硬化级别冠心病诊断结果正常可疑冠心病合计0340116357I7313692II971818133III3216合计5134431588中华统计学习网名的检查结果,问:两种方法何者为优?表8-7两种方法检查结果比较甲法乙法+-合计+421860-303060合计72481204.用噬菌体治疗小儿细菌性痢疾结果见表8-8,问两组阴转率有无显著差异?表8-8两种方法检查结果比较组别观察人数粪见检阴性人数阴转率(%)试验组292586.2对照组281760.7合计574273.75.某医院用冠心2号方治疗心绞痛患者,经三个月疗程后,疗效见表8-9