X2检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1作者:熊林平2检验2χ2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,此方法以χ2分布为理论依据,可用于两个或多个率(构成比)间的比较,计数资料的关联度分析,拟合优度检验等等。30.00.10.20.30.40.50369121518卡方值纵高自由度=1自由度=2自由度=3自由度=6χ2分布(chi-squaredistribution)图7-1不同自由度的χ2分布曲线图42分布是一种连续型分布,按分布的密度函数可给出不同自由度的一簇分布曲线。2分布的形状依赖于自由度的大小:(1)当自由度小于等于2时,曲线呈L形;(2)随着自由度的增大,曲线逐渐趋于对称;(3)当自由度趋向于无穷大时,2分布趋向正态分布。2分布具有可加性。52分布具有可加性:如果两个独立的随机变量X1和X2分别服从自由度1和2的χ2分布,那么它们的和X1+X2服从自由度1+2的χ2分布。χ2分布分位数:当自由度确定后,χ2分布曲线下右侧尾部的面积为α时,横轴上相应的χ2值记作χα,2,即χ2分布的分位数。6x2分布规律自由度一定时,P值越小,x2值越大。当P值一定时,自由度越大,x2越大。=1时,P=0.05,x2=3.84P=0.01,x2=6.63P=0.05时,=1,x2=3.84=2,x2=5.997总体率(或构成比)的假设检验当两个样本率不同时,有两种可能:1.P1,P2所代表的总体率相同,由于抽样误差的存在,造成的不同,这种差别在统计上叫差别无统计学意义。2.P1,P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义。现在就是要用统计学的方法进行判断到底属于那种情况。8两组或多组卡方检验数据的整理格式行(Row)×列(Column)表比较组分类指标(X)合计数阳性数阴性数甲组A11A12n1乙组A21A22n2合计A11+A21A12+A22nA:表示某组某分类的例数(频数)9表100例高血压患者治疗后临床记录编号年龄性别治疗组舒张压体温疗效X1X2X3X4X5X6137男A11.2737.5有效245女B12.5337.0无效343男A10.9336.5有效459女B14.6737.8无效。10054男B16.8037.6无效10两组药物对高血压患者治疗的疗效疗效(X)比较组有效人数无效人数合计有效率%A组20204050B组25356042问:两药对高血压的疗效是否不同?将原始数据整理计数资料的频数表11第一节四格表资料的检验2例7-1某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?12表7-1两组降低颅内压有效率的比较组别有效无效合计有效率(%)试验组99510495.20对照组75219678.13合计1742620087.002.卡方检验的基本思想:处理组阳性事件发生数阳性事件未发生数合计甲aba+b乙cdc+d合计a+cb+dn表9-2四格表资料的基本形式根据检验假设H0:,即两样本来自同一总体,或两总体率相同,则从理论上讲,各处理组的发生率和总发生率应相等,有:12)29(ncadccbaa各处理组的未发生率和总的未发生率应相等,有:)59(ndbdcdbab实际频数A(actualfrequency)(a、b、c、d)的理论频数T(theoreticalfrequency)(H0:π1=π2=π):a的理论频数=(a+b)×pc=(a+b)×[(a+c.)/n]=nRnC/n=21.3b的理论频数=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理论频数=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理论频数=(c+d)×(1-pc)=(c+d)×[(b+d.)/n]=nRnC/n=57.3nnncolumnrowTCR总例数合计列合计行)()(各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue)。若H0成立,则四个格子的实际频数A与理论频数T相差不应该很大,即χ2统计量不应该很大。若χ2值很大,即相对应的P值很小,比如P≤α,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑的H0正确性,继而拒绝H0,接受其对立假设H1,即。)1)(1(,1)()(222CRTTATTA12χ2检验的基本公式171表7-1两组降低颅内压有效率的比较TTA22)(组别有效无效合计有效率(%)试验组99(90.48)5(13.52)10495.20对照组75(83.52)21(12.48)9678.13合计1742620087.00基本公式:182检验的步骤:H0:,即试验组与对照组降低颅内压的总体有效率相等H1:,即试验组与对照组降低颅内压的总体有效率不等212105.0检验假设1986.1248.1248.122152.8352.837552.1352.13548.9048.909948.12200/269652.83200/1749652.13200/2610448.90200/1741042222222211211TTTT1)12)(12(计算检验统计量20查附表8的界值表得。按拒绝H0,接受H1,可以认为两组降低颅内压总体有效率不等,即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪+地塞米松的有效率。查表作结论005.0P05.03.四格表专用公式(1)为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:(四格表专用公式)基本公式:;1))()()(()())(())(())(())(())(())(()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA2222()()()()()adbcnabcdacbd四格表专用公式:四格表资料数据格式组别阳性阴性合计A组ab(a+b)B组cd(c+d)合计(a+c)(b+d)(n)23计算检验统计量86.122617496104200)7552199(22结果与用基本公式相同!查表作结论24四格表资料连续性校正实际频数为分类资料,是不连续的,因此计算所得的χ2值是离散型分布。而χ2界值表的依据是χ2分布,χ2分布是连续型分布。因此由公式计算的χ2值查χ2界值表所得的P偏小,特别是当自由度为1时。25(1)当n≥40且所有的T≥5时,用检验的基本公式;当P≈α时,改用四格表资料的Fisher确切概率法。对于四格表资料,通常规定:(2)当n≥40但有1≤T<5时,用四格表资料的校正公式;或改用四格表资料的Fisher确切概率法。(3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。(4)连续性校正仅用于ν=1的四格表资料。26四格表资料连续性校正公式122(||)2()()()()cnadbcnabcdacbdTTAC22)5.0(27例7-2某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?表7-2两种药物治疗脑血管疾病有效率的比较组别有效无效合计有效率(%)胞磷胆碱组4665288.46神经节苷酯组188(4.67)2669.23合计64147882.0528:,即两种药物治疗脑血管疾病的有效率相等:,即两种药物治疗脑血管疾病的有效率不等0H211H2105.023.14c35.42未校正:校正:ν=1,按校正χ2值3.14查χ2界值表,得P0.05,按α=0.05检验水准不拒绝H0,尚不能认为两种药物治疗脑血管疾病的有效率不等。若按不校正时的χ2值查χ2界值表,得P0.05,结论与之相反。29第二节配对四格表资料的检验2计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比较。其特点是对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果。配对设计表5-3某抗癌新药两种剂量的毒理实验结果乙剂量甲剂量死亡(+)生存(-)合计死亡(+)6(a)12(b)18生存(-)3(c)18(d)21合计93039成组设计表某抗癌新药两种剂量的毒理实验结果结果分组死亡(+)生存(-)合计甲剂量(a)(b)乙剂量(c)(d)合计78对子号甲剂量乙剂量1死亡死亡2死亡生存………39生存生存编号剂量组结果1甲死亡2乙生存………78甲生存31其中,a,d,为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。当两种处理方法无差别时,对总体有B=C。由于在抽样研究中,抽样误差是不可避免的,样本中的b和c往往不相等。为此,需进行假设检验。该法一般用于样本含量不太大的资料。32免疫荧光法乳胶凝集法合计+-+11(a)12(b)23-2(c)33(d)35合计134558表7-3两种方法的检测结果例7-3某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?33H0:B=C,即两种方法的总体检测结果相同H1:B≠C,即两种方法的总体检测结果不相同05.034cbcb22)(cbcbc22)1((b+c)≥40时(b+c)<40时1=79.5212)1212(22c本例,P<0.05。1=35第四节行×列表资料的检验2专用公式)1(22CRnnAn1、多个样本率的比较2、样本构成比的比较3、双向无序分类资料的关联性检验自由度ν=(行数-1)(列数-1)1.R×C表的χ2检验通用公式nnnTCR总例数列合计行合计理论频数代入基本公式可推导出:基本公式通用公式)1()(2222CRnnAnTTA自由度=(行数1)(列数1)2.几种R×C表的检验假设H01.多个样本率的比较H0:π1=π2=π3=π4(四种疗法三年总体生存率相等)H1:πi≠πj,4ji(四种疗法三年总体生存率不全相等)2.两组构成比的比较H0:两处理组的总体构成相同H1:两处理组的总体构成不同3.多组构成比的比较H0:各年龄组病变类型的总体构成相同(年龄与病变类型无关)H1:各年龄组病变类型的总体构成不全相同(年龄与病变类型有关)38多个样本率或两个构成比比较的2检验表7-8三种疗法有效率的比较疗法有效无效合计有效率(%)物理疗法199720696.60药物治疗1641818290.11外用膏药1182614481.94合计4815153290.4139H0:π1=π2=π3,即三种疗法治疗周围性面神经麻痹的有效率相等H1:三种疗法治疗周围性面神经麻痹的有效率不全相等05.0402222199726532(1)206481206511445121.042)12)(13(查2界值表,得p<0.005,按α=0.05水准,拒绝H0,接受H1,三种疗法治疗周围性面神经麻痹的有效率有差别。41双向无序分类资料的关联性检验表7-10某地5801人的血型ABO血型MN血型合计MNMNO4314909021823A3884108001598B4955879502032AB13717932

1 / 55
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功