2020年2月10日本章结构第一节四格表2检验第二节四格表确切概率法第三节R×C表资料的2检验第四节配对四格表资料的McNemar检验第五节多个样本率的两两比较2020年2月10日第一节四格表2检验卡方检验的基本思想四格表专用公式校正卡方检验四格表卡方检验的应用条件2020年2月10日2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比较的2检验。2检验2020年2月10日KarlPearson(1857~1936)英国统计学家1901年10月与Weldon,Galton一起创办Biometvika2020年2月10日疗法有效无效合计有效率胃金丹271(253.24)5(22.76)27698.19%西药74(91.76)26(8.24)10074.00%合计3453137691.76%表8-1两药治疗胃脘痛的疗效四格表例8-1某医院收治376例胃脘痛患者,随机分为两组,分别用新研制的中药胃金丹和西药治疗。结果如表8-1,探讨两药疗效有无差别。2020年2月10日把全部数据按两个分类变量(原因变量、结果变量)进行完全分类列成的频数表格称为列联表,R行C列的列联表简称R×C表,2×2列联表也称为四格表,利用列联表进行分类资料的检验称为列联表分析。列联表资料分析2020年2月10日21例8-1对表8-1资料推断两药的疗效有无差别H0:,即两药总体有效率相等由于总体有效率未知,将两组数据合并,计算合并样本有效率(称为理论有效率)p=345/376=91.76%,据此推算两组的理论有效数:T11=276×345/376=253.24,T21=100×345/376=91.76,理论无效数:T12=276-253.24=22.76,T22=100-91.76=8.24一、卡方检验的基本思想2020年2月10日27157426表示总合计。列的合计数;表示第行的合计数;表示第,ncnrnnnnTcrcrrc理论数公式253.2422.7691.768.242020年2月10日衡量理论数与实际数的差别检验统计量2值:TTATTACRcrrcrcrc2,1,22)()(2020年2月10日Pearson2值近似服从自由度为df=(R-1)(C-1)的2分布2值的大小反映了实际频数A与理论频数T的吻合程度1)12)(12(77.5624.8)24.826(276.91)76.9174(276.22)76.225(224.253)24.253271(22df2020年2月10日0.00.10.20.30.40.50369121518卡方值纵高自由度=1自由度=2自由度=3自由度=62/)12/(2222)2/(21)(ef3.847.8112.59P=0.05的临界值2分布(chi-squaredistribution)2020年2月10日2检验的基本公式)1)(1()(22CRdfTTA上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”资料。2020年2月10日二、四格表专用公式为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:1))()()(()()(222dfdbcadcbanbcadTTA基本公式:-------四格表专用公式2020年2月10日,可以认为疗效不同。,接受拒绝水准,,按下结论:界值表,查1021,05.0221,05.022205.005.0;84.384.31,77.5631345100276376)74526271(HHPdf例8-1用专用公式计算2值:2020年2月10日1.建立数据文件在SPSS数据编辑窗,建立数据文件Li8-1.sav。行变量:“组别”,Values为:1=“胃金丹”,2=“西药”列变量:“疗效”,Values为:1=“有效”,2=“无效”;频数变量:“频数”。2020年2月10日2.spss操作过程(1)在spss中调出数据文件Li8-1.sav(2)频数变量加权。从菜单选择Data→WeightCases弹出WeightCases对话框,选择WeightCasesby框,框内选入“频数”,即指定该变量为频数变量2020年2月10日加权变量2020年2月10日(3)2检验从菜单选择Analyze→DescriptiveStatistics→Crosstable(交叉表)指定Row(s):组别Columns(s):疗效击Statistics按钮选择Chi-square。2020年2月10日列联表分析2020年2月10日一致性检验危险度分析配对四格表卡方检验统计量卡方检验2020年2月10日主要输出结果理论数小于5的格子数为0(占0%),最小理论数为8.24校正只适用于四格表2020年2月10日结果分析由总频数n=376>40,最小理论频数8.24>5,使用Pearson卡方检验。结果分析:Pearson2=56.77,双侧P=0.000<0.05,以α=0.05水准拒绝H0,差异有统计学意义,可认为两药疗效不同。2020年2月10日三、四格表2检验的应用条件(1)当n≥40,且所有T≥5时,用Pearson2检验(2)当n≥40,而有1≤T<5时,用校正2检验(3)当n<40或T<1时,用Fisher精确检验(Fisherexacttest)2分布是一连续型分布,而四格表资料属离散型分布,对其进行校正称为连续性校正(correctionforcontinuity),又称Yates校正(Yates'correction)。2020年2月10日四、连续性校正公式校正公式:,TTA22)5.0())()()(()2/(22dbcadcbannbcad2020年2月10日校正2检验疗法有效无效合计通塞脉1号26733活血温经汤36238合计62971表8-4两组疗效比较例8-2某中医院将71例血栓闭塞性脉管炎Ⅲ期2~3级患者随机分为两组,分别用活血温经汤和通塞脉1号治疗。结果如表8-4,推断两药疗效有无差别。2020年2月10日21例8-2对表8-4资料推断两组的疗效有无差别(1)H0:,即两组疗效相同H1:,即两组疗效不同,α=0.05(2)计算2值,最小理论数因有理论数1T5,n40,故用校正2检验2118.47133912T2020年2月10日175.29623833)2/71367226(7122df若不用校正公式,则2=4.06,P0.05.,结论相反(3)确定P值,作结论查界值表,P0.05,按α=0.05水准不拒绝H0,不能认为两法疗效不同。205.022)1(05.084.3,2020年2月10日1.建立数据文件在SPSS数据编辑窗,建立数据文件Li8-1.sav。行变量:“组别”,Values为:1=“通塞脉1号”,2=“活血温经汤”列变量:“疗效”,Values为:1=“有效”,2=“无效”;频数变量:“频数”。2020年2月10日2.spss操作过程(1)在spss中调出数据文件Li8-2.sav(2)频数变量加权。从菜单选择Data→WeightCases弹出WeightCases对话框,选择WeightCasesby框,框内选入“频数”,即指定该变量为频数变量2020年2月10日(3)2检验从菜单选择Analyze→DescriptiveStatistics→Crosstable(交叉表)指定Row(s):组别Columns(s):疗效击Statistics按钮选择Chi-square。2020年2月10日输出结果理论数小于5的格子数为2(占50%),最小理论数为4.18卡方检验:有效观测数n=7140,有两个格子理论数T5,故用校正卡方检验2=2.746,P=0.098,不能认为两药疗效不同。2020年2月10日第二节四格表确切概率法四格表确切概率法基本思想实例2020年2月10日四格表资料:当①总例数n40;②用其他方法所得概率接近检验水准α;③四格表中有实际频数A=0;④四格表中有理论频数T1。应采用四格表确切概率法。四格表确切概率法系英国统计学家Fisher于1934年提出,又称Fisher精切概率法(Fisersexacttest)2020年2月10日四格表确切概率法的基本思想在四格表周边合计固定不变的条件下,改变某一格子的实际频数,列出a、b、c、d各种组合的四格表,按公式8-9计算每个四格表的概率,然后计算单侧或双侧累积概率,并与检验水准α比较,作出是否拒绝H0的结论。!!!!!)!()!()!()!ndcbadbcadcbaP(2020年2月10日组别改善无效合计红花散15520安慰剂31417合计181937例8-3研究中药制剂红花散改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对照,将37个病例随机分到两组,结果如表8-5,分析红花散的疗效。表8-5红花散改变缺血组织皮肤微循环资料2020年2月10日H0:红花散无效,H1:红花散有效。α=0.05n=3740采用四格表确切概率法。Spss操作过程同例8-12020年2月10日1.建立数据文件在SPSS数据编辑窗,建立数据文件Li8-3.sav。行变量:“组别”,Values为:1=“红花散”,2=“安慰剂”列变量:“效果”,Values为:1=“改善”,2=“无效”;频数变量:“频数”。2020年2月10日2.spss操作过程(1)在spss中调出数据文件Li8-3.sav(2)频数变量加权。从菜单选择Data→WeightCases弹出WeightCases对话框,选择WeightCasesby框,框内选入“频数”,即指定该变量为频数变量2020年2月10日(3)2检验从菜单选择Analyze→DescriptiveStatistics→Crosstable(交叉表)指定Row(s):组别Columns(s):效果击Statistics按钮选择Chi-square。2020年2月10日输出结果2020年2月10日结果分析由总频数n=3740,使用FisherExactTest(Fisher精确检验)。由Fisher精确检验双侧P=0.0010.05,以α=0.05水准拒绝H0,差异有统计学意义,可以认为红花散能够改善周围血管闭塞性病变患者的皮肤微循环状况。