计数资料的统计推断2020年1月9日率的抽样误差与可信区间一、率的抽样误差与标准误二、总体率的可信区间2020年1月9日一、率的抽样误差与标准误样本率(p)和总体率(π)的差异称为率的抽样误差(samplingerrorofrate),用率的标准误(standarderrorofrate)度量。np)1(如果总体率π未知,用样本率p估计nppsp)1(2020年1月9日标准误的计算例5-1观察某医院产妇106人,其中行剖腹产者62人,剖腹产率为58.5%,试估计剖腹产率的标准误。解:已知n=106,p=0.585,其标准误为:%8.4048.0106)585.01(585.0)1(nppSp2020年1月9日二、总体率的可信区间总体率的可信区间(confidenceintervalofrate):根据样本率推算总体率可能所在的范围当n足够大,且np和n(1-p)均大于5时,p的抽样分布逼近正态分布。其可信区间为:双侧:(p-uα/2?Sp,p+uα/2?Sp)(u0.05/2=1.96)单侧:p-uα?Sp或p+uα?Sp(u0.05=1.645)试估计p=0.585,Sp=0.048的总体率双侧95%可信区间。解:u0.05/2=1.96,(p-uα/2Sp,p+uα/2?Sp)=(0.585-1.96×0.048,0.585+1.96×0.048)=(0.491,0.679)即总体率的95%可信区间为49.1%~67.9%。注意:如果计算获得的可信区间下限小于0%,上限大于100%,则将下限直接定为0%,上限直接定为100%。2020年1月9日率的统计学推断一、样本率与总体率比较u检验二、两个样本率的比较u检验2020年1月9日一、样本率与总体率比较的u检验u检验的条件:np和n(1-p)均大于5时例5-5,α-地中海贫血基因携带率:山区p=12/125=0.096,n=125;本省一般成人π0=0.076,H0:π=π0=0.076H1:π≠π0α=0.05。按α=0.05水准,不拒绝H0,即不能认为该山区与本省一般成人的α-地中海贫血基因携带率有差异。)1(0000nppup844.0125)076.01(076.0076.0096.02020年1月9日二、两个独立样本率比较的u检验96.11949.2)6412041)(1045.01(1045.00313.01275.0u表5-1两种疗法的心血管病病死率比较疗法死亡生存合计病死率(%)盐酸苯乙双胍26(X1)178204(n1)12.75(p1)安慰剂2(X2)6264(n2)3.13(p2)合计2824026810.45(pc)2122112121nnpnpnnnXXpc)11)(1(21212121nnppppSppuccppu检验的条件:n1p1和n1(1-p1)与n2p2和n2(1-p2)均52020年1月9日卡方检验χ2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比较的χ2检验。2020年1月9日一、卡方检验的基本思想(1)疗法死亡生存合计病死率(%)盐酸苯乙双胍26(a)178(b)204(a+b)12.75(p1)安慰剂2(c)62(d)64(c+d)3.13(p2)合计28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)表5-1两种疗法的心血管病病死率的比较2×2表或四格表(fourfoldtable)实际频数A(actualfrequency)(a、b、c、d)的理论频数T(theoreticalfrequency)(H0:π1=π2=π):a的理论频数=(a+b)×pc=(a+b)×[(a+c.)/n]=nRnC/n=21.3b的理论频数=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理论频数=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理论频数=(c+d)×(1-pc)=(c+d)×[(b+d.)/n]=nRnC/n=57.3nnncolumnrowTCR总例数合计列合计行)()(2020年1月9日一、卡方检验的基本思想(2)各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue),它服从自由度为ν的卡方分布。)1)(1(,1)()(222CRTTATTA1)12)(12(82.4)3.5717.617.18213.211(7.423.57)3.5762(27.6)7.62(27.182)7.182178(23.21)3.2126(22v2020年1月9日0.00.10.20.30.40.50369121518卡方值纵高自由度=1自由度=2自由度=3自由度=62/)12/(2222)2/(21)(ef3.847.8112.59P=0.05的临界值χ2分布(chi-squaredistribution)2020年1月9日χ2检验的基本公式)1)(1(1)()(222CRTTATTA上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”。2020年1月9日二、四格表专用公式(1)为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:(四格表专用公式)基本公式:;1))()()(()())(())(())(())(())(())(()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA2020年1月9日二、四格表专用公式(2)021,05.0221021,05.0221,05.0205.0;84.3,,05.0;84.305.0;84.31,82.46424028204268)21786226(22HPHPP,即不拒绝则如果即拒绝如果下结论:2(1)~u2=2.19492=4.82(n40,所有T5时)2020年1月9日三、连续性校正公式(1)χ2分布是一连续型分布,而行×列表资料属离散型分布,对其进行校正称为连续性校正(correctionforcontinuity),又称Yates校正(Yates'correction)。⑴当n≥40,而1≤T<5时,用连续性校正公式⑵当n<40或T<1时,用Fisher精确检验(Fisherexacttest)校正公式:列表资料),(也适合其它行TTAc22)5.0())()()(()2/(22dbcadcbannbcadc2020年1月9日三、连续性校正公式(2)表5-2两零售点猪肉表层沙门氏菌带菌情况检查结果沙门氏菌零售点阳性阴性合计带菌率(%)甲2(4.17)26(23.33)287.14乙5(2.33)9(11.67)1435.71合计7354216.671,62.3357142842)24262592(22c1,49.5357142842)26592(22因为1<T<5,且n>40时,所以应用连续性校正χ2检验2020年1月9日四、配对四格表资料的χ2检验配对设计表5-3某抗癌新药两种剂量的毒理实验结果乙剂量甲剂量死亡(+)生存(-)合计死亡(+)6(a)12(b)18生存(-)3(c)18(d)21合计93039成组设计表某抗癌新药两种剂量的毒理实验结果结果分组死亡(+)生存(-)合计甲剂量(a)(b)乙剂量(c)(d)合计78对子号甲剂量乙剂量1死亡死亡2死亡生存???39生存生存编号剂量组结果1甲死亡2乙生存??78甲生存2020年1月9日配对四格表资料的χ2检验也称McNemar检验(McNemar'stest)1,)1(2402cbcbcb时,需作连续性校正,1,27.4312)1312(22,4015采用连续性校正本例cb1,)(2240ccbcbb时,当05.0;84.321,05.02PH0:b,c来自同一个实验总体(两种剂量的毒性无差异);H1:b,c来自不同的实验总体(两种剂量的毒性有差别);α=0.05。2020年1月9日五、行×列(R×C)表资料的χ2检验前述四格表,即2×2表,是最简单的一种R×C表形式。因为其基本数据有R行C列,故通称行×列表或R×C列联表(contingencytable),简称R×C表。R×C表的资料形式有:1.多个样本率的比较(如例5-10的4×2表)2.两组构成比的比较(如例5-11的2×5表)3.多组构成比的比较(如例5-12的4×3表)等2020年1月9日R×C表的χ2检验通用公式nnnTCR总例数列合计行合计理论频数代入基本公式可推导出:基本公式通用公式)1()(2222CRnnAnTTA自由度=(行数1)(列数1)2020年1月9日几种R×C表的检验假设H01.多个样本率的比较H0:π1=π2=π3=π4(四种疗法三年总体生存率相等)H1:πi≠πj,4ji(四种疗法三年总体生存率不全相等)2.两组构成比的比较H0:两处理组的总体构成相同H1:两处理组的总体构成不同3.多组构成比的比较H0:各年龄组病变类型的总体构成相同(年龄与病变类型无关)H1:各年龄组病变类型的总体构成不全相同(年龄与病变类型有关)2020年1月9日R×C表的计算举例例5-12对1135例绝经后出血的妇女进行临床与病理分析,结果见表5-6,试分析病变类型是否与年龄有关。表5-6不同年龄妇女绝经后出血的病变类型病变类型,例数(%)年龄组(岁)功能性恶性良性合计≤5060(44.4)16(11.9)59(43.7)13551―208(33.3)111(17.8)306(49.0)62561―66(25.0)79(29.9)119(45.1)26471―21(18.9)47(42.3)43(38.7)111合计355(31.3)253(22.3)527(46.4)11352222601643211135(1)58.91135355135253111527(41)(31)6RCAnnnχ2=58.91>χ20.05,6=12.59,所以,P<0.05,以α=0.05水准拒绝H02020年1月9日R×C表χ2检验的应用注意事项1.对R×C表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)2020年1月9日R×C表χ2检验的应用注意事项2.多组比较时,若效应有强弱的等级,如+,++,+++,最好采用后面的非参数检验方法。χ2检验只能反映其构成比有无差异,不能比较效应的平均水平。3.行列两种属性皆有序时,可考虑趋势检验或等级相关分析。表6-2某药对两种不同病情的支气管炎疗效疗效单纯型(1)单纯型合并肺气肿(2)控制654