第四章-可信区间

249383353
2 ℃
2020-03-07

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第四章可信区间一、概念二、均数的可信区间三、率的可信区间四、可信区间的正确应用可信区间的概念1、点估计（pointestimation)2、区间估计（intervalestimation)：按一定的概率或可信度(1-)用一个区间估计总体参数所在范围，这个范围称作可信度为1-的可信区间(confidenceinterval,CI)，又称置信区间。这种估计方法称为区间估计。=0.0595%可信区间=0.0199%可信区间3、可信区间的两个要素第一个要素是可靠性，反映为可信度1-的大小；第二个要素是精确性，常用可信区间的长度CU－CL衡量。sx,back1均数的可信区间1总体均数的可信区间（，）例4.1随机抽取12名口腔癌患者，检测其发锌含量，得=253.05g/g，=27.18g/g，求发锌含量总体均数95％的可信区间。本例自由度=12-1=11，经查表得t0.05,11=2.201，则L=U=即口腔癌患者发锌含量总体均数的95％可信区间为：193.23～321.87(g/g)。2两均数之差的区间估计XstX,XstX,XXs)/(23.19318.27201.205.25311,05.0ggstXX)/(87.31218.27201.205.25311,05.0ggstXX1111........xxxxxstxstxPstxstPtsxtPtttP.t.t01111........xxxxxstxstxPstxstPtsxtPtttPback32两均数之差的区间估计设两样本之样本含量、均数和方差分别为：n1,n2和s12,s22，根据数理统计结果：服从自由度为=n1+n2-2的t分布。其中：称为均数之差的标准误。sC2称为合并方差，是两样本方差的加权平均：可得1-2的可信区间：21)()(2121XXsXXt2121121nnsscXX21XXs2)1()1212222112nnsnsnsc（21212121)2,(21)2,(21)()(XXnnXXnnstXXstXX，例4.3某医生研究转铁蛋白对病毒性肝炎诊断的临床意义，测得12名正常人和15名病毒性肝炎患者血清转铁蛋白含量(g/dl)，结果如下，试估计正常人和患者的转铁蛋白含量均数之差的95％可信区间。正常人(X1)265.4271.5284.6291.3254.8275.9281.7268.6(n1=12)264.4273.2270.8260.5病毒性肝炎患者(X2)235.9215.4251.8224.7228.3231.1253.0221.7(n2=15)218.8233.8230.9240.7256.9260.7224.4根据资料算得：s12=10.382s22=14.39289.2711X21.2352X3679.1632151239.141438.1011222cs95.41511213679.1631121221nnsscXX(271.89－235.21)±2.060×4.95=26.48～46.88(g/dl)back1率的可信区间1率的抽样误差及标准误2总体率的区间估计3两总体率之差1-2的区间估计nppsp)1(back1总体率的区间估计(1)正态近似法当样本例数n足够大，且样本率p和(1-p)都不太小时，即np和n(1-p)均大于5时，样本率p的抽样分布近似正态分布。例4.4从某地人群中随机抽取144人，检查乙型肝炎表面抗原携带状况，阳性率为9.20％，求该地人群的乙型肝炎表面抗原阳性率的95％可信区间。本例n=144，p=9.20％，可用近似正态法计算可信区间。先计算：95％可信限为：9.20%±1.96×2.41%，4.48%～13.92%。psup%41.20241.0144/)092.01(092.0ps(2)精确概率法当样本例数n较小时，特别是当p接近0或1时，不能用前述的正态近似法，而应根据二项分布的原理确定总体率的可信区间。设n个个体中阳性数为r，样本率为p=r/n，则100(1-)%的可信区间为(L,U)：)(2),1(2;2/2),1(2;2//)(11)1(rnrUrrnLFrnrrFrnrr当r=0时，当r=n时，nULFn2,2;2//110，12,2;2/UnLFnn，对例4.5资料用精确概率法计算HIV阳性率的95％可信区间。F0.025;58,2=39.482，F0.025;4,56=3.024，%76.17024.3/2822%09.0482.392911UL，back7两总体率之差1-2的区间估计如果n1p1，n1(1-p1)，n2p2，n2(1-p2)均大于5，则正态近似的方法可用于求总体率之差的可信区间：96.1)(,96.1)(21212121ppppsppspp222111)1()1(21nppnppsppback7可信区间的正确应用1、正确理解可信区间的涵义2、单侧可信区间3、区间和的区别4、可信区间与容许区间的区别Xu05.0XstX,05.0XstX,05.0suX05.0back195%可信区间的涵义是：如果重复100次抽样，每次样本含量均为n，每个样本均按构建可信区间，则在此100个可信区间内，理论上有95个包含总体均数，而有5个不包含总体均数。-2-1012图4.1100个来自N(0,1)的样本所估计的可信区间示意back11实际工作中，有时仅可信区间的下限或上限有意义。例如，某药物的平均有效期最短是多少？某药物的不良反应发生率最大是多少？例如，临床上观察120例使用某生物制剂的患者，其皮疹发生率2/120=1.67%，则该生物制剂的皮疹发生率的95％可信上限为：即该生物制剂的皮疹发生率最大为5.2%。%2.51371.2/)2120(1212/)(11)(2),1(2;rnrUFrnrrback11区间是以为中心的区间，表示从已知的均数为标差为的正态分布总体中抽样，每100个样本含量为n的样本均数中，理论上有95个被包含在该区间内。从逻辑推理上看，是用演绎法解释了样本均数的抽样误差。区间是以样本均数为中心的区间，用以估计总体均数所在范围。若用同样方法估计100次，理论上将有95个可区间包含总体均数。从逻辑推理上看，是用归纳法解释了样本均数的抽样误差。Xu05.0XstX,05.0back11(1)可信区间用于估计总体参数，总体参数只有一个；而容许区间用于估计变量值的分布范围，变量值可能很多甚至无限，95％容许区间的涵义是指有95％的变量值在该范围内。(2)可信区间所基于的t分布是统计量的抽样分布，一般均可通用；而容许区间所基于的正态分布是变量值的分布，只有当分布接近正态分布时方适用。两者有着本质的区别。XstX,05.0suX05.0XstX,05.0suX05.0back11back14