同样,我们只研究总体是正态随机变量的情形。设,是来自这个总体的样本,我们的任务是利用样本值来给出的置信区间。三、方差的置信区间我们已经研究了期望的区间估计,找出了期望的置信区间.但有的实际问题是要求对方差(或标准差)进行区间估计,即根据样本找出的置信区间,这在研究生产的稳定性与精度问题时是需要的。例1已知某地区新生婴儿的体重X~),,(2N,,2未知随机抽查100个婴儿…得100个体重数据X1,X2,…,X100的区间估计2求和(置信水平为1-).解:这是单总体均值和方差的估计未知22,),,(~NX已知先求均值的区间估计.)1(~ntnSXT因方差未知,取对给定的置信度,确定分位数1),1(21nt使1)}1(|{|21ntTP1)}1(|{|21ntnSXP即)]1(),1([22ntnSXntnSX均值的置信水平为的区间估计.即为1从中解得1)}1()1({22ntnSXntnSXP2再求方差的置信水平为的区间估计.1)1(~)1(2222nSn取枢轴量第一步第二步求使得dc,1)(2dcP满足上式的c,d有很多对,只要使得左边图形阴影部分面积为一般习惯选取使得左右阴影部分面积相等的c,dcd11)}1()1()1({2212222nSnnP从中解得1})1()1()1()1({22222212nSnnSnP对给定的置信度,确定分位数1,)1(22n有,)1(221n即选取)1(),1(22122ndnc于是即为所求.])1()1(,)1()1([2222212nSnnSn1})1()1()1()1({22222212nSnnSnP如05.0,6,36.02ns查表得8325.12)5(,8312.0)5(2975.02025.0代入得方差的95%置信区间为2]1655.2,1403.0[需要指出的是,给定样本,给定置信水平,置信区间也不是唯一的.对同一个参数,我们可以构造许多置信区间.设是来自二点分布的样本,现要求p的的置信区间。nxxx,,21),1(pb1在样本容量充分大时,可以用渐进分布来构造近似的置信区间。一个典型的例子是关于比例p的置信区间。大样本置信区间的渐近分布为x)1,(npppN1,0~/1Nnpppxu2/12/11/12/1unpppxP由中心极限定理知,样本均值因此有这个u可以作为枢轴量,对给定利用标准正态分布的分位数可得nppupx/122/1222/1u02122xpnxpn0141422222nnxxxnnx括号里的事件等价于记,上述不等式可化为左侧的二次多项式的判别式故此二项式是开口向上并与x轴有两个交点的曲线,记此两个交点为,则有ULpp,1ULpppPULpp,2241211nnxxnxnp这里是该二次多项式的两个根,它们可以表示为由于n较大,在实际中通常略去项,于是可将置信区间近似为n/nxxuxnxxux1,12/12/196.1,3.0120/36,120975.0而xn218.01207.03.096.13.0ˆLp382.01207.03.096.13.0ˆLp例8对某事件A作120次观察,A发生36次。试给出事件A发生概率p的0.95的置信区间。于是p的0.95(双侧)置信下限和上限分别为故所求的置信区间为[0.218,0.382]。解此处解这是关于两点分布比例p的置信区间问题,的置信区间长度为例9某传媒公司欲调查电视台综艺节目收视率p,为使得p的的置信区间的长度不超过,问应调查多少户?10d1nxxu/122/1这是一个随机变量,但由于,所以对任意的观测值有。这也就是说p的的置信区间长度不超过1,0x25.05.012xx1nu/2/1现要求p的的置信区间长度不超过,只需要02/1/dnu10d即可。202/1dun05.0,04.00d240104.096.104.022975.0un若取则从而设是来自的样本,是来自的样本,且两个样本相互独立。分别是各自的样本均值和样本方差。下面讨论两个均值差和两个方差比的置信区间。mxx,1211,Nnyy,1222,N22,,,yxssyx两个正态总体下的置信区间这是历史上著名的Behrens-Fisher问题,它是Behrens在1929年从实际中提出的问题。它的几种特殊情况已经获得圆满的解决,但其一般情况至今尚有学者在讨论。下面我们对此问题分几种情况进行讨论,留意它们之间的差别及其处理方法。21一、的置信区间nmNyx222121,~1,0~222121Nnmyxu2221,1.已知时取枢轴量为此时有的的置信区间为211nmuyxnmuyx22212/122212/1,沿用前面多次用过的方法可以得到该区间称为二样本u区间。22221221)11(,~nmNyx2~112222nmsnsmyx22,,,yxssyx2~1122221nmtsnsmyxnmnmmntyx2未知时由于相互独立,故可构造如下t分布的枢轴量此时有则的置信区间为211222nmSnSmSyxw2112-nm11,2-nm112/12/1tsnmyxtsnmyxww记2122/)1(,,~2121222121nmNnmNyx2~11/1122222122122nmsnsmsnsmyxyx3.此时的处理方法与2中完全类似,只需注意到已知时22,,,yxssyx由于相互独立,2~/1122221nmtsnsmyxnmnmmntyx2/11222nmSnSmSyxt2112-nm,2-nm2/12/1tsnmmnyxtsnmmnyxtt记则的置信区间为故仍可构造如下t分布的枢轴量1,0~2221Nnsmsyxuyx211nsmsuyxnsmsuyxyxyx222/1222/1,4.当m和n都很大时的近似置信区间由此给出的置信区间为此时可以证明有当m,n并不都很大,可采用如下的近似方法:令nsmssyx//2220021/syxT)1,0(N5.一般情况下的置信区间此时T既不服从也不服从t分布。但研究表明它与自由度的t分布很接近,其中由公式ll取枢轴量11242440nnsmmsslyx决定。l)(~ltT211ltsyxltsyx2/102/10,)(一般不为整数,可以取与之接近的整数代替。从而可得的置信区间为于是近似地有例为比较两个小麦品种的产量,选择18块条件相似的试验田,采用相同的耕作方法做试验,结果播种甲品种的8块试验田的单位面积产量和播种乙品种的10块试验田的单位面积产量(单位:kg)分别为:甲品种628583510554612523530615乙品种535433398470567480498560503426假定每个品种的单位面积产量均服从正态分布,试求这两个品种平均单位面积产量差的0.95置信区间。8,55.2110,38.5692msxx10,22.3256,00.4872nsyy解81,xx101,yy以记甲品种的单位面积产量,记乙品种的单位面积产量,下面分两种情况讨论。由样本数据可计算得到1199.2162975.02/1tnmt4880.521622.3256955.2110721122nmSnSmSyxw78.521199.21018152.48802-nm112/1tsnmw故的0.95置信区间为21]16.135,60.29[78.5248738.569此处(1)若已知两个品种的单位面积产量的标准差相同,则可采用二样本t区间。28.24,44.58910/22.32568/55.2110//02220snsmssyx1874.17111022.32567855.211044.58922222l01.511009.228.24)(975.00lts(2)若两个品种的单位面积产量的标准差不相同,则可采用近似t区间。此处21于是的0.95近似置信区间为[31.37,133.38]。2221/1~/1,1~/122222212nsnmsmyx22,yxss)1,1(~//222212nmFssFyx1由于且相互独立,故可仿照F变量构造如下枢轴量:二、的置信区间1)1,1(//)1,1(2/12222122/nmFssnmFPyx对给定的置信水平,有2221/1)1,1(1,)1,1(12/222/122nmFssnmFssyxyx经不等式变形即可给出的如下的置信区间例某车间有两台自动机床加工一类套筒,假设套筒直径服从正态分布。现在从两个班次的产品中分别检查了5个和6个套筒,得其直径数据如下(单位:cm):甲班:5.065.085.035.005.07乙班:4.985.034.974.995.024.95试求两班加工套筒直径的方差比的0.95置信区间。22/乙甲39.7)5,4(,1068.036.9/1)4,5(1)5,4(975.0975.0025.0FFF00092.000037.022乙甲,ss3.76570.106810.000920.00037)5,4(1,0.05447.3910.000920.00037)5,4(1025.022975.022FssFss乙甲乙甲解此处,m=5,n=6,由查表知由数据算得故置信区间的两端分别为22/乙甲由此可知的0.95置信区间为[0.0544,3.7657]。作业:P353T3,5,9