概率论与数理统计-7.3置信区间

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

11,,,120;(2)(),,.0nin,xinxx其他解(1)样本的似然函数为1()();niifxL2();3xfxdxEX当0xi1时,L()0,1ln,()()lnln2(1)niixnL,ni1X1,X2,…,Xn是取自总体X的一组样本,1,0(2)1();,,0xxfx;其它求的极大似然估计量与矩估计量.其中0为未知参数,例设总体X的密度为故有对数似然函数:1()lnln2niindLxd对求导并令其为0可得似然方程:=0,解得极大似然估计量:1ˆ2lnniinX令121,3niiXXn(2)解得矩估计量:32ˆ.1XX而区间估计正好弥补了点估计的这个缺陷.无偏性有效性一致性——估计量的期望值等于未知参数的真值.为了使估计的结论更可信,需要引入区间估计.评选标准——方差更小的无偏估计量.•样本k阶原点矩是总体k阶原点矩的无偏估计量;•样本方差S2是总体方差2的无偏估计量;•无偏估计量的函数未必是无偏估计量─•在的所有线性无偏估计量中,样本均值X是最有效的.参数的点估计是用样本算得的一个值去估计未知参数.使用起来把握不大.点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围.若我们根据一个实际样本得到鱼数N的极大似然估计为1000条.一个可以想到的估计办法是:若我们能给出一个区间,并告诉人们该区间包含未知参数N的可靠度(也称置信系数).但实际上,N的真值可能大于1000条,也可能小于1000条.§7.3单个正态总体均值与方差的置信区间也就是说,给出一个区间,使我们能以一定的可靠度相信区间包含参数µ。湖中鱼数的真值[]这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平.习惯上把置信水平记作1-,这里是一个很小的正数.譬如,在估计湖中鱼数的问题中,•根据置信水平1-,可以找到一个正数,例如,通常可取置信水平=0.95或0.9等等.,1)(P根据一个实际样本,由给定的置信水平1-,我们求出一个的区间,使),(置信水平的大小是根据实际需要选定的.如何寻找这种区间?,1)|ˆ|(P使得^我们选取未知参数的某个估计量,^只要知道的概率分布就可以确定.下面我们就来正式给出置信区间的定义,并通过例子说明求置信区间的方法.ˆˆ由不等式|ˆ|可以解出:这个不等式就是我们所求的置信区间.),(代入样本值所得的普通区间称为置信区间的实现.1)为两个统计量(由样本完全确定的已知函数);X1,X2,…,Xn是取自总体X的样本,,1)(P对给定值01,),,,(21nXXX),,,(21nXXX),(满足定义4设是总体X的待估参数,和分别称为置信下限和置信上限.一、置信区间的概念则称随机区间为的置信水平为1-的双侧置信区间.若统计量和置信度置信概率和),(2)是随机区间,并非一个实现以1-的概率覆盖了要求置信区间的长度尽可能短.估计的可靠度:─即P()=1-要尽可能大.─可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.估计的精度:即要求区间置信的长度尽可能短,或能体现该要求的其它准则.要求以很大的可能被包含在置信区间内.要求估计尽量可靠.置信水平的概率意义:置信水平为0.95是指100组样本值所得置信区间的实现中,约有95个能覆盖,而不是一个实现以0.95的概率覆盖了.估计要尽量可靠,估计的精度要尽可能的高:^只要知道的概率分布就可以确定.如何根据实际样本,由给定的置信水平1-,求出一个区间,使根据置信水平1-,可以找到一个正数,二、置信区间的求法(一)单个正态总体1.均值(1)已知方差21.均值1-2(1)已知方差12,22(二)两个正态总体2.方差2(2)未知方差2?1)(P),(,1)|ˆ|(P使得^我们选取未知参数的某个估计量,ˆˆ由不等式|ˆ|可以解出:这个不等式就是我们所求的置信区间.),(分布的分位数①②③(1)已知均值(2)未知均值(2)未知方差12,222.方差12/22(1)已知均值1,2(2)未知均值1,2,但相等!对于给定的置信水平,根据估计量U的分布,确定一个区间,使得U取值于该区间的概率为置信水平.─X,S2分别是其样本均值和样本方差,─X~N(,2/n),求参数、2的置信水平为1-的置信区间.设X1,…,Xn是总体X~N(,2)的样本,nXU/①确定未知参数的估计量及其函数的分布是的无偏估计量,②由分布求分位数即得置信区间(一)单个正态总体置信区间的求法(1)已知方差2时─故可用X作为EX的一个估计量,niiXnX11~N(0,1),对给定的置信度1-,按标准正态分布的双侧分位数的定义2/2/2/|/|unXunXunX,)||(2/uUP,21)(2/u即令查正态分布表可得u/2,③由u/2确定置信区间,),(2/2/unXunX有了分布就可求出U取值于任意区间的概率简记为2unX由抽样分布定理知1.均值的置信区间2/2/unXunX是求什么参数的置信区间?置信水平1-是多少?^1.寻找未知参数的一个良好的点估计量(X1,X2,…,Xn);^确定待估参数估计量函数U()的分布;求置信区间首先要明确问题:2.对于给定的置信水平1-,由概率─(,)就是的100(1-)%的置信区间.─一般步骤如下:─3.由分位数|U|x确定置信区间(,).─,)||(xUP)||(2/uUP21)(2/u),(2/2/unXunX查表求出分布的分位数x,)1,0(~/NnXUniiXnX11总体分布的形式是否已知,是怎样的类型,至关重要.某乡农民在联产承包责任制前人均纯收入X(单位:元),求的置信水平为0.95的置信区间.推行联产承包责任制后,在该乡抽得n=16的样本,且X~N(µ,252).解由于=0.05,查正态分布表得例1─得x=325元,假设2=252没有变化,2/|/|unX96.1|16/25325|96.1162532596.11625325即得置信区间(312.75,337.25).同一置信水平下的置信区间不唯一,如在上例中取=0.01+0.04,)(1)(104.001.004.010.0uu75.1,33.204.001.0uu由正态分布上侧分位数定义知)(101.004.0uUuP)()(104.010.0uu查表知75.1162532533.21625325u0.025=1.96,当然区间长度越短的估计,精度就越高.其长度也不相等.区间长度为24.25长度为25.5谁是精度最高的?由于标准正态分布密度函数的图形是单峰且对称的,xx在保持面积不变的条件下,以对称区间的长度为最短!!但的长度是最短的,l与n,的关系:),(2/2/unXunX可知,置信区间的长度l为:,22/unl由置信区间公式l随着的减小而增大;20若给定,l随着n的增大而减小;21)(2/u)(x同一置信水平下的置信区间不唯一.其长度也不相等.),(2/2/unXunX故我们总取它作为置信水平为1-的置信区间.若给定n,且由于l与成反比,n减小的速度并不快,例如,n由100增至400时,l才能减小一半.则u/2越大,l就越大,这时就越小.10(u/2)就越大,一般地,在概率密度为单峰且对称的情形下,a=-b对应的置信区间的长度为最短.例2:某厂生产的零件长度X服从N(,0.04),现从该厂生产的零件中随机抽取6个,长度测量值如下(单位:毫米):14.6,15.l,14.9,14.8,15.2,15.1.求:µ的置信系数为0.95的区间估计。解:n=6,=0.05,z/2=z0.025=1.96,2=0.22.,95.14X通过计算,得.11.15,79.14,22znXznX所求置信区间为故不能采用已知方差的均值估计方法由于与有关,但其解决的思路一致.nSX由于S2是2的无偏估计量,查t分布表确定上侧/2分位数令,1})1(||{2ntTPT=(2)未知方差),(2/2/unXunXnXU/——用分布的分位数求的置信区间.故可用S替代的估计量:S~t(n-1),)()1(,)1(22ntnSXntnSX即为的置信度为1-的区间估计.)1()1(22ntnSXntnSX2时由抽样分布定理知——实用价值更大!!)1(||2/ntnSXt/2(n-1),测定总体服从正态分布,求总体均值的置信水平为0.95的置信区间.解由于/2=0.025,查t分布表得例3为确定某种溶液中甲醛浓度,─且其4个独立测量值的平均值x=8.34%,样本标准差s=0.03%,2/|/|tnSX182.3|4/03.034.8|%)182.3403.034.8(%)182.3403.034.8(即得置信区间自由度n-1=3,t0.025=3.182,─将x=8.34%代入得%)182.3403.034.8(,%)182.3403.034.8(.)%883.8,%292.8(即,)1(~)1(222nSn(2)未知时1})1()1({222221nnP,)1()1()1()1(22122222nSnnSn所以2的置信水平为1-的区间估计为因为2的无偏估计为S2,2.方差2的置信区间的求法由抽样分布定理知2=由确定2分布的上侧/2分位数.))1()1(,)1()1((2212222nSnnSn找一个含与S,但不含,且分布已知的统计量为了计算简单,在概率密度不对称的情形下,如2分布,F分布,习惯上仍取对称的分位点来计算未知参数的置信区间.并不是最短的置信区间/2/2)1()1()1(2222221nSnn,)1(22n,)1(221n测定总体服从正态分布,求总体均值的置信水平为0.95的置信区间.解由于/2=0.025,查2分布表得例4为确定某种溶液中甲醛浓度,─且其4个独立测量值的平均值x=8.34%,样本标准差s=0.03%,故2的置信区间为自由度n-1=3,得将s2=0.0009代入,)%0125.0,%00029.0(.)%112.0,%017.0(求总体方差2和标准差的置信水平为0.95的置信区间.,348.9)3(2025.0,)1()1()1(2222221nSnn,216.00009.03348.90009.032故的置信区间为,216.0)3(2025.01在实际应用中,经常会遇到两个正态总体的区间估计问题。于是,评价新技术的效果问题,就归结为研究两个正态总体均值之差1-2的问题。例如:考察一项新技术对提高产品的某项质量指标的作用,将实施新技术前的产品质量指标看成正态总体N(1,12),实施新技术后产品质量指标看成正态总体N(2,22)。设X1,…,Xm分别是总体X

1 / 26
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功