复旦版工程数学之概率统计课件第30讲

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

引言前面,我们讨论了参数点估计.它是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.区间估计正好弥补了点估计的这个缺陷.譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的极大似然估计为1000条.若我们能给出一个区间,在此区间内我们合理地相信N的真值位于其中.这样对鱼数的估计就有把握多了.实际上,N的真值可能大于1000条,也可能小于1000条.也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.湖中鱼数的真值[]这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平.习惯上把置信水平记作1,这里是一个很小的正数.置信水平的大小是根据实际需要选定的.例如,通常可取置信水平=0.95或0.9等.11}ˆˆ{21P根据一个实际样本,由给定的置信水平,我]ˆ,ˆ[21小的区间,使们求出一个尽可能置信区间.称区间为的]ˆ,ˆ[211置信水平为的寻找置信区间的方法,一般是从确定误差限入手.1}|ˆ{|P使得称为与之间的误差限.ˆ我们选取未知参数的某个估计量,根据置信水平,可以找到一个正数,ˆ1只要知道的概率分布,确定误差限并不难.ˆ下面我们就来正式给出置信区间的定义,并通过例子说明求置信区间的方法.ˆˆ由不等式|ˆ|可以解出:这个不等式就是我们所求的置信区间.教材180页已经给出了概率分布的上侧分位数(分位点)的定义,为便于应用,这里我们再简要介绍一下.在求置信区间时,要查表求分位数.设01,对随机变量X,称满足)(xXP的点为X的概率分布的上分位数.x例如:645.105.0u96.1025.0u设01,对随机变量X,称满足)(xXP的点为X的概率分布的上分位数.x标准正态分布的上分位数u例如:348.9)3(2025.0216.0)3(2975.0设01,对随机变量X,称满足)(xXP的点为X的概率分布的上分位数.x分布的上分位数)(2n2自由度为n的设01,对随机变量X,称满足)(xXP的点为X的概率分布的上分位数.xF分布的上分位数),(21nnF自由度为n1,n2的书末附有分布、t分布、F分布的上侧分位数表,供使用.需要注意的事项在教材上有说明.2至于如何由标准正态分布函数表查表求得分位数,若你对分布函数定义熟悉的话,这个问题不难解决.现在回到置信区间题目上来.一、置信区间定义:1}ˆˆ{21P),,,,(ˆˆ2111nXXX),,,(ˆˆ2122nXXX)ˆˆ(21满足设是一个待估参数,给定,0若由样本X1,X2,…Xn确定的两个统计量则称区间是的置信水平(置信度、置信概率)为的置信区间.]ˆ,ˆ[21121ˆˆ和分别称为置信下限和置信上限.一旦有了样本,就把估计在区间]ˆ,ˆ[21内.这里有两个要求:可见,11ˆˆ对参数作区间估计,就是要设法找出两个只依赖于样本的界限(构造统计量)22ˆˆ)ˆˆ(21(X1,…Xn)(X1,…Xn)2.估计的精度要尽可能的高.如要求区间12ˆˆ长度尽可能短,或能体现该要求的其它准则.]ˆ,ˆ[211.要求以很大的可能被包含在区间}ˆˆ{21P内,就是说,概率要尽可能大.即要求估计尽量可靠.可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.~N(0,1)选的点估计为X求参数的置信度为的置信区间.例1设X1,…Xn是取自的样本,,2已知),(2N1nXU取二、置信区间的求法明确问题,是求什么参数的置信区间?置信水平是多少?寻找未知参数的一个良好估计.解:寻找一个待估参数和估计量的函数,要求其分布为已知.有了分布,就可以求出U取值于任意区间的概率.,1对给定的置信水平查正态分布表得,2u对于给定的置信水平(大概率),根据U的分布,确定一个区间,使得U取值于该区间的概率为置信水平.1}|{|2unXP使为什么这样取?,1对给定的置信水平查正态分布表得,2u1}{22unXunXP1}|{|2unXP使从中解得],[22unXunX也可简记为2unX1}{22unXunXP于是所求的置信区间为从例1解题的过程,我们归纳出求置信区间的一般步骤如下:1.明确问题,是求什么参数的置信区间?置信水平是多少?12.寻找参数的一个良好的点估计T(X1,X2,…Xn)称S(T,)为枢轴量.3.寻找一个待估参数和估计量T的函数S(T,),且其分布为已知.4.对于给定的置信水平,根据S(T,)的分布,确定常数a,b,使得11P(a≤S(T,)≤b)=5.对“a≤S(T,)≤b”作等价变形,得到如下形式:1}ˆˆ{21P]ˆ,ˆ[211则就是的100()%的置信区间.可见,确定区间估计很关键的是要寻找一个待估参数和估计量T的函数S(T,),且S(T,)的分布为已知,不依赖于任何未知参数(这样我们才能确定一个大概率区间).而这与总体分布有关,所以,总体分布的形式是否已知,是怎样的类型,至关重要.这里,我们主要讨论总体分布为正态的情形.若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间估计.教材上讨论了以下几种情形:单个正态总体均值和方差的区间估计.2两个正态总体均值差和方差比的区间估计.212221比例p的区间估计.下面我们举几个例子,其余部分请自己看.休息片刻继续例2已知某地区新生婴儿的体重X~),,(2N,,2未知随机抽查100个婴儿…得100个体重数据X1,X2,…,X100的区间估计2求和(置信水平为1-).解:这是单总体均值和方差的估计未知22,),,(~NX已知先求均值的区间估计.)1(~ntnSXt因方差未知,取对给定的置信度,确定分位数1),1(2nt使1)}1(|{|2nttP1)}1(|{|2ntnSXP即)]1(),1([22ntnSXntnSX均值的置信水平为的区间估计.即为1从中解得1)}1()1({22ntnSXntnSXP)1(~)1(222nSn取枢轴量1)}1()1()1({2222221nSnnP从中解得1})1()1()1()1({22122222nSnnSnP2再求方差的置信水平为的区间估计.1对给定的置信度,确定分位数1,)1(22n使,)1(221n于是即为所求.])1()1(,)1()1([2212222nSnnSn1})1()1()1()1({22122222nSnnSnP需要指出的是,给定样本,给定置信水平,置信区间也不是唯一的.对同一个参数,我们可以构造许多置信区间.~N(0,1)nXU取枢轴量由标准正态分布表,对任意a、b,我们可以求得P(aUb).例如,设X1,…Xn是取自的样本,,2已知),(2N求参数的置信水平为的1置信区间.~N(0,1)nXU例如,由P(-1.96≤U≤1.96)=0.95)(ufu96.196.195.0我们得到均值的置信水平为1的置信区间为]96.1,96.1[nXnX由P(-1.75≤U≤2.33)=0.95这个区间比前面一个要长一些.置信区间为]33.2,75.1[nXnX我们得到均值的置信水平为1的)(ufu33.275.1我们总是希望置信区间尽可能短.类似地,我们可得到若干个不同的置信区间.任意两个数a和b,只要它们的纵标包含f(u)下95%的面积,就确定一个95%的置信区间.0buuu)(ufaaabb950.950.950.在概率密度为单峰且对称的情形,当a=-b时求得的置信区间的长度为最短.0buuu)(ufaaabb950.950.950.a=-b即使在概率密度不对称的情形,如分布,F分布,习惯上仍取对称的百分位点来计算未知参数的置信区间.2我们可以得到未知参数的的任何置信水平小于1的置信区间,并且置信水平越高,相应的置信区间平均长度越长.)(22n)(221n)(xfx)(~2nX也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差.这是一对矛盾.实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些.例3某单位要估计平均每天职工的总医疗费,观察了30天,其总金额的平均值是170元,标准差为30元,试决定职工每天总医疗费用平均值的区间估计(置信水平为0.95).解:设每天职工的总医疗费为X,近似服从正态分布X),(2nN大样本,由中心极限定理,2E(X)=,D(X)=未知,用样本标准差S近似代替.取枢轴量nSXU近似N(0,1)分布对给定的置信水平,确定分位数1,2u使1}|{|2unSXP],[22unSXunSX得均值的置信水平为的区间估计为1将=170,S=30,=1.96,n=30代入得,X的置信水平为0.95的置信区间是[159.27,180.74]2u],[22unSXunSX得均值的置信水平为的区间估计为1三、单侧置信区间上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限.例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了.这时,可将置信上限取为+∞,而只着眼于置信下限,这样求得的置信区间叫单侧置信区间.于是引入单侧置信区间和置信限的定义:1}ˆ{1P),,,(ˆˆ2111nXXX满足设是一个待估参数,给定,0若由样本X1,X2,…Xn确定的统计量则称区间是的置信水平为的单侧置信区间.),ˆ[111ˆ称为单侧置信下限.),,,(ˆˆ2122nXXX又若统计量满足1}ˆ{2P2ˆ则称区间是的置信水平为的单侧置信区间.]ˆ,(21称为单侧置信上限.设灯泡寿命服从正态分布.求灯泡寿命均值的置信水平为0.95的单侧置信下限.例4从一批灯泡中随机抽取5只作寿命试验,测得寿命X(单位:小时)如下:1050,1100,1120,1250,1280)1(~ntnSX由于方差未知,取枢轴量2解:的点估计取为样本均值X对给定的置信水平,确定分位数)1(nt11)}1({ntnSXP使即1})1({nSntXP于是得到的置信水平为的单侧置信区间为1],)1([nSntX将样本值代入得的置信水平为0.95的单侧置信下限是1065小时的置信水平为的单侧置信下限为1即nSntX)1(请自己画一张表,将各种情况下的区间估计加以总结.留作作业置信区间演示为了使你对置信区间概念有更好的理解,并对样本容量、置信水平对置信区间的影响建立直观印象,请看演示:同学们可通过练习,掌握各种求未知参数的置信区间的具体方法.这一讲,我们介绍了区间估计.

1 / 50
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功