估计量的评选标准与区间估计一估计量的评选标准(一)无偏性定义若估计量=(X1,X2,…,Xn)的数学期望E()存在,且对于任意∈有E()=,则称是的无偏估计。ˆˆˆˆˆˆ在科学技术中E()-称为以作为的估计的系统误差,无偏估计的实际意义就是无系统误差。例1设总体X的的k阶矩k=E(Xk)(k1)存在,又设X1,X2,…,Xn是X的一个样本。试证明不论总体服从什么分ˆ布,k阶样本矩nikiXnkA11证X1,X2,…,Xn与X同分布,故有E(Xik)=E(Xk)=k,i=1,2,…,n.)(kAE即有niXXni1)(1ˆ22证22211ˆXniXni.)(11knikiXEnX例2对于均值,方差20都存在的总体,若,2均为未知,则2的估计量是有偏的。22XA是k阶总体矩k的无偏估计。特别,不论总体服从什么分布,只要它的数学期望存在总是总体X的数学期望1=E(X)的无偏估计量。,)(2222AE22)]([)()(XEXDXE又)()ˆ(222XAEE是有偏的。所以2ˆ)()(22XEAE,乘若以2ˆ1nn所得的估计量就是无偏的了:)ˆ1(2nnE:ˆ122Snn本方差就是第六章中定义的样.)(11122niiXXnS故,/22n,1nn.)ˆ(12Enn这就是说S2是2的无偏估计,因此,一般都是取S2作为方差2的估计量。例3设总体X服从参数为的指数分布,概率密度为其它。,0,0,,(/xexfx其中0为未知,又设X1,X2,…,Xn是来自X的样本,试证)],...,,[min(21nXXXnnZX和都是的无偏估计量证的无偏估计。是故因XXEXE)()(而Z=min(X1,X2,…,Xn)服从参数为/n的指数分布,即具有概率密度其它。,0,0,;(/minxenxfnx故知.)(,)(nZEnZE即nZ也是参数的无偏估计量。由此可见一个未知参数可以有不同的无偏估计量。事实上X1,X2,…,Xn均可。(二)有效性都是与设定义),...,,(ˆˆ),...,,(ˆˆ21222111nnXXXXXX的无偏估计量,若有现在来比较的两无偏估计量.)ˆ()ˆ(21DD有效。较则称21ˆˆ例4(续例3)试证当n1时,的无偏估计量较的无偏估计量nZ有效。XXXX(三)一致性定义设(X1,X2,…,Xn)为参数的估计量,若对于任意,当n时(X1,X2,…,Xn)依赖收敛于,则称为的一致估计量。ˆˆˆ证由于D(X)=2,故有D()=2/n,再者,由于D(Z)==2/n2,故有D(nZ)=2.当n1时D(nZ)D(),故较nZ有效。由第六章2知,样本k(k≥1)阶矩是总体X的k阶矩k=E(Xk)的一致估计量,进而若待估参数=g(1,2,…,k),其中g为连续函数,则的矩估计量)ˆ,....,ˆ,ˆ(ˆ21kg=g(A1,A2,…,Ak)是的一致估计量。由极大似然估计法得到的估计量,在一定条件下也具有一致性。二区间估计对于未知参数,除了求出它的点估计外,还必须给出一个范围,并知道这个范围包含真值的可信度,这样的范围用区间给出,并给出范围含的可信程度。这种形式的估计称为区间估计。ˆ置信区间设总体X的分布函数F(x;)含有一个未知参数.对于给定值a(0a1),若由样本X1,X2,…,Xn确定的两个统计量),...,,(),...,,(2121nnXXXXXX和满足,a1)},...,,(),...,,({2121nnXXXXXXP分和的置信区间的置信度为是则称随机区间,a1),(别称为置信度为1-a的双侧置信区间的置信下限和置信上限,1-a称为置信度。意义:若反复抽样多次(容量都是n),每个样本确定一个区间,其中包含真值的约占100(1-a)%。例4设总体X~N(,2),2为已知,为未知,设X1,X2,…,Xn是来自X的样本,求的置信度为1-a的置信区间。的无偏估计,且有是已知解X).1,0(~/NnX且它不依赖于任何未知参数,按标准正态分布的上a分位点的定义,有(如图).a1}/{2/aznXPa.1}{2/a2/aznXznXP即这就得到了的一个置信度为1-a的置信区间(5)),(2/a2/aznXznX)(2/aznX常写成如果取a=0.05,即1-0.05=0.95,又若=1,n=16,查表得za/2=z0.025=1.96.于是得到置信度为0.95的置信区间,)96.1161(X).49.0(X即则有获得再者,若由一个样本值,52.0X),49.0(5.20).5.69(4.71,即这已不是随机区间,但仍称为95%的置信区间,含义是该区间属于那些包含的区间的可信程度为95%,或“该区间包含”的可信度为95%.注意:置信区间不唯一,上例给定a=0.05,则还有.95.0}{0.040.01znXznXP即,95.0}/{0.0104.0znXzP(7)),(0.040.01znXznX故也是的置信度为95%的置信区间。比较(5)和(7)则区间长度分别为,3.9220.0251nznl.48.4)(0.010.042nzznl,2,4a/2nznL解出设置信区间的长度中在例,)2(2a/2zLn可见,L随n的增大而减小(当a给定时)。我们可以确定n,使置信区间具有预先给定的长度。寻求参数的置信区间的具体做法步骤:1)寻求一个样本X1,X2,…,Xn的函数:Z=Z(X1,X2,…,Xn;),它包含待估参数,而不含其它未知参数,且Z的分布不依赖其它未知参数。(当然不依赖于待估参数)2)对给定置信度1-α,定出两常数a,b,使P{aZ(X1,X2,…,Xn;)b}=1-α3)若能从aZ(X1,X2,…,Xn;)b得到等价的不等式的的已得到采用函数为已知,由例a1,/4)(2nXa,的置信区间。的一个置信度为就是那么都是统计量a1),(,函数Z(X1,X2,…,Xn;)的构造,可以从的点估计着手考虑。(三)单个总体N(,2)的情况设已给定置信度为1-a,并设X1,X2,…,Xn为总体N(,2)方差。分别是样本均值和样本的样本2S,X.1)均值的置信区间),...,,(),,...,,(2121nnXXXXXX其中).nX(2/az置信区间为222,),)(是而因其内含为未知。这时,不能用Saba,1)}1(/)1({a/2a/2ntnSXntP得a.1)}1(nSX)1(nS-X{a/2a/2ntntP即于是得的置信度为1-a的置信区间)).1(nX(2/antS例5有一大批糖果,现从中随机地取16袋,称得重量为506508499503504510497512,)1(),1(~/,不依赖于任何未知参数且又的无偏估计ntntnSX514505493496506502509496解这里1-a=0.95,a/2=0.025,n-1=15,,75.503xs=6.2022.于是根据得均值的0.95置信区间).1315.2162022.6(503.75即(500.4,507.1).若以此区间任一值作的近似值,其误差不大于%.9561.621315.2162022.6克,且可信度为1315.2)15(025.0t设袋装糖果的重量近似服从正态分布,试求总体均值的置信区间。))1(nX(2/antS2)方差2的置信区间(只介绍为未知)2的无偏估计为S2由第六章2定理一知),1(~)1(222nSna,1)}1()1()1({2a/2222a/2-1nSnnP故这就是2的置信度为1-a的置信区间.)1()1(,)1()1(2a/2122a/22nSnnSn还可得标准差的置信区间。a,1})1()1()1()1({2a/21222a/22nSnnSnP即例6求例5中的置信度为0.95置信区间。解a/2=0.025,1-a/2=0.975,n-1=15,20.025(15)=27.488,20.975(15)=6.262,S=6.2022.由上式得的置信区间为(4.58,9.60).)1()1(,,)1()1(2a/2122a/22nSnnSn