第二节点估计量的优良性11、矩方法;(矩估计)2、极大似然函数法(极大似然估计).复习点估计的方法1.矩方法方法用样本的k阶矩作为总体的k阶矩的估计量,建立含有待估计参数的方程,从而可解出待估计参数2设待估计的参数为k,,,21设总体的r阶矩存在,记为),,,()(21krrXE设X1,X2,…,Xn为一样本,样本的r阶矩为nirirXnB11令kr,,2,1),,,(21krniriXn11——含未知参数1,2,,k的方程组3解方程组,得k个统计量:),,,(ˆ),,,(ˆ),,,(ˆ21212211nknnXXXXXXXXX——未知参数1,2,,k的矩估计量),,,(ˆˆ),,,(ˆˆ),,,(ˆˆ2121222111nkknnxxxxxxxxx——未知参数1,2,,k的矩估计值代入一组样本值得k个数:4定义1:(1)设r.v.X的概率密度函数为f(x,),其中为未知参数(f为已知函数).x1,x2,,xn为样本X1,X2,,Xn的样本观察值,121()(,,,;)(;)nniiLLxxxfx称为变量X关于样本观察值x1,x2,,xn的似然函数。(2)若X是离散型随机变量,似然函数定义为121(,,,;)()nniiiLxxxPXx12(,,,;)nLxxx2.极大似然估计5);,,,()(21nxxxLL定义2如果似然函数在时达到最大值,则称是参数的极大似然估计。ˆˆˆˆ通常步骤:第一步似然函数为1211(,,,;)(,,)nnikiLLxxxfx注:求导不是求极大似然估计唯一方法第二步ln0,1,idLikd令解出1ˆˆ(),1,iinxxik6对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题应该选用哪一种估计量?用什么标准来评价一个估计量的好坏?常用标准(1)无偏性(3)一致性(2)最小方差无偏估计(有效性)第二节点估计量的优良性7一、无偏估计12ˆ(,,,)nxxxˆˆ()E则称ˆ为的无偏估计。定义1设(简记为)为未知参数的估计量,若(真值)8例1:样本均值和样本方差分别是总体均值和总体方差的无偏估计量.计算2ES])(11[212niiXXnEES2211{[2]}1niiiEXXXXn22111{[]}1nniiiEXnXn)]()([112222nnnn22)1(11nn),,,(21nXXX是总体X的样本,一般的设总体X的k阶矩)(kkXE存在容易知道:不论X服从什么分布,nikikXnA11是k的无偏估计量.102222)(iiiEXDXEX2222)(nXEXDXE例2设总体X的概率密度为其它,00),(6)(3xxxxfˆˆD(4)求的方差X1,X2,,Xn为来自总体X的样本.(1)求总体均值EX,总体方差DX;ˆ(2)求的矩估计量;ˆ(3)是否为的无偏估计;11解(1)总体均值dxxxxdxxxfEX)(6)(03dxxx)(630232|)4131(60433xxdxxxxdxxfxEX)(6)(03222dxxx)(6403320543103|)5141(6xx总体方差22222201)2(103)(EXEXDX12(3)2222)2(ˆEXXEXEEˆ所以是的无偏估计;ˆDXnXDXDD144)2(ˆ225120114nn(4)的方差(2)令XEX得的矩估计量为X2ˆ13二、最小方差无偏估计12ˆˆ()()DD则称是的最小方差无偏估计。1ˆ定义2设是的一个无偏估计,若对于的任一无偏估计,成立1ˆ2ˆ),,,(ˆ2111nXXX定义设有效性),,,(ˆ2122nXXX都是总体参数的无偏估计量,且)ˆ()ˆ(21DD则称1ˆ2ˆ比更有效.14例3设X1,X2,,Xn为来自于总体X的样本,总体均值EX=,总体方差DX=2,求的最小方差线性无偏估计。解已知X1,X2,,Xn独立且与X同分布,2,,1,2,,iiEXDXin的线性估计是将X1,X2,,Xn的线性函数nnXaXaXa2211问题是如何选取的值,使得无偏性和最小方差这两个要求都能得到满足。naa,,1作为的估计量。15)()(1222211niinnaXaXaXaD无偏性要求niia11最小方差要求niia12这是一个求条件极值问题,用拉格朗日乘数法,令达到最小,2111(,,)(1)nnniiiigaaaa易知11221()()nnniiEaXaXaXa由条件111nniiiaana得到1/an于是11niiXXn是的最小方差无偏估计。12naaaa20,1,2,,iigaina得niai,2,12112321233123131115ˆˆ,,51023412131ˆ3412XXXXXXXXX12ˆˆ()()DD1ˆ2ˆ1ˆ2ˆ若和都是的无偏估计量,且成立,则通常称估计量较有效,或较佳,或较优.例设X1,X2,X3为总体的一个样本,试证下列估计量都是总体均值的无偏估计量,且问哪一个最佳?18三、一致估计设为总体参数的估计量,显然与样本X1,X2,,Xn有关,我们希望会随着样本容量n的增大而越接近于,这一要求便是衡量估计量好坏的另一标准。12ˆ(,,,)nXXXˆnˆˆn12ˆ(,,,)nnXXXˆlim{||}1nnPˆn则称为的一致性估计。定义3设为未知参数的估计量,若依概率收敛于,即对任意的0,成立20X例4试证样本均值为总体均值的一致性估计。niiXnEXE1)1()(证因为lim1nPX1)1(1lim11niniiinXnEXnP所以,对于相互独立且服从同一分布的随机变量X1,X2,,Xn,由大数定理,即得此外,还可证明样本方差S2是总体方差2的一致性估计.21例5证明正态总体N(,2)的样本方差S2是总体方差2的一致性估计量。证由切比雪夫不等式有2222221DSESSPSP而22242222)1()1(1)1(SnDnnSnDDS12)1(2)1(424nnn1lim22SPn)1(212422nSP22例6X~N(0,2),其中0为已知,X1,X2,,Xn为样本,记22*011()niiSXn证明为2的无偏估计,一致估计.2*S注意:不是样本的二阶中心矩.2*S本题即要证2222**(1),(2)lim{||}1nESPS24222**2,ESnDSnn2222**0211(1)()~()niinSSXnn42222**22(2){||}111()nDSPSn23例7总体X的概率密度X1,X2,X3为样本10()0xfx其它112321234ˆˆmax(,,),4min(,,)3XXXXXX12ˆˆ,证明为的无偏估计量,并比较它们的有效性.解:记Y=max(X1,X2,X3),Z=min(X1,X2,X3)33()[()](),(0)YXxFxFxx2422333(),()(1)YZxxfxfx230334xEYxdx2031(1)4xEZxdx12ˆˆEE为的无偏估计量12ˆˆ,33()1[1()]1(1),(0)ZXxFxFxx22141ˆ()315DDY229ˆ15D同样的方法可得:1ˆ2ˆ因此比更为有效422223022233()5333()5480xEYdxDYEYEY26设总体分布含有一未知参数,又x1,x2,,xn为来自于总体的样本,若对于给定(01),统计量1(x1,x2,,xn)和2(x1,x2,,xn)满足1121{(,,)(,,)}1nnPxxxx则称区间[1,2]为相应于置信度是1-的置信区间,简称置信区间。一、置信区间第三节置信区间1,2分别称为置信下限和置信上限.(1-)称为置信度。注意:区间[1,2]是随机区间。二、单侧置信限若对于给定的(01),统计量1(x1,x2,,xn)满足1)},,({11nxxP28则称区间[1,+)为相应于置信度是1-的单侧置信区间,1称为置信度是1-的单侧置信下限。类似,满足下式问题:如何确定总体参数的区间估计[1,2]呢?对于一般总体是难于确定的.现仅能确定正态总体N(,2)中参数,2的区间估计这对许多实际应用已经够了.21{(,,)}1nPxx的2为单侧置信上限。我们知道,正态随机变量是最为常见的,特别是很多产品的指标服从或近似服从正态分布。因此,我们主要研究正态总体参数的区间估计。先研究均值的区间估计,然后再研究方差的区间估计。这些在实际应用中是很重要的.第四节正态分布均值和方差的区间估计30211()~(,)nXXXNnn设总体X~N(,2),其中2已知,又X1,X2,,Xn为来自于总体的样本。一.均值EX的区间估计下面分两种情况进行讨论。1.方差DX已知,对EX进行区间估计由第七章第三节中的结论可知于是~(0,1)/XUNn3121)(}{2121zzUP12{||}1进而有PUz121/xPzn即11221Pxzxznn由标准正态分布可知,对于给定的,可以找到一个数z1-/2,使3220.97511.96zz当=0.05时,查标准正态分布表得临界值此时的置信区间是2211[,]nnxzxz即为的置信区间。称z1-/2为在置信度1-下的临界值,或称为标准正态分布的双侧分位点。区间[1.96,1.96]nnxx0.995122.58zz2.58,2.58xxnn当=0.01时,查标准正态分布表得临界值此时的置信区间是34作业•习题八5,6,8,935