第7章参数估计总体所服从的分布类型已知/未知估计总体中未知的参数参数估计抽样参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数.参数估计估计废品率估计新生儿的体重估计湖中鱼数§7.1点估计X1,X2,…,Xn现从该总体抽样,得到样本设有一个统计总体,总体的分布函数向量).为F(x,),其中为未知参数(可以是从样本出发构造适当的统计量1ˆˆ(,,)nXX作为参数的估计量,即点估计。1ˆˆ(,,)nxxnxx,,1将代入估计量,得到的估计值点估计矩估计极大似然估计关键问题:如何构造统计量?1ˆˆ(,,)nXX矩估计样本k阶原点矩11nkkiiAXn总体k阶原点矩kkEX矩估计基本思想:用样本矩估计总体矩.1lim(|()|)1nkikinXPEXn大数定律:K.皮尔逊设总体的分布函数中含有k个未知参数k,,1(1)它的前k阶原点矩都是这k个参数的函数,记为:(2)用样本i阶原点矩替换总体i阶原点矩(3)解方程组,得θi=hi(X1,X2,…,Xn)(i=1,2,…,k);则以hi(X1,X2,…,Xn)作为θi的估计量,并称hi(X1,X2,…,Xn)为θi的矩法估计量,而称hi(x1,x2,…,xn)为θi的矩法估计值。总体期望、方差的矩估计量分别是样本均值和样本二阶中心矩。例1.设总体X的数学期望和方差分别是μ,σ2,求μ,σ2的矩估计量。例2:已知某产品的不合格率为p,有简单随机样本X1,X2,…,Xn求p的矩估计量。解:E(X)=p.11ˆniipXXn例3:设电话总机在某段时间内接到呼唤的次数服从参数λ未知的泊松分布,现在收集了如下42个数据:接到呼唤次数012345出现的频数71012832求未知参数λ的矩估计。8040ˆ4221x例4.X~U(a,b),由简单随机样本X1,X2,…,Xn求a,b的矩估计量。解:E(X)=(a+b)/2,D(X)=(b-a)2/12.12222111ˆˆ()()()22111ˆˆ()()()1212niiEXababXXnnDXbabaMSn223(1)3(1)ˆˆnnaXSbXSnn,矩法的优点是简单易行,并不需要事先知道总体是什么分布.缺点是,当总体类型已知时,没有充分利用分布提供的信息.矩法特点分析:极大似然估计例:设一箱中装有若干个白色和黑色的球,已知两种球的数目之比为3:1或1:3,现有放回地任取3个球,有两个白球,问:白球所占的比例p是多少?如果只知道0p1,并且实测记录是X=k(0≤k≤n),又应如何估计p呢?若总体分布已知,对于样本值,选取适当的参数,使样本值出现的概率最大,这种估计方法就是极大似然估计法。极大似然估计法设总体X的分布律或概率密度为f(x;Ө),θ=(θ1,θ2,…,θk)是未知参数,X1,X2,…,Xn是总体X的样本,则称X1,X2,…,Xn的联合分布律或概率密度函数121(,,...,;)(;)nniiLxxxfx为样本的似然函数,简记为L(θ)。对于固定的样本观测值x1,x2,…,xn。如果有例1.设总体X~N(μ,σ2),其中μ,σ2是未知参数。求μ,σ2的极大似然估计。])(21exp[21),;(222xxf222122222111(,)exp[()]221(2)()exp[()]2niinnniiLxxniixnnL12222)(21ln2)2ln(2),(lnniiniinxnLnxL122222120)()(212ln0][1ln12211ˆ1ˆ()niiniixxnxxn22ˆ1ˆXnSn求极大似然估计量的步骤:(1)根据f(x;θ),写出似然函数niixfL1);()((2)对似然函数取对数niixfL1);(ln)(ln(3)写出方程0lnL若方程有解,求出L(θ)的最大值点),...,,(ˆ21nxxx例3.已知某产品的不合格率为p,有简单随机样本X1,X2,…,Xn,求p的极大似然估计量。若抽取100件产品,发现10件次品,试估计p.例2.设总体X服从参数λ0的泊松分布,求参数λ的极大似然估计量。例4.设X1,X2,…,Xn为取自总体X~U(a,b)的样本,求a,b的极大似然估计量.回顾:设X1,X2,…Xn是取自总体X的一个样本其它,010,)1()(~xxxfX求的矩估计量和极大似然估计量.其中0,101()()(1)2EXxfxdxxxdxX21XX112ˆ1解:(1)矩估计(2)极大似然估计)10()()1()(1iniinxxLniixnL1ln)1ln()(ln0)(lndLd令niixn1ln1niixn12ln1ˆ§7.2点估计量的评价标准评价一个估计量的好坏,不能仅仅依据一次试验的结果,而必须由多次试验结果来衡量.即确定估计量好坏必须在大量观察的基础上从统计的意义来评价。常用的几条标准是:1.无偏性2.有效性3.一致性一、无偏性)ˆ(E则称为的无偏估计.),,(ˆ1nXX设是未知参数的估计量,若ˆ则称较有效.1ˆ都是参数的无偏估计量,若有),,(ˆˆ122nXX设和),,(ˆˆ111nXX2ˆ12ˆˆ()()DD11ˆˆ,()min(())ˆˆnDD如果对固定的则称是的有效估计。二、有效性123123123111ˆ236111ˆ333112ˆ663XXXXXXXXX123例1:设X1,X2,X3是来自某总体X的样本,且E(X)=μ,讨论μ的以下估计量的无偏性和一致性。2,例2:设X1,X2,…,Xn是来自某总体X的样本,且,判断的矩估计量是否是无偏估计。2,DXEX三、一致性(相合性)是参数的估计量,若有设),,(ˆˆ1nnnXX则称是参数的一致估计量.nˆ21,,(),()nXXEXDXX设样本来自数学期望方差的总体,则是的一致估计量。切比雪夫大数定律伯努利大数定律1,,npXXXp设总体为参数为的0-1分布,为样本,则是的一致估计量。niinXnP11)|1(|lim§7.3置信区间定义:则称区间是θ的置信度为的置信区间.]ˆ,ˆ[21121ˆˆ和分别称为置信下限和置信上限.),,,,(ˆˆ2111nXXX),,,(ˆˆ2122nXXX)ˆˆ(21满足设θ是一个待估参数,给定,0若由样本X1,X2,…Xn确定的两个统计量1)ˆˆ(21P§7.41.期望的区间估计σ2已知时μ的置信区间σ2未知时μ的置信区间2.求方差的区间估计μ已知时σ2的置信区间μ未知时σ2的置信区间单正态总体四种类型的区间估计已知方差,求期望的区间估计例1:随机地从一批服从正态分布N(μ,0.022)的零件16个,分别测得其长度为:2.142.102.132.152.132.122.132.102.152.122.142.102.132.112.142.11估计该批零件的平均长度μ,并求μ的置信区间(α=0.05)求参数的置信度为的置信区间.设X1,…Xn是取自的样本,,2已知),(2N1)10(~/,利用NnX查正态分布表得,2u1}|{|2unXP使例1:随机地从一批服从正态分布N(μ,0.022)的零件16个,分别测得其长度为:2.142.102.132.152.132.122.132.102.152.122.142.102.132.112.142.11估计该批零件的平均长度μ,并求μ的置信区间(α=0.05)解:2.14...2.112.12516X代入得查表,16,02.0,96.1025.02nuu135.2,115.222nuXnuXμ的置信区间为(2.115,2.135).求置信区间的步骤(1)构造仅与待估参数θ有关,但分布已知的函数U;(2)给定置信度1-α,得常数a,b,使P{aUb}=1-α;(3)将aUb变形,使得:),...,,(ˆ),...,,(ˆ212211nnXXXXXX12ˆˆ(,)1.区间就是的一个置信度为的置信区间(4)结论方差未知,求期望的区间估计例2:随机地从一批服从正态分布N(μ,σ2)的零件16个,分别测得其长度为:2.142.102.132.152.132.122.132.102.152.122.142.102.132.112.142.11估计该批零件的平均长度μ,并求μ的置信区间(α=0.05)1}|{|2tnSXP使查t分布表得,2t求参数的置信度为的置信区间.设X1,…Xn是取自的样本,,2未知),(2N1例1:用一个仪表测量某物理量9次,得到样本均值为56.32,样本标准差为0.22.测量标准差σ反映了测量仪表的精度,试求σ的置信水平为0.95的置信区间。μ未知,求方差的区间估计例2:假设某地区18~25岁女青年身高现抽取30名,样本均值为158cm,样本方差为(5cm)2,求σ2的置信水平为95%的区间估计。2~(,)XN求参数的置信度为的置信区间.设X1,…Xn是取自的样本,),(2N121)}1()1()1({2222221nSnnP确定分位数)1(),1(22/22/1nn使例2:假设某地区18~25岁女青年身高现抽取30名,样本均值为158cm,样本方差为(5cm)2,求σ2的置信水平为95%的区间估计。例3:随机地从一批服从正态分布N(2.12,σ2)的零件16个,分别测得其长度为:2.142.102.132.152.132.122.132.102.152.122.142.102.132.112.142.11试求σ2的置信水平为0.95的置信区间。μ已知,求方差的区间估计求参数的置信度为的置信区间.设X1,…Xn是取自的样本,μ已知),(2N1222211222){()()}1niiXPnn(确定分位数221/2/2(),()nn使例4.对飞机的飞行速度进行15次独立试验,测得飞机的最大飞行速度(单位:m/s)如下:422.2418.7425.6420.3425.8423.1431.5428.2438.3434.0411.3417.2413.5441.3423.0假设飞机最大飞行速度服从求最大飞行速度的方差的置信度为0.90的置信区间。解:σ2的置信区间为(41.407010,142.549270).2(424.93,)N2220.0522120.952i15,424.93,10.900.1()(15)24.996,()(15)7.261,(X)=1035.013504nnn查表代入得双总体设总体X~N(μ1,σ12),总体Y~N(μ2,σ22),X1,X2,…,Xm来自X,Y1,Y2,…,Yn来自Y,且两样本相互独立。均值差μ1-μ2的区间估计方差比σ12/σ22的区间估计例1.设甲乙两地区女青年身高分别服从分布。甲地区抽取100名,样本均值为163cm;乙地区抽取100名,样本均值为160cm,求的置信水平为90%的置信区间。12(,16),(,9)NN12σ1,σ2已知时,μ1-μ2的置信区间即得μ1-μ2的置信区间