第六章参数估计参数估计:用样本统计量来估计总体的参数参数估计的两条途径:点估计:区间估计:用由样本数据所计算出来的单个数值对总体参数直接估计,例如利用样本平均数的值估计总体平均数参数。所谓的区间估计就是在一定的概率保证下指出总体参数的可能范围,这个可能的范围称为置信区间,相应的概率保证保证称为置信水平或置信度。如:某一研究发现猪仔出生重平均数的置信水平为95%的置信区间为(1.02kg,1.38kg)第一节点估计(PointEstimation)点估计就是用样本特征数来估计相应的总体特征数,如用样本平均数,中位数或众数来估计总体平均数估计同一个参数的样本统计量(常称为估计量——estimator)可能有好几个,如何决定哪个最好?一个好的估计量应满足三个条件:3.相容(consistent)1.无偏(unbiased)2.有效(efficient)无偏估计量(unbiasedestimator)如果一个统计量的理论平均数等于总体参数,这个统计量就被称为无偏估计量。1、是μ的无偏估计值。2、s2是σ2的无偏估计值。y有效估计量(efficientestimator)在样本含量相同的情况下,如果一个统计量的方差小于另一个统计量的方差,则前一个统计量是更有效的估计量。从一个整体总体中,抽取含量为n的样本,样本平均数的方差为当n充分大时,中位数m的方差为n22y2n22m相容估计量(consistentestimator)若统计量的取值,任意接近于参数值的概率随样本含量n的无限增加而趋于1,则该统计量称为参数的相容估计量。(样本越大,估计量越好)样本平均数是总体平均数的相容估计量。样本方差也是总体方差的相容估计量。第二节区间估计(IntervalEstimation)1.区间估计的基本方法定义:根据样本统计量,以一定的可靠程度推断总体参数所在的区间范围。1-α(置信区间)就是区间估计的可靠程度。一般求法:依据样本统计量的分布来求这里,我们主要讨论总体分布为正态的情形.若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间估计.例一已知原来成年对虾的平均体长µ0=10.0cm,标准差为σ=0.40cm。改善饲养方法后,随机抽取10个对虾,测得体长平均数为10.23cm。问改善饲养方法后对虾体长变化是否显著?显著性水平α=0.052.平均数µ的置信区间2.1σ已知时,µ的置信区间1)/y(22unuP1)/y/y(22nunuP所以µ的1-α的置信区间为)/y,/y(22nunu或写成nu/y2说明:(1)置信区间不唯一,在置信度固定的条件下,置信区间越短,估计精度越高.(2)在置信度固定的条件下,n越大,置信区间越短,估计精度越高.(3)在样本量n固定时,置信度越大,置信区间越长,估计精度越低.例2与北京“全聚德”烤鸭店订立的合同上要求鸭子尽量2.0公斤/只,按只付钱。养鸭户送来100只,平均1.88公斤/只,烤鸭店说太轻了。带回去又养了几天,平均2.12公斤/只。烤鸭店又说太肥了。鸭子合格的平均重量范围应该是多少?显著性水平为0.05样本含量不同,要求范围不同每次送4只鸭子,要求的重量范围是1.80~2.20kg/只每次送16只鸭子,要求的重量范围是1.90~2.10kg/只每次送100只鸭子,要求的重量范围是1.96~2.04kg/只每次送400只鸭子,要求的重量范围是1.98~2.02kg/只2.2σ未知时,µ的置信区间1)/y(22tnstP1)/y/y(22nstnstP所以µ的1-α的置信区间为)/y,/y(22nstnst或写成nst/y2ns-yt用的统计量是未知时,研究平均数所例3晚稻良种汕优63的千粒重µ0=27.5g。现育成一高产品种协优辐819,在9个小区种植,得其千粒重为:32.5,28.6,28.4,24.7,29.1,27.2,29.8,33.3,29.7(g)(1)(原来的问题)试问新育成品种的千粒重与汕优63有无显著差异?(2)求置信水平为95%的新育成品种千粒重的置信区间?5.27:;5.27:100AHH)解:(036.2/y,587.2,55.29y0nsts所以拒绝域为时,=-自由度为,306.2819,05.02t千粒重没有显著差异。即新品种与汕优所以,我们不否定63,0H0.051952=所以,-%=)置信水平(266.273587.2306.2255.29y2nst244.313587.2306.2255.29y2nst。,%的置信区间为(所以新品种千粒重244).31266.2795注意:(a)置信区间也可以用来进行假设检验。以上述例子为例,因为95%的置信区间是(27.266,31.244),它包含了零假设中待检验的27.5,所以我们没有理由拒绝H0:µ=27.5。(b)利用置信区间进行假设检验的基本方法:如果置信区间包含了H0中的数值,则不拒绝H0;如果置信区间不包含H0中的数值,则拒绝H0。(c)置信区间和假设检验的结论是一致的。3.方差σ2和标准差σ的置信区间分布。的它服从自由度为,所采用的统计量是研究22221)1(nsn1))1(22/2222/1snP(因此,-1))1)1(22/12222/2-((变形得到,snsnP。(,(的置信区间是所以,-22/1222/22)1)1snsn。(,(的置信区间是相应地,-22/122/)1s)1snn4.平均数差µ1-µ2的置信区间已知标准差i)1(时=未知,但标准差21i)2(时未知,但标准差21i)3(已知标准差i)1()1,0(~)(yy2221212121Nnnu样本统计量1))(yy(222212121212unnuP所以,1)yyyy(22212122121222121221nnunnuP+变形得到,)yyyy(122212122122212122121nnunnu+,置信区间为-的所以)11(2)1()1()yy(,)11(2)1()1()yy(12121222211221212122221122121nnnnsnsntnnnnsnsnt置信区间为-的-得到利用和上面类似的推导22121222211212121~)11(2)1()1()(yynntnnnnsnsn样本统计量时=未知,但标准差21i)2(自由度为n1+n2-2的t分布))yy(,)yy((22212/2122212/2121nsstnsstnnn时,上式可简化为=当22212122122212122121)yy(,)yy(1nsnstnsnst置信区间为-的-得到利用和上面类似的推导分布,其中的服从自由度为样本统计量)(yy2221212121tdfnsns时未知,但标准差21i)3(2221211212212,1)1(11nsnsnsknknkdf例4对两批黄连中小檗碱的含量进行比较,分别随机抽取出4个150g的样品,在同样条件下测定含量为:(1)(原来的问题)试检验这两批黄连小檗碱含量的总体方差是否有显著差异?样本1数据(Y1)样本2数据(Y2)8.908.918.968.858.988.828.968.90(2)试求两批黄连小檗碱含量差值µ1-µ2的95%的置信区间,并回答两批黄连小檗碱含量是否有显著差异?(提示:利用求得的置信区间进行假设检验)62,40018.0,87.8y,0012.0,95.8y2121222211nnnnnss自由度=且,求得解:首先根据样本数据013.040018.00012.0447.287.895.8yy22212/21nsst所以,147.040018.00012.0447.287.895.8yy22212/21nsst),%置信区间为(的-因此,147.0013.095210:,0:21210AHH设检验现利用置信区间进行假含量存在显著差异。认为两批黄连的小檗碱所以我们否定,中的不包含的置信区间(-因为,0)147.0,013.00021HH5.配对数据的置信区间的标准差。为的平均值,为分布,其中的它服从自由度为为研究配对数据的统计量ididdsddtnnsd1,/),2/2/21nstdnstdddd(的置信区间为配对数据所以,的置信区间和标准差比方差比212221.6分布。的-和-它服从自由度为,样本统计量比较两样本方差时使用Fnnss11//21222221211)1,1(//)1,1(212/22222121212/1nnFssnnFP因此,1)1,1(1)1,1(1212/122212221212/2221nnFssnnFssP即,1)1,1()1,1(1122/22212221212/2221nnFssnnFssP即,))1,1(,)1,1(1(1122/2221212/22212221nnFssnnFss的置信区间为-的所以))1,1(,)1,1((12122/1212/2121snnFsnnFss的置信区间为-的相应地,的置信区间?%的碱含量的方差比为例,求两批黄连小檗,以本节例例9545222144.15)3,3()1,1(025.0212/FnnF解:44.15)3,3()1,1(025.0122/FnnF0432.044.1510018.00012.0)1,1(1212/2221nnFss293.1044.150018.00012.0)1,1(122/2221nnFss)%的置信区间为(的所以,293.10,0432.0952221参数估计与假设检验的关系统计的置信区间不同:区间估计通常求的是以样本估计值为中心的双侧置信区间;而假设检验不仅有双侧检验也常常采用单侧检验,视检验的具体问题而定。统计的方法不同:区间估计立足于大概率,通常以较大的把握程度(置信度)去估计总体参数的置信区间;而假设检验立足于小概率,通常是给定很小的显著性水平去检验对总体参数的原假设是否成立。在假设检验中,人们更重视拒绝域。统计的基本原理相同:根据样本信息对总体参数进行推断;以抽样分布为理论依据;建立在概率的基础上的推断;推断结果具有一定的可信程度和风险。