第五章统计估计和假设检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

63第五章统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量(xxxn12,,,)来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?记A=“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有X=0与X=1两种情形,于是,可得事件A发生的概率为:P(A)=其中:是这批产品的次品率。若次品率=0.1,则P(A)=0914.×0.1=0.0229若次品率=0.4,则P(A)=0614.×0.4=0.0003现在事件A既然在一次观察中就发生了,直观地我们可以认为事件A发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。由于0.02290.0003,故应选择0.1作为产品的次品率比选择0.4更可靠些。把上例推广到一般的情形,我们就可以得到极大似然法的一般原理。设nxxx,,,21是取自密度函数为f(x,)的总体的一组样本。其中:x和都为参数,待估计。的极大似然估计的基本思路是,若记A=“一次观察中,所得一组样本的样本值为(nxxx,,,21)”。现在在一次观察中A发生了,即P(A)应尽可能地大,即应在所有可能取值的集合中选出一个使P(A)达到最大值的作为的估计值。此时的又称为的极大似然估计值。由于nxxx,,,21相互独立,且都与X具有相同的分布,由此可以得到,P(A)就相当于事件:XxXxXxnn1122,,,同时发生的概率,也就是P(A)=,记为L()=L(),于是有:L()=64L()称为的似然函数。求极大似然值的问题就是求似然函数L()的最大值问题,根据微分学的结果,L()取到最大值的必要条件是它对的导数为零。因为lnL()与L()取得极大值的点相同,为计算方便,我们通常就用对数似然方程来求解最大似然估计值。在我们上述例子中,f(1,)=,f(0,)=1-,于是得到似然函数:L()=141511,iixf令ddL=0,舍去ˆ=1,得的最大似然估计值151ˆ=0.067。实际上,151ˆ正是在15次抽样中得到一次次品的频率,用频率估计概率,当n充分大时无疑是合理的。例5-2。从一个正态总体中抽取容量为n的样本,求总体参数及2的极大似然估计。解:构造似然函数2221exp21inx2221ln2ln2lnixnnL为了求和,使ln的极大,令解上述方程得到:所以得到和的极大似然估计量为:,ˆx2221ˆniSxxn二、估计量好坏的评选标准前面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。那么,什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请看下面一个例子。例5-3。假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强度是多少。现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。由于随机原因,每次抽取样本的测量结果是不同的。如果样本容量为3,抽取4组样本,测得结果如表5-1所示。表5-1一组抽样样本的观察值样本值样本顺序x1x3均值1900999101197029951050110510653101094189094765495091011401000为了说明的方便起见,我们假定,实际上μ=1000公斤,当然这在事先是不知道的。我们要求利用样本信息来推断总体指标,并使其误差最小。第一组样本的中位数最接近总体指标,第二组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断总体指标更合理呢?评价点估计的结果通常有无偏性、有效性和一致性等标准。1.无偏性无偏性的含义是个别样本由于随机原因可能偏大或偏小,然而一个好的估计量从平均上看应该等于所估计的那个指标,其直观意义是估计量的值应在参数的真值周围摆动而无系统误差。一般地,无偏性的定义为:设为被估计参数,若有估计量(nxxx,,,21),对一切n,有ˆE=,则称ˆ为的无偏估计量。若ˆE-=b,则称b为估计量ˆ的偏差。若b≠0,则称ˆ为的有偏估计量。如果0nblin,则称ˆ为的渐近无偏估计量。不论是重复抽样或不重复抽样,也不论样本容量大小,样本均值及样本比例都是总体均值和总体比例的无偏估计,即PPEXEˆ,,但样本方差2nS并不是总体方差2的无偏估计量。这是因为如果我们把2nS定义为2nS=21xxni,则:212211xxEnxxnESEiniinniixnxxxEn12221222222221121nnnnnnnxnExnExEni产生偏差的原因是总体方差的无偏估计应该是nxi22,但抽样时由于μ是未知的,因而用估计量x来代替。根据最小平方原理,变量X距样本均值x的离差平方和为最小,因此2xxi就小于2ix,从而用x代替μ计算的方差就低估了2,为了得到2的无偏估计,令Snxxi2211这时,由于ES22,Snxxi2211就是2的无偏估计了。66样本方差与2nS之差称为偏差。但当n很大时20n,所以它是渐近无偏差估计。当样本容量很大时,也可以直接用样本方差作为总体方差的估计值。但如样本容量较小时偏差就比较大了。图5-1估计的无偏性和有效性2.有效性即使是符合无偏性要求的估计统计量,在抽取个别样本时也会产生误差。为了使误差尽量地小,要求估计量围绕其真值的变动愈小愈好,也就是说要求统计量的离散程度要小,或者说其方差要小。一般地,有效性的定义为:设、是未知参数的两个估计量,若对任意的正常数c,有,则称比有效。有效性反映了估计量分布的集中程度,估计量的分布越是集中在参数真值附近,则其估计效率越高,如图5-1所示。但是为了方便起见,在实际上有效性可定义为:、是未知参数的两个无偏估计量,若用V(),V()分别表示各自的方差,若V()/V()1,则称比有效。例如,对正态总体,利用样本均值x及样本中位数M来估计总体的均值时,均为无偏估计,那末哪一个更有效呢?均值的抽样分布为x~,Nn2,统计上可以证明中位数的分布为MNnc~,22,由于。这就说明比有效,即用样本均值x来估计总体的均值比用中位数来估计总体的均值效率高。换句话说,用中位数来估计总体均值的平均误差要比用样本均值来估计总体均值时的更大。如果用中位数作为估计量要达到与以样本均值作为估计量同样可靠的程度,就要增加样本。设用均值估计的样本为n1,中位数估计的样本为n2,设其估计效率相等,即方差相等,则21222nn,由此得到n2=1.57n1,即用中位数估计时要比用样本均值来估计时多抽57%的样本单位。3.一致性这就是要使统计量随样本容量n的增加,不断趋近于总体指标。在n→∞(有限总体n→N)时,估计值与总体参数完全一致。一般地,点估计的一致性定义如下:设(nxxx,,,21)为未知参数的估计量,若依概率收敛于,则为的一致估计量。现在来看样本均值这一统计量是否符合一致性的要求。根据切比雪夫等式:令当时67一致性是从极限意义上来说明统计量与总体参数关系的。这种性质只有当样本容量很大时才起作用。另外,符合一致性的统计量也不止一个,因此,仅考虑一致性是不够的。事实上,我们也可以证明,当总体为正态分布时,中位数这一统计量也符合一致性的要求。而样本的最小值和最大值尽管在个别的抽样中可能取得好的效果,但从总体上来看并不是一个好的估计量。第二节区间估计一、区间估计的概念和步骤点估计用一个确定的值去估计未知的参数,具有较大的风险。因为估计量来自于一个随机抽取的样本,结果也就带有随机性。样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。这种方法就是区间估计法。在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧x范围内的概率是0.683,落在总体均值2x范围内的概率是0.955,落在总体均值3x范围内的概率是0.997等等。由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到:1.如果所估计的区间越大,参数被包含在该区间内的概率就越大。2.如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。一般地,设为总体的一个未知参数,分别为由一组样本所确定的对的两个估计量,对于给定的10,若P()=1,则称区间[]为置信度是1的置信区间。分别为置信区间的下限和上限。1称为置信度或置信概率,表示区间估计的可靠度。称为置信度水平。常用的置信度有0.80,0.90,0.950.99等。一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为95%,则犯错误的概率就为1-95%=5%。这一概率也就是置信度水平,也可理解为风险率或风险水平。68图5-2根据不同样本所得到的置信度为95.5%的置信区间需要指出的是,P()=1不应理解为落在某一固定区间的概率。因为这里是一个参数,而不是随机变量,而是根据抽样的结果计算出来的,因此,[]是一个随机区间。即每一个样本都可产生一个估计区间[],因此,上述概率1可以理解为随机区间[]中包括参数的概率。图5-2表示根据不同样本所得到的置信度为95.5%的置信区间与总体均值的位置关系。从所有样本得到的置信区间中有95.5%的区间将包括总体均值,因此可以说所得到的估计区间包括总体均值具有95.5%的置信度。二、单个总体参数的区间估计(一)正态总体,方差已知,总体均值的区间估计根据第四章关于样本均值分布的结果,有xn~N(0,1)在给定了估计置信度为1时,我们有我们可以根据这一原理用样本均值来推断总体均值的区间估计值。若样本的均值为x,同时若规定置信度为1,则总体均值的区间

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功