《统计学教程》第6章抽样分布与参数估计2019年8月20日/下午10时26分第6章抽样分布与参数估计6.1抽样分布6.3单一总体参数的区间估计6.1.1总体、个体和样本6.3.1总体均值的区间估计6.1.2大数定律和中心极限定理6.3.2总体比例的区间估6.1.3三种分布6.3.3总体方差的区间估计6.1.4样本均值的抽样分布6.4两个总体参数的区间估计6.1.5样本比例的抽样分布6.4.1两个总体均值之差的6.1.6样本方差的抽样分布区间估计6.1.7两个总体样本统计量的抽样分布6.4.2两个总体比例之差的6.2参数估计的一般问题区间估计6.2.1估计量和估计值6.4.3两个总体方差比值的6.2.2点估计区间估计6.2.3点估计量的评价准则6.2.4区间估计第6章抽样分布与参数估计6.1抽样分布《统计学教程》卢小广2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布6.1.1总体、个体和样本总体(Population)是指所研究的事物及其现象的全体,由该事物及其现象的全部个体组成。个体(ItemUnit)是指构成总体的元素。总体容量(PopulationSize)是指构成总体的全部个体的数量。样本(Sample)是指从总体抽取的若干个体构成的集合。抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽取若干个体的过程。样本容量(Samplesize)是指构成样本的全部个体的数量。2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布6.1.1总体、个体和样本总体(Population)是指所研究的事物及其现象的全体,由该事物及其现象的全部个体组成。个体(ItemUnit)是指构成总体的元素。总体容量(PopulationSize)是指构成总体的全部个体的数量。样本(Sample)是指从总体抽取的若干个体构成的集合。抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽取若干个体的过程。样本容量(Samplesize)是指构成样本的全部个体的数量。★讨论题请用经济管理中的实例,解释上述的总体、个体和样本等概念。2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布6.1.2大数定律和中心极限定理1.大数定律在对客观事物及其现象进行观测和实验中,随着观测或实验的次数增多,事件发生的频率和均值逐渐地趋于某个常数。(1)贝努利定理(BernoulliTheorem)(6.1)贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的场合,可以用事件发生的频率来替代事件的概率。1limAAnPnnP2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布(2)车比雪夫定理(ChebyshevTheorem)设随机变量相互独立,且具有相同的有限的数学期望和方差,对于任意正整数有(6.2)称序列依概率收敛于总体均值。即当n充分大时,车比雪夫不等式几乎都是成立的;当n趋于无穷大时,n个随机变量的均值趋于总体均值。,,,,nXXX2111limlim1nkknnXnPxP2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布2.中心极限定理在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种随机变量往往近似地服从正态分布。中心极限定理(CentralLimitTheorem)反映了随机变量近似地服从正态分布的特征。中心极限定理是大样本推断的理论基础。独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,则(6.3)xtnkknnndtexnnXxF21221limlim2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布2.中心极限定理在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种随机变量往往近似地服从正态分布。中心极限定理(CentralLimitTheorem)反映了随机变量近似地服从正态分布的特征。中心极限定理是大样本推断的理论基础。独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,则(6.3)★讨论题大数定律和中心极限定理对于参数估计的意义。xtnkknnndtexnnXxF21221limlim2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布6.1.3三种分布1.总体分布总体分布(PopulationDistribution)是指由客观存在的,构成总体的个体所形成的频数分布,及其相关参数数值。例如,当研究某一企业职工收入情况时,该企业全体职工的收入状况的频数分布,以及反映该企业全体职工收入状况的均值、方差、偏态系数和峰度系数,从不同角度综合描述了这一总体的分布特征。我们往往是通过对构成总体的部分个体进行观察,即通过样本数据计算的统计量,例如样本均值、样本方差、样本偏态系数和样本峰度系数,以及样本的频数分布来推断总体参数,用样本分布来估计总体分布。2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布2.样本分布样本分布(SampleDistribution)是指由构成样本的个体所形成样本的频数分布,以及计算出来的相关统计量。样本中的个体都是来自于总体,具有总体的相关信息和基本特征,样本分布是总体分布的一个映象,一个缩影。当样本容量充分大时,样本分布趋近于总体分布。样本分布是指某一个具体的样本中的个体数量特征。由于样本是随机抽取的,每一次抽取的样本中的个体不尽相同,每一个具体的样本分布也会与对应的总体分布存在或大或小的偏误,根据样本计算的统计量是随机变量。(随机抽取的)样本的分布与客观的总体分布之间的误差,需要借助抽样分布概念。2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布3.抽样分布抽样分布(SamplingDistribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样本均值趋于正态分布。2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布3.抽样分布抽样分布(SamplingDistribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样本均值趋于正态分布。★讨论题为什么说抽样分布是抽样理论研究的对象,解释三种分布之间的联系。2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布6.1.4样本均值的抽样分布1.大样本场合下的样本均值抽样分布在反复抽取容量相同的独立同分布样本条件下,所得到的样本均值的概率分布称为样本均值的抽样分布。在样本容量充分大的情况下,即大样本场合,样本均值依据中心极限定理趋于正态分布。所谓独立同分布样本为从无限总体中随机抽取的等概样本,或从有限总体中以放回方式,随机抽取的等概样本。所谓大样本是指能够满足中心极限定理要求,使样本均值趋于正态分布的样本容量。在统计实践中一般称样本容量大于30即为大样本这只是一个粗略的经验数值。有离散变量样本均值的计算公式(6.4)nXxnii12019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布在样本容量充分大的场合下,样本均值渐进地趋于数学期望为总体均值,方差为总体方差的n分之一的正态分布,即样本均值的数学期望为总体均值,表明从平均的观点来看,用样本均值估计总体均值不存在偏差,即具有无偏性;样本均值的方差为总体方差的n分之一,表明只要总体方差是有限的,那么随着样本容量的增大,样本均值的方差相应减小,用样本均值估计总体均值的误差也相应减小。同时可以由总体方差和样本容量,精确地计算出这一样本均值的方差,并且用这一样本方差度量使用样本均值估计总体均值的误差。通过对样本均值的标准化处理,在用样本均值估计总体均值时,可以使用标准正态分布来计算抽样误差出现的概率。nNx2,~2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布例6.1在一次研究某一企业职工收入情况的调查中,准备从该企业随机抽取100个职工个人的收入状况数据构成样本,以此推断该企业职工平均月收入。要求若该企业职工平均月收入的总体均值为2000元,总体标准差为为250元,试计算样本均值不小于1950元的概率。解根据中心极限定理,在样本容量充分大时,样本均值渐进地趋于数学期望为总体均值,方差为总体方差的n分之一的正态分布,有本例的样本均值渐进地趋于数学期望为2000元,标准差为25的正态分布,即。代入正态分布概率计算公式,得即样本均值不小于1950元的概率为97.7%。(查表,教材324页)97725.02225200019502520001950ZPZPxPxP2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布2.小样本场合下的样本均值抽样分布在小样本场合,不满足中心极限定理对于样本容量充分大的要求,样本均值不趋于正态分布,而是趋于t分布。统计学家戈斯特(W.S.Gosset1876-1936)在1908年以Student的笔名发表的一篇论文中,首次提出了t分布,从而这一小样本分布理论被称为Student分布,简称为t分布。设为来自正态分布总体的样本,有(6.5)为T统计量,T统计量服从于自由度为n-1的t分布。nsxT2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布式(6.5)中的s2表示样本方差,有(6.6)式(6.6)存在着一个线性约束,T统计量服从自由度n-1为的t分布。t分布的形状也是一左右对称的钟形图形,比正态分布扁平,并且受到自由度数值大小的约束,自由度的数值越小,t分布越趋于扁平;自由度的数值越大,t分布扁平的程度越小,并且随着自由度的数值增大,t分布的形态逐渐趋于正态分布。t分布的应用条件是总体服从正态分布。在总体方差未知时,t分布是一种精确的估计方法,正态分布只是其近似的概率分布。1122nxxsnii2019年8月20日/下午10时26分《统计学教程》第6章抽样分布与参数估计6.1抽样分布例6.2假定某一企业职工收入情况服从正态分布中,从该企业随机抽取了16个职工个人的收入状况数据构成样本,拟以此推断该企业职工平均月收入。要求若该企业职工平均月收入的总体均值为2000元,样本标准差为为250元,试计算样本均值不小于1950元的近似概率。解由于样本容量小于30,为小样本,此时的样本均值服从于t分布。并且,已知样本容量为16,因此本例的样本均值服从于自由度为15的t分布。有即在样