省电大开放教育开放本科金融专业

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1省电大开放教育开放本科金融专业、会计专业选修课程-《工商管理统计》单元辅导(二)(4-5章)第四章推断未知的总体特征(一)内容提要本章主要介绍参数估计的基本方法,也就是如何根据样本所提供的信息来推断我们所关心的总体特征。对于一个总体,我们所关心的总体特征主要有总体均值、总体比例和总体方差2等,这些特征通常是不知道的,需要根据样本进行推断。本章内容主要涉及总体均值和总体比例的推断。要进行抽样推断,首先需要解决抽取样本的问题。从总体抽取样本的方法有概率抽样和非概率抽样两类。统计推断所依据的主要是概率抽样。抽样的概率抽样方法有简单随机抽样、分层抽样、系统抽样和整群抽样等。本章所介绍的推断方法主要依据简单随机抽样。根据简单随机抽样抽取样本的方法主要是根据随机数字表来进行。要根据样本进行推断,还必须知道样本统计量是如何分布的,比如样本均值的分布、样本比例的分布等。样本统计量的分布与原有总体的分布以及样本容量的大小有关。统计研究表明,如果原有总体是正态分布,那么,无论样本容量的大小,样本均值也服从正态分布,在重复抽样条件下,其分布的数学期望为xE,方差为n22。也就是说,作为随机变量的样本均值)/,(~2nNX。在不重复抽样条件下,对重复抽样分布的方差用系数nNN1进行修正即可。这时样本均值的抽样分布为:nNNnNX1,~2。对于无限总体进行不重复抽样时,或者对于有限总体,当N很大,而抽样比Nn/很小时,其修正系数nNNNX1~趋于1,这时样本均值的方差也可n22来计算。如果原有总体的分布不是正态分布,就要看样本容量的大小了,当n为大样本时30n根据统计分上的中心极限定理可知,当样本容量n增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。这时就可以按正态分布来进行推断。当n为小样本时,其分布则不是正态分布,这时就不能按正态分布进行推断。同样,对于样本比例pˆ的分布,我们也需要知道pˆ的数学期望和方差。统计证明,pˆ的数学期望等于总体的比例,即:)ˆ(pE,而pˆ的方差p2则与抽样方法有关,在重复抽样条件下,有:np)1(2,在不重复抽样条件下,则用修正系数加以修正,即:)1()1(2nNNnp。也就是说,在重复抽样条件下,样本比例的抽样分布为2))1(,(~nNP;在不重复抽样条件下,样本比例的抽样分布为:11,~NnNnNP。与样本均值分布的方差一样,对于无限总体进行不重复抽样时,可以按重复抽样来处理。此时样本比例的方差仍可按np)1(2来计算。对于有限总体,当N很大,而抽样比%5/Nn时,其修正系数nNN1趋于1,这时样本比例的方差也可以按np)1(2来计算。统计证明,对于来自正态总体的简单随机样本,比值221sn的抽样分布服从自由度为(n-1)的2分布,即)1(~12222nsn。总体方差的区间估计就是用2分布来建立的。在知道了样本统计量的分布后,我们就可以根据其分布来估计总体的参数了。用样本统计量估计总体参数的方法有点估计和区间估计两种。点估计就是用样本估计量ˆ直接作为总体参数的估计值。一个优良的估计量应满足无偏性、有效性和一致性三个标准。但由于点估计没有给出估计的可靠程度,实际中我们更多的使用区间估计,它是在点估计的基础上,给出总体参数估计的一个范围,并指出总体参数落在这一范围的概率是多少。总体参数所在的区间称为置信区间。总体均值的区间估计有以下集中情况:一是正态总体方差已知,或非正态总体方差未知但大样本。这种情况下,可以根据正态分布建立总体均值的置信区间。在重复抽样条件下,总体均值在1置信水平下的置信区间为:nzx2/;在不重复抽样条件下,总体均值的置信区间为:12/NnNnzx。如果总体方差未知,即使总体为非正态分布,只要在大样本条件下,则可以用样本方差2s代替总体方差2,这时总体均值在1置信水平下的置信区间可以写为:nszx2/。在不重复抽样条件下,总体均值的置信区间为:12/NnNnszx。二是正态总体方差2未知,且小样本。在这种情况下,则需要用样本方差2s代替2,这时,将样本均值标准化后的结果不再服从标准正态分布,而是自由度为n-1的t分布。在这种情况下,应采用t分布来建立总体均值的置信区间。根据t分布建立的总体均值在1置信水平下的置信区间为:nstx2/。对于总体比例的置信区间,当样本容量很大时,即当5ˆpn,就可以认为样本容量足够大,这时样本比例pˆ的抽样分布可以用正态分布近似。这时可以根据正态分布来建立总体比3例的置信区间。总体比例在1置信水平下的置信区间为:nppzp)1(ˆ2/。在不重复抽样条件下,总体比例在1置信水平下的置信区间为:1)1(ˆ2/NnNnppzp估计总体方差的置信区间则要用2分布。总体方差的置信区间为22/12222/2)1()1(snsn。开方后即得到总体标准差的置信区间。抽样估计中的另一个问题是如何确定一个适当的样本容量。增加样本容量可以提高估计的准确性,但样本容量的增加会受到许多限制。一个合适的样本容量与估计时所要求的估计误差(边际误差)有关。在一定的边际误差条件下,采用重复抽样估计总体均值时所需的样本容量为:2222/Ezn;采用不重复抽样估计总体的均值时所需的样本容量为:222/2222/)1(zENzNn。采用重复抽样估计总体比例时多需的样本容量为:nzE)1(2/;采用不重复抽样的估计总体比例时所需的样本容量为:222/)1(Ezn。(二)学习要求通过本章的学习,要求掌握以下内容:(1)理解抽样的含义,掌握抽取样本的具体方法;(2)理解抽样分布的含义,掌握样本均值和样本比例的抽样分布。(3)了解点估计的含义,掌握平价估计量的标准;(4)掌握样本容量的确定方法;(5)熟练掌握总体均值和总体比例的区间估计方法;(6)能应用本章所学方法对实际问题进行估计与分析。1、对抽样推断的理解抽样推断是从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。2、对抽样分布的理解,样本统计量的分布与总体分布的关系。所谓抽样分布,就是指样本统计量的分布。所有的样本均值形成的分布就是样本均值的抽样分布。样本均值x抽样分布的形状与原有总体的分布有关,如果原有总体是正态分布,那么,无论样本容量的大小,样本均值也服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n,即X~N(,2/n)。如果原有总体的分布不是正态分布,就要看样本容量的大小了,当n为大样本时(n≥30),根据统计上的中心极限定理可知,当样本容量n4增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n。3、简述评价估计量好坏的标准。(1)无偏性。无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为,所选择的估计量为,如果E()=,称为的无偏估计量。(2)有效性。一个无偏的估计量并不意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。假定有两个用于估计总体参数的无偏估计量,分别用1和2表示,它们的抽样分布的方差分别用D(1)和D(2)表示,如果1的方差小于2的方差,即D(1)D(2),我们就称1是比2更有效的一个估计量。在无偏估计的条件下,估计量方差越小估计也就越有效。(3)一致性。一致性是指随着样本容量的增大,点估计量的值越来越接近总体的参数。换言之,一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。4、简述样本容量与置信概率、总体方差、边际误差的关系。从样本容量的公式可以看出,样本容量与置信概率成正比,在其他条件不变的情况下,置信概率越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与边际误差的平方成反比,我们可以接受的边际误差越大,所需的样本容量就越小。4、Z2/n的含义是什么?Z2/n是估计总体均值时的边际误差(Marginerror),也称为估计误差。总体均值的置信区间就是由点估计值和描述估计量精度的边际误差两部分组成的。6、某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取不重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。(1)求该小区中赞成该项改革的户数比例的置信区间,置信水平为95﹪。(2)如果小区管理要求估计时的边际误差不超过10﹪,应抽取多少户进行调查?解答:(1)以知N=500,n=50,已知样本比例为:p=赞成的户数/n=32/50=64﹪样本比例的抽样标准为:p=1)1(NnNnpp=15005050050)64.01(64.0=6.45﹪由于np=50064﹪=325,所以可以用正态分布建立总体合格率的置信区间。置信率为95﹪5时,Z2/=1.96。边际误差为:E=Z2/1)1(NnNnpp=1.9615005050050)64.01(64.0=12.63﹪总体比例的置信区间为:pZ2/1)1(NnNnpp=64﹪12.63﹪即我们可以用95﹪的概念保证,该居民小区赞成改革的户数比例在51.37﹪~76.63﹪之间。(2)当要求边际误差不超过10﹪时,应抽取的样本容量为:n=)1()()1()1()(22/222/ZENZN=%)641(%64)96.1(%)10()1500(%)641(%64)96.1(500222=75.33≈76(户)7、某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95﹪的置信水平估计每个顾客购物金额的置信区间,要求边际误差不超过20元,应抽取多少个顾客作为样本?解答:已知=120,边际误差E=20,置信概率为95﹪时,Z2/=1.96。应抽取的样本容量为:n=2222/)(EZ=22220)120()96.1(=138.3≈1398、某大学共有在校本科生8000人,学校想要估计每个学生一个月的生活费支出金额,准备采取不重复抽样方法。根据前几届的毕业生资料,平均每个学生月生活费支出金额的标准差约为50元,若本次估计确定的置信概率为95﹪,要求边际误差不超过20元,应抽取多少名学生进行调查?解答:已知N=8000,=50,边际误差E=20,置信概率为95﹪时,Z2/=1.96。应抽取的样本容量为:n=222/2222/)()1()(ZENZN=22222)50()96.1()20()18000()50()96.1(8000=23.94≈24应抽24个学生作为样本。9、某种饮料采用自动饮料机进行灌装,其重量的方差对生产厂家来说时非常重要的。如果方差太大,过度灌装或灌装不足,都会使顾客不满意。一个可以接受的灌装方差为≤8(灌装重量以克计)。为对生产过程进行检测,厂家随机抽取了20个样品组成一个样本,测得样本方差为12。取显著性水平α=0.05,建立该灌装饮料重量方差的置信区间,并说明样本6是否表明方差太大,需要对灌装机进行停产检验?解答:总体方差2的置信区间为:2/12222/22)1()1(snsn根据显著性水平=0.05和自由度(n-1)=(20-1)=19,查2分布表得852.32)19()1(0025.022/2

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功