第五章 抽样与参数估计 国贸

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第五章抽样与参数估计重点:抽样推断的概念、抽样误差、抽样平均误差、参数估计的基本方法、样本容量的确定2第一节抽样推断的一般问题抽样推断的意义抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计方法。抽样推断具有以下特点:抽样推断是由部分推算整体的一种认识方法。抽样推断是建立在随机取样的基础上。抽样推断是运用概率估计的方法。抽样推断的误差可以事先计算并加以控制。3抽样推断的内容推断的前提是我们对总体的数量特征不了解或了解很少,但是利用抽样推断的方法去解决这类问题,可以有两种途径,因此,抽样推断的内容就有两个方面,即参数估计和假设检验。这两方面的内容虽然都是利用样本观察值所提供的信息,对总体做出估计或判断,但它们所解决问题的着重点是不同的。4一、参数估计。由于我们不知道总体数量特征,可以这样考虑即依据所获得的样本观察资料,对所研究对象总体的水平、结构、规模等数量特征进行估计,这种推断方法称为总体参数估计。二、假设检验。由于我们对总体的变化情况不了解,不妨先对总体的状况作某种假设,然后在根据抽样推断的原理,根据样本观察对所作假设进行检验,来判断这种假设的真伪,以决定我们行动的取舍,这种推断方法称为总体参数的假设检验。5有关抽样的基本概念一、总体和样本。总体也称全及总体,指所要认识研究对象的全体。它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。总体的单位数通常是很大的,甚至是无限的,一般用N表示总体的单位数。样本又称子样,它是从全及总体中随机抽取出来的们作为代表这一总体的哪部分单位组成的集合体,样本的单位数是有限的,相对值或标志属性决定的。一个全及指标的指标数值是确定的、唯一的,所以称为参数。6二、总体参数何样本统计量。对于总体中的数量标志,常用的总体参数有总体平均数和总体方差,用和表示。总体参数样本统计量平均数成数方差标准差)1(2PPpXNNP1PQ1NXXFXFXnxxfxfxnnp1pq1122nxxs)1(ppsp12nxxsFFXX2)(27三、样本容量和样本个数样本容量是指一个样本包含的单位数。样本个数又称样本可能数目,是指从一个总体中可能抽取多少样本。和样本容量以及抽样方法有关。8四、重复抽样和不重复抽样重复抽样也称置回抽样,它是指每次抽取一个样本登记后在放回总体中参加下一次抽取。也就是说每一个样本单位都有被重复抽取的可能。从总体N个单位中,用重复抽样的方法,随机n个单位构成一个样本则共可抽取个样本。nnNNA9例如:总体有A、B、C、D四个单位,要从中以重复抽样的方法抽取两个单位构成样本,先从四个单位中取1个,有四种取法,结果登记后再放回,然后再从四个单位中取1个,也有四种取法,前后取两个构成样本,全部可能抽取的样本数目为4×4=16个。10不重复抽样也称置回抽样,它是指每次抽取一个样本登记后不放回总体中参加下一次抽取。也就是说每一个样本单位只有一次被抽取的可能。从总体N个单位中,用不重复抽样的方法,随机n个单位构成一个样本则共可抽取N(N-1)(N-2)…(N-n+1)个样本。11不重复抽样P93考虑顺序的不重复抽样不考虑顺序的不重复抽样nNPnNC12例如:总体有A、B、C、D四个单位,要从中以不重复抽样的方法抽取两个单位构成样本,先从四个单位中取1个,有四种取法,然后再从三个单位中取1个,有3种取法,前后取两个构成样本,全部可能抽取的样本为4×3=12个。13第二节抽样误差(1)抽样误差①概念是指在遵守随机原则的条件下,用抽样总体指标估计或推断全及总体指标所不可避免的误差。②具体内容③特点a.是抽样调查所固有的,不可避免b.它是个随机变量c.它是实际误差(理论误差),无法计算PXpx14(2)抽样平均误差(可以计算)①概念简称平均误差,是指所有可能组成的样本的抽样平均数或抽样成数与总体平均数或总体成数的平均误差。注意:抽样误差的平均数不是算术平均,而是标准差式的平均。②意义抽样平均误差越大,则表示样本的代表性低抽样平均误差越小,则表示样本的代表性高③计算15抽样平均误差分反映抽样误差一般水平的指标。抽样平均误差是抽样平均数或抽样成数的标准差。抽样平均数(或成数)的标准差是按抽样平均数(或成数)与其全及总体平均数(或成数)离差平方和计算的。但由于抽样平均数的平均数等于总体平均数,而抽样成数的平均数等于总体成数,抽样指标的标准差恰好反映了抽样指标和总体指标的平均离差程度。16①样本平均数的数学期望值即样本平均数的平均数a.定义式17b.推导式②样本平均数的方差()或标准差()2xx18样本平均数的标准差即为平均数的抽样平均误差(抽样标准误差)。所以,平均数抽样平均误差的计算为:19影响抽样误差大小的因素主要有:1、总体各单位标志值的差异程度。抽样误差的大小和总体标准差的大小成正比例关系。2、样本单位数。抽取样本单位数越多,抽样误差越小;抽取样本单位数越少,抽样误差越大。抽样误差的大小和样本单位数的平方根成反比例关系。3、抽样方法。不重复抽样误差比重复抽样误差小。4、抽样调查的组织形式。选曲不同的抽样组织形式,也会有不同的抽样误差。20简单随机抽样下的抽样平均误差的计算一、抽样平均数的抽样误差(1)重复抽样条件下,抽样平均误差和总体的变异程度以及样本容量大小两个因素有关,它们的具体关系如下:从这一公式可以看出,抽样平均误差的大小和总体标准差成正比变化。nx21(二)在不重复抽样的条件下,抽样平均数的平均误差不但和总体变异程度、样本容量有关,而且还要考虑总体单位数的多少。它们的关系如下:NnnNnNnxx112222总体方差是未知的,解决方法1.用估计的材料2.用过去的差所得到的材料。如果有几个不同的总体方差的材料,则应该用数值较大的。3.用样本方差材料代替总体方差4.如果既没有过去的材料,又需要在调查之前就估计出抽样误差,可以在大规模调查之前,组织一次小规模的试验性调查23二、抽样成数的平均误差。抽样成数的平均误差表明各样本成数和总体成数绝对离差的一般水平。由于总体成数可以表现为总体是非标志的(0,1)分布的平均数,而且它的方差也可以从总体成数推算出来,即:P与P(1-P)。因此容易从抽样平均数的抽样平均误差和总体标准差的关系推算出来。24(一)在重复抽样条件下:nPPp125(二)在不重复抽样条件下:NnnPPNnNnPPpp111126以上计算过程中如无总体方差时,可用样本方差代替。总体成数一般是不知道的,用过去资料代替,选用最大的方差。成数方差的最大值是0.5(1-0.5)=0.25,当两类总体各占一半时,它的变动程度最大。因此选用最大值,也就是选用最接近0.25的方差值。27例已知总体方差为1000元,总体单位数为4个,样本单位数为2个,用不重复抽样的方法计算抽样平均误差。元26.1814242100012NnNnx28例:要估计某地区10000名儿童的入学率,随机抽取400名,检查有320名儿童入学,求抽样入学率的平均误差。根据已知条件:1、在重复抽样条件下:%80400320P%24008.018.01nPPp292、在不重复抽样条件下:%96.1110000400100004008.010811NnNnPPp30三、抽样极限误差抽样极限误差(抽样允许误差)是从另一个角度考虑抽样误差问题。以样本的抽样指标来估计总体指标,要达到完全准确毫无误差,这几乎是不可能的,所以,在估计总体指标的同时就必须考虑估计误差的大小。我们不希望误差太大,误差愈大样本的价值愈小。但也不是误差愈小愈好,因为在一定限度之后减少抽样误差势必增加很多费用。所以,在作抽样估计时,应该根据所研究的变异程度和分析任务的要求确定可允许误差的范围,在这个范围内的数字都算是有效的。31概念允许误差:指样本和总体指标之间误差的可能范围。由于总体指标是一个确定的数(未知的常数),而样本指标(随机变量)则是围绕总体指标上下波动的,它与总体指标之间既有正离差,也有负离差,样本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围,我们将这种以绝对值形式表示的抽样误差的可能范围称为抽样极限误差。32用表示抽样平均数极限误差和抽样成数极限误差。xppPpxXx33根据数理统计证明:pptxxt34概率度t与置信度F(t)置信度:是指总体指标落在某一区间内的概率保证程度,常用概率函数F(t)表示。概率度:用抽样极限误差除以相应抽样平均误差得出的相对数称为概率度,它表示抽样极限误差的范围为抽样平均误差的若干倍。xxtppt35t(概率度)置信度(概率)抽样误差范围0.50.38290.51.00.68271.01.50.86641.51.960.95001.962.000.95452.003.000.99733.0036第三节参数估计一、参数估计需要解决的问题参数估计就是以所计算的样本指标来估计相应的总体指标,需要解决下面三个问题:1.针对待估的总体指标,根据样本构造一个合适的统计量,作为该总体指标的估计量。2.对所构造的估计量的优良性作出判断,并在必要时进行修正。(无偏性、一致性、有效性)3.在给定的可靠程度下,求出抽样估计的极限误差。37二、参数估计的形式1.点估计(定值估计)对于总体的未知参数,由样本构造统计量对其作出估计,则称为的估计量。即不考虑抽样误差,直接从样本指标来推断全及总体指标。在多个估计量中,由于估计量是水机变量,选择一个优良性估计量,需要明确优良性估计量的标准:无偏性、有效性、一致性。ˆˆ382.区间估计(1)总体平均数的区间估计由得xXxxxxXxxxt39如果估计区间越大,则可靠程度(概率保证程度)越大;估计区间越小,则可靠程度越小。而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t决定的。因而可靠程度与t之间有一定正比关系。40(2)总体成数的区间估计由pppPppPpppt41例:某灯泡厂某月生产5000000个灯泡,在进行质量检查中,随机抽取500个进行检验,这500个灯泡的耐用时间见下表:试求:⑴该厂全部灯泡平均耐用时间的取值范围(概率保证程度0.9973)⑵检查500个灯泡中不合格产品占0.4%,试在0.6827概率保证下,估计全部产品中不合格率的取值范围。(3)如果耐用时间在1000小时以上为优等品,估计优等品率在95.45%的概率保证下的范围42耐用时间(小时)灯泡数f组中值xxf800~85035850~900127900~950185950~10001031000~1050421050~11008合计43由概率保证程度0.9973,查表得概率度t=34.926fxfx47.25002.55nx9194.74.926xx2.554.747.23xxt8.9334.74.926xx44p=0.4%概率保证程度为0.6827时,t=1%28.0500996.0004.01nppp%28.01pp%12.0%28.0%4.0pp%68.0%28.0%4.0pp45优等品率P=50/500=0.1总体总量指标的推算即用样本指标或总体指标(总体平均数和总体成数)的区间估计值乘以总体单位数来推算总体总量指标NxNxx

1 / 56
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功