第七章抽样估计.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第七章抽样推断第一节抽样调查的基本概念第二节抽样误差第三节参数估计基本方法第四节抽样调查的组织形式及抽样估计抽样估计在统计方法中的地位统计方法描述统计推断统计抽样估计假设检验统计推断的过程样本总体样本统计量例如:样本均值、比例、方差抽样推断——是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。抽样推断的特点:它是由部分推断整体的一种认识方法抽样推断建立在随机取样的基础上抽样推断运用概率估计的方法。抽样推断的误差可以事先计算并加以控制参数估计参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。假设检验假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。抽样推断的内容第一节抽样调查的基本概念一、全及总体及样本二、总体参数和样本估计量三、样本可能数目全及总体及样本(概念要点)全及总体:统计研究的总体,又称为母体,简称总体。它分为变量总体和属性总体。样本(sample):又称样本总体或子样,就是从总体中随机抽取出来并用来代表总体的那部分单位所构成的新的小总体或集合体。对于一个具体的抽样问题,总体是唯一确定的,而样本则不是唯一的。总体参数与样本统计量在统计学中约定俗成,将用来描述总体的特征的综合指标称为总体参数;将用来描述样本特征的指标称为样本统计量。总体参数参数研究总体中的数量标志总体平均数总体方差X=∑XNX=∑XF∑FΣ(X-X)N2σ=2Σ(X-X)FΣF2σ=2研究总体中的品质标志总体成数成数方差σ2=P(1-P)P=N1N(只有两种表现)样本统计量研究数量标志样本平均数x=∑xnx=∑xf∑f样本标准差nxx2ffxxx2研究品质标志样本成数成数标准差np=nppp11.样本可能数目:又称样本个数,是指从一个有N个单位的总体中抽取容量为n的样本时,有可能出现的所有样本的个数,是一种理论概率分布。2.样本单位数:一个样本包含的单位数,又叫样本容量。用“n”表示。社会经济统计一般要求n≥30,为大样本。3.在总体单位数N和样本容量n一定的条件下,样本可能数目与抽样方法有关。而在同一抽样方法下,又由于对被抽中的几个单位考虑顺序与否,从而有不等的样本可能数目。样本可能数目与样本容量可能样本数目的计算公式考虑顺序不考虑顺序不重复抽样重复抽样!()!nNNANnnnNBN!!()!nNNCnNn(1)!!(1)!nnNNNnDDnN第二节抽样误差一、抽样误差的概念二、抽样平均误差三、抽样极限误差四、抽样误差的概率度一、抽样误差的概念抽样误差:是指由于随机抽样的偶然因素而引起抽样指标与总体指标之间的绝对离差。影响抽样误差大小的因素:1)总体各单位标志值的差异程度。2)样本的单位数。3)抽样方法。4)抽样调查的组织形式。不同的抽样组织形式就有不同的抽样误差。二、抽样平均误差所有可能的样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽样平均误差就是将所有的误差综合起来,再求其平均数。抽样平均误差:是反映抽样误差一般水平的指标。抽样平均误差通常用抽样平均数的标准差或抽样成数的标准差来作为衡量其抽样误差一般水平的尺度。按照标准差的一般意义,抽样平均数(或抽样成数)的标准差是按抽样平均数(或抽样成数)与其平均数的离差平方和计算的,但由于抽样平均数的平均数等于总体平均数,而抽样成数的平均数等于总体成数,抽样指标的标准差恰好反映了抽样指标和总体指标的平均离差程度。设以表示抽样平均数的平均误差,表示抽样成数的平均误差,M表示全部可能的样本数目,则:抽样平均误差(理论公式)2()xxXM2()ppPMxp注:以上公式中的关键是无法得到总体平均数和总体成数的数据,所以按上述公式来计算抽样平均误差实际上是不可能的。抽样平均数的平均误差(实用公式)1、在重复抽样的条件下,抽样平均数的平均误差与总体的变异程度以及样本容量大小两个因素有关:2、在不重复抽样的条件下,抽样平均数的平均误差不但和总体变异程度、样本容量有关,而且还与总体单位数有关:其中,为修正因子。2xnn2()1xNnnN()1NnN标准误(StandardError)•简单随机抽样、重复抽样时,样本均值抽样分布的标准差等于,这个指标在统计上称为抽样平均误差,又叫标准误。•统计软件在对变量进行描述统计时一般会输出标准误这一结果。n抽样成数的平均误差:表明各样本成数和总体成数绝对离差的一般水平。1、在重复抽样的条件下:抽样成数的平均误差(实用公式)(1)pppnn(1)()1pppNnnNn2、在不重复抽样的条件下:①样本平均数的平均数等于总体平均数。②抽样平均数的标准差仅为总体标准差的③可通过调整样本单位数来控制抽样平均误差。抽样平均误差所反映的内容1n1n1n例题:假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?解:抽样单位数增加2倍,即为原来的3倍则:抽样单位数增加0.5倍,即为原来的1.5倍则:xxxn577.0313xxxn8165.05.115.1即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。三、抽样极限误差抽样极限误差是指样本指标与总体指标的最大可能误差范围。由于总体指标是一个确定的数,而样本指标则是围绕总体指标上下波动的,样本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的最大可能范围。设Δx、Δp分别表示抽样平均数极限误差和抽样成数极限误差。则有:xxppxXxpPp区间称为平均数的估计区间或称平均数的置信区间。区间称为成数的估计区间或称成数的置信区间。(,)xxxx(,)pppppxPpXx////四、抽样极限误差的概率度基于概率估计的要求,抽样极限误差通常需要以抽样平均误差或为标准单位来衡量。把极限误差或分别除以或所得的相对数t,表示误差范围为抽样平均误差的t倍。t是测量估计可靠程度P(概率)的一个参数,同概率存在一一对应的函数关系,称为抽样误差的概率度。概率P=F(t)=1-α,在抽样估计中是已知的。xpxpxpxxtppt第三节参数估计的方法一、总体参数的点估计二、总体参数的区间估计总体参数的点估计点估计(概念要点)•从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计点估计也叫定值估计:p=P点估计没有给出估计值接近总体未知参数程度的信息点估计的关键是确定优良的估计量,它有三个标准。Xx•1.用于估计总体某一参数的随机变量–如样本均值,样本比例、样本中位数等–例如:样本均值就是总体均值的一个估计量–如果样本均值x=3,则3就是的估计值•理论基础是抽样分布估计量(概念要点)估计量的优良性准则(无偏性)•无偏性:估计量的数学期望等于被估计的总体•参数P(X)XCA无偏有偏估计量的优良性准则(有效性)AB中位数的抽样分布均值的抽样分布XP(X)有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量估计量的优良性准则(一致性)•一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P(X)X总体参数的区间估计总体参数的区间估计(抽样误差范围的概率保证度)在确定允许的抽样误差范围后,从主观愿望说,希望抽样调查的结果,样本指标的估计值都能够落在允许的误差范围内,但这并非都能实现的事情。由于抽样指标值随着样本的变动而变动,它本身是个随机变量,因而抽样指标和总体指标的误差仍然是个随机变量,不能保证误差不超过一定范围的这件事是必然的,而只能给以一定程度的概率保证。抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。落在总体均值某一区间内的样本X95.45%的样本99.73%的样本x-368.27%的样本x-2x-X+3X+2X+x总体参数的区间估计(概念)总体参数区间的基本特点:是根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围。换句话说,对于总体的被估计指标X,找出样本的两个估计量x1和x2,使被估计的总体指标X落在区间(x1,x2)内的概率1-α,(0α1),为已知的。即P(x1≤X≤x2)=1一α是给定的。我们称区间(x1,x2)为总体指标X的置信区间,其估计置信度为1一α,称α为显著性水平,x1是置信下限,x2是置信上限。已知抽样误差范围,求概率保证度计算步骤是:首先抽取样本,计算抽样指标(如计算抽样平均数或抽样成数),作为相应总体指标的估计值,并计算样本标准差以推算抽样平均误差。其次,根据给定的抽样极限误差范围,估计总体指标的下限和上限。最后,将抽样极限误差除以抽样平均误差求出概率度t值,再根据t值查《正态分布概率表》求出相应的置信度F(t),并对总体参数作区间估计。[例1]对某型号的电子元件进行耐用性能检查,抽查的资料分组列表如下,要求耐用时数的允许误差范围Δx=10.5小时,试估计该批电子元件的平均耐用时数。已知抽样误差范围,求概率保证度(应用)耐用时数组中值元件数900以下900-950950-10001000-10501050-11001100-11501150-12001200以上875925975102510751125117512251263543931合计1001、计算抽样平均数和标准差2、根据给定的Δχ=10.5小时,计算总体平均数的上下限,下限=上限=3、根据t=,查概率表得置信度F(t)=0.9545•我们可以作如下估计,即可以概率95.45%的保证程度,估计该批电子元件的耐用时数在1045-1066小时之间。1055.5xfxf2()51.91xxfSf51.915.191100xn1055.510.51045xx1055.510.51066xx10.525.191xxx已知给定的置信度要求,推算极限误差的可能范围计算步骤是:首先抽取样本,计算抽样指标,作为相应总体指标的估计值,并计算样本标准差以推算抽样平均误差。其次,根据给定的置信度F(t)要求,查表求得概率度t值。最后,根据概率度t和抽样平均误差来推算抽样极限误差的可能范围,再根据抽样极差求出被估计总体措标的上下限,对总体参数作区间估计。例:某纱厂某时期内生产了10万个单位的纱,按纯随机抽样方式抽取2000个单位检验,检验结果合格率为95%,废品率为5%,试以95%的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?已知:100000N2000n%95p%51p95.0tF96.1tNnnppp11%48.010000020001200005.095.0%94.0%48.096.1ppt区间下限:%06.940094.095.0pp区间上限:%94.950094.095.0pp例3•某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质率为85%,试计算当把握程度为90%时优质品率的区间范围。n=200,P=0.85,/.z21645()().PppPPnn1100252/.%ppz2415总体优质品率p的置信度为90%的置信区间为%.%%.%.%.%即pp854158541580858915若这批产品共有2000只,则可进一步推算出这批产品中优质品总数Np的置信区间为

1 / 43
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功