第五章抽样估计教学目的:通过对本章的学习,了解抽样估计的基本原理,掌握抽样估计的基本方法。教学设计:对主要的知识点进行讲解,通过在线学习平台的“教学辅导”与“参考资料”栏目获取相关知识,从而对重要的知识点有进一步的认识,在此基础上通过练习来加深对相关问题的理解,同时通过网上实时与非实时的答疑解决疑难问题。本章导学:登陆省电大网站教学辅导(三)IP课件第十讲参考资料中华人民共和国国家统计局中国人口信息网(1%人口抽样调查)重难点讲解:抽样误差的概念及计算;抽样估计的方法第五章抽样估计第一节抽样推断的一般问题第二节抽样误差第三节抽样估计的方法第四节抽样组织设计统计调查方法全面调查非全面调查普查抽样调查重点调查典型调查相关知识回顾:统计报表抽样调查:按照随机原则,从总体中抽取一部分样本单位,根据对样本单位的调查结果来推断总体的数量特征。一、抽样推断的意义1、概念:抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。第一节抽样推断的一般问题样本总体推断2、特点(1)由部分推算整体的一种方法;(2)抽样推断建立在随机抽样的基础上;(3)抽样推断是运用概率估计的方法;(4)抽样推断的误差可以计算并加以控制。样本(非唯一)总体(唯一)推断二、抽样推断的内容(一)参数估计用样本的观察资料来估计所研究现象总体的水平、结构、规模等数量特征,这种推断方法称为参数估计。(二)假设检验对总体的状况作出某种假设,然后根据样本所提供的信息来判断总体未知参数事先所作的假设是否成立的统计分析方法称为假设检验。三、抽样的几个基本概念1、总体也称全及总体,指所要认识的研究对象全体,由具有某种共同性质许多单位组成的集合体,一般用N表示。无限总体、有限总体2、样本又称子样,是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体,一般用n表示。总体样本3、随机抽样按随机原则从总体中抽取样本单位。4、非随机抽样根据市场调查者的主观分析判断来选取样本单位。包括偶遇抽样、主观抽样、定额抽样。5、参数根据总体各单位的标志值或标志特征计算的,反映总体数量特征的综合指标,称为全及指标,由总体各单位的标志值或标志特征所决定,全及指标的指标值是确定的,唯一的,称为参数。2和总体方差体均值,常用的总体参数有总对于总体中的数量标志XFXFNXXFFXXNXX222对于总体中的品质标志:由于不能用数量来表示,总体参数通常用成数P表示。成数:总体中具有某种性质的单位数在总体全部单位数中的比重,用P表示。总体中不具有某种性质的单位数在总体中所占的比重,用Q表示。有P+Q=1X:表示总体变量,有N个单位,所以可以表示为nXXX,,21道性质的单位数,可以知表示总体中不具有某种质的单位数,表示总体中具有某种性表示总体单位数,用01NNNNNN01PNN/1当某种标志,它的标志表现只有是非两种,可以用“1”表示标志表现为“是”的标志的标志表现,“0”表示标志表现为“非”的标志的标志表现,在此情况下:PNNNNNXP10101PQQPPQPQQPNNQNPNNPNPP2212021202210PQNN1/06、统计量根据样本各单位标志值或标志属性计算的综合指标称为统计量。样本统计量是用来估计总体参数的。反映样本的数量特征。fxfnxx222()()xxxxffnpxp2ppq参数总体统计量样本例题:某批产品共500件,合格品480件,不合格品20件,要求计算成数合格品率、、PXP%96500480P%96PX196.0%4%96PQP7、样本容量指一个样本所包含的单位数。8、样本个数又称样本可能数目,是指从一个总体中可能抽取的样本个数。9、重复抽样从总体N个单位中随机抽取样本容量为n的样本,每次从总体中抽取一个,连续进行n次实验构成抽样样本。每次抽出一个单位把结果登记下来又放回,重新参加下一次的抽选。共可抽取容量为n的样本个。nN10、不重复抽样从总体N个单位中随机抽取容量为n的样本,每次从总体中抽取一个,连续进行n次实验构成抽样样本。但每次抽选出的单位就不再放回参加下一次抽选。共可抽取容量为n的样本N(N-1)(N-2)….(N-n+1)个。结论:总体单位数一致,在相同样本容量的情况下,重复抽样的样本个数大于不重复抽样的样本个数。第二节抽样误差一、抽样误差的概念概念:指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。)()(抽样误差偶然性代表性误差系统偏误系统性代表性误差代表性误差登记性误差调查误差系统偏误与登记性误差可以防止或避免,抽样误差不可避免,只能加以控制。影响抽样误差大小的因素:(1)总体各单位标志值的差异程度;(2)样本单位数;(3)抽样方法;(4)抽样组织形式。二、抽样平均误差(抽样指标的标准差)反映抽样误差一般水平的指标。是所有可能出现的样本指标和总体指标的平均离差。1、抽样平均数的平均误差,也可称为抽样平均数的标准差(表明各样本均值与总体均值离差的一般水平)(1)重复抽样情况下)(计算公式nσxμ:样本单位数总体标准差n:例:设有三个数8、10、12,这一总体的均值、标准差分别为:10312108X1.6333210)(12210)(10210)(8N2xxσ用重复抽样的方法,从8、10、12三个数中抽两个数构成样本,求样本的平均值,用以代表三个数的一般水平,所有可能的样本以及样本的平均值列表如下:样本个数样本变量样本均值平均数离差离差平方123456789888108121010101210812121281210891010119121011-2-1001201-1410014011合计9001210990)(MxxE样本平均数的平均数抽样平均数的标准差:1.155x9122nxEx现在按重复抽样误差公式计算抽样平均误差1.1551.6332nx几个基本关系:a.样本平均数的平均数等于总体平均数;b.抽样平均误差实质上就是抽样平均数的标准差,也称为抽样标准误差;c.抽样平均数的标准差(抽样平均误差)比总体标准差小很多,仅为总体标准差的。d.可以通过调整样本单位数n来控制抽样平均误差。n1(2)在不重复抽样的情况下12NnNnx)1(2Nnnx样本个数样本变量样本均值平均数离差离差平方123456810812101210812812109101191011-101-101101101合计600410660)(MxxE样本平均数的平均数816.6420xnxEx按不重复抽样误差公式计算抽样平均误差816.0)1323(22633.112NnNnx)(差重复抽样的抽样平均误nNnNn12代替标准差经常是未知的,用样本在计算中,总体标准差sσ12nxxs)(2nxxs某工厂有1500个工人,用简单随机重复抽样的方法抽取50个工人作为样本,调查其工资水平,资料如下:月平均工资(元)524534540550560580600660工人数(人)469108643计算样本平均数和抽样平均误差。560(元)50366065344524fxfx=32.45(元)5034560)(52422)560660(2ffxx)4.59(5032.45元nx2、抽样成数的平均误差(表明各样本成数与总体成数绝对离差的一般水平)(1)在重复抽样下nP)P(1Pμ)(2nxP:总体成数n:样本单位数(2)在不重复抽样下1)-(Nnn)-P)(NP(1Pμ))Nn(1np)p(1p(在实际计算中,用样本成数p代替总体成数Pnnp1从2000件产品中抽查200件,其中合格品190件,要求:计算样本合格率及其抽样平均误差。解:在重复抽样下:95.0200/190p0.01542000.050.95np)p(1p在不重复抽样下:0.0146)Nn(1np)p(1pμ某电子产品使用寿命在3000小时以下为不合格品。现在用简单随机抽样方法从5000个产品中抽取100个对其使用寿命进行调查,结果如下表所示使用寿命(小时)产品数量(个)3000以下3000~40004000~50005000以上2305018合计100要求:(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差;(2)按重复抽样和不重复抽样计算该产品合格率的抽样平均误差。解:根据资料可算出使用寿命(小时)组中值产品数量(个)xf3000以下3000~40004000~50005000以上25003500450055002305018500010500022500099000合计100434000)(4340100434000小时样本均值fxfx)(03.7311001843405500243402500222小时=样本标准差ffxx%9810098p样本合格品率)(..小时样平均误差重复抽样下平均寿命抽17310003731nx)(37.725000100110003.731122小时抽样平均误差不重复抽样下平均寿命Nnnx014.01000196.010002.098.01nppp平均误差重复抽样下合格率抽样01386.098.01000196.05000100110002.098.011--样平均误差不重复抽样下合格率抽Nnnppp三、抽样极限误差指变动的抽样指标与确定的总体指标之间离差的可能范围,统计上称为抽样极限误差。设误差抽样平均数的抽样极限:x差抽样成数的抽样极限误:pXxxPpPpppPpxxxXx.,),()称为置信区间或(ppxxppxx四、抽样误差的概率度xtxΔppt抽样误差的概率度。就称为,,得到数值除以或者用除以用ttppxx)(xxtppt对某市居民进行生活水平调查,现随机抽取100户,结果户月均收入为482元,标准差为50元,要求该市居民户月均收入在472~492元的范围内,试求抽样极限误差和抽样概率度。10482,xxxxxXx解:根据2510510050xxxtn又第三节抽样估计的方法一、总体参数的点估计根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值,即直接以样本平均数、成数推断总体的平均数和成数。的估计量表示总体成数的估计量,表示总体平均数设PPXXˆˆPpXxˆˆ优良估计的标准:1、无偏性:以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身。))1(,(npppnx2、一致性:以抽样指标估计总体指标要求当样本容量增大时,抽样指标也充分地靠近总体指标。3、有效性:以抽样指标值估计总体指标要求作为优良估计量的方差应该比其他估计量的方差小。二、抽样估计的精度估计精度=1-误差率xXxx误差率=KPPPXxP21xΔ三