项目九统计抽样技术项目九统计抽样技术能力目标(1)具有在实际工作中正确运用抽样方法进行样本选取的能力;(2)能够根据研究目的进行抽样框的设计;(3)具有在实际工作中正确运用参数估计的方法进行抽样推断的能力;(4)具有应用Excel工具进行样本抽样、样本分析的能力。知识目标(1)抽样推断的基本概念;(2)抽样方法的选择;(3)抽样误差的含义;(4)抽样估计的含义;(5)抽样估计的方法及适用条件。项目概述表9-1样本的耐用时间h编号耐用时间编号耐用时间编号耐用时间编号耐用时间编号耐用时间143100003509200795850011889000161584001461000037681008459700124392001629970016890005279800865830012658900164889002199300633950092593001308950018109300264850066184009748200141097001854970027390006718600984960015019000195183002778900705910010389000154885001974970031889007598800110188001584890019909000项目分析产品的质量检测不可能对所有产品进行一一检查,只能从总体中抽取部分检验。通常采用从总体中随机抽取部分样本作为检查对象,通过样本的特征来反映总体特征。作为这家计算机经销商需要解决如何选择样本,即从2000件产品中如何选择40件样本,并对样本进行分析。本项目可以通过以下任务来完成:工作任务一统计抽样的意义工作任务二抽样误差工作任务三抽样估计的方法工作任务四抽样方案的设计工作任务一统计抽样的意义一、统计抽样的概念与特点统计抽样是抽样调查和抽样推断的总称,它是按照随机原则从总体中抽取部分单位进行调查,利用这部分单位的调查资料推算总体数量特征的一种统计分析方法。工作任务一统计抽样的意义一、统计抽样的概念与特点统计抽样具有以下几个特点:(一)按照随机原则抽取样本单位(二)根据部分推断总体(三)运用了概率估计的方法(四)抽样误差可以事先计算并加以控制工作任务一统计抽样的意义二、统计抽样的作用21能够解决全面调查无法或难以解决的问题可以补充和订正全面调查的结果43可以在短期内取得时效性强的资料可以应用于生产过程中产品质量的检查和控制工作任务一统计抽样的意义三、统计抽样中的基本概念(一)全及总体和样本总体全及总体简称总体,是指根据研究的目的所确定的研究事物的全体,也就是抽样调查所确定的调查对象,又叫母体,如前例中的30000户职工家庭就是全及总体。全及总体单位数一般用表示。样本总体简称样本,它是从全及总体中随机抽取出来的那部分单位组成的集合体,又叫子体。如前例,抽出的300户职工家庭就构成一个样本总体。样本总体的单位数一般用表示。工作任务一统计抽样的意义三、统计抽样中的基本概念(二)全及指标和样本指标根据全及总体计算的反映总体数量特征的指标称为全及指标,又叫参数。常用的总体参数有总体平均数和总体标准差(或总体方差)。公式分别为:XXNXFXF或22()()XXNXXFF或工作任务一统计抽样的意义三、统计抽样中的基本概念(三)样本容量和样本个数样本容量是指一个样本总体所包含的单位数,即。样本单位数的确定,必须结合调查任务的要求以及总体各单位标志值的差异情况来综合考虑。通常将样本单位数不少于30个(≥30)的样本称为大样本,样本单位数不及30个(30)的样本称为小样本。社会经济统计中的抽样调查多属于大样本调查,因此,后面的有关计算和分析都是建立大样本理论基础之上的。工作任务一统计抽样的意义三、统计抽样中的基本概念(三)样本容量和样本个数样本个数又称样本可能数目,是指从一个总体中可能抽取的样本总体的个数。从一个总体中可能抽取多少个样本,和样本容量以及抽样方法等因素有很大关系。从一个总体抽取多少个样本,则样本指标就有多少个取值,因而就形成了样本指标的分布。工作任务一统计抽样的意义三、统计抽样中的基本概念(四)重复抽样和不重复抽样重复抽样又称回置抽样,它是从总体中抽出一个单位后,把结果登记下来,再放回总体中参加下一次抽选。重复抽样每次都是从全部总体单位中抽选,每个单位被抽中的机会在各次中是完全相同的,且有多次被抽中的可能。工作任务一统计抽样的意义【例9-1】总体有A、B、C3个单位,要从中随机重复抽取2个单位构成一个样本,先从3个单位中抽取1个,共有3种抽法,结果登记后再放回;然后再从相同的3个中抽1个,也有3种抽法。前后取两个单位构成一个样本,全部可能抽取的样本个数为3×3=9,具体的样本是AA、AB、AC、BA、BB、BC、CA、CB、CC。不重复抽样又叫不回置抽样,它是指从总体中抽出一个单位之后不再放回去参加下一次抽选。在不重复抽样过程中,总体单位数依次减少,因而每个单位被抽中的可能性越来越大,但被抽中的机会只有一次。工作任务一统计抽样的意义【例9-2】从总体A、B、C3个单位中用不重复抽样方法抽取2个单位构成样本。先从3个单位中抽1个,共有3种抽法;第二次从留下的2个单位中抽1个,共有2种抽法。前后两个单位构成一个样本。全部可能抽取的样本个数为3×2=6个,具体样本是AB、AC、BA、BC、CA、CB。根据概率论,在相同样本容量的要求下,同一个总体的重复抽样的样本个数总是大于不重复抽样的样本个数。工作任务二抽样误差一、抽样误差的意义误差是客观现象的统计资料与客观现象真值之间的差别。抽样误差是指在遵循随机原则的前提下,抽取的样本指标与总体真值指标之间的差别或离差。如抽样平均数与总体平均数之间的离差,抽样成数与总体成数之间的离差等。工作任务二抽样误差一、抽样误差的意义影响抽样误差大小的因素有以下几种。(一)总体各单位标志值的差异程度(二)样本单位数的多少(三)抽样方法(四)抽样调查的组织形式工作任务二抽样误差二、抽样平均误差以表示抽样平均数的抽样平均误差,表示抽样成数的抽样平均误差,M表示全部可能的样本个数,则:xp2()xxXM2()ppPM工作任务二抽样误差二、抽样平均误差(一)抽样平均数的抽样平均误差(1)在重复抽样的条件下,计算公式为:(2)在不重复抽样的条件下,计算公式为:工作任务二抽样误差二、抽样平均误差(一)抽样平均数的抽样平均误差不重复抽样与重复抽样两个抽样平均误差公式相比,前者比后者多了个修正系数。这个系数总是小于1的,因此,不重复抽样的误差总是小于重复抽样的误差。当总体单位数N非常大时,N与N-1非常接近,因此,不重复抽样的抽样平均误差公式可以近似的简化为:1NnN工作任务二抽样误差【例9-3】设有4个工人,其日产量分别为70、90、130、150件。这一总体的平均日产量和标准差σ为:X70901301501104XXN2XXN2222(70110)(90110)(130110)(150110)41000=31.62(件)=工作任务二抽样误差现在用不重复抽样的方法从4个工人中抽2个工人求平均日产量,所有可能的样本及有关资料见表9-2。表9-2样本平均数及其离差计算表工作任务二抽样误差应用抽样平均误差的理论性公式计算如下。样本平均数的平均数:=(件);抽样平均误差:(件)。现在直接用数理统计的应用性公式计算如下。抽样平均误差:(件)。x132011012xM132011012xM2()400018.2612xxXM210004218.261241xNnnN工作任务二抽样误差二、抽样平均误差(二)抽样成数的抽样平均误差(1)在重复抽样条件下,计算公式为:(2)在不重复抽样条件下,计算公式为:工作任务二抽样误差二、抽样平均误差(二)抽样成数的抽样平均误差同理,在总体单位数N很大时,公式可以近似地简化为:工作任务二抽样误差【例9-4】某电子元件厂生产某型号的电子管,根据过去的情况,产品一级品率为60%,现从10000件电子管中随机抽取100件进行检验,求一级品率的抽样平均误差。根据已知条件:P=60%,N=10000,n=100。在重复抽样条件下,一级品率的抽样平均误差为:p(1)PPn60%40%100===4.9%在不重复抽样条件下,一级品率的抽样平均误差为:(1)60%40%1001110010000PPnnNp==4.87%工作任务二抽样误差三、抽样极限误差样本指标与总体指标之间的抽样误差是客观存在的,不可避免的。因此,以样本指标估计总体指标,要达到完全准确毫无误差,几乎是不可能的。所以,在用样本指标估计总体指标时,应该根据所研究对象的变动程度和分析任务的要求,确定一个可允许的误差范围,在这个范围内估计的数字都算是有效的。这种可允许的误差范围称作抽样极限误差,又叫允许误差。它是抽样指标和总体指标之间抽样误差的最大可能范围,它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。设、分别表示抽样平均数极限误差和抽样成数极限误差。工作任务二抽样误差三、抽样极限误差则有:由于总体指标是未知的,所以,从这个意义上是无法计算抽样极限误差的。工作任务二抽样误差三、抽样极限误差图9-1正态概率分布工作任务二抽样误差三、抽样极限误差表9-3正态概率表(部分)工作任务二抽样误差【例9-5】设样本粮食平均亩产量=500kg,又知抽样平均误差=12.5kg,求总体粮食平均亩产量在500±25kg(即475~525)之间kg的估计置信度是多少?根据公式:xxX25212.5xxt查《正态概率表》,当=2时,置信度为95.45%。即总体平均亩产量在475~525kg之间的概率保证程度为95.45%,也就是说还有4.55%的可能性不在这个范围内。t工作任务三抽样估计的方法一、点估计点估计又称定值估计,是指不考虑抽样误差而直接以样本指标代替总体指标,也就是直接以抽样平均数或抽样成数代替总体平均数或总体成数。用公式表示为:工作任务三抽样估计的方法【例9-6】在对某乡进行的农产量调查中,样本地块的平均亩产为350kg,以此推断该乡的平均亩产也是350kg;对某批产品进行质量检验,抽取的部分产品的合格率为95%,认为这批产品的合格率也是95%。点估计简便、直观,但这种估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度,所以实际工作中常常采用区间估计的方法。工作任务三抽样估计的方法二、区间估计根据前面所讲的抽样极限误差的概念和不等式:对上面不等式,很容易得到以下两个等价的不等式:工作任务三抽样估计的方法【例9-7】某进出口公司出口一种名茶,规定每包重量不低于150g,现在用不重复抽样的方法抽取其中的1%进行检验,结果见表9-4。表9-4某进出口公司出口一种名茶的抽查资料工作任务三抽样估计的方法要求以99.73%的概率估计这批茶叶平均每包的重量范围,以便确定该批茶叶是否达到重量规格的要求。xxff15030150.3100==(g)S====0.87(g)2xxff761000.76===0.087(g)x2(1)snnN0.76(10.01)100工作任务三抽样估计的方法【例9-8】某城市随机抽取400户居民进行家计调查,得每户年耐用品的消费支出的标准差为200元,试确定该市居民年平均每户耐品用的消费支出在930.4~969.6元之间的概率保证程度。已知:n=400,=200,=(元)则有:===10(元)=查正态概率表,得置信度为:95%。该市居民年平均每户耐用品的消费支出在930.4~969.6元之间的概率保证程度为95%。x969.6930.419.62xn20040019.61.9610xxt工作任务三抽样估计的方法【例9-9】某企业生产一批食品罐头共60000桶,随机不重复抽查30