第七章抽样调查●抽样调查的概念和作用●抽样调查的基本原理●抽样调查的组织形式§7.1抽样调查的概念和作用§7.1.1抽样调查的概念就是从所研究总体中按随机原则抽出一部分单位作为样本进行观察研究,以达到认识总体的一种统计方法。§7.1.2抽样调查的特点⒈是一种非全面调查⒉是按随机原则抽取调查单位⒊是用总体中部分单位的指标去推断总体指标数值⒋抽样调查中产生的误差是可以事先计算并加以控制的§7.1.3抽样调查的作用§7.1.3.1用于不可能进行全面调查的总体数量特征的推断。§7.1.3.2用于某些不必要进行全面调查的总体数量特征的推断。§7.1.3.3用于全面调查资料的评价和验证。§7.1.3.4用于生产过程的质量控制。§7.2抽样调查的基本原理§7.2.1全及总体和抽样总体⒈全及总体:是指所有调查对象的全体。简称总体,又称母体,常用大写英文字母N表示。总体根据其总体单位是否可以全面计数分为有限总体和无限总体。⒉抽样总体:是指从全及总体中按随机原则抽取的那部分调查单位所构成的总体,简称样本,用字母n表示,样本可分为大样本和小样本,一般来讲,样本单位数目在30个以上的算是大样本,30以下属于小样本。§7.2.2全及指标和样本指标⒈全及指标:根据全及总体各个单位的标志值计算的统计指标是全及指标。它是一个确定的量。⒉样本指标:根据抽样总体各单位标志计算的统计指标是样本指标。样本指标的量是一个不确定的量,是一个随机变量。§7.2.3重复抽样与不重复抽样⒈重复抽样:也叫回置抽样,是指每抽出一个样本单位后,把结果登记下来,又重新把它放回全及总体去,参加下一次的抽选,使它和其余未被抽中的单位在下次抽选中仍有可能被抽中的同等机会。⒉不重复抽样:也叫不回置抽样,就是任何一个单位经随机抽出后,不再放回全及总体中去参加以后的抽选。也就是说,每个单位只能被抽中一次,不会被重复抽出来。§7.2.4抽样误差§7.2.4.1抽样误差的含义是指样本指标与总体指标之间数量上的差别。注意两点:第一、指的是随机误差,不包括登记误差和偏差。登记误差是登记时多记或少记原因产生的误差。偏差是指破坏随机原则而产生的误差。第二、随机误差有两种:实际误差和平均误差。实际误差是一个样本指标和总体指标的差别,这是无法知道的。平均误差即可能出现的许多样本的样本指标与总体指标的平均误差,样本指标与总体指标之间离差的标准差就是平均误差。§7.2.4.2影响抽样误差的因素⒈总体各单位标志值的差异程度⒉样本单位数目的多少⒊抽样方法⒋抽样调查的组织形式§7.2.4.3抽样平均误差的计算(理论公式)抽样误差从直观上理解,是指某一次抽样结果所得的抽样指标与总标指标之间的差别。可以称之为实际误差,一般是无法获知的。而事实上抽样误差是指抽样平均误差,即一系列抽样指标的标准差,它概括地反映了整个抽样过程中一切可能结果的误差,表明抽样指标与总体指标之间平均的误差程度。其理论公式为:nx2),2.1()(2ninXxix§7.2.4.3抽样平均误差的计算(实际公式)⒈抽样平均数的抽样平均误差重复抽样:不重复抽样:nx2nx2)1()1(22NnnNnNnx⒉抽样成数的抽样平均误差重复抽样:不重复抽样:nx2nPPnPQp)-(=1)1(1)1(NnnPPNnnPQp)-(=【例7-1】某生产彩色电视机的工厂,从一批出厂产品中抽取1%的产品进行质量检验,取得如下资料:试计算抽样平均误差.正常工作时间(千小时)电视机(台)6—8158—103010—125012—144014—1619合计144解:例表计算:正常工作时间(千小时)电视机(台)Xxf6—815710515.777236.6558—103092703.889116.6710—1250115500.0010.0512—1440135204.113164.5214—1691513516.225146.025合计144—1580—663.915)(972.101441580千小时fxfx2x2)(xxfxx2)(1483.2144915.663)(2ffxx=1781.0%)11(1446152.4)1(2Nnnx179.01446152.42nx【例7-2】一批商品(10000件)运抵仓库,随机抽取100件检验其质量,发现有10件不合格。试按重复与不重复抽样分别计算合格率抽样平均误差。解:成数:重复抽样:不重复抽样:%98.2)100001001(100%10%90)1()1(Nnnppp%3100%10%90)1(nppp%901009010010100p§7.2.5点估计和区间估计⒈点估计基本特点:根据抽样资料计算的样本指标直接作为相应全及指标的估计值。⒉区间估计就是以一定的概率把握程度确定某总体指标所在的区间。xxxxxpppPp§7.2.6概率度、置信度和极限误差数理统计和概率论认为:抽样误差与可靠程度(概率)之间存在一定的数量关系。当抽样误差范围扩大时,就可以提高推断的可靠程度,同理,缩小抽样误差,抽样推断的右靠程度就会降低。统计学中把扩大或缩小抽样误差范围的倍数叫概率度,用字母t表示。把扩大或缩小后的抽样误差范围叫允许误差,或极限误差,用符号Δ=tμ置信度F(t):是用样本指标推断总体指标时的可信程度。xxtxxtppt§7.2.7必要抽样数目的确定§7.2.7.1重复抽样必要抽样数目的确定⒈根据平均指标计算必要抽样数目⒉根据成数指标计算必要抽样数目)1(2PPPQnttxx2=ntx222=222xtn=221pPPtn)-(=【例7-3】现对某产品的平均重量进行抽样调查,要求极限误差不超过0.2克,费用不超过500元。该调查的基本费用为98元,调查每一个单位需要1元,保证程度为0.9545,根据以往的调查知σ=2。试确定采用重复抽样必要的样本单位数。解:σ=2Δ=0.2由F(t)=0.9545知:t=24002.022222222==xtn§7.2.7.2不重复抽样必要抽样数目的确定⒈根据平均指标计算必要抽样数目⒉根据成数指标计算必要抽样数目)12NnnttXX-(=)-(=NnntX122222222tNNtnx=)1(1222pptNNPPtnP)-(=§7.3抽样调查的组织形式§7.3.1简单随机抽样⒈简单随机抽样的概念它是从总体的全部单位中,按照随机的原则抽取一部分单位进行调查的方式。具有两个特点:第一,在调查前没有对总体进行任何形式的分组、排队、划群等处理;第二,抽取每个样本单位时,仅只遵循随机的原则。⒉简单随机抽样的方法⑴直接抽选法就是直接从调查对象中随机抽选样本单位。例:从成品库中任意抽取若干件产品进行质量检查。⑵抽签法这种方法就是先给每个总体单位编上序号,将号码写在纸片上,然后掺和均匀后,从中抽选,抽到哪个就调查哪个单位,直到抽够预先规定的数量为止。⑶随机数字表法是先给总体单位进行编号,然后根据号码应用随机数字表抽选样本单位的方法。具体步骤:①先将所有的总体单位进行编号,并确定最大的号码是几位数字。②然后在随机数字表中取几列数字作为计算单位,从任意一列一行开始向任意方向数去,凡是属于编号范围内的数字号码就作为样本单位,一直抽满预定的数量为止。如果是不重复抽样,则抽到重复号码舍去不要。⒊简单随机抽样平均误差的计算⑴抽样平均数的抽样平均误差①重复抽样:②不重复抽样:nx2nx2)1()1(22NnnNnNnx⑵抽样成数的抽样平均误差①重复抽样:②不重复抽样:nx2nPPnPQp)-(=1)1(1)1(NnnPPNnnPQp)-(=⒋简单随机抽样的区间估计⑴平均数的区间估计◆总体总值估计xxtxxtxNxXNxxx)(~)(⒋简单随机抽样的区间估计(续)◆抽样估计精确度:◆抽样误差系数:⑵成数的区间估计xxxxxA1pppPp⒌简单随机抽样必要抽样数目的确定⑴重复抽样必要抽样数目的确定①根据平均指标计算必要抽样数目②根据成数指标计算必要抽样数目)1(2PPPQnttxx2=ntx222=222xtn=221pPPtn)-(=⑵不重复抽样必要抽样数目的确定⒈根据平均指标计算必要抽样数目⒉根据成数指标计算必要抽样数目22222tNNtnx=)1(1222pptNNPPtnP)-(=§7.3.2类型抽样⒈类型抽样的概念也叫分类抽样或分层抽样,它首先是将总体单位按其属性特征或某一重要的相关标志分为若干类型或层,然后在每个类型或层中采用纯随机抽样的一种调查方式。采用类型抽样法主要有两个好处:⑴提高样本的代表性。⑵可以降低样本的差异程度。⒉类型抽样的样本单位的确定一般有四种方法:按平均法确定,按分类比例确定,按各组标志变动度确定,按最优法确定。但最常用的是分类比例抽样。所谓分类比例抽样就是把样本单位个数n按总体各类型所占的比例分配到各类型中的一种类型抽样。nNNnnNNnnNNnKk......,2211,⒊类型抽样平均误差的计算类型抽样误差的计算和简单随机抽样误差的计算方法,只有一个区别,就是用平均组内方差代替总体方差。⑴抽样平均数的抽样平均误差①重复抽样:②不重复抽样:nx2nx2)1(2Nnnxnx2)1(2Nnnx问题的关键:如何理解和计算平均组内方差。①平均组内方差是各个类型组的方差的平均数②如何计算是各组的组内方差kiikiiinn1122⑵成数的抽样误差①重复抽样:②不重复抽样:nx2nppiip)1(=)1()1(Nnnppiip=nppp)1(=)1()1(Nnnppp=关键问题:如何计算成数的平均组内方差各类型组的组内方差kiikiiiiiinnpppp11)1()1(§7.3.3机械抽样⒈机械抽样的概念也叫等距抽样或系统抽样,它是先将总体单位按某一标志或次序排列,并在确定的范围内随机地抽取样本第一个单位,然后按相等的距离和间隔依次抽取样本其他单位的抽样调查组织形式。机械抽样将总体进行排列,常用的方法有两种,一种是按无关标志(与调查项目无关)排列,一种是按有关标志(与调查项目有关)排列。⒉抽取样本的方法⑴随机等距假设总体有30个单位,要抽6个单位,那么把排列的数据分为6段,在第一段随机抽取第一个单位,然后,每隔5个抽一个单位,共抽6次。×××××××续(1):⑵对称等距先在第一段随机抽样抽一个,假定是第2个,然后在第二段找一个与之对称的(倒数第2个),以后单数段抽第2个,双数段抽倒数第2个。××××续(2):⑵中点等距先在第一段中点抽一个,以后每隔K个抽一个,至抽够为止。××××××⒊抽样误差的计算机械抽样由于按无关标志排队的准确性接近于不重复简单随机抽样,所以一般按不重复纯随机抽样误差公式计算它的近似值。按有关标志排队具有分类的性质,因而可用类型抽样误差的公式计算它的抽样误差)1(2Nnnx)1(2Nnnx)1()1(Nnnppx)1()1(Nnnppiip=§7.3.4整群抽样⒈整群抽样的概念也叫分群抽样或区域抽样或集团抽样,它是先将总体单位按时间或空间形式划分成许多群,然后按纯随机抽样或机械抽样方式从中抽取部分群,对中选群的所有单位进行全面调查的抽样组织方式。⒉抽样误差的计算⒈平均数抽样误差的计算⒉成数抽样误差的计算)1(2Rrrxx)1(2Rrrpx关键问题:什么是群间方差:群间方差:也叫组间方差,它说明群与群之间的差异程度。如何计算群间方差?代表样本的各群的平均数代表样本平均数样本内各群的成数样本成数rxxriix122)