多阶段抽样

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第九章多阶段抽样第一节引言第二节初级单元大小相等的二阶抽样第三节初级单元大小不相等的二阶抽样第四节其他问题第一节概述一、概述二、多阶段抽样的定义及其与其他抽样的关系二、多阶段抽样的特点和作用三、抽选方法与推断原理一、引言采用整群抽样的主要理由是整群样本比较集中,实施便利,每个基本单元的调查费用较低。它的最大缺点是由于群内小单元存在一定程度的相似性(群内相关系数大于0),其抽样误差高于同样样本量的简单随机抽样。事实上,在多数情形,特别是当群的规模比较大时,确实没有必要对群内所有次级单元都进行调查。因此很自然地想到可以对每个被抽到的群中的次级单元再次进行抽样。二、多阶段抽样的定义及其与其他抽样的关系(一)二阶段抽样设总体由N个初级单元组成,每个初级单元又由若干二级(次级)单元组成,若在总体中按一定方法抽取n个初级单元,对每个被抽中的初级单元再抽取若干二级单元进行调查,则这种抽样称为二阶抽样,或二级抽样(two-stagesampling)在二阶抽样中,全部抽样是分两步实施的:第一步是从总体中抽初级单元,称为第一阶抽样;第二步是从每个被抽中的初级单元中抽二级单元,称为第二阶抽样。如果每个二级单元又由更小的三级单元组成,那么第二阶抽样后,若对每个被抽中的二级单元中的三级单元再进行抽样,则是三阶抽样。如果对每个被抽中的二级单元不再抽样,调查其中每个三级单元,则称为二阶整群抽样。以此类推,可定义更高阶的多阶抽样(multi-stagesampling)或多阶整群抽样(multi-stageclustersampling)。(二)多阶段抽样与其他抽样的关系整群抽样可以看作是多阶段抽样的一种特殊情形,即最后一阶抽样是100%的抽样。分层抽样也可看作是多阶抽样的特例:此时每个初级单元即是层,第一阶抽样是100%抽样,而层内抽样是第二阶抽样。当然,层内抽样本身也可能是多阶的。在多阶段抽样中,各阶抽样的方法可以采用简单随机抽样,也可以采用放回或不放回的不等概抽样,或者用系统抽样。三、多阶段抽样的特点及作用1、实施方便,节省费用保持了整群抽样的优点,即由于样本比较集中,便于调查、节省费用;.2、对抽中的次级单元进行再抽样,提高了效率多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即避免了对小单元过多调查造成的浪费。3、抽样框编制得以简化多阶段抽样是分阶段实施的,因此抽样框也可以分级进行准备:在第一阶抽样中,仅需准备总体中关于初级单元的抽样框;在第二阶抽样中,仅需对那些被抽中的初级单元准备二级单元的抽样框。更高阶的也是如此,每次只需要对被抽中的单元准备下一级抽样单元抽样框。在社会经济调查中,多阶抽样常用于抽样单元为各级行政单位的情况。例如,在一项全国性调查中,往往将省、地市、县、街道(乡、镇)、居(村)民委员会、居(村)民小组及住户作为各级南样单元。在此,采用多阶段抽样显然十分方便。再如,在一个城市中,可以将区作为其中一级单元,也可直接将街道作为一级单元;可以将居委会作为街道下一级的单元,也可以将居民小组作为街道下一级的单元。4、多阶段抽样可用于散料的抽样.所谓散料是指连续松散的不易区分为个体或抽样单元的材料.如:矿石、煤、粮食、水泥、化肥等等。例如:对贮藏在仓库中的小麦中农药残留量的监测.首先,从仓库中抽若干麻袋然后,再从每个抽中的麻袋中的不同部位抽取一定数量的小麦样品(称为份样)进行测试。三、抽选方法与推断原理多阶段抽样每一阶段的抽样可以相同,也可以不同,它通常与整群抽样、分层抽样、系统抽样结合使用.实际工作中,多阶段抽样通常与整群抽样结合使用,即前几阶是多阶段抽样,最后一阶为整群抽样。多阶段抽样时,抽样是分步进行的,因此,讨论估计量的均值及方差时需要分阶段进行,则用到下面的性质:ˆ性质1对于两阶段抽样,有)]ˆ([)]ˆ([)ˆ()ˆ()ˆ(212121VEEVVEEE)(•式中,E2、V2为在固定初级单元时对第二阶抽样求均值和方差;E1、V1为对第一阶抽样求均值和方差.)]ˆ([)]ˆ([})]ˆ([)ˆ([{)]ˆ([()]}ˆ([)]ˆ([{)]ˆ([)]}ˆ([{)]ˆ([)]ˆ([)ˆ()(2121221221212122122122122122VEEVEEEEEVEVEEEEEEEEEEV上述1式是显然的。2式证明如下:性质1可推广到多阶段抽样的情形,如三阶段抽样:)]ˆ([)]}ˆ([{)]ˆ([)ˆ()ˆ()ˆ(321321321321VEEEVEEEVVEEEE第二节初级单元大小相等的二阶抽样一、符号二、总体均值的估计量及其性质三、关于总体比例的估计引:本节先讨论初级单元大小(即所包含的次级单元数目)相等情形的二阶抽样。此时两阶抽样中的每一阶都可采用简单随机抽样:第一阶抽样从总体N个初级单元中抽取n个初级单元,第二阶抽样则是从每个被抽中的初级单元(设每个包含M个次级单元)中抽取m个次级单元。假定:在抽中的若干初级单元中作第二阶抽样是相互独立地进行的。一、符号说明初级单元的个数:N二级单元的个数:M第一阶段和第二阶段的样本量:n,m;第i个初级单元中第j个二级单元的观测值:Yij(i=1,2,…N;j=1,2,…M)样本中第i个初级单元中的第j个二级单元的观测值:yij(i=1,2,…n;j=1,2,…m)第一阶段和第二阶段的抽样比:MmfNnf21,总体和样本中第i个初级单元按二级单元的平均值:总体和样本按二级单元的平均值:mjijiMjijiymyYMY111,1niiNiiynyYNY111,1总体和样本初级单元间的方差:初级单元内的方差:2121)(11niiyyns,)(112121NiiYYNS21122)()1(1MiiijNiYYMNS21122)()1(1miiijniyymns若记则有同理2122)(11MjiijiYYMSNjiSNS122221的平均值。是2222iss二、总体均值的估计量及其性质性质2如果二阶抽样中的每一阶抽样都是简单随机的,且对每个初级单元,第二阶抽样是相互独立的,则对总体均值的无偏估计为:其方差为:方差的无偏估计为:YYnimjijniiynmynyY11111ˆ22221111)(SnmfSnfyV)(yV2221211)1(1)(snmffsnfyv估计量的方差由两个分量组成:其中源由第一阶抽样的第一项主要取决于第一阶抽样的样本量n与初级单元间的方差S12源由第二阶抽样的第二项主要取决于第二阶抽样的总样本量mn与初级单元内的方差S22在通常情况下,第一项占总方差的绝大部分,因此在固定次级单元样本量mn的条件下,n愈大(m愈小),则方差就愈小。【例8.1】欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水帐,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水帐.调查的结果如下,要求根据这些数据推算100家企业该指标的总量,并给出估计的95%置信区间.5家企业的调查结果样本企业第一日第二日第三日15759642384150351606344853495625554解:已知N=100,M=30,n=5,m=3f1=n/N=5/100=0.05,f2=m/M=3/30=0.10首先计算样本初级单元的均值和方差:iy样本企业16013243393583945075571922is6.53)57...4360(5111niiyny3.49)(112121niiyyns4.23112222niisns4372.9)1(1)(2221211snmffsnfyv0078.9216)ˆ(84934800)()ˆ(1608006.5330100ˆ22YsyvMNYvyNMY置信区间:之间。即4.1788636.142736921696.1160800三、对总体的比例的估计总体中具有所研究特征的二级单元占全体二级单元数的比例为:N1iiN1iiANM1PN1P式中:Ai为第i个初级单元中具有所研究特征的二级单元数。对总体比例P的估计是:niiniianmpnp1111式中:ai为第i个样本初级单元中具有所研究特征的二级单元数。性质3:对于二阶抽样,如果两个阶段都是简单随机抽样,则有估计量p的方差为:PpE)(N1iii2N1i2i1QP)1M(NMnmf1)PP(1N1nf-1V(p)V(p)的无偏估计为:n1iii221n1i2i1qp1)-(mn)f(1f)pp(1)-n(nf-1v(p)N1i2i21)PP(1N1SN1iii22QP)1M(NMS类似于前面总体方差的表达形式,有:【例8.2】欲调查某个新小区居民户家庭装潢聘请专业装潢公司的比例。在15个单元中随机抽取了5个单元,在这5个单元中分别随机抽取了4户居民并进行了调查,对这20户调查结果如下:样本单元第一户第二户第三户第四户一栋A座是是否否二栋C座否是否否三栋C座否否否是四栋C座否否否否五栋B座是否否否要求:根据这些数据推算居民家庭装潢聘请专业装潢公司的比例。解:聘请专业装潢公司的居民户为“1”,否则记为“0”N=15M=12n=5m=41551f1242f25.041)10112(45111niianmp00657.04341...43414242145124115541414140414141414142)15(51551qp1)-(mn)f(1f)pp(1)-n(nf-1v(p)222222n1iii221n1i2i1标准差为s(p)=0.081若以95%的概率估计居民户装潢聘请专业公司的比例在:.%9.40%1.9081.096.125.0之间即第三节初级单元大小不等的二阶抽样一、一般说明及符号二、估计量及其性质三、估计量是自加权的条件及对初级单元的PPS抽样一、一般说明及记号与整群抽样类似,当初级单元大小不相等时的二阶抽样有两种处理方法:一种是将初级单元按大小分层,使层内的初级单元大小大致相同,从而可用上一节的方法处理。另一种方法是考虑用不等概率抽样抽取初级单元。符号说明:总体中初级单元的个数以及第一阶抽取的样本量:N,n第i个初级单元中二级单元的个数Mi第i个初级单元中第二阶抽样的样本量mi第i个初级单元中第j个二级单元的观测值:Yij样本中第i个初级单元中的第j个二级单元的观测值:yij第一阶和第二阶的抽样比:Nnf1ii2Mmf总体及样本二级单元数:总体及样本指标总和:总体及样本第i个初级单元指标总和:总体及样本第i个初级单元按二级单元的平均值N1ii0MMn1ii0mmNiMjijiYY11nimjijiyy11iM1jijiYYim1jijiyyiiM1jijiiMYYM1Yiiim1jijiimyym1yi总体及样本二级单元的平均值:初级单元间的方差:第i个初级单元二级单元间的方差:01M1jij0MYYM1YiNin1iin1iin1im1jijmymyyi2N1ii21)YY(1N1Sn1i2i21)y

1 / 69
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功