第十章 其它抽样方法技术1

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第十章其它抽样方法技术本章要点本章主要对样本轮换、双重抽样、随机化装置、交叉子样本等抽样技术原理、方法、特点及应用条件进行了较为全面的介绍。具体要求:掌握本章所介绍的几种抽样技术的特点及应用条件,在抽样实际工作中能够正确运用该种技术,提高估计的精度与效果。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换第二节双重抽样第三节随机化装置第四节交叉子样本02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`抽样调查除了对总体的一次性抽样以外,很多重要的调查是隔一段时间重复进行的,对于这种经常性的抽样问题,就必须重视其样本轮换问题的研究。对于样本轮换问题,我们至少应考虑以下问题:每次调查的样本如何组成?是采用固定样本还是采用全新的样本,或者是部分保留部分替换,即样本轮换;在估计后期的总量或均值时,是否需要利用前期的信息来改进现期的估计,以及如何利用;如果采用样本轮换的方法,如何确定最优的保留比例或替换比例。第一节样本轮换02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`一、样本轮换的原因如果是单纯地估计现值的情况,当然最好每次重新抽取新样本,这样必然会增加费用;如果要逐期地与上期比较,则采用固定样本的方法为好,固定样本可以消除样本的因素而只观察动态的变化。然而,样本长期不变,随着时间的推移,固定样本会显露它的弊端,既难以反映总体的变化,而且受访者也会产生厌烦心理,出现不合作或回答质量下降等问题,从而影响调查质量。另外,无论是采用固定样本还是全新样本都难以正确地反映总体在各个不同时间上的水平及变化,因此,一种广泛采用的方法是样本轮换,即每隔一定时间(一个月、一季或一年)更换一定比例的单元,保留其余单元。第一节样本轮换02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`二、样本轮换的最优比例第一个时期采用有放回简单随机抽样方式抽出样本量为n的样本;在第二个时期采用有放回简单随机抽样方式选出样本量为nq的旧有样本点以便替换掉,即保留的样本量为np,保留样本的比例为p,同时独立地依有放回简单随机样本方式补充新的nq个新样本点,这里p+q=1,这样第二个时期的样本量仍旧为n。设:第一节样本轮换02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`为第一个时期与第二个时期相同的np个单元在第一个时期的均值。为第一个时期nq个单元在第一个时期的均值。为np个单元在第二个时期的样本均值。为nq个补充单元在第二个时期的样本均值。ρ为和之间的相关系数。如果希望估计第二个时期的样本均值并充分利用第一个时期的信息,令该估计量为,那么它应该是充分利用前后期中保留样本、不保留样本和后期新补充样本的加权平均数。第一节样本轮换xxxxyyxxywy02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`设我们希望得到的估计量是两期估计量的线性函数,即=a+b+c+d(10.1)要求估计其参数a,b,c,d。因为E()=E()=,E()=E()=,所以E()=(a+b)+(c+d)。要使成为的无偏估计量,需a+b=0,c+d=1,也即b=-a,d=1-c。代入(10.1),有=a(-)+c+(1-c)第一节样本轮换xxxxyyxxywywyxywywyXXYYYwyxxyy02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx该估计量的方差可以求得为:22222211(1)2()()...yyxyxwccacVyaqpnpnqnpn其中是第一个时期的方差,是第二个时期的方差。我们要求出a和c,使得达到最小,就要以上公式分别对a和c求偏微分并使之等于0,即可求出a和c的最优值分别为:2x2y()wVy02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx该估计量的方差可以求得为:22.1yxpqaq221paq02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx将其代入公式(10.1),就得到2222222(1)()111ywxpqpqqyxxyyqqq该估计量的方差为:22221()1ywqVynq02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx如果不利用前期信息,只根据第二期的结果来估计均值,那么:其方差为:ypyqy2()yVyn02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx故利用前期信息后的设计效果为:从上式可以看出,当ρ的值比较大时,利用上期信息可以较大地提高的效率。表10.1给出了不同的q,ρ值时的值。222()1()1wVyqVyqwy()()wVyVy02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx表10.1不同的q,ρ值时的值()()wVyVy02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx三、样本轮换方法(一)随机轮换法在进行轮换时按确定的轮换单位数目或比例,从原有样本中随机抽出若干单位不再调查,而从其余未包括在样本中的总体单位中抽取同样数目的单位来代替。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx(二)等距轮换法在总体抽样框中确定出各个等距抽样的样本,在各次的调查中,按相应位置的等距样本单位进行轮换。我国农村住户调查就是采用这种轮换方式。(三)子样本轮换法从总体中抽出若干套子样本,每次调查一定数量的子样本,逐次轮换其中的部分子样本。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx子样本轮换实际上就是每次采用交叉子样本,而交叉子样本不仅能有效地减少和控制估计偏差,而且由于每个交叉子样本都能代表总体,即使有的子样本资料搜集不到,我们也可以用其他的子样本甚至一个子样本来观察和推断总体。此外,用交叉子样本还可以考察非抽样误差发生的程度。因此,一般来说,子样本轮换方法是以上三种样本轮换方法中最好的。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx四、样本轮换应遵循的原则(一)代表性。一是指轮换后的新样本必须具有代表性,二是指新选取的样本原则上必须满足与被轮换掉的原样本同类型,有代表性。(二)连续性。指样本轮换后进行抽样调查取得的资料应与样本轮换前进行调查所取得的资料连续并可比。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx(三)保证必选样本点。所谓必选样本点,就是指进行抽样调查时必须作为样本点的总体单元。保证必选样本点,就是指必选样本点不参加轮换,仅对非必选样本点进行轮换。(四)遵循抽样原理。指进行样本轮换时,要按照抽样调查的原理来选取被轮换掉的样本点和补入的新样本点。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxx五、案例介绍美国人口现状调查(currentpopulationsurvey,CPS)是国际上最著名的抽样调查项目之一,已经成为美国以及许多国家进行居民调查的参考模型,其实施是在每个月包含19号的那一周进行,调查的问题涉及受访者此前一周内的活动。调查氛围覆盖全美50个州和哥伦比亚地区。CPS采用的就是样本轮换的方法,即每位受访者连续4个月接受访问,然后退出样本,8个月后再进入样本,连续4个月接受访问,最后永久地退出样本。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第一节样本轮换xxxCPS在1995年7月的抽样设计方案中样本轮换的特征:1.在任意一个月内,都有1/8的住户单元第一次接受调查,1/8的住户单元第二次接受调查,依次类推。2.每个月都由新的样本组代替从样本中永久退出的老样本组。3.每个月都有一个样本组在闲置8个月后重新接受调查,以此代替刚刚进入闲置期的样本组。4.通过轮换设计,保证每个样本单元在2个年份的4个相同月份里接受调查。5.在连续的2个月内,有3/4/的样本点是相同的;在连续的2年内,有1/2的样本点是相同的。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第二节双重抽样xxx我们可以先从总体中抽取一个大的初始样本,从而获得总体的辅助信息,然后再从初始样本或从总体中再抽一个子样本,这种方法就是双重抽样。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第二节双重抽样xxx一、定义双重抽样,也称二相抽样或二重抽样(two-phasesampling),是指在抽样时分两步抽取样本。一般情况下,先从总体N中抽取一个较大的样本,称为第一重(相)样本(thefirstphasesample),对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重抽样(thesecondphasesampling)。第二重抽样所抽的样本n相对较小,但是第二重抽样调查才是主调查。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第二节双重抽样xxx二、双重抽样与两阶段抽样的区别(一)两阶段抽样(two-stagesampling)是先从总体N个单元(初级单元)中抽出n个样本单元,却并不对这n个样本单元中的所有小单元(二级单元)都进行调查,而是在其中再抽出若干个二级单元进行调查;双重抽样则不同,要对第一重(相)样本进行调查以获取总体的某些辅助信息,并且要利用这些辅助信息进行排序、分层、抽样或估计等。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第二节双重抽样xxx(二)两阶段抽样的第二阶段抽样单元和第一阶段抽样单元往往是不同的;双重抽样要有一份最终单元的完整名册(总体所有单元的抽样框),而两阶段抽样只是需要第一阶段单元(初级单元)名册,然后在中选的初级单元中构造第二阶段抽样的抽样框。02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第二节双重抽样xxx三、双重抽样的作用(一)有助于筛选主调查对象(二)节约调查费用(三)提高抽样效率(四)可用于研究样本轮换中的某些问题(五)降低

1 / 61
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功