PPS抽样

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

抽样2020/9/1•假设从某市100所高校的50万大学生中,抽取5000名学生进行环保意识的抽样调查。二阶段抽样:大学——学生2020/9/1第一阶段:从100所高校中抽取10所按简单随机抽样或系统抽样的方法,则首先需要弄到一份100所高校的名单,并对其进行编号,然后根据抽签、随机数表或通过计算抽样间距直接从抽样框中抽取;若按分层抽样的方法,则可以先将其分为本科院校和专科院校,然后分别从每一类中抽取若干高校;几种抽样方法的比较2020/9/1第二阶段:从10所高校中分别抽取500名学生按整群抽样的方法(假设其中一个学校有100个班级,每班50名学生)几种抽样方法的比较2020/9/1•多段抽样中,其实暗含了一个假定:即每一个阶段抽样时,其元素的规模是相同的。•比如第一阶段抽取学校时,暗含了每个学校的规模相同。•在这样的假定下,采取上述几种随机抽样的方法,最终每名学生被抽中的概率相等。2020/9/1•但现实生活中,每一个学校包含的学生人数不同,因而按照上述多段抽样的方法来抽取样本时,最终每名学生被抽中的概率实际上是不同的。•(规模不一样大)假设甲学校比较大,有2万名学生,乙学校比较小,只有3千名学生。那么当二者在第一阶段都被抽中后,第二阶段分别从他们中抽取500名学生,•甲学校学生被抽中的概率为:(10/100)*(500/20000)=1/400•乙学校学生被抽中的概率为:(10/100)*(500/30000)=1/602020/9/1(一)原理:•以阶段性的不等概率换取最终的、总体的等概率。一、PPS抽样(概率与元素的规模大小成比例的抽样)§4PPS抽样2020/9/1(二)做法(以二阶段为例):•1、在第一阶段,每个群按照其规模(其所含元素的数量)被给予大小不等的抽取概率。•2、到了第二阶段,从每个抽中的群中都抽取同样多的元素(也是不等概率的)。•正是这一大一小,平衡了由于群的规模带来的概率差异。2020/9/1(三)公式每一个元素被抽中的概率所抽取的群数总体的规模群的规模群的规模平均每个群中所要抽取的元素=××PPS的做法已经排除了群的规模这一影响因素——第一个分子与第二个分母相互约掉了——每一个元素的被选中概率变成了:(所抽取的群数*每个群中所抽取的元素数目)/总体的规模。这实际上就是样本规模除以总体规模。2020/9/1(四)PPS的具体操作方法:•1、在确定的总体内,给每个抽样单位按序编号,并且写出它们的规模;•2、累计相加每个抽样单位包含的单位数,并根据累计相加结果确定每个单位的号码范围;•3、采用随机数表的方法或等距抽样的方法选择号码,号码所对应的单位入选第一阶段样本;•4、在被抽取的单位中,按照抽样元素的多少进行第二阶段抽样。2020/9/1用PPS方法抽取第一阶段样本举例学校序号学生人数/人累计人数/人号码范围入选号码入样单位0140004000000001-004000002032单位10250009000004001-00900003320012200009001-012200009786单位2042000032200012201-032200012234029824单位3、405600038200032201-038200………………………………9910000492000482001-492000484551单位201008000500000492001-5000002020/9/1§5非概率抽样方法•非概率抽样,不是按照概率均等的原则,而是根据人们的主观经验或其他条件来抽取样本。•偶遇抽样•判断抽样•定额抽样•雪球抽样2020/9/1一、偶遇抽样•又称作方便抽样或自然抽样•是研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象•区别随机抽样:偶遇抽样没有保证总体中的每一个成员都具有同等的被抽中的概率。2020/9/1二、判断抽样•研究者根据研究的目标和自己主观的分析来选择和确定研究对象的方法。•由于抽样标准的确定带有较大的主观性,所以,此法的运用结果如何往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很大关系。•在实际中,这种抽样多用于总体规模小、所涉及的范围较窄或时间、人力等条件有限而难以进行大规模抽样的情况2020/9/1三、定额抽样•又称作配额抽样•是指调查人员将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。例:假设某高校有4000名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%、二年级、三年级、四年级学生分别占30%、20%和l0%。现在要用定额抽样方法依上述三个变数抽取一个规模为100人的样本。2020/9/1依据总体的构成和样本规模,我们得到的定额表:男生(60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(30人)年级一二三四一二三四一二三四一二三四人数1296312963864286422020/9/1定额抽样与分层抽样的区别•分层抽样是完全依据概率原则,排除主观因素,客观地、等概率地到各层中进行抽样;•配额抽样是由调查人员在配额内主观判断选定样本。先“分层”(事先确定每层的样本量,即抽选出一个总体的“模拟物”)再“判断”(在每层中以判断抽样的方法选取抽样个体)2020/9/1四、雪球抽样•当我们无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并再询问他们知道的人。•如同滚雪球一样,我们可以找到越来越多具有相同性质的群体成员。研究退休老人的生活2020/9/1•非概率抽样其样本的代表性往往较小,误差有时相当大,且这种误差又无法估计。•所以,在大规模的正式研究中,一般很少用非概率抽样,常常只是在探索性研究中采用。2020/9/1定额抽样与分层抽样的区别•定额抽样•其目的:在于要抽选出一个总体的“模拟物”,•其方法:则是通过主观的分析来确定和选择组成这种模拟物的成员。也就是说,定额抽样注重的是样本与总体在结构比例上的表面一致性。(“按事先规定的条件,有目的地寻找”)•分层抽样•目的:一方面是要提高各层间的异质性与同层中的同质性,另一方面也是为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一步减小。•其方法:则是完全依据概率原则,排除主观因素,客观地、等概率地到各层中进行抽样2020/9/1

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功