第六章抽样第一节抽样概述第二节概率抽样方法第三节非概率抽样方法第一节抽样概述一、抽样的术语1.总体population:调查研究的全部事物,是构成它的所有元素的集合。人口普查——全国人口华电2009届本科毕业生择业意愿调查——所有符合条件的学生2.样本sample:从总体中按一定方式抽取出来的一部分元素的集合,是总体的一个子集。3.抽样sampling:从总体中按一定方式抽取样本的过程。4.抽样单位samplingunit:一次直接的抽样所使用的基本单位。例:从全班50人中抽取10人构成小样本,个人(学生)是抽样单位从全校30个班级中抽取1个班组成样本,则班是抽样单位。5.抽样框samplingframe:指一次直接抽样时总体所有抽样单位的名单。6.参数值/总体值——是对总体元素特征的综合数量表现。7.统计值/样本值——是根据样本计算出来的关于样本变量的数量表现。二、抽样的作用基本作用:由部分认识总体。必要性:研究人员难以做到任何研究都进行全面调查,而抽样误差可以控制到很小,因而抽样调查成为最常用的研究方法之一。三、抽样的一般程序1.界定总体2.制定抽样框3.决定抽样方案(准备采用哪种抽样方法)4.实际抽取样本——先抽好样本再调查——边抽部分样本边调查5.评估样本质量第二节概率抽样方法一、简单随机抽样simplerandomsampling(一)——从含有N个元素的总体中直接随机抽取n个元素组成样本,类似于抽签。(二)方法A总体元素较少时,类似于抽签方法。B总体元素较多时,随机数表法二、系统抽样/等距/机械抽样(一)含义:把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码组成样本的方法。P134(二)具体步骤:1.将总体的所有个体按顺序编号2.计算抽样间距KN(总体规模)n(样本规模)K=3.在头K个个体中随机确定起点(A)e.g.如果K=10,就从01-10号中抽签决定一个号码作为起点,假定为054.从A开始,每隔K个个体抽取一个个体,组成样本:A,A+K,A+2K…..,A+(n-1)K05,15,25,….,95001011021031…091002012022032092003013023033093004014024034094005015025035095006016026…..096007017027097008018028098009019029099010020030100√√√√√(一)含义:先将总体中所有单位按某种特征或标志划分为若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样本,将其合成样本。分类随机抽样总体样本三、分层抽样/类型抽样子群四、整群抽样clustersampling(一)含义:将总体按某种标准划分为一些子群体,每个子群为一个抽样单位,用随机方法从中抽若干子群,将抽出的子群中的所有个体结合起来构成样本。划分子群随机抽样1.优点:1.简化抽样过程,降低费用2.可扩大抽样规模3.更容易取得抽样框2.缺点:样本分布面不广,代表性较差,尤其是当子群间异质性较强时,影响代表性更明显。(二)整群抽样的特点PS:区别分层抽样与整群抽样当某个总体是由若干个明显的类别、层次组成时,若不同类别(或群)之间差异很大,而类别内部差异不大时,适合分层抽样。当不同子群体之间的差别不大,而每个子群内部的差异很大时,适合整群抽样。五、多级抽样multistagesampling(一)含义:按抽样元素的隶属关系或层次关系,把抽样分为几个阶段进行。e.g.大学——院系——班级——学生1.优点:不需要总体全部名单,抽样较容易;节约人力物力2.缺点:每级抽样都会有误差,故误差较大(二)多级抽样的特点第三节非概率抽样方法非概率抽样:——依据研究者的主观意愿、判断或是否方便等因素来抽取对象的方法。一、偶遇抽样accidentalsampling/方便抽样——按调查者的方便任意抽取样本。与等概率抽样方法的不同之处:不能保证符合条件的每个成员有同样的被抽中的概率。二、判断抽样judgemental/立意抽样——研究者依据研究目标和自己主观分析来选择和确定研究对象。优点:发挥主观能动性,当研究者本人素养高,熟悉情况,经验丰富,分析判断力强时,此法很方便。缺点:难以判断样本的代表性。适用于:规模小,调查范围窄,时间、人力条件有限时三、定额抽样quota/配额抽样方法:尽可能地依据那些有可能影响到研究变量的各种因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例,然后依据这种划分以及各类成员的比例去选择调查对象。1.目的不同:定额抽样要保证样本与总体在结构比例表面上一致;分层抽样则包括比例分层和非比例分层。2.方法不同:定额抽样中各层样本是非随机抽取的;而分层抽样中各层样本是随机抽取的。PS:定额抽样与分层抽样的区别四、滚雪球抽样snowball