2019/8/201第七章:抽样调查技术本章教学目的第一节抽样调查的基本概念第二节概率抽样设计第三节非概率抽样第四节样本容量的确定2019/8/202本章教学目的通过本章学习,了解抽样调查的各项技术的特点,正确地应用各项技术进行抽样调查;掌握如何选取样本、样本框,减少抽样调查的误差,提高抽样调查的精确度。2019/8/203第一节抽样调查的基本概念一、普查二、全及总体与样本总体三、抽样误差四、抽样框与抽样框误差2019/8/204一、普查概念:普查是指为了某一特定调查目的而专门组织的一次性全面调查,即为了了解调查对象的基本情况而一次性地对调查对象中的全部单位逐一进行登记的调查。特点:同其它调查形式相比,涉及面大、调查的内容和项目比较简单,但所收集的资料全面准确、可靠、误差比较小。同时,普查需要占用较多的人力、花费较多的财力和物力才能完成。2019/8/205二、全及总体与样本总体(一)全及总体概念:也称目标总体(targetpopulation),是由符合研究目的的所有具有相同性质或特征的个体(individual)所组成的集合。在抽样调查中,全及总体是抽样推断的目标。分类:全及总体可以根据单位数量是否有限,分为无限全及总体(infinitepopulation)和有限全及总体(finitepopulation)。2019/8/206(二)样本总体概念:也称抽样总体(sampledpopulation)或者“子样”、“样本”,是指从全及总体中抽取出来的单位集合。大样本与小样本:样本总体通常是有限总体,它所包含的的总体单位数目称为样本容量(通常用英文字母n来表示)。一般来说,样本单位数达到或者超过30个称为大样本,而在30个以下的称为小样本。2019/8/207三、抽样误差在市场调查中存在两类误差:抽样误差与非抽样误差。抽样误差是指在调查中因使用的样本而发生的样本指标与总体指标之间的差异。2019/8/208四、抽样框与抽样框误差(一)抽样框(samplingframe)1.抽样框的概念抽样框就是供抽样调查使用的所有调查单位的名单。这份名单为调查者提供了辨别和联系调查总体中个体的有效途径。2.设计抽样框的要点准确的抽样框包括两个方面:完整性与不重复性。①完整性是指不遗漏总体中的任意一个个体;②不重复性是指任意一个个体不能重复列入抽样框。2019/8/209(二)抽样框误差1.抽样框误差的概念抽样框误差(samplingframeerror)是因不准确或不完整的抽样框而引起的误差。抽样框误差是一种非抽样误差2019/8/20102.抽样框误差的形成(1)丢失目标总体单位也被称为“涵盖不足”,是指抽样框没有覆盖全部目标总体单位。(2)包含非目标单位也被称为“过涵盖”,是指抽样框中包含了一些不属于研究对象的非目标总体单位。(3)丢失目标单位和非目标单位共存,是指在抽样框中既有丢失目标单位,也有包含非目标单位。(4)复合连接是指抽样框单元与目标总体单元不完全一一对应,而是存在一对多、多对一或多对多模式的现象。(5)不正确的辅助信息误差也被称为“内容上的偏差”,这种误差会降低估计的精度。(6)抽样框老化又被称为“抽样框过时”或“不准确的抽样框”。2019/8/20113.减少抽样框误差的方法(1)在抽选样本之前,要对抽样框加以检查,发现可能存在的问题,进行识别、处理,并采取一定措施加以补救。(2)联接遗漏单位法,就是指把抽样样本遗漏的个体和抽样样本中某个值相联接,其联接规则必须在调查前明确规定。4.抽样估计的总体参数(1)总体和(2)总体中具有某种特定特征的个体总数或它们在总体中所占的比例或百分率:(3)总体两个不同指标的总和或均值的比值2019/8/2012第二节概率抽样设计一、简单随机抽样二、等距抽样三、分层抽样四、整群抽样法五、多阶段抽样2019/8/2013一、简单随机抽样(一)简单随机抽样的具体操作(二)简单随机抽样平均误差(三)简单随机抽样的方法(四)简单随机抽样的优缺点2019/8/2014一、简单随机抽样(一)具体操作步骤:第一,对总体的每个单位进行编号,总体单位数为10,000的总体可编为00001到期10,000号;第二,在随机数码表(一般的数理统计书中都有此表)中从任意一个编号数开始,向上、向下或跳跃选取编号,在00001和10,000之间选出200个(样本单位数);第三,在有明确总体单位的数字表中选出符合上述数字的总体单位,这些总体单位就是样本。2019/8/2015(二)简单随机抽样平均误差公式是全及总体标准差;是抽样单位数2xSnnnnSx2n2019/8/2016(三)简单随机抽样的方法1.抽签法2.随机掷骰子法3.计算机随机数法4.随机数表法5.使用统计软件直接抽取6.其他方法7.放回抽样与不放回抽样的比较2019/8/2017(四)简单随机抽样的优缺点方法简单直观,当总体名单完整时,可直接从中随机抽取样本,由于抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。尽管简单随机抽样在理论上是最符合随机原则的,但在实际应用中则有一定的局限性。2019/8/2018二、等距抽样(一)等距抽样法的具体操作(二)等距抽样的实施办法(三)等距抽样的参数估计(四)等距抽样的优缺点2019/8/2019(一)等距抽样法的具体操作第一步,将N个总体单位按一定顺序排列,编号为1,2,…N,第二步,根据总体单位数N和样本单位数n计算出抽样间隔K(必须是整数),K=N/n;第三步,在1和K之间随机选一个数字r,称为随机起点;第四步,根据r和K从总体中抽取n个样本单位。2019/8/2020(二)等距抽样的实施办法1.随机起点等距抽样2.循环等距抽样3.中点等距抽样4.对称等距抽样法(1)塞蒂(Sethi)的方法——两两对称等距抽样。(2)辛(Singh)等人的修正方法——中心对称等距抽样。5.总体有周期性变化时的等距抽样2019/8/2021(三)等距抽样的参数估计njijisyynyy111、估计量2019/8/20222.估计量的方差22)1(1)(wsysySNnKSNNyV22)1(1)(wsysySNnKSNNyV其中,22)()1(1injijKiwsyyynKS为等距样本(群)内方差2S为总体方差。2019/8/2023(四)等距抽样的优缺点第一,运用等距抽样的前提是要有总体每个单位的有关材料,特别是按有关标志排队时,往往需要有较为详细、具体的相关资料。第二,等距抽样的效率取决于对总体进行排列时所使用的标志值。在等距抽样中,调研人员假设总体是有序的。2019/8/2024三、分层抽样(一)分层抽样的具体步骤(二)分层抽样的方法(三)分层指标的选择(四)分层抽样的优缺点(五)分层抽样适用的范围2019/8/2025(一)分层抽样的具体步骤第一步,辨明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。第二步,确定在每个层次上总体的比例。2019/8/2026(二)分层抽样的方法例如,我们要在一个有1000名职工的企业中抽取100名职工。我们以工作岗位为分层指标,主要分为管理人员、一线工人和后勤工人三类,已知的情况是管理人员占职工总数的10%、一线工人占60%、后勤工人占30%,从而确定了各类人员的样本数为管理人员10名、一线工人60名、后勤工人30名。然后,用简单随机抽样的方法对各类人员进行抽样。2019/8/2027(三)分层指标的选择例如,我国国内一般大规模的民意调查都是以居住地分层的,至少分为城镇和乡村两层。因为城、乡居民的观念、行为和习惯等是很不相同的。中央人民广播电台1992年的全国抽样调查是多级分层的,第一级的分层是按经济发展水平将全国467个地区分成四层:“经济发达地区”、“经济一般发达地区”、“不发达地区”和“贫困地区”,因为根据以往的研究,人们的广播接触行为是与地区的经济发展水平和个人的经济地位相关的。2019/8/2028(四)分层抽样的优点分层抽样比简单随机抽样和等距抽样等方法更为精确,能够通过对较少的抽样单位的调查,得到比较准确的推断结果,特别是当总体较大、内部结构复杂时,分层抽样常能取得令人满意的效果。同时,分层抽样在对总体推断的同时,还能获得对每层的推断。2019/8/2029分层抽样的缺点:首先是层的划分,有时在实际工作中分层并不容易,需要收集必要的资料,从而耗费额外的费用。另外,分层抽样要求各层的大小都是已知的,当它们不能精确得知时,就需要通过别的手段进行估计,这不仅增加了抽样设计的复杂性,而且也会带进新的误差。2019/8/2030(四)分层抽样适用的范围类别各自特点共同点抽样间的联系适用范围简单随机抽样从总体中逐个抽取(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样总体个数较少等距抽样将总体均分成几部分,按预先制定的规则在各部分抽取在起始部分时采用简单随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或等距抽样总体由差异明显的几部分组成2019/8/2031四、整群抽样法(一)整群抽样法的具体操作(二)采用整群抽样的原因(三)整群抽样需注意的几个问题2019/8/2032(一)整群抽样法的具体操作假如我们要进行北京市居民家用电器的拥有状况调查,采用整群抽样方法,那么,我们在北京市3,600个居民委员会中随机抽取20个居委会,这20个居委会中的所有户都成为我们的调查样本。2019/8/2033(二)采用整群抽样的原因原因一:当缺少基本单位的名单而难以直接从总体中抽取所要调查的基本单位。原因二:即使容易获得个体的抽样框,但从费用上考虑,直接从个体抽样获得的样本可能比较分散。原因三:采用整群抽样是抽样调查本身目的的需要。原因四:如果某些总体的各个子总体之间的差异不大。2019/8/2034(三)整群抽样需注意的几个问题第一,整群抽样的随机性体现在群与群之间不重叠,总体的任何一个基本单位都必须且只能归于某一群,群的抽选按概率确定。第二,如果把每一个群看成一个单位,那么,整群抽样就是以群为单位的纯随机抽样。第三,整群抽样对于群而言是非全面调查,对于被抽中群内基本单位而言则是全面调查,是“先部分,后全部”的抽样组织形式,与分层抽样正好相反。第四,整群抽样也是多阶段抽样的前提和基础。2019/8/2035五、多阶段抽样(一)多阶段抽样的特点第一,多阶段抽样对基本调查单位的抽选不是一步到位的,至少要两步。第二,组织调查比较方便,尤其对于那些基本单位数多且分散的总体,由于编制抽样框较为困难或难以直接抽取所需样本,就可以利用地理区域或行政系统进行多阶段抽样。第三,多阶段抽样是多种抽样方法的结合物。(二)二级抽样和分层抽样、整群抽样的比较2019/8/2036名称一级单元二级单元精度(样本含量相同时)提高精度的办法分层抽样抽取全部抽取部分高于简单随机抽样扩大层间差异,缩小层内差异整群抽样抽取部分抽取全部低于简单随机抽样缩小群间差异,增大群内差异,增加群数二级抽样抽取部分抽取部分介于整群抽样和简单随机抽样之间减少一级单元之间的差异,尽量多抽取一级单元(二)二级抽样和分层抽样、整群抽样的比较2019/8/2037第三节非概率抽样一、方便抽样法二、判断抽样法三、配额控制抽样四、雪球抽样法五、非概率抽样的优缺点2019/8/2038一、方便抽样法方便抽样也称任意抽样法,是根据调查者的方便性,以无目标、随意的方式进行的抽样调查活动。例如,某公司的市场营销部选择公司雇员对公司开发的新产品进行初步测试。2019/8/2039二、判断抽样法判断抽样又称目的抽样,研究人员从总体中选择那些被判断为最能代表总体的单位作样本的抽样方法。2019/8/2040三、配