第4章 抽样调查技术要点

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

北京邮电大学世纪学院抽样调查技术韩璐重点章节为了获取总体的信息及特征,可以选择普查和抽样调查两种方法。总的来说,与普查相比抽样调查具有经济、及时、准确和高效的特点。普遍调查抽样调查•需要投入大量的人、财、物和时间•获取的信息全面,但准确性未必高•在对精度要求小,但是对整体状况详细性要求高时可采用这种方法,比如人口普查,农业普查、企业员工整体素质普查等。•时间短、效率高,投入资源较少•调查结果的正确性较高,但是获取的信息全面性不如普查•可以通过统计推断技术来估计调查总体的各项指标,是企业经常使用的调查研究方法。普查与抽样调查抽样调查的定义抽样调查又称样本调查,是指按照随机原则,从研究总体个单位中,抽取部分单位作为样本,按照以样本的调查结果对总体的数量特征做出具有一定可靠度和精确度的估计或推断的一种调查方法。抽样调查的理论基础是概率论。抽样调查是什么?抽样调查要遵循随机原则吗?需要从研究总体中抽取样本吗?能够可靠或准确的估计总体样本吗?有理论基础吗?——概率论简单随机抽样系统抽样整群抽样分层抽样方便抽样配额抽样滚雪球抽样判断抽样抽样方法概率抽样非概率抽样抽样调查的分类概率抽样非概率抽样两种抽样的区别概率抽样又称随机抽样,是指按照随机原则抽取样本,在抽取样本时排除主观因素影响,不进行有意识的挑选,使每个单位都有一定机会被抽中。非概率抽样,它不遵循随机原则,而是从方便、快捷出发抽取样本,或是根据主观有目的地挑选样本。•遵循随机原则•客观抽样•每个单位都有相同机会•不遵循随机原则•主观判断抽样•方便、快捷的抽取样本优:从概率样本中获得的信息含量较高。缺:抽取样本技术复杂,必须有合适的样本框,成本较高,对抽样人员专业技术要求高。优:操作简便、时效快、成本低,适合做探索性研究和预调查。缺:无法估计和控制误差,无法用统计方法来推断总体。第一步:定义有关的总体抽样方案的设计步骤第二步:获得总体的名单第三步:设计样本方案明确总体:1)抽样的单位是什么?(家庭还是个人)2)时间限制,需要获取哪一时间段的信息?3)空间限制,局限于哪个区域的信息?建立抽样框1)所有的样本均从抽样框中得到2)抽样框误差会影响分析结果的可靠性确定样本数量和抽样方法1)确定抽样数量2)根据样本特征选择抽样方法概率抽样简单随机抽样简单随机抽样又称单纯随机抽样、纯随机抽样、无限制随机抽样,它对调查总体不经过任何分组、排队,完全凭着偶然的机会从中抽取个体加以调查。(1)抽签法该方法适用于调查总体中个体数目较少的情况。例如:北京小轿车摇号(2)随机数字表法该方法需要使用摇码器生成乱数表,而后在从中抽取,也是适用于数量不大的总体。随机数字表0947437386162294773997742467628482532731167662276663017863591256859926332134122955595635645760328644从第1行第4列开始抽取,小于70的数。如果样本不够那么再从其他列抽取,直至抽够为止。(3)计算机抽取使用统计软件中都有的抽取随机样本的功能,从中抽取,该方法简便快捷,但是需要注意,软件生成的随机数是伪随机数,随机效果并不理想。例如:商场让个人用电脑抽奖的活动简单随机抽样的优点及局限性优点:方法简单,易操作,理论上是最符合随机原则的。简单随即抽样适用于总体的个数不太庞大,总体分布较为均匀的情况。局限性:(1)采用简单抽样必须对个体进行编号,当总体样本巨大,且不断产生时逐一编号比较困难。(2)当调查总体的标志变异程度较大时,简单抽样的代表性就会下降。(3)简单抽样样本较为分散,需要的调查投入较大。系统抽样系统抽样是指将总体中的单位按某种顺序排列,在规定的范围内随即抽取起始单位,然后按一定的规则确定其他样本单位的抽样方法。抽选距离=Nn=kN——调查总体数;n——样本数;k——最接近N/n的整数。排序的标志:①按与调查项目无关的标志排序,如电话号码排序;②按与调查项目有关的标志排序,如最近购买时间。例:从某小区600户家庭中抽选50户进行消费习惯调查,可以利用小区物业管理的现有名册按顺序编号排序,从第1号编至600号。抽选距离=Nn=1260050=抽取方式:从第一个12户中用简单随即抽样的方式抽取第1个样本个体,假如抽到的是8号,则后续依次抽中20号32号44号……,直至抽够50户为止。系统抽样的优点及局限性局限性:(1)需要调查总体中每个个体的详细材料,尤其是按有关标志排序时,较为困难;(2)当抽选间隔与被调查本身的节奏性相重合时会影响调查精度。系统抽样适用于总体时间周期性不强的情况。优点:操作简便,只要随即确定一个起始单位整个样本就可以确定了。当研究对象的标志变异程度较大,又不可能抽取更多样本个体时,这种方法能比较均匀的调查总体。例:对军队中士兵对待战争的积极性进行调查,采用系统抽样的方法,将士兵的编号按班排序(每班10人),进行抽样,从1号开始抽取,接下来是11号、21号……,调查发现士兵对待战争的积极性很高。但是经过对样本进行研究发现,被抽到的士兵都是每班的班长,样本的代表性就有问题了!分层抽样分层抽样,是指先将调查总体的所有个体按某一重要标志进行分类(分组),然后在各类(组)中采用简单随即抽样或系统抽样方式抽取样本个体的抽样方法。分层抽样主要是希望增加样本的代表性,避免单纯随机抽样的样本过于集中于某种特性或完全无某种特性。N=∑Ni=N1+N2+N3+…+Nk进行分层抽样时,先将整个母体按照各种特性划分成i个副次母(层):n=∑ni=n1+n2+n3+…+nk再由各层中随机抽取样本单位若干个,如n1,n2,…,nk根据样本在各层中分配方法不同,可以分为等比分层抽样和非等比分层抽样两种方法。1.等比分层抽样:按各层中个体数量占总体数量的比例分配各层的样本数量。例:某产品的用户共有5000个,按用户的“年平均支出”将其分为“大客户”、“一般客户”和“临时客户”。从中抽取800个用户进行消费者调查。客户类型各层客户总数量各层占比应抽取样本数大客户125025%800*25%=200一般客户250050%800*50%=400临时客户125025%800*25%=200等比分层抽样简便易行,分配合理,计算方便,适用于类型之间差异不大的分层抽样调查。2.非等比分层抽样:按其他因素(如各层平均数或成数标准差的大小,抽样工作量或费用的大小等)调整各层的样本个体数。非等比分层抽样主要在于减低各层之间的标准差,使母体平均数的估计更加精确。ni=n×NiSi∑NiSini——各层应抽出的样本数;n——总样本数;Ni——各层的调查单位总数;Si——各层调查单位的标准差。非等比分层抽样适用于各层之间相差悬殊或标准差相差较大的情况。例:某产品的用户共有5000个,按用户的“年平均支出”将其分为“大客户”、“一般客户”和“临时客户”。从中抽取800个用户进行消费者调查。客户类型各层客户总数量Ni样本标准差SiNiSi乘积抽取的样本大客户1250100125000800*0.17=136一般客户2500150375000800*0.5=400临时客户1250200250000800*0.33=264∑N=5000750000800可以看出,标准差较大的抽取的样本个体也较多,这样可以平衡标准差的作用。但准确了解各组标志值变异程度的大小比较困难。分层抽样的优点及局限性优点:把科学分组方法和抽样原理结合,能划分出性质比较接近的组,以减少标志值之间变异程度,然后按随机原则,可以保证大数法则的准确运用。比前两种抽样更准确,能得到比较准确的推断,尤其是总体数目较大,内容结构复杂时。分层抽样优点较多,局限性较小,是调查中常用的抽样方法。局限性:(1)在调查前准确了解各组标志值变异程度大小比较困难。(2)划分层次时,应尽量使各层之间具有显著性差异,不致混淆。分层数目也不宜过多,各层内各单位应尽量保持相似。整群抽样整群抽样也叫分群抽样,是指将总体分解为群,抽样直接抽取群,对抽中群中的个体单位全部或随机抽取部分进行调查(一级整群抽样、二级整群抽样、三级整群抽样),以此来推断总体的一般特性。整群抽样时,各群的特性应尽量保持相近,如人口、经济等。但每一群内部则应具有差异性。如:初级调查单位(如地区):具有相同性次级调查单位(如家庭):具有差异性整群抽样与分层抽样刚好相反:高收入层高收入高收入高收入中等收入层中等收入中等收入中等收入低收入层低收入低收入低收入分层抽样第一群高收入第二群中等收入第三群低收入整群抽样高收入中等收入低收入高收入中等收入低收入思考:1、调查某产品消费者可支配收入去向时,可采用哪种方法?2、调查一线城市消费者耐用品消费状况时,可采用哪种方法?3、调查北京地区高校大学生用于购买电脑消费状况时,可采用哪种方法?分层抽样整群抽样整群抽样分层抽样系统抽样系统抽样分层抽样整群抽样的优点及局限性优点:组织抽样和实施调查比较方便,节省了费用和时间。局限性:(1)与其他抽样方式相比,在抽样个体数目相同的条件下,抽样误差较大,代表性较差。(2)采用整群抽样时,一般都要比其他抽样方法抽选更多的个体,以降低抽样误差,提高结果的准确性。(3)抽样结果的可靠性还取决于群与群之间的差异大小,差异越小,整群抽样结果就越准确。在大规模市场调查中,当群体内各个体间差异性较大,而各群之间差异性较小时,适合采用整群抽样。几种概率抽样方法的选择与比较对抽样误差大小的要求:•有关标志值排队的系统抽样方式误差最小;•分层抽样、按无标志值排队的系统抽样方式其次;•简单随即抽样和整群抽样方式误差较大。抽样误差大小调查对象本身特点的要求:•有无总体的全面、详细的资料,如果没有就无法按有关标志值排队进行系统抽样;•与对调查对象了解的程度也有关系。调查对象特点人、财、物和事件等各种调查条件的要求:•样本的分散程度大、调查往返的时间长和费用大的情况下可以考虑整群抽样。调查条件应当注意,强调根据调查要求和调查对象特点选择合适的抽样方式,并不否认几种概率抽样方式的结合运用。在实际调查中,特别是在复杂、大规模的市场调查中,抽取的调查个体一般不是一次性直接进行的,而是采用两阶段或多阶段抽取的方法。非概率抽样在以下情形下可以考虑进行非概率抽样:(1)由于客观条件的限制,无法很好的进行概率抽样;(2)调查人员具有丰富的积累,凭经验可以抽选出很好的样本;(3)调研委托方对抽样误差没有过多要求,不需要对总体参数进行区间估计。常用的非概率抽样方式有:方便抽样、判断抽样、配额抽样和滚雪球抽样四种。方便抽样方便抽样又称便利抽样或任意抽样,样本的抽选完全从调查者的方便或便利出发。1.入户调查2.拦截式访问3.利用客户名单进行调查4.将问卷通过传播媒体(如纸媒、网络)上,被调查者自填后寄回。节省费用和时间,但样本信息不适用于对总体参数的推断,预调查时可以采用,正式调查较少采用。判断抽样判断抽样是指根据调查人员的主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查对象的抽样方法。1.专家判断后选择样本:平均型与多数型2.利用统计资料判断、选择样本简便易行,符合调查目的和特殊需要,被调查者配合较好,资料回收率高。但是容易发生主观判断抽样误差。配额抽样配额抽样也叫定额抽样,是指将总体中的各单位按一定的标准划分为若干个类别,将样本数额分配到个类别中,在规定的数额内由调查人员任意抽选样本。配额抽样可分为独立控制配额抽样和相互控制配额抽样两类。收入水平高50中50低50总计150年龄20-29岁4030-44岁4045-64岁4065岁以上30总计150收入水平男75女75总计150独立控制配额抽样调查人员可以将某个单一的特征的分类作为抽样配额的标准。如按收入分,高、中、低各抽50个,而不用规定高收入中男女比例或年龄分布。样本容易偏向某一组别,从而影响样本代表性。相互控制配额抽样收入水平总计高中低性别男女男女男女年龄20-29岁446610104030-44岁668812125245-64岁335511113865岁以上22335520总计15

1 / 56
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功