1第二章:抽样调查技术P90•主要学习内容•补充:全面市场调查补充:典型和重点市场调查方式•随机抽样市场调查方式•非随机抽样技术•抽样误差2第一节全面市场调查一、概念、特征、适用情况•1、概念:•为了搜集比较全面、精确的调查资料,对调查对象(总体)的全部样本所进行的逐一的、无遗漏的专门调查。3•2、优点:•有可能取得比较全面、准确的资料•缺点:•工作量大、费用高、时间长•资料不一定准确•3、适用情况:•调查对象的总体比较小,并且分布比较集中的情况。4二、全面调查的实施要点•1、确定一个统一的调查时点•2、统一调查项目•3、要有统一的步骤和方法•4、选择适当的时间•根据调查的任务和条件、调查对象特点选择。5三、全面调查的具体做法•1、向每一个调查样本发放调查表,由对方按规定填报。•小提示:适合于谁对谁的调查呢?•2、调查人员按照调查项目的要求,对调查对象进行访问或观察。•小提示:适用于谁对谁的调查呢?6•3、借用机关、团体、企业等单位的统计资料,再进行汇总•4、搭便车。利用国家或地方、部门所组织的普查机会,搜集自己的资料。7第二节典型和重点市场调查方式一、典型调查方式•1、含义•对调查对象作全面分析、比较的基础上,有意识地选择少数具有代表性的样本作为典型,对其进行比较系统、深入的专门调查。“解剖麻雀”8•2、特点•优点:•1)可节省工作量和费用•2)可和研究结合起来,揭示事物的内在规律。•缺点:•1)典型单位的选择受主观影响很大•2)用调查结果推算总体,缺乏有力的科学依据,难以进行定量分析•3)难以进行连续性调查。9•3、典型市场调查的几个关键问题正确选择典型单位正确使用调查结论将调查和研究结合起来进行直接选典分类选典10二、重点市场调查方式•1、含义:•在调查总体中,针对选择的一部分重点样本进行的非全面的调查。•重点单位:在总体中处于重要地位的样本•在总体和总量中占绝对大比重的样本•重点单位不具有普遍的代表性•2011.3.1812第三节抽样市场调查概述P90•一、抽样调查概念•是指从调研总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。•包括:概率抽样非概率抽样P9113二、抽样调查的特点⒈优点:①时间快,收效快。②质量高、可信程度好。③费用省、易推广。⒉抽样调查的不足•对人员的数理统计和统计学原理要求较高14三、与抽样调查相关的重要概念•1.总体•调查对象就是调查总体。2.样本与样本单位样本是有一定数量的样本单位所组成的集合。样本单位的多寡又称样本容量的大小。样本单位是按一定的抽样方法从总体中抽取出来。•3.抽样框将抽样单位按某种顺序排列编制的名单,其形式可以是一张表格、名册或地图15三、抽样调查的一般程序确定调查总体抽取样本设计样本方案获得总体名单实施调查推断总体16第四节概率抽样技术P94一、简单随机抽•样纯随机抽样、无限制随机抽样•(一)方法:1、抽签法或抓阄法•适用情况:总体单位数少的情况。将调查总体的每个单位编上号码将号码均匀打乱任意从中抽选,抽到一个号码,就作为一个单位直到抽足预先规定的样本数目为止172、乱数表法调查总体中的所有单位加以编号,根据编号的位数确定适用若干位数字查乱数表直到抽足预定样本数目为止183、计算机直接随机抽取:将编号输入机器,由机器直接随机抽取。4、摇码机直接随机抽取•(二)适用情况?:•总体规模小•总体内各单位间的差异较小•调查对象的情况不明,难以分类或分群19二、等距(系统)随机抽样•操作步骤:第一步:将总体各单位按某个标志进行排序和编号•可按无关标志排序:如姓名笔划多少、身份证号码等•也可按有关标志排序:如家电市场调查,按收入排序等•例:对110商户按门牌号排队编号,从1到110第二步:确定抽样间隔•确定抽样间隔=总体单位数÷应抽样本数=110÷11(应抽样本数)=10第三步:在1----10号间按纯随机方法抽取一个作为起始号•如抽中的是6号第四步:从6号开始,按照10的间距抽取其它样本单位。•即616263646566676869610621机械抽样的优点:•样本分布均匀,提高其代表性。缺点:1)需要有祥细、具体的相关资料,以便编号2)当抽样间隔和调查对象本身的节奏性(循环周期)相重合时,会出现较大误差。22三、分层(分类)随机抽样•将总体各单位按某个标志或属性进行分层或分类,然后在每一类或每一层中纯随机抽取•操作步骤如下:分层或分类在每一层或类中分配样本数在每一层或类中进行简单随机抽样•两种两种样本数分配方法:1、等比例分层随机抽样•例:某居住小区有100户人家,其中高收入户20户、中等收入户50家、低收入户30家。计划抽10户,•由高的应抽2户、中的应抽5户、低的应抽3户。•思考:上述案例中采用此种方法合理吗?为什么?242、分层最佳抽样法(非等比例抽样)各层(类)样本数的计算公式:Ni----第i层应抽的样本数n----应抽样本总数Ni----第i层单位总数Si-----第i层标准差•2011.3.23•例:某公司要调查某地家用电器的潜在用户,这种商品的消费跟居民的收入有关,所以按收入分类。户数总数有20000户•已定样本单位总数n=200户•高收入户N1=12000户,占10%,标准差S1=300元•中收入户N2=6000户,占30%,标准差S2=200元•低收入户N3=12000户,占60%标准差S3=50元标准差27•若按不等比例抽样,各层应抽样本数为:•∑NiSi=N1S1+N2S2+N3S3•=2000×300+6000×200+12000×50•=2400000•高的n1=(n×N1S1)÷∑NiSi=200×2000×300÷2400000=50户•中的n2=200×6000×200÷2400000=100户•低的n3=200×12000×50÷2400000=50户•思考:这种方法更加科学,但是有什么困难吗?•分层随机抽样技术的优点:P99本部分最后三行四、分群随机抽样(整群抽样)•将调查总体分成若干个差异不大的群体,从这些群体中按随机抽取。一级整群抽样:对所抽中的群中所有个体进行调查二级整群抽样:对抽中群中的个体再进行简单随机抽样三级整群抽样:对抽中的群再分为若干子群,简单随机抽取若干子群,对抽中的子群中的所有个体再进行简单随机抽样。与分层抽样的区别:分层抽样:各层之间差异大,每层内各单位间的差异小分群抽样:各群之间的差异较小,而每群内各单位间的差异可能较大。和分层抽样相比,分群抽样的优点:样本比较集中,便于调查,可节省费用。缺点:误差较大。•思考题:•我想对全校大三学生的电脑需求情况进行调查,假如全校大三学生各班之间的购买力方面的差异很微小,请问用分层随机抽样呢,还是用分群随机抽样?几种概率抽样方法的选择与比较•在选择时要考虑几个因素:P1001、对抽样误差的要求误差由小到排序:最小的:按有关标志排序的系统随机抽样其次小的:分层随机抽样(分层最佳的误差等比例分配样本的)其三:按无关标志排序的系统随机抽样、简单随机抽样、整群随机抽样•2、对调查对象本身的了解程序•3、人力、物力、经费和时间等条件•节省人力、物力、经费和时间的方法是:•整群随机抽样•多阶段随机抽样33第五节:非随机抽样技术•一、方便抽样:也称:任意抽样、方位抽样•用此法的前提条件:总体中各单位间是同质的•例如:选择家中或宿舍中有人的街头拦截调查按客户名单或通信地址进行调查如在报刊或网上进行问卷调查利用赠送样品的机会发调查问卷•二、判断抽样技术•判断抽样(目的抽样):按照调研者的主观经验判断选定调研单位的一种方法。35•1、可由专家判断抽样•1)多数型:在总体中多数单位中挑选样本•2)平均型:挑选具有代表平均水平的单位作为样本。•2、也可利用统计判断选择样本,利用总体的全面统计资料按照某个标准选。•此法的优点:简便易行•缺点:调研者主观判断容易产生误差36三、配额抽样•配额抽样:在总体中按照某些属性或特征(控制特性)进行分类,然后根据各类在总体中的比重分配样本数,最后进行任意抽样。•与分层随机抽样不同•与判断抽样也不同:37配额抽样判断抽样抽取样本方式不同从各类中分别任意抽取样本从总体的某个层次中抽取若干典型样本抽样要求不同注重量的分配注重质的分配抽样方法不同复杂精细简单易行38•1、独立控制配额抽样•只规定按一种控制特征分配样本•如年龄样本分配数20岁以下21—40岁41—60岁61岁以上50人80人40人30人合计200人职业样本分配数一般工人公务员及科教人员其他80人70人50人合计200人39•2、相互独控制配额抽样•同时对具有两种或其以上控制特性的每一个样本都作出具体规定。200507080合计50804030122288182416122034161020岁以下21—40岁41—60岁61岁以上合计其他公务员及科教人员一般工人职业年龄样本数40•四、滚雪球非随机抽样•调查者先通过少数自己可以确定的样本单位进行调查,再通过这些样本单位去发展其他同类单位,如此下去,样本越来越多。42第六节抽样误差P106--108一、抽样误差的概念误差样本的代表性误差系统的代表性误差(由抽样方法不当引起)偶然代表性误差(抽样误差)实际误差(不可计算)平均抽样误差允许的抽样误差调查误差43二、影响抽样误差的因素•纯随机分层、分群、机械•分层分群•重复抽样不重复抽样•按不相关标志排队的机械抽样按相关标志排队的机械抽样1、总体各单位间的差异程度。2、样本单位数目的多少。3、抽样方法的不同。如果差异程度大,抽样误差大还是小?大大如果样本容量小,则抽样误差大还是小?三、平均抽样误差的计算1、平均数指标抽样误差的计算•例子:对1000名消费者调查,按重复抽样抽了49名,样本标准差80元。平均消费水平为800元。n:样本容量49σ:可用样本调查的标准差表示8045•简单随机抽样•重复抽样条件下的误差计算公式804911.4nn:样本容量σ:可用样本调查的标准差表示46•不重复抽样条件下的误差的计算228049491000(1)(1)11.115nnNN:总体单位数2、成数指标抽样误差的计算•例子:某区居民家庭30万个,对样本户的调查结果显示,电脑的普及率达到40%。该市电脑的社会拥有量为48(2)成数指标抽样误差的计算•重复抽样条件下的误差计算(1)0.4*(10.6)1000.0494.9%PPn49•不重复条件下的抽样误差的计算(1)0.4(10.4)1001005000(1)(1)4.85%PPnnN50四、点估计和区间估计值的计算(一)点估计值的计算•例1:据全校学生的抽样调查,样本平均每月日常开销300元。则全校学生月度消费总额为300*1.5万名=450万元•如2:某市居民家庭30万个,对样本户的调查结果显示,彩电的普及率达到98%。该市彩电的社会拥有量为•30万*98%=29.4万台。512、区间估计值的计算•计算公式:区间:平均数加减允许抽样误差大小成数加减允许抽样误差52•计算公式:•例:对1000名消费者调查,按不重复抽样抽了49名,样本标准差80元。平均消费水平为800元。••如果允许抽样误差为:2倍的平均抽样误差。则•1000名消费者的消费水平的区间值为:•800-2*11.115-----800+2*11.115,即777.77----822.23•把握程度为(查正态分布表)95.45%53四、影响抽样数目的因素•1、总体各单位间的差异大小如果差异程度小,抽样数目应该多些还少些?少•2、允许误差大小若允许误差大,抽样数目应该多些还少些?少•3、不同的抽样方法简单随机抽样与其它随机方法相比,抽样数目应该多些还少些?多