MarketingResearch第四章抽样技术MarketingResearch教学目的与要求:本章主要介绍市场调查中多种抽样方式及应用、样本容量及抽样误差的计算方法。第四章抽样技术MarketingResearch主要内容§4.1抽样调查的基本概念§4.2随机抽样技术§4.3非随机抽样技术§4.4抽样中的误差问题附:有关抽样设计的几个问题MarketingResearch§4.1抽样调查的基本概念一、抽样调查概述二、常用术语三、抽样方案设计MarketingResearch一、抽样调查概述1.定义:指从总体中抽取一部分单位作为样本进行调查,然后根据样本调查结果对总体情况作出推断和估计的调查法。抽样调查的理论原理是数理统计知识。总体样本样本统计量(X)总体参数估计MarketingResearch一、抽样调查概述2.分类:按被抽取机会是否相等,可以分为:①随机抽样:按照随机原则抽取样本。随机原则:完全排除了人的主观应因素影响,使每一个单位都有同等的可能性被抽到。优点:1、抽出样本的分布情况接近总体,样本对总体研究具有充分的代表性。2、有助于调查人员准确地计算抽样误差,并有效的加以控制,从而提高调查的精度。MarketingResearch一、抽样调查概述②非随机抽样:不遵循随机原则,从方便出发或根据主观判断来抽取样本。非随机抽样简单易行,尤其适用于做探所性研究。非随机抽样无法估计和控制抽样误差,无法用样本的定量资料进行统计分析来推断总体。优点:缺点:MarketingResearch一、抽样调查概述3.特点:(1)经济,抽样调查节约人力、物力和财力。(2)高效,抽样调查更节省时间。如城市住户调查。(3)准确。MarketingResearch4、作用:(1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解决。一、抽样调查概述(2)节省费用,争取时效,用较少的人力物力和时间达到满意的调查效果。(3)运用抽样调查对全面调查进行验证。(4)可运用于企业质量管理。举例:对有破坏性或损耗性质的商品质量检验;对一些具有无限总体的调查(如对森林木材积蓄量的调查)等。MarketingResearch二、常用术语1、总体与样本总体:所要研究的对象全体。一般用“N”表示。样本:从总体按一定程序抽取的个体或单元组合。一般用“n”表示。某市在12万名大学生中抽出1000人进行消费结构调查。认识:总体:12万名大学生就是调查。样本:被抽到的1000名大学生。MarketingResearch二、常用术语2、总体指标和样本指标总体指标:即根据总体各个单位的标志值或属性值计算的综合指标。主要有:总体平均数、总体成数和总体方差。样本指标:即根据样本各个单位的标志值计算的综合指标。主要有:样本平均数、样本成数和样本方差。认识:方差比例平均数nN单位数样本总体1NN1nPnXNXxn22()XFN2(1)22()(1)XXfsn2(1)sppMarketingResearch二、常用术语3、重复抽样与不重复抽样重复抽样又称作重置抽样、有放回抽样:即每抽一个单位,登记结果后,又重新放回参加下一次的抽取,这样连续抽足一个样本所需的单位。抽出个体登记特征放回总体继续抽取程序:特点:同一总体单位有可能被重复抽中,而且每次抽取都是独立进行。MarketingResearch二、常用术语不重复抽样又被称作不重置抽样、不放回抽样:即每抽一个单位后,就不再放回参加下次的抽取,每抽一次,总体的单位数就减少一个。程序:特点:同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行。抽出个体登记特征继续抽取MarketingResearch二、常用术语3、抽样框与抽样单元抽样框指对可以供抽样用的所有调查单位的名册或详细名单。认识:例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册……。注意:在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。以提高样本对总体的代表性。MarketingResearch二、常用术语抽样单元指构成抽样框的有限又不重复的个体。1、抽样单元不仅指构成抽样框的目录项,同时还表示该目录项所对应的实际总体特定的一个或一些单元。2、抽样单元可大可小。如:在手机调查中我们抽中一栋居民楼,居民楼是一级单元,而楼中的每个居民就是二级单元。说明:MarketingResearch三、抽样方案设计1、定义:在抽取样本资料以前,预先确定抽样程序和方案。目的:保证样本有代表性,经济、实惠。MarketingResearch2、抽样方案设计的主要程序:三、抽样方案设计定义总体和抽样单位确定所采用的抽样框选择抽样技术确定必要的样本量确定总体目标的估算方法实施抽样MarketingResearch§4.2随机抽样技术一、简单随机抽样二、等距抽样三、分层抽样四、整群抽样五、多阶段抽样MarketingResearch一、简单随机抽样简单随机抽样(SRS)按照随机原则,从总体中不加任何分组、划类、排序,直接地抽取调查样本。如果抽样是有放回的,则称非常简单随机抽样(VSRS)方法:抽签法或随机数法抽签法给总体各单位编号后,把号码写在结构均匀的字签上,将字签混合均匀后即可从中抽取。随机数法利用随机数表进行抽样的方法。MarketingResearch112345678910212345678910312345678910412345678910123456119690446154744526694557285734248116213235237831726457477749527079953678975438797344087217320889837519243372959367838485462244431168684876768935914166539459593823961011891190425920307112059262522966367891004493524940054997654359631530759808083914605885236752463382464051881592689809354454272684201390922864586251025961196389633351354628360949700772814407761962793355469282391779745002413021248929391083647MarketingResearch一、简单随机抽样仅适用于规模不大、内部各单位标志值差异较小的总体应用:优点:(1)简单、直观比较容易理解和掌握;(2)抽样框不需要其他辅助信息;(3)理论上比较成熟,有现成的方差估计公式。缺点:(1)对样本编号困难;(2)样本分散,费用较高;(3)总体方差大时,样本代表性差。MarketingResearch二、等距抽样又称系统抽样先把总体单位按某种顺序排列成行(或按自然顺序),用随机方法抽取第一个单位,以后每隔若干单位抽取一个单位。1、和调查项目无关,如按照门牌号排列;2、和调查项目有关,如按收入给家庭排序。排列:抽选方法:设总体单元数为N,要抽n个单元为样本,先计算抽样间隔k=N/n(取整),在1到k之间抽取一个随机起点r,则被抽中单元的顺序位置是:r,r+k,r+2k,…。MarketingResearch二、等距抽样举例:某企业对购进的10000台电视机的质量进行调查,计划抽取400台作为样本调查,总体编号为1-10000。1、样本间距为K=10000/400=25。2、然后从1-25中任意抽取一个数为样本,假定为第8台,则第2个样本为8+25=33,即抽取第33台作为第2个样本,以此类推,一直抽够400台为止。MarketingResearch关于排序问题的处理办法1.随机排序:排序是随机的,与研究目的无关。如:要调查居民的购买意向,一般按照家庭的住址或地理位置排序。2.选择排序:选择一个与调查变量相关的变量进行排序。如:要调查居民的住房购买意向,按照居民现有住房面积进行排序。尽量选择与研究相关程度高的辅助变量作为排序依据二、等距抽样MarketingResearch关于间隔问题注意间隔与研究现象本身的关系如对集市贸易成交量的调查,间隔就不能用7或30这种与周、月周期一致的数。二、等距抽样MarketingResearch二、等距抽样(1)若抽样间隔与总体的某种周期性变化一致,会得一个差的样本;(2)要知道有关材料,如排序标志;(3)没有一个无偏的方差估计量;误差计算复杂。优点:(1)简便易行,容易确定样本单元(2)分布比较均匀,有利于提高估计精度缺点:国家统计局的调查多采用系统抽样,它便于操作。MarketingResearch三、分层抽样将总体按某个主要标志进行分组,再按随机原则采用简单随机抽样方式从各组中抽取一定数目的总体单位组成样本的抽样组织方式。总体N样本n2NkN1N1n2nkn······等额抽取不等比例抽取等比例抽取描述:MarketingResearch三、分层抽样等比例抽样(PPS)指分层后,按随机原则根据各层中单位数量占总体单位数量的比例抽取各层的样本数量。每层抽取的样本数计算公式为:nNNnii式中:ni为第i层抽出的样本数Ni为第i层的总单位数N为总体单位数n为总体样本数MarketingResearch某电机厂有120万用户,其中:大型:36万户中型:60万户小型:24万户若确定抽取1000户进行调查。例如三、分层抽样MarketingResearch户小型用户抽取数户中型用户抽取数户大型用户抽取数200100012000002400005001000120000060000030010001200000360000适用于各层之间差异不大的情况下各层应抽取的单位数为:三、分层抽样MarketingResearch三、分层抽样非等比例抽样指分层后,不按各层中单位数量占总体单位数量的比例抽取各层的样本数量。一般用最佳抽样或最低成本抽样。最佳抽样:根据各层标准差的大小来调整各层样本数目的抽样方法。nNNniiiiii为第i层的标准差MarketingResearch例如某电机厂有120万用户,其中:大型:36万户中型:60万户小型:24万户若确定抽取1000户进行调查,大型的标准差:5%中型的标准差:2%小型的标准差:3%三、分层抽样MarketingResearch户小型用户抽取数户中型用户抽取数户大型用户抽取数1931000%3240000%2600000%5360000%32400003231000%3240000%2600000%5360000%26000004841000%3240000%2600000%5360000%5360000适用于各层之间差异很大的情况下各层应抽取的单位数为:三、分层抽样MarketingResearch如何科学分层?1.选择好分层的标准根据调查的目的进行选择如要了解消费者的购买力,选择居民的收入水平进行分层。三、分层抽样MarketingResearch2.分层要使层内差异缩小,层间差异增大各层内部的个体差异层与层之间的差异可以提高样本的代表性三、分层抽样MarketingResearch3.分层不宜太多,以免失去层的特性5层合适不超过7层三、分层抽样MarketingResearch优点1.当总体内部类型明显时,可以增强样本对总体的代表性。2.提高了样本指标推断总体指标的精确度。3.有利于了解总体内部的情况。三、分层抽样MarketingResearch问题1.层的划分问题实际调查中,不易划分2.要求总体容量N已知三、分层抽样MarketingResearch适用范围1.对各层进行