第十一十二章调研样本设计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十一、十二章调研样本设计一、样本和抽样的基本概念(一)调查总体与抽样总体从市场调查的范围来看,将所有调查研究的对象的全体称为调查总体(简称总体),有时也可称为全域。定义总体要明确这样几件事:总体的范围、性质和构成。抽样总体是由抽样调查时被抽取的调查对象所构成的集合(简称样体)。(二)总体单位和样本单位总体单位就是构成总体的每一个单位。样本单位就是抽样调查时被抽中的总体单位,也叫抽样单位。一定数量的样本单位所组成的集合又称为样本。样本单位的多寡又称样本容量的大小,即所谓的大、小样本。(三)总体指标与样本指标根据总体各个单位标志值计算出来的综合指标成为总体指标,用“X”表示。根据样本中各样本单位标志值计算出来的综合指标称为抽样指标,用“x”表示。指标经常使用的主要有两种,一种为平均数,另一种为成数。成数一般用P(总体指标)或p(样本指标)来表示。1.总体指标(1)总体平均数。总体平均数是调研总体所研究标志的平均值,有简单式和加权式两种计算方法,其计算公式为:简单式:NXXNii1(公式3-1)式中:iX为总体单位标志值,N为总体单位数目。加权式:niiniiiNNXX11(公式3-2)式中:iX为各组标志值,iN为各组总体单位数目,n为组数。(2)总体成数。总体成数是指一个现象有两种表现时,其中具有某种标志的个体数在总体中所占的的比重。总体成数计算公式为:NNP/1NNQ/0(公式3-3)式中:N为总体单位数目,P(或Q)为成数,1N、0N分别为两种表现的总体单位数。并且1N+0N=N,P+Q=1。(3)总体方差和均方差。总体方差和均方差是用来说明总体指标变异程度的指标,是理解和应用抽样调查时很重要的基础指标。方差与均方差的关系是平方和开平方的关系,可分别计算平均数和成数的方差和标准差。总体平均数方差和均方差的计算公式的简单式为:简单式:NXXi22)((公式3-4)NXXi2)((公式3-5)加权式:iiiNNXX22)((公式3-6)iiiNNXX2)((公式3-7)总体成数方差与均方差的计算公式为:2=PQ=P(1-P)(公式3-8)=)1(PPPQ(公式3-9)式中:2、分别为方差、均方差,其他符号含义同前。2.抽样指标常用的抽样指标有抽样平均数、抽样成数、抽样方差和均方差,其计算方法与调研总体综合指标计算方法相同,只是计算公式中所采用的符号有所不同。市场调研中,一般用抽样平均数、抽样成数、抽样方差和均方差来推断总体平均数、总体成数、总体方差和均方差。(四)抽样框及抽样框的选择抽样框就是所有总体单位的集合,是总体的数据目录或全部总体单位的名单。最理想的抽样框起码具有下面的一些特点:1.包含尽可能多的样本单位,即尽可能地将所有样本单位都包括在这个集合之中。2.所有样本单位出现在这一集合中的概率相等,即在这一抽样框中每个样本单位出现的机会相同,从而保证每个样本单位被抽中的机会相同。(五)调查误差和抽样误差调查误差是指调查的结果和客观实际情况之间的偏离,一般以工作性误差和代表性误差两种形式存在。工作性误差,是在市场调查工作过程中,由于调查方案有缺陷、调查方法不科学、调查人员不诚实或者由于抄写、记录、登记、计算等工作上的失误而导致的误差。这种误差是能够通过采取一定措施来避免的。代表性误差是指用样本代表总体、推断总体时产生的误差。代表性误差只在非全面调查中存在,具体又分为系统性偏差和抽样误差两种。系统性偏差是由于调查者违背抽样的随机原则,人为地选择偏高或偏低单位进行调查而产生的误差,它是调查者通过努力可以力求避免的;抽样误差则是在不违背随机原则的情况下,必然出现的误差,它是抽样调查固有的代表性误差。抽样误差的大小,主要受以下三个因素的影响:1.被研究总体各单位标志值的差异程度。2.抽取的调查个体数目。3.抽样调查的组织形式。二、抽样调查的特点及程序(一)抽样调查的特点抽样调查主要有如下几方面的特点:1.费用低、易推广。2.质量高,可信度好。3.时间短,收效快。(二)抽样调查的适用情况1.用于认识那些不能或难以采用全面调查的总体的数量特征。2.用于认识不适宜进行全面调查,但又必须了解总体数量特征的事物。3.用于认识不必进行全面调查的总体。4.用于搜集灵敏度高、时效性强或时间要求紧迫的信息资料。5.在核对和补充普查准确性时采用抽样调查。此外,抽样调查和推断还可以用来对总体特征的某种假设进行检验,并判断这种假设的真伪,决定方案的取舍,为行动决策提供依据。(三)抽样调查程序1.界定调查总体及样本单位一般来说,调查总体可以从以下几方面进行描述:地域特征、人口统计学的特征、产品或服务使用情况、对产品或服务的认知程度等。样本单位是抽样的基本单位,有时是个人,有时是家庭,有时是公司等,我们明确了同质总体的特征,在市场调查的操作过程中还要选择合格的样本单位。另外,被访者获得商品或服务信息的渠道也是调研人员应该考虑的因素。2.选择资料收集方法在进行抽样设计时,要反复比较不同的资料收集之方式、争取做出最好的选择。3.选择抽样框在实践中,抽样框可以是由一定的顺序的名单的形式,也可能是以一定的逻辑关系形成的顺序表。调研实践中,有时较易于得到的抽样框包括了部分非总体单位,调研人员仍然可以使用它,但是需要注意对样体按照确定的总体单位特征再进行过滤。4.选择抽样方法抽样方法的选择取决于调查研究的目的、调查问题的性质以及调研经费和允许花费的时间等客观条件。抽样方法可以分为两大类:随机抽样和非随机抽样(也称概率抽样和非概率抽样)。随机抽样方法是对总体中每一个总体单位都给予平等的抽取机会的抽样技术。★随机抽样方法的优劣表现在:优点:(1)因其排除了人为的干扰,抽取的样本可以大致上代表总体。(2)能够计算调查结果的可靠程度。可通过概率推算抽样误差(又称代表性误差),并将误差控制在一定范围内。缺点:(1)对所有调查样本都给予平等看待,难以体现重点。(2)抽样范围比较广,所需时间长,参加调查的人员和费用多。(3)需要具有一定专业技术的专业人员进行抽样和资料分析。一般调查人员难以胜任。非随机抽样方法是指在抽样时,按照一定的主观标准来抽取样本的抽样技术。★非随机抽样方法的优劣表现在:优点:(1)可以充分利用已知资料,选择较为典型的样本,使样本更好地代表总体;(2)可以缩小抽样范围,节约调查时间、调查人员和调查费用。(3)操作方便,易于实施,统计上也远较随机抽样简单。缺点:(1)无法判断其误差,检查调查结果的准确性。(2)有目的的非随机抽样可能会导致系统的排除或过分强调研究对象的个性特征,评估非随机抽样的总体质量有很大的困难。在进行实际市场调研时,调研人员要根据不同的调研要求和目的,选择最合适的抽样技术,才能起到良好的效果。★在选择抽样方法时,需要考虑的因素可以有以下几个方面:(1)如果调研人员在最后使用各种统计学的方法分析与处理调研数据,确定调研单位的方法必须是随机抽样,以保证调研数据对总体具有足够的代表性。(2)如果市场调研在方案设计中就明确规定最终必须获得具有一定准确性和把握性的调研结果,那么在确定调研单位时,就应该选择随机抽样的方式。(3)如果市场调研存在一个近乎理想的抽样框,就可以选择随机抽样的抽样方法。(4)在调研人员没有掌握随机抽样的程序、原理和原则的情况下,或者由于调研的时效性要求越来越高,调研的频度也越来越大,研究人员也常采用非随机抽样的方法。5.确定样本容量样本容量确定的原则是控制在必要的最低限度,但要能够尽可能准确和有效地推断总体特征,获得调研信息。6.制定抽取样本的操作程序对于随机抽样,这一程序显得尤为重要,否则,随机抽样的随机性将得不到保障,调查结果将变得不可信。例如,对某城市进行电视收视率调查,其总体单位为住户。如果已有城市的街道名单,并且依照随机数码表确定在某条街道抽取5户进行调查,则可以进一步制定一个具体入户调查抽样操作程序。入户调查抽样操作程序为:⑴到达街道找到门牌号为1号的第一个住户。⑵按照门牌编号顺序抽取样本户。⑶从第一户开始(第一户不作为样本户),每隔20户确定一个样本户。⑷如果一个门牌号为多户,可继续沿“附”号顺序抽样。如果该多户门牌号内未编“附”号,可按如下原则、顺序抽取:①进入多户门牌号院内,按右手方向为先的原则数户;②如果遇到楼房可按其所编的栋、单元及门牌号数户;③如果楼房也未编号,可按右手为先的原则逐栋、逐户数户。⑸对抽取的住户记下门牌号或具体位置(对于多户门牌号内抽取的样本户应画一示意图)。⑹按上述方法抽取样本户直至抽足5户为止。⑺如果上述方法数到街道最后一户时仍不足5户,可将开始时的第一户放入数户抽样顺序编号中继续数户抽样。如果这时正好抽到第一户,则放弃第一户,并将抽样间隔调整为12户或者其他与“20”不重复的频率间隔。⑻对于上述方法抽中的住户应排除一切困难进行调查,如果因该户无电视或长期不居住在此地等其他无法调查的原因需要排除,应报调查项目负责人批准后方可排除并重新按上述方法抽样。在实施适宜操作的抽样计划前,应先对其进行充分的讨论研究。在调查现场,要完全熟悉抽样背景、抽样区域,然后再进行抽样。遇到特殊情况不能拿定主意时要多问,还要把抽取样本的详细情况清楚地记录下来,保证调查能够找到、联系到。三、随机抽样方法及其应用(一)简单随机抽样方法及其应用简单随机抽样的优点是方法简单,并且保证每个总体单位在抽选时都有相等的被抽中机会。当进行相对较小的总体的调研时,这一抽样技术非常有效。但是简单随机抽样的局限也很明显:①该法需以一个完整的总体单位表为依据,但是在现实中编制这样一个完整的总体单位表往往是极其困难的;②这一方法要求事先对所有研究对象编码,当研究对象较多时,这一工作非常复杂,也不易做到;③这一方法的精度往往较低,标准差较大;④该法抽出的样本是否能代表目标总体,值得商权,当样本较小时尤其如此。(二)系统抽样方法及其应用系统抽样也称等距随机抽样,它是先将调研总体的各个体按一定标志排列起来,然后按照一定顺序和一定间隔来抽取样本个体。其应用程序为:1.先按一定标志把总体中的个体顺序排列。排列所依的标志有两种:一种是按与调查项目无关的标志排队。另一种是按与调查项目有关的标志排列。2.确定一个抽样间隔,并在此间隔基础上选择样本单位。计算公式为:抽样间隔=总体单位数(N)/样本单位数(n)3.确定起始抽号数,即抽样起点。4.按抽样间隔继续抽取余下的个体,直至抽够为止。系统抽样与简单随机抽样相比更为简便,耗时更少,更为经济。该法可使中选的个体比较均匀地分布在调研总体中。系统抽样也有一定的局限性,主要表现在:①运用系统抽样的前提是要具有调研总体每个个体的有关资料,这是一种细致而又繁琐的工作。②可能会出现系统误差。(三)分层抽样方法及其应用分层抽样方法将总体各单位先按照与我们关心的对象特征标识相关的标志进行分组(层),然后在各组(层)中采用简单随机抽样或系统抽样方式,确定所要抽取的单位。分层抽样实质上是科学分组和抽样原理的结合。1.等比例分层抽样等比例分层抽样是按各层(或各类型)中的个体数量占总体数量的比例分配各层的样本数量。用公式表示为:NNnnii或nNNnii式中:n为样本量;N为总体单位数;i为各组(层)单位数。例如,某地共有居民N为20000户,按收入高低进行分类,其中,高收入居民N1为4000户,中等收入居民N2为12000户,低收入居民N3为4000户。从中抽选200户进行购买力调查,则各类型应抽取的样本个数为:高收入样本数目为nNNn114000÷20000×200=40(户)中等收入样本数目为nNNn2212000÷20000×200=120(户)低收入样本数目为nNNn334000÷20000×200=40(户)这种方法简单易行,分配合理,计算方便,适应各类型之间差异不大的分类抽样调查。如果各类之间差异过大,则不宜采用,而应采用非等比例分层抽样。2.非等比例分层抽样非等比例分层抽样不是按各层中个体数占总体数的比例分配样本个体,而

1 / 40
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功