第二章抽样设计要点:1、掌握抽样设计的几个基本概念2、掌握抽样设计的基本方法3、掌握确定样本量的方法第一节抽样设计的基本概念1、总体——指研究对象的全部2、样本和样本量——样本是指每一个被抽到的个体或单位。样本中包含个体或部分的数量就是样本量。3、抽样单元——为了便于实现随机抽样,常常将总体划分为若干个互不重叠的部分,每一个部分就叫做抽样单元。4、抽样误差和非抽样误差由抽样引起的误差就叫做抽样误差;而在调查过程中由于人为因素造成的误差则是非抽样误差。5、随机性原则和效果最佳原则随机性原则要求每一个样本被抽取的可能性应该是一样的,即机会均等。效果最佳原则要求在特定精度要求下,使调查费用最少。第二节抽样的基本方法抽样方法有两大类:随机抽样和非随机抽样。一、随机抽样(概率抽样)1、简单随机抽样(1)抽签法(2)随机数表法,下面以10000个学生中抽取300个样本进行调查为例说明其基本步骤:第一步、对总体中的各抽样单位进行编号。在编号时注意以“降位”的方式来进行,这样抽样的效率要高很多。举例说明降位。降位:比如总体规模是100,那么最好的编排方式是00——99,那么,如果总体规模是10000,其编号方式呢?第二步、选择图表中第一行,从左向右的第三个数字“2”开始,以四个数字为一组进行连续选择,那么就可以得到下面标号的样本:2715,9986,7174,4511,0215,1418……直到选够300个为止。随机数表632715998671744511021514180714586389310813554799458854708986954367911508303010412003063754084592836455957572438386509911197616653540102266466014715702……2、系统抽样(即等距抽样或机械抽样)基本步骤是:第一步、编号。将总体中每一个单元按照顺序排列并加以编号。第二步、计算抽样距离K。K=N/n,其中,N为总体数量,n为要抽取的样本量。第三步、确定抽样起点B(即抽取第一个样本)。这个B是处在1——K之间。第四步、做等距抽样。从抽样起点B起,每隔抽样距离K就选中一个样本号码,一直到选够样本为止。操作中的注意事项:1、当K不是整数时,比如当K=3.3时(即小数点后的数字<5),那么就按照四舍五入的方法确定K=3,这样就可以进行后续操作了。当K=3.7时(即小数点后的数字>5),也同样进行四舍五入,即K=4。假设从1000个样本中取270个,则K=3.7,按四舍五入则K=4,这是又出现了另一个问题。即第270个中选编号为1079(此时B只能是3而不能是2,为什么?),这就超出了总体编号,这时就应当将1——1000个编号看成一个封闭的号码链,连续的从头再来进行选择。2、由于抽样距离相等,这样就在总体的抽样号码链上形成了一个具有周期性质的规律。这个周期规律如果与总体抽样单位排列方式的周期吻合,那么就可能存在抽样的巨大偏差,抽样的结果可能是完全没有代表性的。3、分层抽样分层抽样是在对总体有事先了解的前提下,按照一定的标准,将总体划分成若干个互不重叠的层。然后再从每个层中按照简单随机抽样或系统抽样方法抽取相应的样本。(1)分层抽样的设计的基本原则:在层的划分上:A、总体划分为若干个层时,不能有遗漏,以免使个别“层”被忽略,影响样本的代表性。B、层与层之间不应当有相互重叠的现象,总体中的某一个抽样单位被划分到某一个层之后,就不能再属于其他的层。C、层与层之间的差异要尽可能大,从而提高样本对整体的代表性。D、同一层内各单位之间的差异要尽可能小。在分层标准的选择上:除了人口统计特征之外(年龄、性别、职业、收入、教育程度等),还可以根据消费产品的情况(比如重度、中度、轻度及潜在消费者等),品牌知晓情况、媒介接触情况等指标进行分层。层数的确定:经验上的层数一般是3——10个精心划分的层就可以了。(2)分层抽样的基本步骤第一、根据需要及对总体的了解情况,按一定标准将总体的构成元素划分为若干个互不重叠的层,所有层的数量加起来应当等于总体规模。第二、按照每个层的大小与内部构成的差异程度,将样本数量以等比例或不等比例的反陪方式分配到各层。第三、从每个层中选出分配数量的样本作为该层的代表。第四、将每层的样本合在一起构成整体样本。关于比例分层与非比例分层的补充:比例分层:在将一定数量的样本分配到各层时,按照各层的规模大小进行分配。即层样本数量在整个样本数量中所占的比例,应该与该层总体规模在整个总体中所占的比例相等。比如,从1000个教师中按比例分层抽100个样本。职称比例样本数量教授200人20%20副教授300人30%30讲师500人50%50非比例分层:即每层分配的样本比例不与该层在总体中所占的比例相等。比如,从1000个教师中按非比例分层抽100个样本。职称比例样本数量教授200人50%50副教授300人35%35讲师500人15%154、整群抽样它是将总体划分为若干个群,以群作为抽样单位,从中选取一部分群,然后对群内的全部元素进行调查的抽样方法。基本步骤是:第一、确定分群的标准,如自然行政区域。第二、将总体划分为若干个互不重叠的部分,每个部分为一个群。第三、根据总样本量确定应该抽取的群数。第四、采用简单随机抽样或系统抽样的方法抽取确定的群数。分层抽样与整群抽样的区别:1、分层抽样要求各层之间的差异大,层内个体差异小;而整群抽样则要求群与群之间的差异要小,群内的个体差异大。2、分层抽样的样本是从每个层中抽取若干个样本,而整群抽样则是要么某一个群被抽取,从而群内的样本都被调查,要么某一个群不抽取,从而群内的样本都不调查。另外,在实践中通常需要进行多阶整群抽样,比如,全国城市的抽样调查就是省中选城市—中选城市抽区—中选区抽街道—中选街道抽家庭—中选家庭抽个人进行访问。二、非随机抽样的基本方法1、方便抽样:它是根据抽样者抽取样本的便利或方便性来进行选样。实践中的以下几种情况可考虑用这种方法:调查方案设计前的摸底调查;设计问卷前的调查以及问卷测试等。2、判断抽样:是指研究人员依据一定的选择标准,通过其主观判断来选择最合适的被访者的一种方法。它常适用于总体内部构成差异较大而样本量较小的研究。3、配额抽样:是根据一定标准或标志对总体分层或分类后,从各层或各类中主观的抽取一定比例样本的方法。所谓“配额”就是给划分出的总体各层或各类分配一定数量的名额,从而组成一个配额样本。配额样本见图表。4、滚雪球抽样:是指通过受访者推荐另外受访者的方法来获得调查对象并对其进行调查的方法。手机用户的配额样本构成表单位:人现有手机用户潜在手机用户合计男351550女351550小计7030100如果还要考虑年龄的因素,则还给出年龄配额:20-29岁为50%的配额,30-39岁为30%的配额,40岁以上为20%的配额,则会有下列三个指标形成的配额样本。三个指标的配额样本构成表单位:人现有手机用户潜在手机用户合计男女男女20-29岁1818885230-39岁1010442840岁以上773320小计35351515100第三节抽样设计的步骤抽样设计的基本步骤:1、界定总体(见表一)表一:界定总体的指标详细描述指标详细描述人口统计因素主要是指被调查对象的性别、年龄、职业、收入、教育程度等地域因素一定地域范围内的被调查对象,可能是全国、一个城市或一个县等。使用情况通常是通过在一定时间范围内是否使用及使用的频率来对消费者产品或服务的情况进行区分信息认知程度主要是指消费者对商家传播出的有关服务或产品信息知晓情况与理解记忆的情况。2、编制抽样框是将抽样单位进行编号排列而形成的一张清单。在这个抽样清单中,每个抽样单位都有一个号码作为其标志,以便对总体中的每个抽样单位进行识别,并能保证从总体中抽出所需要的样本。3、选择收集资料的方法主要是指确定接触被访对象搜集原始资料的方法,目前主要的方法包括:入户访谈、街道拦截访谈、电话访谈、邮寄问卷等。4、确定样本量5、选择抽样方法抽样方法的选择解决两个层次的问题:第一、是选择概率抽样还是非概率抽样;第二、确定具体的抽样方法,即是用简单随机抽样的方法还是分层抽样或者系统抽样。6、制定选择样本单位的操作程序。下表是一个操作程序例子。7、抽样实施操作程序详细说明表以下说明是有关你在某个街区访问时应走的路线。在城市中,这可能是一个城市的街区;在农村,它可能是一块百条道路包围的土地。1、如果在你的路线中遇到死胡同,继续沿这条路或者街道的另一面向相反方向走。在可能的地方右拐,每隔两户住家访问一户。2、如果你沿街区走了一圈,又回到了出发点而又没有完成规定的4个访问目标,那么可以试着访问起点的那一家。3、如果你调查了整个街区,还是没有完成所需要的访问目标,则继续从街(或乡间小路)对面最近的第一个住户开始。只要这个地址在你的访问单上的一个“×”旁边出现,就把它当作你所在区域的街道中的另一个地址。并访问这一家。如果不是,就访问这家右边的一家。永远遵循“右手原则”。4、如果这一地区街对面从第一号开始都没有住户,则在第一号对面的街区转一圈,并遵守“右手法则”(这意味着你将按照顺时针方向在街区转一圈),然后沿着路线每隔两户访问一户。5、在起始门牌号对面临近的街区绕一圈后,如果你没有完成所需要的访问,就按照顺时针方向,在下一个街区访问。6、如果第三个街区的住户数不够完成你的任务,就继续在几个街区进行直到完成要求访问的户数为止。这些街区要按照顺时针方向绕原有的街区来找。第四节样本量的确定一、影响样本量大小的因素(一)管理方面影响样本量大小的因素1、企业的调查经费预算2、需要衡量调查的精度要求对企业的实际意义。(二)统计方面影响样本量大小的因素1、总体的构成情况2、抽样误差的大小3、抽样方法的差异(三)调查实施方面影响样本量的因素1、问题的回答率2、问卷的回收率二、确定样本量大小的方法(一)经验确定方法常用的经验样本量有200个、300个、400个、500个。抽样调查中大样本与小样本的确定基本原则:1、样本量达到或超过总体的5%,就称为大样本2、样本量不到总体的5%,这样的样本称为小样本3、样本量虽不足总体的5%,但是大于500个,也可算是大样本4、样本量不足总体的5%,且小于500个,就算是小样本。对样本量的确定方法:1、尽量使样本量达到总体的5%以上2、若样本量在总体的5%以下,也最好在500个以上。(二)样本量的理论计算方法公式:其中,n为样本量,Z为一定置信度下对应的概率度(具体对应情况见表二),E为可接受的抽样误差。表三就给出了一些在不同置信度与允许误差条件下的简单随机样本值。(置信度:也称把握度,是指由抽样调查结果来推断总体情况的可信程度,一般用百分比来表示。)当样本量大于总体的5%时,就要对上述公式计算出的样本量进行调整,其调整公式为:n1=(n×N)÷(N+n-1)。其中,n1为调整样本量,N为总体数量,n为原来计算出的样本量表二:常用的置信度与相应的Z值表置信度Z值99%2.5895%1.9690%1.65表三:简单随机抽样的样本量置信度最大允许误差90%95%99%1%67659604165892%1691240141473%752106718434%42360010375%2713846646%1882674617%138196339