抽样设计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三讲样本设计SAMPLEDESIGN抽样的基本概念定义目标总体非概率样本设计概率样本设计样本量的的确定不回答问题内容提要【案例】谁会是下一任美国总统?在社会科学研究中,美国大选前的民意测验对抽样方法的发展起到了重要的推动作用。《文摘》杂志于1936年进行的总统选举结果预测就是一个经典的例子。为了预测1936年美国总统选举结果,《文摘》开展了一项庞大的民意测验,向从电话号码簿和车牌登记名单中抽取的1000万人邮寄了问卷,收回了240万份问卷。该调查结果预测共和党候选人兰登(Landon)将以57%对43%击败民主党候选人罗斯福,但实际结果是兰登以38%对62%败北。这项耗资巨大的调查使该杂志因资金困难和名誉扫地而破产。这个案例告诉了我们什么?来源:抽样(sampling)是根据一定的规则和程序,从研究总体中抽取其中的一部分样本的过程。总体(population)指的是享有一些共同特征、构成某项研究对象的所有个体的集合,代表总体某些特征的统计指标叫参数(parameters)。样本(sample)是从总体中选出来的一部份成员,样本特征叫统计量(statistics),可用来对总体参数进行推断。一、抽样的基本概念抽查与普查的适用条件你觉得汽车碰撞试验的有效性如何?标准抽查普查1.预算2.时间3.总体规模4.特征差异5.抽样误差成本6.非抽样误差成本7.测量的性质8.对个案的关注小短大小低高破坏性是大长小大高低非破坏性否抽样过程确定抽样框架选择抽样方法确定样本规模抽取样本定义总体二、定义目标总体目标总体(targetpopulation)是某项研究所要推论的所有个体的集合,是通过研究要对其进行描述和推论的总体。抽样总体(samplingpopulation)是从中实际抽取样本的所有个体的集合,通常依据抽样框架来加以定义。应该根据内容、范围和时间三重标准定义目标总体。讨论:目标总体的确定假如凤凰网要进行一项SUV品牌美誉度调查,请问:应当如何定义调查的目标总体与抽样总体?确定抽样框架抽样框架(samplingframe)是抽样总体的可操作性定义,由一份完整的名单或一组用于识别目标总体的文字说明组成。在编制抽样框架时常见的问题如下:•遗漏-遗漏部分样本单位;•聚堆-缺乏个体样本单位信息;•重复-同一样本单位重复出现;•混杂-抽样框架中包括部分非样本总体成员。过滤问题为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。除了某项研究的特殊要求以外,营销研究通常要求研究对象:过去3个月内没有接受任何产品或广告调查;本人及家庭成员不在有关的公司工作。【例】大中城市女性减肥品市场分层研究:目标总体目标总体:2003年中国大中城市女性减肥品的现有消费者和潜在消费者抽样总体:十个代表城市中,A公司销售人员在其产品销售终端可以接触到的年龄在20-50周岁之间的女性减肥品现有消费者和潜在消费者甄别问卷访问员提问,被访者回答0-1【出示卡片1】请问你本人或你家中是否有人在卡片上列举的地方工作呢?市场研究公司,广告公司................................X社情民意调查机构,咨询公司............................X--终止访问减肥产品的生产/批发/销售部门..........................X以上均无..............................................10-2请问在过去半年内您有没有接受过有关减肥产品的市场调查呢?有........................................................1--终止访问没有......................................................20-3【出示卡片2】请问您的年龄属于如下哪一个年龄段呢?20岁以下..................................................1--终止访问20-25岁...................................................226-30岁...................................................331-40岁....................................................441-50岁....................................................550岁以上...................................................6--终止访问0-4请问您过去1年有没有使用过有关减肥方面的产品呢?使用过.............................................1跳问1-1(检查配额)没有使用过........................................2继续问0-50-5请问您未来一年内是否可能会使用有关减肥方面的产品呢?可能会使用.........................................1检查配额,继续问1-1肯定不会使用.......................................2终止访问狗粮市场需求调查的目标总体?抽样方法三、选择抽样方法非概率抽样概率抽样便捷抽样判断抽样配额抽样滚雪球抽样系统抽样分层抽样整群抽样其它简单随机抽样非概率样本设计非概率样本设计(nonprobabilitysampledesign)依赖于研究人员的个人判断而非随机原则选择样本个体,事先并不确定每个样本单位被抽中的概率。这种样本设计往往无法排除研究人员偏好对抽样的影响,也无法准确估算样本估计值的抽样误差。该方法通常用于下列情况:样本量很小时;探索性研究或研究的初始阶段;目标总体成员很少或很难寻找;无法采用概率样本时。非概率样本的种类便捷样本(conveniencesample)-选择容易接触的个体作为调查研究对象;主观样本(judgmentalsample)-根据研究者的判断,选择有代表性或典型性的样本单位;定额样本(quotasample)-将总体分层并确定每层应抽取的样本量,让调查员根据定额抽样;滚雪球样本(snowballsample)-先抽取少量的样本,然后通过滚雪球的方式扩大。(1)独立控制配额抽样是根据调查总体的不同特性,对具有某个特性的调查样本分别规定分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。因此,调查员就有比较大的自由去选择总体中的样本。优点:简单易行,调查员选择余地较大;缺点:调查员可能图一时方便,选择样本过于偏向某一组别,从而影响样本的代表性。月收入人数300元以下20301~600元50601~900元70900元以上60合计200年龄人数30岁以下4030~40岁6040~50岁7050岁以上30合计200性别人数男100女100合计200例:某市进行空调器消费需求调查,确定样本量200名,选择消费者收入、年龄、性别三个标准分类。其各个标准样本配额比例及配额数如表。(2)交叉控制配额抽样对每一个控制特性所需分配的样本数都做具体规定,调查员必须按规定在总体中抽取调查单位,由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。300元以下301-600元601-900元900元以上合计男女男女男女男女30岁以下225577664030~40岁332061016116040~50岁101341273307050岁以上5225833230合计208302037331339200入户调查的抽样过程•1、建立抽样框(家庭抽样)•2、确定抽样对象(户内抽样)【例】大中城市女性减肥品市场分层研究:抽样方法抽样方法:配额抽样样本城市:北京、广州、深圳、昆明、贵阳、重庆、成都、沈阳、乌鲁木齐、济南样本总量:每个城市100份,共1000份配额:实行现有和潜在消费者配额,城市配额,甄选问卷对抽样配额进行控制。概率样本设计概率样本设计(probabilitysampledesign)采取随机的办法,排除研究人员主观因素的干扰,使样本总体中的每一个成员都有一个事先确定好抽中概率。简单随机抽样系统抽样分层抽样整群抽样简单随机抽样简单随机抽样(simplerandomsampling)是最基本的概率抽样方法。该抽样方法保证每一抽样单位都有相同的非零抽中概率,并给出总体参数的自加权估计值。若总体为N,样本量为n,则每一抽样单位的抽中概率:p=n/N随机数表是将0-9十个数字用完全随机顺序排列编成的表。28465335749213452067421520578090043628192664371555012664985671497258435789642754如要从94家上市公司中抽取12家作为调查样本,可将94家公司由1至94编号,然后从随机数表的任一行一列作为起点,如从第二排第三列的数组起从上而下、自左而右抽取,则顺序取得的样本号为:42、28、26、43、35、15、19、64、57、74、20、26、89、92系统抽样系统抽样(systematicsampling)是随机抽取第一个样本单位,然后每隔k个单位抽取一个。系统抽样时每个样本单位抽中的概率相同,为1/k,通过系统抽样也可获得总体参数的自加权估计值。讨论:什么时候应避免采用系统抽样?按标志排序计算抽样距离抽选样本例:某地区有居民110户,采用系统抽样法抽选11户。①将总体单位进行编号,即从1至110号;②确定抽样距离=1011110nNnN样本数总体数③确定起抽号数:从1——10号中随机抽取,如2;④确定被抽取的单位:2,12,22,32,42,……,102。系统抽样举例分层抽样分层抽样(stratifiedsampling)时将总体按某些重要特征分为数个层,然后用简单随机抽样或系统抽样的办法从每层中抽取一定数量的样本。比例分层抽样非比例分层抽样如果某校有1000名本科生,400名普通硕士生和600名MBA学生,若要比较不同类别学生对教学的满意度,请问:应采用哪种抽样方法?总体满意度应如何计算?即按各层中的单位数占总体的比例分配各层样本量。nNNniini表示第i层要抽取的样本数;Ni表示第i层目标总体数;N表示目标总体数;n表示要抽取的样本总数。例如:某公司要预测某地区家用电器的潜在用户,这种商品的消费同收入水平有关,因而以家庭收入为分层基础。已知总体单位数为20000户,已确定的样本数为200户。家庭收入分为高、中、低三层,其中高收入层2000户,中收入层6000户,低收入层12000户。则:高收入层要调查的户数为:20200200002000nNNn高高(户)(户),低中12060nn(1)比例分层抽样(2)最佳分层抽样(牛曼分层抽样)根据各层样本的标准差的大小,调整各层的样本数目。即考虑各层在总体中所占的比例,又考虑到各层标准差的差异程度,有利于降低各层的差异,以提高样本的可信程度。nSNSNnmiiiiii1)(1)(12iNjiijiNxxSi式中:Si表示第i层的标准差;m表示所分层数目;xij表示第i层第j个样本的观察值。例如:在上例中50200300低中高;;SSS则:户)高(502005012000200600030020003002000n(户)户);低中50(100nn结果对比分析:高收入层增加了30户,中收入层增加了40户,低收入层减少了70户。购买电器与收入成正比,高收入层相对大于低收入层,更加吻合,提高了准确性。(3)分层最低成本抽样(德明分层抽样或经济抽样)ncSN

1 / 57
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功