抽样题解

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

一、概率抽样与非概率抽样的区别及各自的特点:非概率抽样特点:抽取样本不足按照随机原则而是根据主观判断有目的的有意识地进行或根据方便原则进行随机抽样,操作简单但精度差。概率抽样特点:按一定的概率以随机原则抽取样本、每个单元被抽中的概率已知可以算出、当用样本估计总体时,要考虑样本被抽中的概率、可以依据调查结果计算抽样误差从而得到对总体目标量进行推断的可靠程度、也可以按照要求的精度确定样本单元的数目。两者的区别:①概率抽样时是按照给定的入样概率(一定的准则)通过一定的随机化程序抽取样本单元而非概率抽样则是没有一定准则随便的抽样。②概率抽样可以通过样本对总体进行推断而非概率抽样不能,非概率抽样得到的数据不能用来计算抽样误差,不能从概率意义上控制误差从而不能保证推断的准确性二、等概抽样与不等概抽样的区别:等概抽样与不等概抽样都是概率抽样随机抽样。总体中每一个单位被抽中的概率相等,每个单元的入样概率不等则称为不等概抽样。三、PPS抽样与πPS抽样的含义及操作方法:PPS:放回的,与但愿规模大小成比例的概率抽样(不等概)(对总体中的N个单元进行放回的抽样,每一抽中的i个单元的概率为NiiiiMMZ1,独立的进行N次)操作方法:1、代码法在PPS抽样中赋予每个单元与Mi大小相等的代码数(若Mi不是整数,则乘以某个倍数)将代码数累加到M0,每次抽样都产生一个[1,M0]之间的随机数设为m,则代码m所对应的单元被抽中。例:N=10,抽3个iMiMi*10累计Mi*10代码10.6661—6214.51451517—15131.515166152—166413.7。。。。。。167—30357.8。。。。。。304—381←354615。。。。。。382—531←493710。。。。。。532—667←55383.6。。。667632—6679660727668—727101.111738728—738∑M0=73.8738————在[1,738]中随机产生354553493所以5、6、7号单元被抽中。2、拉希里法令M*=iNiM1max,每次抽样都分别产生一个[1,N]之间的随机数i及[1,M*]之间的随机数m,如果Mi≥m,则第i个单元被抽中;否则,重抽一组(n,m)。反复进行以上操作,直至抽满n个样本为止。πPS:不放回的与单元大小成比例的概率抽样(不等概)①严格的πPS抽样(n固定、严格不放回、包含概率πi与单元大小严格成比例)当n=2时通常使用布鲁尔方法:布鲁尔方法的两样本单元的抽取方法是:按与iiiZZZ211成比例的概率抽取第一个单元,记第一个被抽出的单元为j,按与jiZZ1成比例的概率抽取第二个单元。当n2时通用使用水野法:水野法是一个逐个抽取的方法,它以概率),.....,2,1(11)1(*NiNnnNZNnZii抽取第一个样本单元,在剩下的N-1个单元中,不放回、等概率地抽出n-1个样本单元。为了保证每个0*iZ,要求每个单元的大小满足:110NnMnMi为满足这一点,必须避免Mi相差过大,我们可以通过分层,将大小相似的单元分到同一层来解决这个问题。②非严格的πPS抽样耶茨—格伦迪逐个抽取法,每次都以与未入样的单元的iZ成比例的概率抽样,即以iZ抽取第一个样本单元,不妨记被抽中的单元为第一个;以)1(1ZZi在剩下的N-1个单元中抽取第二个样本单元,不妨记被抽中的单元为第二个;以)1(21ZZZi在剩下的N-2个单元中抽取第三个样本单元;以此类推,直到抽出n个样本单元。四、抽样误差和非抽样误差产生原因及减少方法①产生原因:抽样误差是抽取样本的随机性(样本结构与总体结构的随机差异导致的)造成样本值与总体值之间的差异。只要采用抽样调查,抽样误差就不可避免(可用不同的量值表示,如(̂)或√(̂))减少方法:控制抽样误差的根本方法是改变样本量②产生原因:非抽样误差(除了抽样误差以外的所有误差的总和)不是由于抽样的随机性,而是清除了抽样误差以外的各种原因引起的误差,具有非随机性,难以识别和测定,产生原因众多等特点。减少方法:从各方面各环节出发采取相应的措施,对其实施有效的预防和控制,例如①科学设计调查方案(不断检查抽样框,问卷设计)②加强培训,提高抽样调查的整体素质③重视调查员的挑选和管理④采用多种途径,减少被调查者误差⑤做好调查资料的汇总工作,防止汇总误差总之,非抽样误差的大小直接关系到调查结果得准确性和可靠性,深入分析非抽样误差的各种原因,从而找到预防和控制非抽样误差具体措施才能保证调查结果的准确性,提高抽样调查资料的质量。五、各种抽样方法的特点,优点和缺点①简单随机抽样特点和优点:它是一种简单的随机抽样,是其他抽样方法的基础,它最大的特点是简单直观。优点是由于抽选样本中的概率相同,用样本统计量对目标总量进行估计及计算抽样误差都比较方便。缺点:要求包含所有总体单元的各单元作为抽样框,当N很大时,抽样框难构造样本在总体中比较分散,给实施调查增加了困难没有利用其他辅助信息以提高估计效率②分层抽样特点和优点:抽样效率高,即估计精度高不仅能对总体指标进行推算,而且能对各层指标进行推算层内抽样方法可以不同,而且便于抽样工作的组织在一定条件下为组织实施调查提供了方便缺点:对总体抽样框的分层有时会增加额外的工作量,可能相当费时费力费钱③整群抽样特点和优点:(不算优点)抽样单元与接受调查的基本单元不同抽样框编制得以简化样本集中便于调查节省费用当总体中各个群的结构相似时,它有较高的精度缺点:估计精度较差(由于群内单元的相似性,使得整群抽样的抽样方差比相同样本量的简单抽样方差大)④系统抽样特点和优点:简单易行,容易确定样本单元样本单元在总体中分布比较均匀,有利提高精度缺点:若单元的排列存在周期性变化,而抽样若对此缺乏了解或缺乏处理经验,那么样本代表性可能很差系统抽样的方差估计较为复杂,一般系统抽样难以找到设计意义下的无偏估计。⑥多阶段抽样优点和特点:样本比较集中便于调查,节省费用,同时避免了对小单元过多调查造成浪费不需要包含所有低阶段抽样单元的抽样框,每阶段只需要编制该阶段的抽样框,大大降低了编制抽样框的工作量由于实行了再调查,使抽样单元在更大的范围内展开六、有哪几种估计方法,其特点?①简单估计估计量是无偏的线性的(对于简单的随机抽样)②比率估计有偏,渐近无偏,非线性,用到辅助变量(可提高精度)目标量是总体比率时用比法③回归估计有偏,渐近无偏,非线性,用到辅助变量(可提高精度),(简单估计和比估计是它的特殊情况)③差值估计无偏,渐近无偏,非线性,用到辅助变量(可提高精度),回归系数接近于1。七、二重抽样先从总体中抽取一个大的初始样本,从而获得总体的辅助信息,然后再从初始样本中或总体中再抽取一个子样本。这种方法就是二重抽样。它的主要特点是分两步进行抽样,每步都抽取一个样本,而且对每个样本都要获取信息。主要适用于以下场合:①为了筛选主调查对象方法:先从总体中抽取一个大样本,通过相对比较简单的调查测试,筛选出满足条件的对象,从中再进行进一步的调查②节约调查费用对于一项大规模的多指标调查,由于单元之间的差异或对目标量估计的精度要求不同,往往不需要相同的样本量方法:先抽取一个大样本,对差异较大的项目或精度要求较高的项目进行调查,然后再抽一个较小的样本,对差异较小的项目进行调查(这样可以保证一定精度的前提下节约调查费用)③通过获取所需的总体辅助信息来提高抽样效率例如:在分层抽样时要知道层权,比率估计或者回归估计时要知道有关辅助变量的指标值。方法:先抽取一个较大的样本以获取有关的信息,然后再抽取一个较小的样本做出改进的估计④用于研究样本轮换中的某些问题⑤较低无回答偏倚方法思想:对最初无回答进行再一次的随机抽样,对无回答子样本采用更细致、更艰巨的努力去获取数据,用第一次样本的回答数据和第二次样本的数据进行估计以消除无回答的偏倚影响,改善对总体的估计效果九、有效的抽样调查遵循的原则理论模型统领原则解决市场难题的原则研究目标(一个或两个)锁定原则远战略近战术研究并举原则投入产出匹配原则要避免成为低档无用空洞近视最费钱的原则十、简述几种常用的调查方法①文案调查法又称资料查阅寻找法,间接调查法,资料分*法等,利用企业内部和外部现有的各种信息、情报,对调查内容进行分析研究的一种调查方法,它是收集已经加工过的次级资料,以文献性信息为主资料包括动态和静态两方面②实地调查法㈠访问询问法(最常用、最基本)又称询问调查,就是调查人员采用访谈询问的方式向被调查者了解市场情况的一种方法,按内容传递方式可分为:面谈调查、电话调查、邮寄调查、留置调查和日记调查等㈡观察法是调查员凭借自己的感官和各种记录工具、深入调查现场,在被调查者未察觉的情况下,直接观察和记录被调查者行为,以收集市场信息的一种方法㈢实验调查法指市场调研者有目的、有意识地改变一个或几个影响因素来观察市场现象在这些因素影响下的变动情况,以认识市场现象的本质特征和发展规律。③网络调查法通过网络进行有系统、有计划、有组织地收集、调查、记录、整理、分析与产品、劳务有关的市场信息,客观地测定及评价现在市场及潜在市场,用以解决市场营销的有关问题,其调研结果可以作为各项营销决策的依据,相比传统调查而言,它有及时性、便捷性、效率较高等优点。④抽样调查是一种非全面调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得有关总体目标简答题事后分层事后分层可以解决如下几个问题:想利用分层抽样的优点,但却存在问题:1、各层的抽样框无法得到2、总体规模N特别大,事先分层太费事3、一个单位到底属于哪一层要等到样本数据收集到以后才知道4、几个变量都适用于分层,要进行事先的多重交叉分层比较困难,并且不需要交叉分层后每个子层的估计,另外还可利用事后分层解决yi存在离群值(特别大或特别小)的问题,通过事后分层对估计结果进行校正实施要点:1通过某种途径知道各层的层大小N下标h或层权M下标h2保证层权要与实际情况相符,如此才能达到提高精度的目的3“事后层”的数目不宜太多见书128页5

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功