杭州电子科技大学管理学院1第七章抽样设计(上)杭州电子科技大学管理学院2第七章抽样设计学习目标•了解抽样技术的分类•掌握抽样设计过程内容•掌握随机抽样技术和非随机抽样技术杭州电子科技大学管理学院3给飞机焊上钢板最高指挥部对此伤透了脑筋:要降低损失,就得将防弹钢板焊到飞机上;倘若给整个机身“穿上”钢板“防弹衣”,势必影响战机的速度、航程和载弹量。为了破解这道难题,军方决定求助数学家亚伯拉罕·沃尔德。杭州电子科技大学管理学院4解决方法处理的方法很简单:他把制作好的统计表发到地勤技师手中,要求他们把返回的飞机上的弹洞位置,填表上报;接着亚伯拉罕·沃尔德在一张铺开的大白纸上画出一个飞机的轮廓,将那些小窟窿一一标上去。最后大家发现,除了飞行员座舱和尾翼两处是空白外,机身上下弹痕累累。亚伯拉罕·沃尔德意味深长地指出:明显违反规律的地方,往往就是问题的关键点。用科学方法从实践中提炼出的规律,堪称致胜的法宝。杭州电子科技大学管理学院5抽样调查的一般理论抽样与抽样调查抽样:从总体中抽取样本的过程,专门组织的非全面调查——依据概率论的中心极限定理。总体指标:调查对象(总体)必须是明确的,数量限定是人为的,其相关参数为总体指标。如:大学生体育消费的心理特征,某个节目的总体平均收视率等等。样本统计量:包括样本均值、样本比例、样本方差,大样本条件下,趋于正态分布。杭州电子科技大学管理学院6第七章抽样设计——基本概念•目标总体与样本目标总体(N)是指市场研究对象的总体,它可以是一群人、家庭、企业、情形或活动等。即由研究对象的全体单位构成的集合。目标总体必须要精确定义,例如:“农场主”,什么样的人是农场主?样本(n)是指从总体的所有单位中抽取出来的能代表总体的部分单位(集合)。其中称n30的样本为大样本,而称n<30的样本为小样本。•总体指标与样本指标总体指标是根据总体中各标志值计算的,用于反映总体数量特征的定量指标。样本指标根据样本中各标志值计算的,用来估计和判断总体数量特征的随机性指标,即样本统计量。杭州电子科技大学管理学院7第七章抽样设计–基本概念总体指标和样本指标符号及计算公式总体指标样本指标单位数目均值成数(比例)方差标准差Nn11NiiXXN11niixxn1NPN01NQPN1npn01nqpn2211()NiiXXN2211()1niSxxn211()NiiXXN211()1iniSxxn(1)PQPP(1)pqpp其中,和分别表示总体和样本中具有某种性质的个体数;和分别表示总体和样本中不具有某种性质的个体数。1N1n0N0n杭州电子科技大学管理学院8第七章抽样设计–基本概念抽样技术非随机抽样任意抽样判断抽样配额抽样滚雪球抽样系统抽样分群抽样分层抽样其他抽样技术简单随机抽样随机抽样•抽样技术分类杭州电子科技大学管理学院9第七章抽样设计–抽样设计过程定义目标总体确定抽样框架和个体编号选择抽样技术确定样本量执行抽样过程•抽样设计过程杭州电子科技大学管理学院10第七章抽样设计–抽样设计过程确定抽样框架和个体编号抽样框架是指目标总体中个体的表示法,由一份或一组用于识别目标总体的指示说明组成。如电话簿、某个行业的公司名录、企事业单位职工名册等。个体编号是指对调查总体中的个体进行编号。确定样本量样本量的大小取决于定性与定量因素,定性因素有决策的重要性、研究的性质、变量的数目、分析的性质等;定量因素有研究对象的变异程度、研究精度要求、要求推断的置信度、抽样的方法等。杭州电子科技大学管理学院11第七章抽样设计–抽样设计过程研究类型最小量典型的范围问题识别研究(如市场潜力)5001,000-2,500问题解决研究200300-500产品测试200300-500试销研究200300-500广告测试150200-300试销市场审核10家商店10-20家商店焦点小组访谈2组10-15组市场调研使用的样本量杭州电子科技大学管理学院12第七章抽样设计–随机抽样(书P126)•简单随机抽样是对调查对象不做任何划类、分组、排队等加工整理的一种随机抽样的组织形式,也称单纯随机抽样。在市场调查中适用于总体容量不太庞大、总体单位差异程度小以及总体分布比较均匀的调查对象。..................................................样本n总体N杭州电子科技大学管理学院13第七章抽样设计–随机抽样简单随机抽样方法抽签法、随机数表法如:从100户居民中抽取11户调查其空调使用情况4.9529444.9144024.9799014.7881294.6737595.0051955.2685285.3085705.5226174.9608525.1541044.3996754.9157754.8215075.5097974.8525045.2064265.0428354.9458504.6680135.3403435.1490885.1301295.3895354.7875115.0798145.1111134.9106485.3918034.9960764.8346785.2076814.9193735.1244535.3692135.0130374.7916625.0693985.2165414.9362304.6186945.0984925.1129925.0063274.9020604.9352794.8108874.8630835.2116844.890046杭州电子科技大学管理学院14第七章抽样设计–随机抽样•系统抽样也称机械抽样或等距抽样,首先要选择标志将调查对象的全部个体按一定顺序排队,其次要依简单随机抽样方式从总体中抽取第一个样本点,即所谓随机起点,然后依据按某种固定顺序和规律(抽样距离)依次抽取其余样本点,最终构成系统样本。例:从1万个体中抽去样本量为100的样本抽样距离=调研总体数(N)/样本数(n)=10000/100=10012……100101……200……300……10,000杭州电子科技大学管理学院15第七章抽样设计–随机抽样•分群抽样(整群抽样)在分群抽样中,组成总体的所有部分被分为若干大群,而样本是随机地从某一群或几群中获得的。群组1群组2群组3群组4群组5群组6群组M...总体N有M个群组群组1群组4群组7群组n...样本数为n个群组杭州电子科技大学管理学院16第七章抽样设计–随机抽样•分群抽样(整群抽样)对总体的构成资料难以了解全面时;在需要把研究限制在某个特定地区而节约时间和经费时。分群抽样多在下面两种情况下使用一个群内的个体应尽可能的异质,各群之间应尽可能同质。(常见形式是区域抽样)即:在大规模的市场调查中,当群体内各单位间的误差较大,而各群体之间的差异较小时,最适宜采用分群抽样方式。杭州电子科技大学管理学院17第七章抽样设计–随机抽样•分层抽样根据总体构成中可辨别的或可测量的特征(年龄、收入、文化水平等),将总体分成若干个层次,样本由每个层次里随机抽出的个体组成。层次Nn...层次N3层次N2层次N1总体N=N1+N2+•••+Nn...抽样n1抽样n2抽样n3抽样nm样本数n=n1+n2+•••+nm杭州电子科技大学管理学院18第七章抽样设计–随机抽样•分层抽样等比例分层抽样与非等比例分层抽样例:某地共有居民20000户,按收入高低进行分类,其中高收入居民4000户,占总体20%,中等收入12000户,占总体的60%,低收入为4000户,占总体的20%,从中抽取200户进行购买力调查1、等比例分层抽样高收入样本数=200*20%=40(户)中等收入样本数=200*60%=120(户)低收入样本数=200*20%=40(户)杭州电子科技大学管理学院19第七章抽样设计–随机抽样2、非等比例分层抽样•分层抽样层次各层总体数N(户)各样本标准差S(元)N*S高收入40003001200000中收入120002002400000低收入4000100400000合计200004000000高收入样本数=200*1200000/4000000=60(户)中收入样本数=200*2400000/4000000=120(户)低收入样本数=200*400000/4000000=20(户)杭州电子科技大学管理学院20第七章抽样设计–非随机抽样•任意抽样指事先不确定样本点,根据调查者的方便与否来抽取样本的一种非随机抽样组织形式。如:街头拦人法、空间抽样法。优点操作简便,能及时获得所需要的信息数据,省时省力,节省调查经费,效率较高,并能为非正式的探索性研究提供很好的数据源。缺点取得的样本偶然性很大,存在着选择偏差,调查结果可信度低。杭州电子科技大学管理学院21第七章抽样设计–非随机抽样•判断抽样指基于调查人员的主观意愿、经验和知识,依据对总体有关特征及实际情况的了解,从目标总体中抽选有代表性的典型单位作为样本单位,或由了解情况的专家圈定样本的一种抽样组织形式。确定样本单位的通常做法选择最能代表普遍情况的群体作为样本,常以“平均型”或“多数型”为标准。避免“极端型”。利用总体的全面统计资料,按照主观设定的某一标准,选择样本。优点方便易行,问卷回答率高,适用于探索性研究。缺点样本质量取决于调查者的业务素质和对目标总体的了解。适用性适用于总体单位规模小,单位间差异较小的情况。杭州电子科技大学管理学院22第七章抽样设计–非随机抽样•配额抽样根据总体的某些特征将总体分成若干个类(组)。样本被选择的可能与他们在总体中的重要程度成正比。在配额抽样中,在每个类别里抽到的样本不是随机的。配额抽样按配额的要求不同分为:独立控制配额抽样与交叉控制配额抽样优点方便易行,成本较低,与其他非随机抽样方法相比样本更具有代表性。缺点样本质量取决于调查者的业务素质和对目标总体的了解。杭州电子科技大学管理学院23第七章抽样设计–非随机抽样•滚雪球抽样指以“滚雪球”的方式,通过少量的样本单位逐步获取更多样本单位的信息,逐步扩大样本容量的方法。优点能利用样本单位方便快捷地寻找样本单位,有针对性地找到样本单位。局限性总体单位间必须有一定联系,并愿意提供和保持这种关系,或至少不反对向外公开这种关系。适用性通常用于对总体缺乏了解,没有现成的抽样框以及那些现象发生率低的事物。杭州电子科技大学管理学院24滚雪球抽样例如:假设一个运动器材的生产商,正在考虑向严肃的成年游戏者营销一种桃木槌球装置。在这个很小的市场上,必须找到一个大样本,如100名严肃的成年槌球游戏者。假如最初的抽样从300个人中找到5个缒球游戏者,那么接下来调研者就会要求这5个缒球游戏者提供其他游戏者的姓名。杭州电子科技大学管理学院25第七章抽样设计(下)杭州电子科技大学管理学院26第七章抽样设计(下)学习目标•掌握抽样误差的确定方法•掌握样本估计与样本量确定方法杭州电子科技大学管理学院27第七章抽样设计(下)-抽样误差及其影响因素1、什么是抽样误差抽样误差指使用样本指标值对总体指标值进行估计所造成的误差,也称为随机误差或代表性误差。2、影响抽样误差的主要因素•总体单位之间的标志变异程度•样本容量•样本的抽取方法(重复抽样与不重复抽样)•抽样调查的组织形式杭州电子科技大学管理学院28第七章抽样设计(下)-抽样误差及其影响因素3、非抽样误差非抽样误差指基于抽样误差之外的各种原因引起的误差。4、非抽样误差产生的原因•抽样框误差指由不完善的抽样框引起的误差。•无回答误差在调查过程中由于各种原因而无法对抽取的样本单元进行计量,获取不到有关这些单元的数据所造成的估计量的偏误。•计量误差指抽样调查所获得的数据与其真值不一致所产生的误差,也称回答误差。杭州电子科技大学管理学院29第七章抽样设计(下)-抽样误差的确定1、抽样分布指在特定的抽样计划下,为每个可能从目标总体中抽出的样本所计算的样本统计量的数值分布。例:假定从20个班级抽取含有5个班级的简单随机样本,可以抽出样本量为5的不