第四章抽样调查

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第四章抽样调查2第四章抽样调查知识点1、抽样及其相关概念;2、抽样的类型;3、概率抽样的基本原理;4、抽样的一般程序;5、简单随机抽样、系统抽样、分层抽样、整群抽样、多段抽样、PPS抽样、户内抽样的含义与特点;6、偶遇抽样、判断抽样、定额抽样、雪球抽样的含义与特点;7、样本规模的确定方法;8、影响抽样误差的因素;9、样本规模与抽样误差的关系。3第四章抽样调查抽样使我们能从总体具有代表性的部分样本中获取数据,从而可以得到关于整个总体的有效结论。———[英]托尼·普罗科特4第一节抽样的意义与作用一、抽样调查的概念抽样调查就是从研究对象的总体中选择一部分代表加以调查研究,然后用所得的结果推论总体特征,从总体中选取部分代表的过程就是抽样,所选取的这一部分代表就称为样本。5第一节抽样的意义与作用二、抽样调查的特点抽样调查与普查相比具有如下特点:调查费用较低、速度快、应用范围广、可获得内容丰富的资料、准确性高。6第一节抽样的意义与作用三、抽样调查的理论依据抽样调查数据之所以能用来代表和推算总体,主要是因为抽样调查本身具有其它非全面调查所不具备的特点,主要是:(1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。(2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体。7第一节抽样的意义与作用(3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。(4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。基于以上特点,抽样调查被公认为是非全面调查方法中用来推算和代表总体的最完善、最有科学根据的调查方法。8第一节抽样的意义与作用四,误差(?)与其它调查一样,抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种:一种是工作误差(也称登记误差或调查误差),一种是代表性误差(也称抽样误差)。但是,抽样调查可以通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内;另外,由于调查单位少,代表性强,所需调查人员少,工作误差比全面调查要小。特别是在总体包括的调查单位较多的情况下,抽样调查结果的准确性一般高于全面调查。9第一节抽样的意义与作用五,抽样的作用提供由部分认识总体的途径和手段例子:一勺汤,一滴血民意测验。1984美国总统选举P.5910第一节抽样的意义与作用抽样调查优缺点优点缺点费用低,易广泛应用质量可控,可信度高时间短,收效快方案设计比较复杂对设计人员的要求较高11第二节概率抽样的原理与程序一、抽样的基本术语总体(population)总体通常与构成它的元素(element)共同定义:总体是构成它的所有元素的集合,而元素则是构成总体的最基本单位。样本(Sample)样本就是从总体中按一定方式抽取出的一部分元素的集合。抽样(Sampling)指从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程,或者说抽样是从总体中按一定方式选择或抽取样本的过程。12第二节概率抽样的原理与程序抽样的基本术语抽样单位(SamplingUnit)就是一次直接的抽样所使用的基本单位。抽样框(SamplingFrame)也叫抽样范围是指一次抽样时总体中所有抽样单位的名单。参数值(Parameter)也称总体值,是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。13第二节概率抽样的原理与程序抽样框就是所有总体单位的集合,是总体的数据目录或全部总体单位的名单。理想的完整抽样框应具备以下几个条件:1.包含尽可能多的样本单位,而且总体是清晰的,易确定的。2.所有样本单位出现在这一集合中的概率相等。3.有时可以按照一定原则方法进行人为的假定。14第二节概率抽样的原理与程序统计值(Statistic)也称为样本值,它是关于样本中某一变量的综合描述。统计值是从样本中计算出来的,它是相应的参数值的估计量。置信度(Confidencelevel)与置信区间(ConfidenceInterval)。置信度也称为置信水平,它是指总体参数值,落在样本统计值某一区间内的概率,或者说是总体参数值落在样本统计值某一区间中的把握性程度。它反映的是抽样的可靠性程度。例子:P64。置信区间指的是样本统计值与总体参数值之间的误差范围,置信区间反映的是抽样的精确性程度。见李书刚概率论与数理统计p.12315例如,设样本粮食平均亩产量为350公斤,又知抽样平均误差为6.25公斤,求总体粮食平均亩产量在345—355公斤之间的估计置信度是多少。根据公式:8.025.63503558.025.6350345xxxxxxXxtXxt查《正态概率表》p.325(课本),当t=0.8时,估计置信水平=0.2831,两个0.2831=2*0.2831=0.5662.即总体平均亩产量在345—355公斤之间的把握程度为56.62%。16P(345-355,6.25)=NORMDIST(355,350,6.25,TRUE)-NORMDIST(345,350,6.25,TRUE)=0.788145-0.211855=0.57628917现在将允许误差扩大到10公斤,即总体平均数在340—360公斤之间,则概率度为:xxxXxt查《正态概率表》,当t=1.6时,估计置信水平=0.4452.2*0.4452=0.8904时即总体平均亩产量在340—360公斤之间的把握程度为89.04%。6.125.6350360xxxXxt18P(340-360,350,6.25)=NORMDIST(360,350,6.25,TRUE)-NORMDIST(340,350,6.25,TRUE)=0.945201-0.05479=0.8904已知Z值,求正态分布概率NORMSDIST(0.8)=0.788145NORMSDIST(1.645)=0.9500NORMSDIST(1.96)=0.975已知概率NORMINV(0.95,0,1)=1.64519如上例粮食平均亩产,也可以作如下区间估计,即以89.04%的概率保证,总体平均亩产在340—360公斤之间。20估计置信度=89.04%,显著水平=1-89.04%=10.96%,它表示总体平均亩产落在340—360公斤区间内有89.04%的把握程度(概率),而不落在这个区间内的概率为10.96%,因此作上述区间估计就必须冒不超过10.96%概率的失败风险。显著水平正是判别估计可信不可信的一个标准。当你不愿意冒这样大的风险时,可以缩小显著水平,扩大置信区间,但是估计的准确程度降低了。21由此可见,总体参数的区间估计必须同时具备估计值、抽样误差范围和概率保证程度三个要素,抽样误差范围决定估计的准确性,而概率保证程度中决定估计的可靠性。22第二节概率抽样的原理与程序抽样框抽样指标总体方差和均方差总体指标与样本指标总体和抽样总体抽样调查23第二节概率抽样的原理与程序二,抽样类型抽样方法:1,概率抽样:简单随机抽样;系统抽样;分层抽样;整群抽样,多段抽样2,非概率抽样:偶遇抽样;判断抽样;定额抽样;雪球抽样24第二节概率抽样的原理与程序三,抽样原理根据总体各个单位标志值计算出来的综合指标称为总体指标,用X表示。它是我们想知道的对象特征的数量反映。常用的指标主要用平均数(X)和成数(P)来表示。25第二节概率抽样的原理与程序或,P为成数,并且分别为两种表现的总体单位数。并且1NNNP1NNQ01QPNNN210N26第二节概率抽样的原理与程序总体方差和均方差总体方差和均方差是用来说明总体指标变异程度的指标。方差与均方差的关系是平方和开平方的关系,可分别计算平均数与成数的方差和标准差。总体平均数方差和均方差的计算公式为:NXXi22NXXi227第二节概率抽样的原理与程序例子:见第四章练习题。28第二节概率抽样的原理与程序抽样指标抽样平均数抽样成数抽样方差均方差29第二节概率抽样的原理与程序确定抽样框:确立总体后,收集总体中全部抽样单位的名单。有两种确立方法:一是全选法,一个不能漏。如大学生社会实习调查。选定总体为全日制大学在校本科生与研究生,就要从各院系花名册中统一编号。另一种是分层次的样本框:如调查一个城市小学生的学习状况。全市500小学,选10所,再从10所中每个学校选3个班;最后每个班选10名学生。30第二节概率抽样的原理与程序决定抽样方案:31第二节概率抽样的原理与程序三,抽样的基本程序:---界定总体—确定抽样框---设计和选取样本---对样本进行评估等步骤P65:界定总体的重要性:例如:1936年总统选举。文摘杂志确定总体1000万份,回收200万份。依此预测共和党人兰登领先15%胜出。结果却是:民主党人罗斯福胜出,超20%。原因:没有确立好总体。而是求方便用的是电话号码簿上的人作调查对象,那些没有电话号码的人被排除在外了。32第三节概率抽样的方法分层抽样系统抽样简单随机抽样整群抽样33第三节概率抽样的方法一、简单概率抽样又称为纯随机抽样,它是最基本的概率抽样,对总体中的所有个体按完全符合随机原则的特定方法抽取样本,即抽样时不进行任何分组、排列,总体中每个个体都同样有被抽取的平等机会。34第三节概率抽样的方法简单随机抽样就是总体中的第一个单位在抽取时都有相同的被抽中机会。其概率公式为:抽样概率=样本单位数n/总体单位数N一般应用于调查总体中各个体之间差异程度较小,或者调查总体数量不太多的情况。35第三节概率抽样的方法简单随机抽样方法常用的有:1.抽签法:先将调查总体的每个个体编上号码,然后将号码写在卡片上搅拌均匀,任意从中选取,抽到一个号码,就对上一个个体,直到抽足预先规定的样本数目为止。此方法适用于调查总体中的个体数目较少的情况。2.随机数表法:随机数表法也称为乱数表法,是指含有一系列级别的随机数字的表格,一般利用特制的摇码设备摇出随机数字,也可以用电子设备自动产生随机数字。36第三节概率抽样的方法二,分层抽样(资料整理一章介绍)将总体按期属性不同划分为若干层次(或类型),然后在各层次(或类型)中随机抽取样本的技术。例如,常见分析标志为年龄、收入、职业等,其实质是科学分组与抽样原理的结合。按学生人数分组按工资分组50---59400---50060---69500---60070---79600---70080---89700---800分层抽样的方式一般有等比例抽样与非等比例抽样两种。37分层抽样优点:?数量一定的情况下保持同质性,减少误差。便于了解不同层次。如城乡妇女社会调查。38第三节概率抽样的方法等比例分层抽样:等比例分层抽样是按各层(或各类型)中的个体数量占总体数量的比例分配各层的样本数量。其表达式为:或非等比例分层抽样是根据其它因素,如各层平均数或成数均方差的大小,抽取样本的工作量和费用大小NNnniinNNniinNNniiiii39第三节概率抽样的方法三,整群抽样技术也称为分群抽样技术,它是指当总体所在基本单位自然组合为或被划分为若干个群后,从中随机抽取部分群的方法。分群抽样的特点:(A)以群为单位进行抽取,对样本的均匀性有较大影响;(B)与其他随机抽样技术相比,抽样误差较大,代表性较低,常通过多抽取样本来弥补不足。如10万户人口中抽1000户。选取居委会为整群单位。P。7340整群抽样例子:大学有100个班,每班30人,现在抽300人,怎么抽样?抽10个班

1 / 76
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功