第2章 基本抽样方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1 第二章第二章基本抽样方法基本抽样方法 Bask Sampling Method 基本抽样技术基本抽样技术是指调查研究中,设计抽样方案所依赖的一些基本设计要素。基本抽样技术包括抽样框的制定、一阶段抽样、多阶段抽样、估计抽样误差和确定样本规模。第一节第一节调查总体与抽样框调查总体与抽样框一、抽样的概念一、抽样的概念总体(Population):构成它的所有元素的集合,元素则是构成总体的最基本单位。样本(sample):从总体中按一定方式抽取出的一部分元素的集合,是总体的一个子集。抽样(sampling):从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程。一、抽样的概念一、抽样的概念抽样单位:即一次直接的抽样所使用的基本单位。抽样框:称为抽样范围,它指一次直接抽样时总体的所有抽样单位的名单。参数值:也称为总体值,是关于总体中某一变量的综合描述。统计值:也称为样本值,是关于样本中某一变量的综合描述。一、抽样的概念一、抽样的概念置信度:指总体参数值,落在样本统计值某一区间内的概率。它反映的是抽样的可靠性程度。置信区间:指样本统计值与总体参数值之间的误差范围,置信区间反映的是抽样的精确性程度。例如,从某一机关一万名干部中抽取200人为样本调查其平均工资,若样本的平均工资为100元,则总体平均工资落在95~105元这一区间的概率可能为96%(误差为±5元),落在90~110元这一区间的概率可能为99%(误差为±10元)。可见,置信区间越大,误差范围越大,置信水平越高,抽样的精确性程度就越低。2 二、抽样的作用二、抽样的作用œ向人们提供一种实现“由部分认识总体”这一目标的途径和手段。œ抽样主要解决的是调查对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。二、抽样的作用二、抽样的作用抽样调查主要用于下列一些现象的调查: 1.实际工作不可能进行全面调查,而又需要了解其全面情况的现象。 2.对某些现象虽然可以进行全面调查,但是由于总体范围大、单位数目多,又缺乏原始记录可作依据,实际进行全面调查有许多困难。 3.对普查和全面调查资料的质量检查和修正。 4.当被调查总体中的单位无限多时,事实上不可能进行全面调查,只能进行抽样调查。事件:1984年11月,里根以59%比41%的优势当选美国新一届总统。 44 56 哈里斯民意测验 43 57 美国广播公司/《华盛顿邮报》 45 55 罗珀民意测验 41 59 盖洛普民意测验/《新闻周刊》 41 59 盖洛普民意测验蒙代尔%里根%事件:1994年,美国总统大选预测的民意调查。 41 38 38 39 39 41 35 多尔% 49 51 51 52 51 49 54 克林顿% 2 9 盖洛普民意测验 2 9 《华盛顿邮报》 2 7 美国广播公司 1 9 哈里斯民意测验 2 8 选举结果 2 8 路透社民意测验 2 9 《新闻周刊》其他%佩罗%主办机构三、抽样的基本原理与相关理论三、抽样的基本原理与相关理论 1.抽样的基本原理œ同质性:每一个成员在所有方面都相同。œ异质性:个体相互之间存在着这样或那样的异别。œ概率样本所要反映的正是总体本身所具有的内在异质性。œ概率抽样要求保证总体中的每一个个体都有同等的机会入选样本;且任一个个体入选与否,与其他个体毫不相关,互不影响,即每一个个体的抽取都是相互独立的。œ概率抽样能够很好地按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。三、抽样的基本原理与相关理论三、抽样的基本原理与相关理论3 三、抽样的基本原理与相关理论三、抽样的基本原理与相关理论 2、抽样分布œ从一个总体不断抽取样本时,各种可能出现的样本统计值的分布情况。œ样本不是唯一的。不同的人抽样结果不一样。不同的样本数目: n N C 三、抽样的基本原理与相关理论三、抽样的基本原理与相关理论中心极限定理:在一个含有N个元素且平均数为μ,标准差为s的总体中,抽取所有可能含有n 个元素的样本(样本数目m=)。若用X 1 ,X 2 , X 3 ,…,X m 来分别表示m个样本的平均数,则样本平均数X i 的分布将是一个随n越大而越趋于具有平均数μ和标准差的正态分布。定理的意义:当n足够大时(通常假定大于 30),无论总体的分布如何,其样本平均数所构成的分布都趋于正态分布。 n N C n s正态分布图正态分布图μμ+SEμ-SEμ+2SEμ+3SEμ-2SEμ-3SE 34.13% 34.13% 13.6% 13.6% 2.16% 2.16%小概率事件区小概率事件区返回三、抽样的基本原理与相关理论三、抽样的基本原理与相关理论可以证明:平均数、众数、中位数相同。全部样本平均数的平均数正好等于总体的平均数μ。全部样本平均数的标准差(标准误差)等于总体标准差除以,SE=任何两个数值之间的样本平均数次数所占的比例是可以求得的。 n s n 四、抽样的步骤四、抽样的步骤抽样一般包括以下几个步骤:确定总体及抽样框、制定抽样方案、实际抽取样本和评估样本质量。抽样工作的第一步是确定总体和抽样框。总体还可进一步划分为研究总体和调查总体。具体抽样时,通常要把调查总体中所有能找到的调查对象名单排列起来,形成所谓的抽样框。抽样框有由名单构成的名单抽样框,有由区域或面积构成的区域抽样框。第二节第二节一阶段抽样一阶段抽样4 在抽样中,如果样本是一次直接从抽样框中抽出的,则称之为一阶段抽样。常用的一阶段抽样方法包括简单随机抽样、系统抽样、分层抽样和整群抽样等几种形式。一、简单随机抽样一、简单随机抽样简单随机抽样(simple random sampling)也称纯随机抽样,是严格按照随机原则从含有N 个的总体中抽取n个单位组成样本(Nn),在抽样过程中总体的每个单位都有同等的机会入选样本,而且每个单位的抽取都是相互独立的。根据被抽中的元素是否放回总体,又可分为放回简单随机抽样和不放回简单随机抽样,在实际抽样中大多采用不放回抽样。常用的简单随机抽样方法包括抽签法和随机数法。㈠㈠抽签法抽签法当总体数目不大时,可以采用抽签法。具体操作方法是先用均质材料做成N个签,给每个签编一个号码,将这N个签充分混合。然后一次抽出n个签;或每次抽取一个但不放回,再抽另一个直至抽满n个签为止。这抽出的n个签上的号码就是入样的单位号码。㈡㈡随机数法随机数法当总体单位很多时,通常采用随机数法。具体操作可以利用随机数表、随机数骰子、计算机产生的伪随机数等进行抽样。在几种操作方式中,最经常使用的是随机数表。随机数表是由范围在00001~99999内的 5位数的随机数,按行和列排序构成的,该随机数表允许从一个规模小于10万的总体中抽取简单随机样本。㈡㈡随机数法随机数法u先取得一份调查总体所有元素的名单(即抽样框);u将总体中所有元素都按顺序编号,根据编号的最大数确定使用随机数表中几位数码;u对随机数表中的数码逐一进行衡量并决定取舍,根据样本规模的要求选择出足够多的数码个数;u依据从随机数表中选出的数码,到抽样框中找出它所对应的元素。随机数表法:随机数表法:5 ㈡㈡随机数法随机数法除了随机数表,随机数骰子也是一种产生随机数的工具,它是由均匀材料制成的正 20面体,每一面上分别标有0~9的数字各2 个。使用时,可根据总体规模N的个数,决定使用几枚骰子,同时规定好不同颜色骰子所代表的位数,将骰子摇匀后读取骰子面朝上的数字,即可获得一个随机数。试验一:随意数试验。让六个人写下100个自己随意想到的三位数,将这些数内的0、 1、…、9数字列成次数分布表如右。可见,六个人都对数字存在偏好,如第一个人更加偏好数字4、3、0;第二个人则偏好数字1、8、 4;等等。这种由于数字偏好所引起的偏估类型可称之为数字偏误。 300 300 300 300 300 300 300 合计 30303030303030303030 50      1      38    29     34     59 29     48     30    57     33     27 20     19     28    31     20     22 50     39     34 34 24 24 55     40     28    29     15     27 20     18     31    15     30     25 30     26 26 27     31     15 12     39     32    35     42     35 25     42     30    23     44     37 9      28     23    20     27     29 0 1 2 3 4 5 6 7 8 9 1       2      3      4       5       6 期望次数人的编号数字两个有名的试验两个有名的试验试验二:着色试验。让四个人将10×10方格的纸板着色,可供选择的颜色有蓝、绿、红、白和黄色五种,对每一个四分象限来说,规定每种颜色只能在每行和每列出现一次。每个方格以其所在的列号与行号表示,如(4,6)代表第四列第六行的方格。请四个人对这100个方格随意选择行列号,而对其着色。将这些由这四个人着色所得到的资料形成次数分布表如下:两个有名的试验两个有名的试验四个人对方格着色的次数分布四个人对方格着色的次数分布 100 100 100 100 100 合计 2020202020 14     26     20     12 28     21     15     21 15     12     20     22 25     23     20     19 18 18 25     26 蓝绿红白黄 1       2       3       4 期望数字人的编号颜色可见四个人都对颜色存在偏好,如第一个人偏爱绿色,第二个人偏爱蓝色等。这种由于对颜色偏好所引起的偏估类型,可称之为颜色偏误。结论:随意抽样≠随机抽样二、系统抽样二、系统抽样系统抽样系统抽样(systematic sampling),又称机械抽样,即将N个总体单位按一定顺序排列,然后先随机抽取一个单位作为起始单位,再按某种确定的规则抽取其他n­1个样本单位。在系统抽样中,等距抽样是最常用的规则,由于抽样使用的是抽样间距,而不是随机数,故等距抽样是一种准随机抽样方法。常用的等距抽样方法包括直线等距抽样和循环等距抽样,二者的区别在于总体规模N 是否为样本规模n的整数倍。㈠㈠整数抽样间距整数抽样间距当N是n的整数倍,即抽样间距k=N/n是整数,可使用直线等距抽样。即在算出抽样间距后,先在1~k范围内抽取一个随机数r作为起点,然后每隔k个单位抽出一个单位,直到抽出n个单位。抽中单位的号码分别为: r,r+k,…,r+(n­1)k6 u将总体中的每个元素都按顺序编上号码:1~10000 u计算出抽样间距K:已知总体规模N=10000,样本规模n=100,那么抽样间距K=N/n=100 u在最前面的100户中,采用简单随机抽样法抽取1 户,记下这户的编号。设所抽取的这户的编号是57 u在抽样框中,自57开始,每隔100就抽1户,即所抽取的家庭编号分别为:57,157,257,…,9957 u将这100户组合起来,就构成了本次调查总体的一个样本。㈠㈠整数抽样间距整数抽样间距㈠㈠整数抽样间距整数抽样间距练习题:练习题:某大学有12000名学生,欲了解其生活态度,决定采用等距抽样的方法从中抽查200名学生,用简单随机抽样的方法抽出第一名学生序号为12,请计算第十位,第十五位学生的序号是多少? ㈠㈠整数抽样间距整数抽样间距注意:等距抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,会使等距抽样产生极大的误差,降低样本的代表性。等距抽样最适用于同质性较高的总体,当总体内个体类别之间的悬殊过大时,样本的代表性可能较差。在这种情况下应采用另一种抽样方法。㈡㈡非整数抽样间距非整数抽样

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功