抽样方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

一、分层随机抽样分层随机抽样(Stratifiedsampling)是随机抽样中的一种抽样方法。在抽样前先对母群体依某些特征分成若干层,再利用简单随机抽样,自各层中抽取样本.类型随机抽样,又称分层随机抽样,它是先将总体各单位按一定标准分成各种类型(或层);然后根据各类型单位数与总体单位数的比例,确定从各类型中抽取样本单位的数量;最后,按照随机原则从各类型中抽取样本。编辑本段案例学习比如,我们要了解某市400个国营企业的生产经营情况,决定采取类型随机抽样法抽取20个企业作为样本进行调查,其具体做法是:首先,将这400个企业按产业(也可按行政区划、盈利情况、规模大小等)分为三类,假定第一产业40个,第二产业200个,第三产业160个。然后,按各类企业在总体中的比重,确定各类企业抽取样本单位的数量。其中,第一产业的企业占总体10%,按比例应抽样本企业2个;按同样方法计算,第二产业中应抽样本企业10个,第三产业中应抽样本企业8个。最后,采用简单随机抽样或等距随机抽样方法,从各类企业中抽出上述数量的样本单位。搞好类型随机抽样的关键,是分类的标准要科学、要符合实际情况,许多复杂的事物还应该根据多种标准作多种分类或综合分类。分类的结果必须是每一个单位都归属于某一类,而不允许既可属于这一类、又可属于那一类,也不允许互相交叉或有所遗漏;必须是各类型单位的数量之和等于总体单位的数量,而不允许大于或小于总体单位的数量。编辑本段类型随机抽样的优点类型随机抽样的优点是,它适用于总体单位数量较多、内部差异较大的调查对象。与简单随机抽样和等距随机抽样相比较,在样本数量相同时,它的抽样误差较小;在抽样误差的要求相同时,它所需的样本数量较少。类型随机抽样的缺点是,必须对总体各单位的情况有较多的了解,否则无法作出科学的分类。而这一点在实际调查之前又往往难以做到。二、等距抽样的概念等距抽样也称为系统抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止。等距抽样的分类根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。按照具体实施等距抽样的作法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。等距抽样特征等距抽样的特点是:抽出的单位在总体中是均匀分布的,且抽取样本可少于纯随机抽样。等距抽样要求等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。等距抽样要防止周期性偏差,因为它会降低样本的代表性。例如,军队人员名单通常按班排列,10人一班,班长排第1名,若抽样距离也取10时,则样本或全由士兵组成或全由班长组成。编辑本段等距抽样具体操作等距抽样的优缺点等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。由此可见,只要抽样者对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。抽样调查中的应用在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。样本距离可通过下面公式确定:样本距离=总体单位数∕样本单位数例如,你使用本地电话本并确定样本距离为100,那么100个中取1个组成样本。这个公式保证了整个列表的完整性。等距抽样方式随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第5页开始,在该页上再另选一个数决定从该行开始。假定从第3行开始,这就决定了开始的位置。编辑本段等距抽样方法当总体单位的顺序排列之后,可选用下列方法进行等距抽样。(1)随机起点等距抽样即在总体分成K段(K=N/n)的前提下,首先从第一段的1至k号总体单位中随机抽选一个样本单位,然后每隔k个单位抽取一个样本单位,直到抽足n个单位为止。这n个单位就构成了一个随机起点的等距样本。这种方法能够保证各个总体单位具有相同的概率被抽到,但是,如果随机起点单位处于每一段的低端或高端,就会导致往后的单位都会处于相应段的低端或高端,从而使抽样出现偏低或偏高的系统误差。(2)半距起点等距随机抽样这种方法又称为中点法抽取样本,它是在总体的第一段,取1,2,…,k号中的中间项为起点,然后再每隔k个单位抽取一个样本单位,直到抽足n个样本单位为止。当总体是按有关标志的大小顺序排列时,采用中点法抽取样本,可提高整个样本对总体的代表性。(3)随机起点对称等距抽样这种方法是在总体第一段随机抽到第i个单位,而在第二段抽取第2k-f+1的单位,在第三段抽取第2k+f的单位,而在第四段抽取第4k-f+1的单位…,以此交替对称进行。可概括为:在总体奇数段抽取第jk+i单位(j=0,2,4…);在总体偶数段抽取第jk-i+1单位(j=2,4…)。这种抽样方法能使处于低端的样本单位与另一段处于高端的样本单位相互搭配,从而抵消或避免抽样中的系统误差。(4)循环等距抽样当N为有限总体而且不能被n所整除,亦即k不是一个整数时,可将总体各单位按顺序排成首尾相接的循环圆形,用N/n确定抽样间隔k,k可以取最接近的整数,然后在第一段的1至后号中抽取一个作为随机起点,再每隔后个单位抽取一个样本单位,直至抽满行个为止。编辑本段等距抽样排序方法采用等距抽样时,必须首先对总体单位按某种标志进行排序,有下列两种排序方法。(1)按无关标志排序即总体单位排列的顺序和所要研究的标志是无关的。如调查职工的收入水平,可按姓氏笔划排列的职工名单进行抽样;工业生产质量检验可按产品生产的时间顺序进行等距抽样等等。一般认为,按无关标志排队的等距抽样是一种抽签法,随机数表法更好的纯随机抽样方式,又称无序系统抽样。(2)按有关标志排序即总体单位排列的顺序与所要研究的标志是有直接关系的。例如,农产量抽样调查时,可按照当年估产或前几年的平均实产由低到高或由高到低的顺序进行抽样。这种按有关标志排队的等距抽样又称有序系统抽样,它能使标志值高低不同的单位,均有可能选入样本,从而提高样本的代表性,减小抽样误差。一般认为有序系统抽样比等比例分层抽样能使样本更均匀地分布在总体中,抽样误差也更小。等距抽样等距抽样也称为:机械抽样\系统抽样(Systematicsampling)、SYS抽样、间隔抽样法(Intervalsampling)目录[隐藏]1什么是等距抽样2等距抽样的作法3等距抽样的优点4等距抽样的特点5等距抽样的排序方法6等距抽样的方法7等距抽样在抽样调查中的应用8等距抽样的估计9等距抽样的例子[编辑]什么是等距抽样等距抽样也称为系统抽样、或机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止。等距抽样要防止周期性偏差,因为它会降低样本的代表性。例如,军队人员名单通常按班排列,10人一班,班长排第1名,若抽样距离也取10时,则样本或全由士兵组成或全由班长组成。根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。[编辑]等距抽样的作法按照具体实施等距抽样的作法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。[编辑]等距抽样的优点等距抽样的最主要优点是简便易行,且当对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。[编辑]等距抽样的特点等距抽样的特点是:抽出的单位在总体中是均匀分布的,且抽取的样本可少于纯随机抽样。等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。[编辑]等距抽样的排序方法采用等距抽样时,必须首先对总体单位按某种标志进行排序,有下列两种排序方法。(1)按无关标志排序。即总体单位排列的顺序和所要研究的标志是无关的。如调查职工的收入水平,可按姓氏笔划排列的职工名单进行抽样;工业生产质量检验可按产品生产的时间顺序进行等距抽样等等。一般认为,按无关标志排队的等距抽样是一种抽签法,随机数表法更好的纯随机抽样方式,又称无序系统抽样。(2)按有关标志排序。即总体单位排列的顺序与所要研究的标志是有直接关系的。例如,农产量抽样调查时,可按照当年估产或前几年的平均实产由低到高或由高到低的顺序进行抽样。这种按有关标志排队的等距抽样又称有序系统抽样,它能使标志值高低不同的单位,均有可能选入样本,从而提高样本的代表性,减小抽样误差。一般认为有序系统抽样比等比例分层抽样能使样本更均匀地分布在总体中,抽样误差也更小。[编辑]等距抽样的方法当总体单位的顺序排列之后,可选用下列方法进行等距抽样。(1)随机起点等距抽样。即在总体分成K段(K=N/n)的前提下,首先从第一段的1至k号总体单位中随机抽选一个样本单位,然后每隔k个单位抽取一个样本单位,直到抽足n个单位为止。这n个单位就构成了一个随机起点的等距样本。这种方法能够保证各个总体单位具有相同的概率被抽到,但是,如果随机起点单位处于每一段的低端或高端,就会导致往后的单位都会处于相应段的低端或高端,从而使抽样出现偏低或偏高的系统误差。(2)半距起点等距随机抽样。这种方法又称为中点法抽取样本,它是在总体的第一段,取1,2,…,k号中的中间项为起点,然后再每隔k个单位抽取一个样本单位,直到抽足n个样本单位为止。当总体是按有关标志的大小顺序排列时,采用中点法抽取样本,可提高整个样本对总体的代表性。(3)随机起点对称等距抽样。这种方法是在总体第一段随机抽到第i个单位,而在第二段抽取第2k-f+1的单位,在第三段抽取第2k+f的单位,而在第四段抽取第4k-f+1的单位…,以此交替对称进行。可概括为:在总体奇数段抽取第jk+i单位(j=0,2,4…);在总体偶数段抽取第jk-i+1单位(j=2,4…)。这种抽样方法能使处于低端的样本单位与另一段处于高端的样本单位相互搭配,从而抵消或避免抽样中的系统误差。(4)循环等距抽样。当N为有限总体而且不能被n所整除,亦即k不是一个整数时,可将总体各单位按顺序排成首尾相接的循环圆形,用N/n确定抽样间隔k,k可以取最接近的整数,然后在第一段的1至后号中抽取一个作为随机起点,再每隔后个单位抽取一个样本单位,直至抽满行个为止。[编辑]等距抽样在抽样调查中的应用在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。样本距离可通过下面公式确定:样本距离=总体单位数∕样本单位数例如,假设你使用本地电话本并确定样本距离为100,那么100个中取1个组成样本。这个公式保证了整个列表的完整性。等距抽样方式随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第5页开始,

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功