盐城师范学院抽样调查技术与技能期末论文题目:《系统抽样与其他抽样的方法的联系,以及不同抽样方法的效果》姓名:崔亚楠二级学院:数学科学学院专业:统计学班级:统计学131班学号:13213205成绩评定:引言1、申明为处理方便起见,以下只讨论系统抽样,且总是假定N是n的整数倍,即N=nk的情形。在这一情况之下,直线和圆形等距抽样的结果一致,样本量一样,尤其关键的是这可以保证各个单元的入样概率都相等。2、符号说明为了方便讨论,将总体的N个单元(实际上是抽样框的N个抽样单元)排列成k行n列,如表1所示。表1等距系统抽样的总体单元排列表12jn行平均12rk1Y2YrYkY1kY2kYkrYkrY(1)1jkY(1)2jkY(1)jkrYjkY(1)1nkY(1)2nkY(1)nkrYrkY1Y2YrYkY列平均1Y2YjYnYY各符号的含义如下:总体单元数:N样本单元数:n第r行第j列的单元变量值:(1)jkrY第r行对应变量的总体均值:rY,rY=(1)11jkrnjYn第j列对应的变量的总体均值:jY,jY=(1)11jkrkrYk注意表1中主区(上下左右去掉一行或者一列剩余的部分)共有k行n列,显然每行都是系统抽样的一个可能样本,所以系统抽样可以看做按简单随机抽样方式(由随机起点的抽法以及牵一发动全身的特性所决定)从k行中抽取一行,每行被抽中的等概率都等于1/k这种说法与第2章里关于简单随机抽样为从所有(等概率的)可能样本中随机抽出一个样本的第一种定义是吻合的。如果表1中的第r行第j列的单元变量值改记为rjY,则(1)rjjkrYY,r=1,2,…,n;j=1,2,…,n则表1的内容就将变成表2。表2等距系统抽样的总体单元的“群”“层”排列表12…j…n群平均12rk11Y21Y1rY1kY12Y22Y2rY2kY…………1jY2jYrjYkjY…………1nY2nYrnYknY1Y2YrYkY层平均1Y2Y…jY…nYY这一变换将导致一系列令人兴奋的结果:如果将每一行的单元视为群,总体由k个群组成,每个群的大小都是n,则系统抽样可以看成从k个群中随机抽取一个群的特殊整群抽样。而如果将每一列单元视为一层,则总体由n个层组成,每个层的大小都是k,则系统抽样可以看成从n个层中各取一个单元的特殊分层抽样,所谓特殊是指这里的群与层更多是形式上的而不是本质上的,不是自然存在的,而是完全取决于单元的排序结果。例如由于上述系统抽样的样本单元在各层的位置相同,就和分层随机抽样中层的构成有很大不同。同时,由于系统抽样的所有可能样本对应于总体全部单元的某一排列顺序,而简单随机抽样所有可能样本则对应于总体全部单元的所有而非某一排列顺序,系统抽样的所有可能样本的数目只有k个,而简单随机抽样所有可能样本的数目有nNC个,因而系统抽样的所有可能样本属于简单随机抽样所有可能样本的一个特殊部分,故系统抽样又可以看成一种特殊的简单随机抽样。总体均值:111111rjrjknknrjrjYYYNnk总体方差;22211111111rjrjknknrjrjSYYYYNnk总体“群”平均:rrYY111,2,,nrjjYrkn样本“群”平均:1111nnrrjrjrjjyyYYnn(r=1,2,…,k)注意:这里隐含着抽样类文献的一个普遍假设,变量值的取得过程即实地调查环节不产生任何误差。如果缺乏这一假设,根据误差公理rjrjyY,因而rryY是根本不可能的。二、下面通过一个例子1、表3\jr12345678910群平均群内方差12311111112121213131314141415151516161617171718181819191920202015.515.515.59.179.179.17层平均11.012.013.014.015.016.017.018.019.020.0层内方差00000000008.53根据表有总体方差:28.53S平均群(行)内方差:2rS=13(9.17+9.17+9.17)=9.17平均层(列)内方差:21000010jS计算每种抽样的总体均值估计量的方差。(1)以行为群的整体抽样或者以行为“系统样本”的系统抽样:k=3,n=10,22221(1)1(1)()0wsysyrNknNknVySSSSNNNN(2)以列为群(系统样本)的整体抽样或者以列为“系统样本”的系统抽样:k=3,n=10,22221(1)1(1)()8.25wsysyjNknNknVySSSSNNNN(3)以行为层的分层随机抽样(每层抽一个单元):L=3,n=3,f=3/3022111()2.75LsthhrhffVyWSSnn(4)以列为层的分层随机抽样(每层抽一个单元):L=10,n=10,f=10/3022111()0jLsthhhffVyWSSnn(5)简单随机抽样:n=10,f=10/30。21()0.57fVySn(6)简单随机抽样:n=3,f=3/30。21()2.56fVySn2、下面将表3中的总体单元的顺序重新排列形成表4表4\jr12345678910群平均群内方差12311111312121411131312141415151716161815171716181819191920202014.715.516.310.239.176.67层平均11.6712.6712.3313.3315.6716.6716.3317.3319.0020.0层内方差0.890.890.890.890.890.890.890.89008.53根据表有总体方差:28.53S平均群(行)内方差:2rS=13(10.23+9.17+6.67)=8.69平均层(列)内方差:210.890.89000.7110jS计算每种抽样的总体均值估计量的方差。(1)以行为群的整体抽样或者以行为“系统样本”的系统抽样:k=3,n=10,22221(1)1(1)()0.43wsysyrNknNknVySSSSNNNN(2)以列为群(系统样本)的整体抽样或者以列为“系统样本”的系统抽样:k=3,n=10,22221(1)1(1)()7.6 1wsysyjNknNknVySSSSNNNN(3)以行为层的分层随机抽样(每层抽一个单元):L=3,n=3,f=3/3022111()2.61LsthhrhffVyWSSnn(4)以列为层的分层随机抽样(每层抽一个单元):L=10,n=10,f=10/3022111()0.05jLsthhhffVyWSSnn(5)简单随机抽样:n=10,f=10/30。21()0.57fVySn(6)简单随机抽样:n=3,f=3/30。21()2.56fVySn三、总结从上述1可以看出(1)和整群抽样一样,系统抽样的估计精度几乎完全取决于其“系统样本”(群)内的差异与总体差异的对比。(2)系统抽样与其他抽样方法相比优劣难以定论,可能好也可能差,这完全取决于其“系统样本”(群)内的差异与总体的差异的对比,而这个对比则取决于系统抽样中的总体单元排列顺序。另外三种方法的比较同样难定优劣,都需要具体情况具体分析。由上述2可以看出将结果1与结果2比较,不难发现,简单随机抽样的方差未变,说明简单随机抽样的结果与顺序无关;而系统抽样、整群抽样以及分层抽样的结果都与单元的顺序或组合结构有关。同时,结果2相对结果1的极好与极差都有一定的距离,这提示我们在选择抽样方式时,必须多掌握有关单元的顺序或组合结构特点方面的信息,才可做出良好判断。