第九章系统抽样§9.1概述§9.2等概率系统抽样——等距抽样§9.3线性趋势总体抽样方法的改进§9.4等概率系统抽样的方差估计§9.1概述一、系统抽样的定义及实施方法二、系统抽样的特点及局限性一、系统抽样的定义及实施方法系统抽样也称机械抽样,它是将总体中的单元按某种顺序排列,在规定的范围内随机抽取起始单元,然后按一套规则确定其他样本单元的一种抽样方法。最简单的系统抽样是等距抽样。当总体中的N个单元按直线排列时,根据样本容量n确定最接近N/n的一个整数k,在1~k是范围内随机抽取一个整数r,以单元r为起始单元,以后每隔是抽取一个单元作为样本单元。k称为抽样间距。例9.1N=90,n=18。当N=nk时,是一种等概率抽样。当N≠nk时,可采用拉希里(Lahid)提出的一种替代方法,称为圆形(或循环)系统抽样。方法是将总体单元排列成首尾相接的圆形,在1~N范围内随机抽取整数r为起始单元编号,然后每隔间距k(k仍为最接近于N/n的整数)抽取样本单元,直到抽足n个单元为止。例9.2N=22,n=5,N/n=22/5=4.4,取k=4,随机起点r=16。二维系统抽样的示意图二、系统抽样的特点及局限性系统抽样的主要优点:简便易行、容易掌握、对抽样框的要求也比较简单,直觉上似乎比简单随机抽样更精确。系统抽样的主要缺点:其方差估计较为复杂、困难。在一项使多阶抽样的用大规模抽样调查中,最后一阶或两阶抽样中常采用系统抽样。在实际上行之有效的系统抽样有时不是严格的概率抽样。§9.2等概率系统抽样——等距抽样一、估计量及其性质二、估计量方差的不同表示形式三、估计量的方差与总体单元排列顺序的关系一、估计量及其性质群层记Yrj=Y(j−1)k+r,r=1,2,⋯,k;j=1,2,⋯,n相应于起始值为r的系统样本的平均数为可用来估计总体均值,即当N=nk时,即是无偏的;但当N≠nk时,是有偏的。11nrrjjyynY11nsyrrjjyyynsyysyy11111kknsyrrjrrjEyyyYknk例9.1设总体由10个单元组成,指标值为Yi,i=1,2,⋯,10,取k=3,则3个可能的样本为:3114710258369123101311113433110syrrEyyYYYYYYYYYYYYYYY为改造为无偏的(1)采用圆形系统抽样。(2)修正的直线系统抽样。(3)syy*1rnsyrjjkyyN二、估计量方差的不同表示形式假定N=nk,1.用样本(群)内方差表示其中2211ksysyrrVyEyYyYk2wsyS2222111111knsyrjrwsyrjknNNVySyySSNNNN221111knwsyrjrrjSyykn2.用样本(群)内相关系数ρwsy表示其中2111sywsySNVynnN221211rjruwsycrjknrjrurjuEyYyYEyYyYyYnNS3.用层的有关参数表示其中211wstsywstSNnVynnN221211rjjruuwstrjjknrjjruurjuwstEyyyyEyyyyyynnkS三、估计量的方差与总体单元排列顺序的关系1.随机排列总体2.线性趋势总体3.周期性波动总体§9.3线性趋势总体抽样方法的改进一、中心位置样本法与首尾校正法二、对称系统抽样一、中心位置样本法与首尾校正法麦多(Madow)提出:直接将起始单元定为(k+1)/2(当k为奇数时),k/2或(k/2)+1(当k为偶数时)。这样样本单元都位于层的中心位置。但该方法的缺点是失去了抽样的随机性,已不是概率抽样了。耶茨(Yates)提出如下的修正估计量:这里1nrjrjjywy1121121,21211,2,,1nirkrkwwnnknnkwinn二、对称系统抽样1.塞蒂(Sethi)方法——层内对称系统抽样2.辛(Singh)方法——总体对称系统抽样2,211,0,1,2,,12nrjkjkrj,1,0,1,2,,12nrjkNjkrj§9.4等概率系统抽样的方差估计1.将系统样本视作简单随机样本。2.设n为偶数,将样本观测值按顺序两两分成一组。2211111nisyifNnvsyynnNn222222212212111212nniiiiiifNnvyyyynnnN3.考虑从第二个样本观测值起,每个与前一个组成一组,共n−1组。4.将样本容量为n的系统样本分成m个子样本独立地抽取,每个仍用系统(等距)抽样,样本容量为,抽样间距为,每个子样本的起始值独立地抽取。nnmkmk123111211112121niiiniiifvyynnNnyynnN241111ˆˆ,1mmvyYYymmm其中例9.2在一连续生产线上,每隔k=100件产品抽取一件,检查产品上的疵点数,下表是n=40个样品的检查结果。试估计这批产品(N=4000)的平均疵点数,并估计其方差。Y