抽样调查-2简单随机抽样

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Chap2简单随机抽样2.2简单估计法(SE)2.1定义与符号抽样调查2.5样本量的确定2.6其它相关问题2.3比率估计量2.4回归估计量抽样调查2019/8/212§2.1定义与符号一、定义与符号(一)定义上述抽样就称为不放回简单随机抽样定义2.1:设有限总体共有N个单元,一次整批抽取n个单元使得每个单元被抽中的概率都相等,任何n个不同单元的组合(样本)都有相同的概率被抽中,这种抽样方法称为简单随机抽样法,所抽到的样本为简单随机样本。抽样调查2019/8/213定义2.2:(在具体实施过程中,)从总体中逐个等概率抽取单元(每次抽取到尚未入样的任何一个单元的概率都相等),直到抽满n个为止。如果每次抽中一个单元,然后放回总体,重新抽取。这样一个单元有可能被重复抽中,故又称重复抽样。1.nnNN所有可能样本有个,每个样本抽中的概率为抽样调查2019/8/214定义2.3按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的CNn个样本,从CNn个样本随机抽取一个样本,使每个样本被抽中的概率都等于1/CNn.上述三中定义其实是完全等价的,而定义2.2在实际中容易实施。抽样调查2019/8/215例2.1设总体有5个单元(1,2,3,4,5),按有放回简单随机抽样的方式抽取容量为2的样本,则所有可能样本为2552个,如表2.1。表2.1放回简单随机抽样所有可能样本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,5抽样调查2019/8/216例2.2上述总体按不放回简单随机抽样方式抽取容量为2的样本,则所有可能样本为1025C个,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2不放回简单随机抽样所有可能样本抽样调查2019/8/217(二)样本分布与符号从总体},,,{21NNYYY抽样单元。假设顺序被抽中的样本单元的号码为niii,,,21(入样号码),则样本为),,,(21niiiYYYy12(,,,)nyyy,称Nnf为抽样比(Samplingfraction)。中逐个不放回抽取n个作为随机变量样本有什么分布呢?抽样调查2019/8/2181y1,…yn同分布但不相互独立,其共同分布列为NYyPi1}{1YYNyENi111)(2211)(1)(YYNyDNi2(yi,yj)的联合分布列均同(y1,y2),0)1(1},{21jijiNNYyYyPji抽样调查2019/8/219表2.3符号NNiYYYYY211NYYYYNYNNi/)(1211)10(,11orYYNNAPiNiXYXYXYRNiNi1122121)(11NNYYNSNinniyyyy211nyyyyynni/)(211)10(,11oryynnapiaixyxyrnini11212)(11yynsni总体参数样本统计量222YSC抽样调查2019/8/2110二、抽样方法(一)抽签法制作N个外形相同的签,将它们充分混合,然后一次抽取n个签,或一次抽取一个但不放回,抽取n次得到n个签。则这n个签上所对应号码表示入样的单元号。例如:某中学为了解学生身体素质的基本状况,从全校N=1200人中抽取一个简单样本n=100人进行检查。抽样调查2019/8/21111随机数表(二)随机数法如上例,N=1200,则在表中随机连续取四列,顺序往下,选出前面100个不同(不放回抽样)的0001~1200之间的数字。如果不够100个,可随机再取四列,同样操作,直至抽取100个止。抽样调查2019/8/2112Simplerandomsampling抽样调查2019/8/211357172420887009811333269022995943909496073388387680289231565909839458178940570743779506734410609871191585974577427917588911607115960179624498170096711900614495295614955678381694722849931943036744831286807196510177729839498335875230566242754993809195058200079068455528677648980566844095086216481611764624164355139405751834121825974465695837104112514291747736639113382480767315148724356703845363154581163862994576488597565417152665167879673099607283206312431238982368310853040387524601881990564674708846013318816374462145512309429831953872391707421978698809272201152432110048125052431618139641369709952253501584316814925405234634916802048315220769824181011610152717046314609150716050229212593079579434881321171120917154988168127005013748499278287518085502035109105530910713364396566072554770214627922705920349089269853061756122176825182394768750612840774138754107091907430568196756348141598504321681782249946375454720185224384614452830953086330804968698087594561107556245878875371626648645498638964835346055750031758290562230237777954187026300Tableofrandomnumbers抽样调查2019/8/21142随机数骰子随机数骰子是由均匀材质制成的正20面体,每个面上刻有一个0~9的数字,且每个数字只出现在两个面上。要产生一个m位数的随机数(如m=4,N=1200),则将m(m=4)个颜色不同的骰子盒中,并规定每个颜色代表的位数,盖上盖子,充分摇动盒子后,打开读出各色骰子的数字,即可得一个随机数。重复上述过程,直至产生了n个满足条件的随机数。抽样调查2019/8/21153利用统计软件直接抽取法大部分统计软件都有产生随机数的功能,快捷方便。不过产生的是伪随机数,有一定循环周期的。简单介绍一下利用EXCEL产生随机数的方法.抽样调查2019/8/2116抽样调查2019/8/2117抽样调查2019/8/2118抽样调查2019/8/2119§2.2简单估计法(SE)一、总体均值的估计(一)简单估计定义………………..(2.6)ˆY11niiyyn(二)简单估计量的性质引理2.1从大小为N的总体中抽取一个样本容量为n的简单随机样本,则总体中每个特定的单元入样的概率为n/N,两个特定单元入样的概率为n(n-1)/N(N-1)。抽样调查2019/8/2120引理2.2从大小为N的总体中抽取一个样本容量为n的简单随机样本。若令:1iiYao入样否则1inEafN21inNnVaffNN13cov,1,11ijffnnaaijNNNN则:抽样调查2019/8/2121(二)简单估计量的性质定理2.1上述简单估计是无偏的,即[]EyY定理2.2上述简单估计的方差(均方误差)为:221()NnfVySSnNn……….(2.12/2.18)抽样调查2019/8/2122证明(P35证法1对称证法):211[()]niEyYn21[()()]nijijEyYyYn1221(1)[()()]nnEyYyYn2()[]VyEyY212])([1niYyEn2211[]niEyYn21211[]nEyYn11()Vyn11()()(1)NijijnYYYYnNN2111()NiYYnN211111[()()()](1)NNNijinYYYYYYnNN2211NnSSnNnN222111()NnfSSSnNnNn为0注意样本分布抽样调查2019/8/2123推论2.7)(yV的无偏估计为21snf………..(2.25)证明:只须说明样本方差是总体方差的无偏估计即可。])([11][122niyyEnsE211[()]1niEyYYyn]))((2)()([111122nniiYyYyYynYyEn}][])([{1122YynEYyEni注意)()(1YynYyni}][][{11221YynEYynEn)]()([11yVyVnn])(1[1212SnNnNYYNnnNi222]1[1SSnNnNSNNnn抽样调查2019/8/2124例2.3从某个N=100的总体重抽取一个容量n=10的简单随机样本,要估计总体平均水平,并给出置信度为95%的置信区间估计。如表2.4序号iiy1234567891045204661508表2.4简单随机样本指标抽样调查2019/8/2125抽样调查2019/8/2126(三)有放回简单随机抽样的简单估计量11niyyn11()[]VyDyn12211NNSSnNn21211)(snsnNNyvN由于1,nfNN故有放回抽样的精度低于不放回抽样的精度。抽样调查2019/8/2127说明:1抽样调查中的估计量与传统数理统计中估计量的区别(见表2.5)表2.5抽样理论与传统数理统计关于样本均值性质异同比较nNCY11niyyn11niyyn[]EyY[]Ey221()NnfVySSnNn2()Vyn2()VX抽样理论数理统计理论假设样本之间不独立,所以可能样本最多个,欲估计总体特征为,当n=N时可以求出样本之间独立,所有可能样本最多为无限多个;欲估计总体特征为总体(一般是随机变量X)期望μ,一般不能通过样本求出符号、定义期望方差抽样调查2019/8/21282总体方差一般也是未知的,故计算估计量方差(估计)值时总是用样本方差直接去估计它,因为该估计无偏,故这样做相对是合理的。3对于无限总体的简单随机抽样(或有限总体有放回简单抽样)估计中由于N一般很大,即从有限总体抽样得到简单随机样本均值得方差是从无限总体抽样得的独立样本均值的方差的1-f倍,要小些,这意味着对同等样本量,不放回简单随机抽样的精度高于有放回的。由于样本点不会重复,样本量相同时所包含的有效样本点更多,因此信息更多,效果当然好些。1-f又被称为有限总体校正系数。2212111)(SnSnSnNNyVN抽样调查2019/8/21294样本容量n越大,估计量方差越小。当样本容量一定时,总体方差越大,估计量方差越大。由于总体方差是固定的,因此在简单随机抽样的条件下,要提高估计量精度就只有增加样本容量了。但增加样本容量也会带来计算量骤增和成本增加,所以是矛盾的一对,需要找到合适的平衡点。抽样调查2019/8/2130二、

1 / 80
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功