第八章二阶及多阶抽样.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第八章二阶及多阶抽样8.1概述1.二阶抽样定义:设总体由N个初级单元组成,每个初级单元又由若干次级单元组成,若在总体中按一定方法抽取n个初级单元,对每个被抽中的初级单元再抽取若干次级单元进行调查,这种抽样称为二阶抽样。2.二阶抽样与分层抽样、整群抽样的关系:如果第一阶段抽样采用全面调查,二阶抽样就成了分层抽样;如果第二阶段抽样采用全面调查,二阶抽样就成了整群抽样。)ˆ()ˆ()1(21EEE)ˆ()ˆ()ˆ()2(2121VEEVV性质l对于两阶抽样,有式中,E2,V2为在固定初级单元时对第二阶抽样求均值和方差;E1,V1为对第一阶抽样求均值和方差。)]ˆ([)]ˆ([)]ˆ([})ˆ({)]ˆ([})ˆ({)]ˆ([)]ˆ([~)ˆ(~2)]ˆ([)]ˆ([~)ˆ(~2ˆ)ˆ()ˆ(~)ˆ(~2)ˆ()]ˆ([~)ˆ(~2)ˆ()~ˆ()~ˆ(~ˆ)ˆ(~ˆ21212122122122121221221212212222211222222222222212VEEVVEEEEEEEVEEEEEVEEEEVEEVEEVEEEEEEEVE,得对上式两边求由)()(记8.2初级单元大小相等时的二阶抽样9.2.1总体均值的估计量:假定总体由N个初级单元组成,每个初级单元都含有M个次级单元。从N个初级单元中按简单随机抽样抽取n个初级单元,在每个被抽中的初级单元中按简单随机抽样抽取m个次级单元。总体的第i个初级单元样本的第i个初级单元次级单元数Mm和均值方差MjijiYY1mjijiyy1MYYiimyyiiMjiijiYYMS1222)(11mjiijiyyms1222)(11iimjiijiiMjiijiiniiNiinimjijniinimjijniiNiMjijNiiyymsYYMSiyynsYYNSmyyMYYnyyNYYyyyYYYnmmNMMnN12221222122112210110111111100)(11)(11)(11)(11///二级单元间的方差个初级单元第初级单元间的方差次级单元的均值初级单元的均值总和次级单元数初级单元数样本总体定理:若两阶段的抽样都是简单随机抽样的,则的无偏估计量;是Yy)1(NiMjiijNiiNiiYYMNSNSYYNSSmnfSnfyV112122221221222211)()1(11)(11,11)()2(,其中nimjiijniiniiyymnsnsyynssmnffsnfyv1121222212212221211)()1(11)(11,)1(1)()3(,其中证明:的无偏估计量;是Yy)1(YYnEnyEEnyEEnmyEEyEEyEniiniiniinimjij111211211121211)()()()()(证明:22221111)()2(SmnfSnfyV22221112222111221221111222111121121111111111)(1111)1()(SnmfSnfSNnmfSnfSnEnmfSnfMYYmfnEYnVynVEynEVyVNiiniiniMiiijniiniinii证明:2212212211121112211122122212211)(111)(111)()1(1)()(SSNSnEYYMnEyymEnEyymnEEsEEsENiiniiniMjiijnimjiijnimjiij2221211)1(1)()3(smnffsnfyv.1ˆ1)()(.212222121222212121212222的无偏估计是的无偏估计是SsmfsSSmfSsEEsESs)的无偏估计。(是yVsmnffsnfyv2221211)1(1)(例:文具商店一柜台,上月共用了18本发票,每本发票含发票200张。查帐者随机挑选了4本发票,再在挑中的发票本中随机抽了40张发票,记录其营业额。数据整理如下:估计该柜台上个月的营业总额及标准差。84.466540.357477.326024.317359.402692.368200.718095.44114012401iijiijyyi解:37.0)1(1)(20040,18494.32169.1)(1128.91601176.3794.8410.1993.7300.1622.9290.5805.11122212112112222122144022smnffsnfyvMmfNnfsnsyynsyynmysyiniiniiijijnimjijii79.218937.020018)()ˆ(00.3340828.920018ˆyvNMYsyNMY8.3初级单元大小不等时的二阶抽样1)(1)()(11)(11///12221222122112210110111111111010imjiijiiMjiijiniiNiinimjijnimjijniiNiMjijNiiiiimjijiiiiMjijiniiNiimyysMYYSiyynsYYNSmyyMYYyyyYYYmyyyyMYYYYimmMMnNiiiiiii二级单元间的方差个初级单元的第初级单元间的方差次级单元的均值总和,,均值个初级单元指标总和、第次级单元数初级单元数样本总体8.3.1对初级单元进行简单随机抽样时,总体总和Y的估计第一阶抽样按简单随机抽样从N个初级单元中抽取n个,第二阶抽样按简单随机抽样,在抽中的初级单元中分别独立抽取次级单元。(1)简单估计:niiuniiiiiniuiNiiiiiNiiuniiiniiuYnYsmfMnNnYYnfNYvSmfMnNNYYnfNYVnyMNYnNY112222121212222121211ˆ1ˆ,)1(1)ˆˆ(1)ˆ()1(1)(1)ˆ(ˆˆ其中证明:的无偏估计量;是YnyMNYniiiu1ˆ)1(YYnNEnYNEnYMNEnyEMNEnyMNEEYEEYEniiniiniiiniiiniiiuu111111121121211)()ˆ()ˆ(NiiiiiNiiuSmfMnNNYYnfNYV122221212)1(1)(1)ˆ(证明:212222211121221111211211)()()ˆ(nSmfMNEnYNVnyVMNEnYMNVnyMNVEnyMNEVYVniiiiiniiniiiniiiniiiniiiuNiiiiiNiiNiiiiiNiiniiiiiNiiSmfMnNNYYnfNNSmfMnNNYYnfNnSmfMEnNNYYnfN122221212122222121212222121212)1(1)(1)1(1)(1)1(1)(11,)11ˆ1ˆ1,)111)ˆ(ˆˆˆ,,1222122221221212221222212212110110imjiijiniiiiiniRiiRiMjiijiNiiiiiNiiiRRniiniiRiNiiNiimyyssmfMnNnYyMnfNYvMYYSSmfMnNNYYMnfNYMSEYVMYMYMMYMYii)(其中()()()(其中()()(为辅助变量:以可用比估计(2)比估计:8.3.2对初级单元进行放回不等概率抽样时,总体总和Y的估计第一阶抽样按放回不等概率抽样(多项抽样)抽取初级单元,第二阶抽样并没有作出特别的规定,只要初级单元指标Yi的估计是无偏的.niHHiiHHNiiiNiiiiHHiiiniiiHHYzYnnYvZYVnYZYZnYVyMYzYnY1212211)ˆˆ()1(1)ˆ()ˆ(1)(1)ˆ(ˆ,ˆ1ˆ其中iYˆ2222212211)ˆ()ˆ(1)(1)ˆ(iiiiiNiiiNiiiiHHSmfMYVZYVnYZYZnYV其中NiiiNiiiiniiiiNiiiiniiiniiiHHHHHHniiiHHZYVnYZYZnzzYVnEnYZYZnzYVnEzYnVYVEYEVYVzYnY122112121122211121211)ˆ(1)(1/)ˆ(11)(1)ˆ(1)1()ˆ()ˆ()ˆ(ˆ1ˆ:证明自加权情形:第一阶抽样按放回不等概率抽样抽取初级单元,第二阶抽样都抽取m个。)(1ˆ111ˆ1ˆ020110001111iiiinimjijHHiiinimjijiiiniiiiniiiHHnzfMmffyfYffKmnzMymzMnzyMnzYnYii事先确定,则如果则有级单元被抽中的概率。表示总体中任意一个二其中常数则要求是自加权的,如果自加权情形:第一阶抽样按PPS抽样抽取初级单元,第二阶抽样按简单随机抽样抽取次级单元,都抽取m个。niiPPSPPSnimjijnimjijiiniiiiniiiHHyynnMYvyMYyMynmMmyMMMnzyMnzYnY12200011011011)()1()ˆ(ˆ/11ˆ1ˆ例某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下所示。高层建筑ABCDEFGHIJ楼层12121615101610181620用二阶抽样方法抽出10个楼层进行调查,第一阶抽样按与每座建筑拥有的楼层数成比例的放回不等概抽样抽取5座建筑,第二阶按简单随机抽样对每座建筑抽取2个楼层。对10个中选楼层居民人数的调查结果如下5所示,请对小区总居民数进行估计,并给出估计的精度。一阶样本序号12345居民数18,1215,1819,1316,1016,11)(8.1425148111人nimjijynmy(人)21468.14145ˆ0yMYPPS625.9776])8.145.13()8.1413()8.1416()8.1416.5()8.1415[()15(5145)()1()ˆ(2222221220niiPPSyynnMYv解:已知n=5,m=2,M0=145,这个样本是自加权的,根据公式(9.26),得:估计量的方差为8

1 / 43
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功