抽样调查第4章分层抽样

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

§4.1估值法(一)§4.2估值法(二)——组合比估计和回归估计§4.3样本量的分配§4.4与简单随机抽样之比较§4.5如何适当分层§4.6后分层估计和定额抽样分层抽样的提法估值法(一)分层抽样的提法分层抽样的步骤分层:抽样:个子总体分成互不相交的将总体KN)(KiiNN1)()(KiiNN1从每层抽取一个样本构成总的样本Kiyyyiinii,,2,1,,,,21Kiinn1采用分层抽样的理由可同时对子总体进行参数估计便于组织实施,可根据各层特点采用不同抽样方式可使样本在总体中分布均匀,从而具有更好代表性适当分层可提高参数估计的精度(Stratifiedsampling)分层抽样的提法分层抽样的问题如何分层如何确定各层样本量如何估值记号KKNKNNYYYYYY,,,,,,122111121NNKii1KKnKnnyyyyyy,,,,,,122111121nnKii1NNWiinnwiiiiiNnfiNjijiYY1iiiNYY/injijiiyny11injiijiiyyns122)(11KiNjijiYY11NYYKiiiNYN1KiiiYW1估值法(一)则估计量有无偏估计且每一层每一层独立抽取的,如果分层抽样样本是从定理,ˆ1.1.4iiYYKiiiYWY1stˆˆ其均方偏差为的无偏估计是,YKiiiYVWYV12st)ˆ()ˆ(估值法(一)则估计量用简单估值时的简单随机样本,且每层当各层独立抽取的都是系,1iYKiiiyWy1st其均方偏差为的无偏估计是,YKiiiiiSfnWyV122st)1(1)(的一个无偏估计为)(styVKiiiiisfnWyv122st)1(1)(估值法(一),2时足够大时,用比估值法的样本额简单随机样本,且各层当各层独立抽取的都是系inKiiiiXrWy1RS其均方偏差近似为的近似无偏估计是,YKiNjijiijiiiiiXRYNnfWyV1122RS)(111)(KiXYiiXiYiiiiiiiSSRSRSnfW1222221的一个近似无偏估计为)(RSyVKinjijiijiiiiixrynnfWyv1122RS)(111)(估值法(一)例1调查某地区居民的奶制品消费支出,以居民户为抽样单元.根据经济收入水平将居民划分为4层,每层抽取样本量为10的简单随机样本,调查数据如下表,试估计该地区居民奶制品的月消费总支出及其置信度为95%的置信区间.层居民总户数样本户奶制品月消费支出yij(元)1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025例2对某地区的居民拥有家庭电脑的情况进行调查,以居民为抽样单位,根据收入水平将居民户划分为4层,每层按简单随机抽样抽取10户。调查数据如表。估计该地区居民拥有家庭电脑的比例及抽样标准误。估值法(一)例3已知某公司一般职员及高级管理人员刚进入公司时的工资总额分别为5523965元、2541660元,欲通过抽样调查估计当前该公司职员的工资总额Y。抽样按照一般职员与高管层进行分层随机抽取。一般职员共390人,抽取15人;高管层共84人,抽取10名。调查数据如表。给出Y的分别比估计量,估计其精度估值法(一)练习1为调查某地区住户的平均家庭成员数,将该地去分为城市和乡村2层,每层按照简单随机抽样抽取10户。调查数据如表。估计该地区住户的平均家庭成员数及其95%的置信区间。估值法(一)组合比估计组合回归估计组合比估计有辅助变量X用于估值分析的,先分别对各层进行简单估计,再用比估值法获得目标指标量的估计组合比估计的含义KiiiyWy1st(Ratiocombined)KiiixWx1stXxyyststRCXrCiiXXXX或无需知道每层的或体的组合比估计只需知道总,组合比估计定理4.2.1对分层抽样的组合比估计,有估值定理||)()(|)(|XxVyVYyEstRCRC.)()(的均方偏差,分别是估计量,其中stRCstRCxyxVyV组合比估计nOYyERC1)()1(2/32/32211)()()2(nOnOxRyEYyEststRC时不依赖与且合理当分层抽样的样本分配)(0,nxstKiXiYiiXiYiiiiSSRSRSnfW12222)2(1KixyiCxiCyiiiiRCsrsrsnfWyv12222)2(1)()3(例3续:给出Y的组合比估计量,估计其精度,与分别比估计进行比较组合比估计KiXiYiiiXiiiiiRSRCSSRRSRRnfWyVyV12222)(2)(1)()(分别比估计与组合比估计的比较KiXiiXiYiiiXiiiiiSRSSRRSRRnfW12222))((2)(1.)(2更精确估计通常比组合比估计式一般大于零,分别比通常比较小,上由于比估计适合的场合XiiXiYiiSRSS.用组合比估计才推荐使只有较小的样本量时,仅当层数较多,而各层分别回归估计)]([ii1LsxXbyWyiiKii分别回归估计其均方偏差为的无偏估计是是事先指定的常数若,,LSYybKiXiYiiiXiiYiiiiSSbSbSnfWyV12222Ls)2(1)(2112222Lsmin11)(iKiKiXiiiiYiiiiBSnfWSnfWyV2112Ls])[(211)(injiijiiijiiiKiixxbyynnfWyv组合回归估计)(ststLCxXbyy组合回归估计其均方偏差为的无偏估计是是事先指定的常数若,,LCYybKiXiYiiXiYiiiiSSbSbSnfWyV12222LC)2(1)(小值为可得上述均方偏差的最取KiXiiiiKiXYiiiiCSnfWSnfWBb12212112112222LCmin11)(CKiKiXiiiiYiiiiBSnfWSnfWyV组合回归估计,有代替实践中以CKixiiiiKixyiiiiBsnfWsnfWb12212C11)21)(22122LCXiCYiXiiCKiYiiiiSBSSBSnfWyV(KinjiijCiijiiiiixxbyynnfWyv1122LC)()(111)(组合回归估计KiCiXiiiiBBSnfWyVyV1222LSminLCmin)(1)()(分别回归估计与组合回归估计的比较组合回归估计别回归估计优于否则最佳选取系数的分相同除非各层,iB.用组合回归估计才推荐使只有较小的样本量时,仅当层数较多,而各层比估计与回归估计小结当Y与X高度相关时,采用比估计和回归估计都是有效的。在选择估计方法时,有以下原则:(1)由于分别估计(分别比或者分别回归估计)要求各层的样本量都比较大,所以当某些层的样本量不够大时,建议采用联合估计。(2)当回归系数需要由样本进行估计时,回归估计是有偏的,尤其当样本量较小的时候,采取联合比估计更好。(3)如果各层的样本量都比较大,每层的比估计或回归估计有效,此时用分别比估计,方差更小。(4)如果各层的样本量不大,各层的Ri差异较小,采用联合估计。(5)如果各层的Ri之间的差别不是太大,而且并不是每层的样本量都相当大,采用联合估计。(6)如果各层的回归系数都接近于1,则可采用差估计。例3(续)已知某公司一般职员及高级管理人员刚进入公司时的工资总额分别为5523965元、2541660元,欲通过抽样调查估计当前该公司职员的工资总额Y。抽样按照一般职员与高管层进行分层随机抽取。一般职员共390人,抽取15人;高管层共84人,抽取10名。调查数据如表。给出Y的分别回归估计量、联合回归估计以及差估计,同时估计其精度。估值法(一)等额样本量按比例分配奈曼最优分配考虑费用的最优分配等额样本量各层的样本量相等KiKnni,,2,1,特点:实施方便,便于管理例1对各乡收入数据,采用分层抽样,各层采用简单随机抽样,计划抽取8个乡,按照下列样本量分配方式,确定各层的样本量(1)等额分配(2)按比例分配(3)Neyman最优分配按比例分配KiNNnnii,,2,1,若总体总值或均值的一个无偏估计量可以表示成样本总值或均值的常数倍,这种估计量称为自加权估计量(proportionalallocation)KinjijKiiistiynyWy1111适用于Ni已知而其他信息很少的情形奈曼(Neyman)最优分配使固定分层抽样中定理,,11KiinnKiiiiistSnfWyV1221)(为达到最小的样本量分配KiSWSWnnKjjjiii,,2,1,1KiiiKiiistSWNSWnyV1221min11)(的近似值查法或类推法获得实践中可用查往法、预iS为时采用估计值带来的影响实践中因)(nNSiKiiiinnnnVVV12minmin)(1考虑费用的最优分配最小的样本量分配有使最小,或固定使固定费用分层抽样中定理CyVyVCstst)()(,2KiCSWniiii,,2,1,KiiiCnCC10费用层调查一个样本单元的是第是基本调查费用iCCi,0例某市有甲、乙两个地区,现要进行家庭收入的调查。令n=500,已知甲地区共有20000户居民,乙地区共有50000户居民;甲地区和乙地区居民收入标准差估计分别为s1=2500,s2=2000;同时对甲地和乙地每户的平均抽样费用之比为2:3,请分别计算出甲地和乙地进行比例分配、一般最优分配(考虑费用因素)以及奈曼最优分配的样本量。分层抽样的精度层权误差分层抽样的精度则若忽略抽样比定理),,,2,1(,1KiNnfNnfiii)()()(yVyVyVstpropstopt.)(;,)(;)(差随机抽样估值的均方偏为不分层简单的均方偏差层内简单随机抽样估值为按比例分配分层抽样抽样估值的均方偏差样,层内简单随机为奈曼最优分配分层抽其中yVyVyVstpropstopt)1()(12122NYYWSWSKiiiKiii忽略2内层内方差S2间层间方差S=+.;22配会有较大收益差异较大,奈曼最优分若各层间大提高估计精度较小时,分层抽样将大较大,内间iSSS层权误差NNWii层权iW给出一定知道,以历史资料实际工作中各层权数不;偏差为计、样本估计量为有偏估KiiiiYWW1)(,1;,,2得益丧失分层抽样在精度方面的因而会使变不会因样本量改变而改、偏差为一常数层权误差带来的影响.)()(1)(MSE312122低估了真实误差常用误差估计量、stKiKiiiiiiiistyvYWWSnfWy例题与练习,分为两层考虑一个大的总体例1,12S都很大,假定212222121,,1.0,9.0NNSSS)(08.0,92.0:)2(21fWW忽略不正确层权机抽样简单随机抽样与简单随比较下列两种情况分层;,)1(的比较与正确层权VVprop的总体如下,层数一个总体规模例3182KN3.011.21013109121333.910.7121289131022.011.013111

1 / 43
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功