抽样技术3分层抽样

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2019/8/201第三章分层随机抽样第一节分层随机抽样的定义、使用场合以及符号第二节估计量及其性质第三节样本量的分配原则第四节样本量的确定第五节分层抽样的若干问题2019/8/202第一节引言一、定义在抽样之前,先将总体N个单元划分成L个互不重复的子总体,每个子总体称为层,它们的大小分别为,这个层合起来就是整个总体,然后,在每个层中分别独立地进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。如果每层都是独立按照简单随机抽样进行,则称为分层随机抽样NNNL12,,,NNhhL1不重不漏2019/8/203作用分层抽样的抽样效率较高,也就是说分层抽样的估计精度较高。这是因为分层抽样估计量的方差只和层内方差有关,和层间方差无关。分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。层内抽样方法可以不同,而且便于抽样工作的组织。2019/8/204二、分层原则:总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。1.估计:层内单元具有相同性质,通常按调查对象的不同类型进行划分。2.精度:尽可能使层内单元的指标值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。3.估计和精度:既按类型、又按层内单元指标值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。4.实施:抽样组织实施的方便,通常按行政管理机构设置进行分层。2019/8/205例题例如,对全国范围汽车运输的抽样调查,调查目的不仅要推算全国货运汽车完成的运量,还要推算不同经济成分(国有、集体、个体)汽车完成的运量。为组织的方便,首先将货运汽车总体按省分层,由各省运输管理部门负责省内的调查工作。各省再将省内拥有的汽车按经济成分分层。为提高抽样效率,再对汽车按吨位分层。例如,某高校对学生在宿舍使用电脑的情况进行调查,根据经验,本科生和研究生拥有电脑的状况差异较大。因此,在抽样前对学生按本科生和研究生进行分层是有必要的。2019/8/206三、符号说明(关于第h层的记号)层号hL12,,,NhnhiyhiWNNhhfnNhhhYNyhhhiiNh11ynyhhhiinh11SNyYhhhihiNh22111snyyhhhihinh22111单元总数样本单元数第个单元的值层权抽样比总体均值样本均值总体方差样本方差2019/8/207第二节估计量一、对总体均值的估计分层样本,总体均值的估计分层随机样本,总体均值的简单估计YWYNNYsthhhLhhhL111yWyNNysthhhLhhhL111YY2019/8/208估计量的性质性质1:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:只要对各层估计无偏,则总体估计也无偏。各层可以采用不同的抽样方法,只要相应的估计量是无偏的,则对总体的推算也是无偏的。YhYhhL12,,,YstYYstVYWVYsthhhL212019/8/209证明性质1由于对每一层有因此,估计量的方差由于各层是独立抽取的,因此上式第二项中的协方差全为0,从而有hhYYEˆLhhhLhhhstYEWYWEYE11ˆˆˆYNYYNYNNYWLhhLhhhLhhh11111LhLhkkhkhLhhhLhhhstYYCovWWYVWYWVYV1121ˆ,ˆ2ˆˆˆLhhhstYVWYV12ˆˆ2019/8/2010性质2:对于分层随机抽样,是的无偏估计,的方差为:YystystVyWVyWfnSsthhhLhhhhhL2122112019/8/2011证明性质2:对于分层随机抽样,各层独立进行简单随机抽样,对每一层有因此,由性质1,有由第二章性质2,得因此hhYyEYyEstLhhhstyVWyV1221hhhhSnfyVVyWVyWfnSsthhhLhhhhhL2122112019/8/2012性质3:对于分层随机抽样,的一个无偏估计为:VystvyWvyWfnssthhhLhhhhhL2122112019/8/2013证明性质3:对于分层随机抽样,各层独立进行简单随机抽样,由第二章性质3,得的无偏估计为:因此,的一个无偏估计为:hyV21hhhhsnfyvVystLhhhhhLhhhstsnfWyvWyv1221212019/8/2014二、对总体总量的估计总体总量的估计为:如果得到的是分层随机样本,则总体总量的简单估计为:LhhstYYNY1ˆˆˆYNystY2019/8/20152.估计量的性质性质4:对于一般的分层抽样,如果是的无偏估计,则是的无偏估计。的方差为:YstYYˆYLhhstYVYVNYV12ˆˆˆYˆLhhhLhhhYVNYVWN12122ˆˆ2019/8/2016性质5:对于分层随机抽样,的方差为:YˆLhhhhhLhhhSnfNyVNYV122121ˆ2019/8/2017性质6:对于分层随机抽样,的一个无偏估计为:YVˆLhhhhhLhhhsnfNyvNYv122121ˆ2019/8/2018例3.1调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及估计的标准差。层居民户总数样本户奶制品年消费支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252019/8/20192850N10hn112000.070182850NWN111100.05200nfN224000.140352850NWN222100.025400nfN337500.263162850NWN333100.0133750nfN4415000.526322850NWN444100.00671500nfN11111139.5niiyyn1221111111624.7221niisyyn2105y3165y424y222166.667s238205.556s24193.333s2019/8/202041ˆhhhyNY20039.54001057501651500242096504422228111ˆ5.9310hhhhhhhhfvYNWvyNsnˆ23208vYˆsYˆ209650223208tsYˆY2019/8/2021三、对总体比例的估计总体比例P的估计为:估计量的性质pWpsthhhL1性质7:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:hphPhL12,,,pstPpstVpWVpsthhhL212019/8/2022性质8:对于分层随机抽样,是的无偏估计,pstPVpNnNPQnhhhhhhh1NNhh1因而的方差为:pstVpWVpNNNnNPQnsthhhLhhhhhhhhL21221111221NNNnNPQnhhhhhhhhLWfPQnhhhhhhL2112019/8/2023性质9:对于分层随机抽样,的一个无偏估计为:VpstLhhhhhLhhhstsnfNNpvWpv12221211WfpqnhhhhhhL21112019/8/2024例3.2在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据(单位:台),要估计该地区居民拥有家庭电脑的比例及估计的标准差。层居民户总数样本户拥有家庭电脑情况123456789101200000100010024000100000010375011000010104150010000000002019/8/2025解:由上表可得,根据前面对各层层权及抽样比的计算结果,可得各层估计量的方差:因此,该地区居民拥有家庭电脑比例的估计为:估计量的方差为:估计量的标准差为:2.01p2.02p4.03p1.04phWhf1111110.01691pqvpfn2222210.01731pqvpfn3333310.02631pqvpfn4444410.00991pqvpfn41411hhhhhhstpNNpWp12000.24000.27500.415000.128500.241221hhhstpvNNpv2222212000.01694000.01737500.026315000.009928500.0050.07ststspvp2019/8/2026第三节样本量在各层的分配确定样本量:总的样本量,各层样本量估计量的方差不仅与各层的方差有关,还和各层所分配的样本量有关。实际工作中有不同的分配方法,可以按各层单元数占总体单元数的比例分配,也可以采用使估计量总方差达到最小、费用最小。2019/8/2027【例3.1】调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及估计的标准差。2019/8/2028hWhs层居民户总数权数方差常数分配与权数成比例与正比12000.07103324000.1446.5106737500.2690.6101123415000.5313.910207hWhshhnwn40.32019/8/2029hWhs层居民户总数权数标准差常数分配与权数成比例与方差成比例与正比120000.220100604940230000.3301009011090350000.534100150141170估计方差3.863.093.113hWhs2019/8/2030一、比例分配按各层单元数占总体单元数的比例,也就是按各层的层权进行分配.对于分层随机抽样,这时总体均值的估计是nnNNWhhhfNnNnfhhhLhnihihhLhhhLhhhprophynnnynnyWy11111yynynniiLhnihih11111自加权2019/8/2031总体中的任一个单元,不管它在哪一个层,都以同样的概率入样,因此按比例分配的分层随机样本,估计量的形式特别简单。这种样本也称为自加权的样本。总体比例的估计是ppnaprophhL1VyWVyWnnfnSfnWSprophhhLhhhhhhLhhhL21212111VpfNnNPQNfnWPQprophhhhhLhhhhL111211NSWnSWyVLhhhLhhhprop12122019/8/2032二、最优分配(一)最优分配在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差达到最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配

1 / 50
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功