抽样调查07

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第七章不等概率抽样7.1概述7.2放回不等概率抽样7.3不放回不等概率抽样7.1概述•7.1.1必要性和优点•7.1.2主要分类7.1概述•7.1.1必要性和优点•总体中个体对总体贡献的“不平等”要求样本抽取时,也应该“不平等”。•在多阶抽样中,初级单元所含的次级单元个数差异大,要求我们区别对待。•提高精度,要求知道所有辅助变量。7.1概述抽样方法放回抽样不放回抽样按大小成比的概率抽样等概率是否放回?抽取概率抽取方法逐个抽取系统抽取法重抽法PPS抽样πPS抽样7.1.2主要分类7.2放回不等概率抽样•7.2.1多项抽样与PPS抽样Niii=1NiZi=1NZ1nn设总体大小为,对其进行放回抽样,在每次抽样中,抽中第个单元的概率为,,,,=,独立进行次抽样,抽到个单元(可重复),称这种方法为多项抽样。7.2放回不等概率抽样•7.2.1多项抽样与PPS抽样N12iNiiiiii=1ttt12N12Ntit0tntnttnZZZttt记为第个单元在样本中出现的次数,显然对每个有:,,为随机变量,且所有的联合分布为如下的多项分布:!!!!这就是多项抽样的术语来源。7.2放回不等概率抽样•7.2.1多项抽样与PPS抽样iii0N0ii=1MMZMMMPPS但每个单位具有一个度量其大小或规模的变量时可取:=其中:=,此时每个单元在每次抽样中时的入样概率与单元大小成比例,称这种特殊的多项抽样为与大小成比例有放回的不等概率抽样,简称抽样。7.2放回不等概率抽样•7.2.2多项抽样的实施i0i0ii1112i-1iN-1Njjjj0j=1j=1j=1j=101.Hansen-HurwitzZi=1NMM=MZi=1NMi1M1M+1MM2M+1MiM+1MMN1Mm代码法(法)对于给定的一组,,,,总可以找到使得每个,,,为整数,然后对进行累计赋予第个单元,即赋予单元,+赋予单元,,赋予单元,,=赋予单元。每次抽样时产生的随机数,设随机数为,则对应代码包mnn含的单元入样,如此重复次即可得到个样本单元。7.2放回不等概率抽样•7.2.2多项抽样的实施1100047325163在,范围内产生随机数:,,,则对应单元、、入样。表7.1代码法进行PPS抽样iZiMi累计Mi代码10.08881~820.1010189~1830.17173519~3540.0664136~4150.24246542~6560.0997466~7470.0557975~7980.0778680~8690.0449087~90100.101010091~100∑1.00M0=1007.2放回不等概率抽样•7.2.2多项抽样的实施i1iNi422.LahiriMMaxM1N1MimmMi49M69,28M108,2mm**法设=,在和之间产生随机数对(,),若则对应的第个单元入样,否则重新抽取随机数对。例如,在上例中,如产生随机数对为:(,),则因为故需要重抽,重新产生随机数对为:(,),则因为故单元入样。7.2放回不等概率抽样•7.2.3汉森-赫维茨估计量及其性质0112Ni1-11ˆˆ1.EY(7.4)1Yˆ2.VarZY(7.5)ZˆVarnniiiiiiiiiyyMnznmnHHHHHH汉森(Hansen)赫维茨(Hurwitz)估计量:Y有如下性质:无偏性Y方差Y2Nij1Y1YZZ(7.12)ZZjiiijijnHHY7.2放回不等概率抽样•7.2.3汉森-赫维茨估计量及其性质2n11ˆˆ3.v(7.6)(1)ˆˆEvVariiiynnzHHHHHHHH方差估计YY方差估计是无偏的,即:YY7.2放回不等概率抽样•7.2.4数值例—职工人数调查2Ni12SRS-Y1ˆVarZY=141483.66ZN(N-n)ˆSRSVar=75537056141483.66deff===0.001873SRS75537056iiiynSnHH汉森(Hansen)赫维茨(Hurwitz)估计量:PPS方差Y方差YPPS方差方差7.2放回不等概率抽样•7.2.4数值例—职工人数调查ayˆaYavyˆavY表7.3样本号12341.051.071.051.07193131976619363196620.0160.0250.0180.02287.64465.25327.46364.337.3不放回不等概率抽样•7.3.1包含概率与πPS抽样•7.3.2霍维茨-汤普森估计量及其性质•7.3.3n=2的严格πPS抽样•7.3.4n2的严格πPS抽样•7.3.5n2的两种非严格πPS抽样7.3不放回不等概率抽样•7.3.1包含概率与πPS抽样iijNii=1NijiijNNiji=1ijPr()Pr(j)1.=n2.=n-113.=nn-12ii单元被包含到样本的概率:任意两个单元被包含到样本的概率,满足以下性质:7.3不放回不等概率抽样•7.3.1包含概率与πPS抽样iiNii00ii=1iiPPSMZM/MMMnZ7.16PS与抽样类似,我们期望与单元大小成比例,仍记(=),则有满足上式的不放回抽样称为不放回与大小成比例的不等概率抽样,简称抽样。7.3不放回不等概率抽样•7.3.2霍维茨-汤普森估计量及其性质1()(hom)ˆ7.17ˆ1.EY7.18AiHTiiHTHorvitzTpsonyYYn霍维茨汤普森估计的定义:霍维茨汤普森估计具有以下性质:无偏性:7.3不放回不等概率抽样•7.3.2霍维茨-汤普森估计量及其性质iNijij2iij1i=1iij2Njiijiji=1ijiiji2.0,1,,1ˆVar+27.18ˆVar7.193.0,0,,1,,,1ˆNNHTiijiNHTjiHTiNYYYYYYYijNijvY方差表达式有两个,此时假定方差估计,此时假定nnijij2ij21i=1ijij2nijijjiYGSi=1ijijy+27.20ˆ7.217.21niijiinHTjiyyyyvY定义的方差估计由耶茨(Yates)-格伦迪(Grundy)-森(Sen)给出的。7.3不放回不等概率抽样•7.3.3n=2的严格πPS抽样iiiij1.(Brewer)Z0,1,,,Z1ZA.12ZiB.N-1ZiN布鲁尔方法1设抽取步骤为:2第一个单元抽取按与成比例的概率抽取假定抽取的单元为总体中的第个单元。第二个单元则在剩下的个单元中按与成比例的概率抽取。7.3不放回不等概率抽样•7.3.3例7.37.3不放回不等概率抽样•7.3.3例7.3iii0iii115i22MZM/M,Z1Z1.28570112Zr0.6711.2857r0.97842ZZ0.85201r0.4980.852r0.4244此时为城市市区人口数,的累计总值是。在,内产生均匀分布随机数,乘以得=,于是第二个城市入样。第个单元抽取要先去除后,重新累计,总值为,在,内产生均匀分布随机数,乘以得=,于是第个城市入样。7.3不放回不等概率抽样•7.3.3n=2的严格πPS抽样iii1212HTB121222121212HT121222121212n22ZnZ7.16yyyy1ˆˆYY2zz11ˆv(Y)=yy2yy时,可以证明:此时Horvitz-Thompson估计为:而方差估计为:Yates-Grund2121212HT1212yyˆv(Y)=y-Sen方差估计此时只有一项:7.3不放回不等概率抽样•7.3.3n=2的严格πPS抽样iijijiii2.(Durbin)Z0,1,,,A.ZiB.N-111Z12Z12ZnZ2ZiN德宾方法1设抽取步骤为:2第一个单元抽取按与成比例的概率抽取,设抽取到的为第个单元。第二个单元则在剩下的个单元中按与成比例的概率抽取。同样可以证明,此时同样有。7.3不放回不等概率抽样•7.3.4n2的严格πPS抽样i*iiii1.(Midzuno)1Z,1,,,(1)PSZA.ZB.n-1N-1nZniNnNNn水野方法设则水野的方法是严格的抽样,抽取步骤为:n(N-1)n-1第一个单元抽取按与=-成N-n比例的概率抽取。剩下的个样本单元在剩下的个总体单元中按无放回等概率的方式抽取。可以证明:7.3不放回不等概率抽样•7.3.4n2的严格πPS抽样iiiiiiiiij2.(Brewer)n2Z1ZA.1ZZ1ZB.r11ZnZ,nnr布鲁尔方法是=时推广,抽取步骤为:第一个样本单元抽取按与成比例的概率抽取。第个样本单元抽取按与成比例的概率抽取。可以证明:该方法的缺点是难计算,有递推公式可以利用。7.3不放回不等概率抽样•7.3.4n2的严格πPS抽样iiiiiij3.(Rao)-(Sampford)A.ZiZB.n11ZnZ,n2n=2n拉奥桑福特方法该方法为重抽法,抽取步骤为:第一个样本单元抽取按与成比例的概率抽取,设第个单元被抽中。剩下的个样本单元按与成比例的概率有放回地抽取,若有重复,则放弃重抽,直到样本中无重复单元出现为止。可以证明:可以看出在时,与时的布鲁尔方法等价。该方法的缺点是难计算,有递推公式可以利用。7.3不放回不等概率抽样•7.3.5n2的两种非严格πPS抽样ijikijiii1.(Murthy)A.ZiZB.1-ZjZC.1-ZZkD.nnZ莫蒂方法该方法的实现方便、自然,抽取步骤为:第一个样本单元抽取按与成比例的概率抽取,设第个单元被抽中。第二个样本单元抽取按与成比例的概率抽取,设第个单元被抽中。第三个样本单元抽取按与成比例的概率抽取,设第个单元被抽中。以此类推可以抽出所有个样本单元。该方法是非严格的,因为,且计算复杂,此时估计也不使用Horvitz-Thompson估计。7.3不放回不等概率抽样•7.3.5n2的两种非严格πPS抽样1nigggingRHCgg1g2.(Rao)-(Hartley)-(Cochran)nNNZggyZzZgZyˆYZz**拉奥哈特利柯克伦方法将总体随机分为个组,每组单元数为,,在每组内按与成比例的概率抽取一个单元组成样本,设第组抽取的单元为,指标值记为,相应的值为,为第组的值的和,则总体总和的估计为:7.50

1 / 29
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功