抽样技术题目

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1一、简单随机抽样1、在简单随机抽样中,试证明比估计Ry是总体均值Y的渐近无偏估计,并求其方差。证明:XRYXxyXRYyR2211XXxoXXxXXxXyEXXXxXyEXXxyEyER由于0PXx即0XXx所以YyEXyEXyER得证。2222RxyEXXRXxyEyEyEyVarRRR222111XXxoXXxXXxXxRyXXxXxRyEX由于0PXx即0XXx所以22221ZRSnfxRyVarxRyEXxRyEXyVar其中:RXYZ故222212111XXYYNiiiRSRRSSnfXRYRXYNnfyVar2、对于简单随机抽样,总体均值Y的回归估计量定义为:()lryyXx,如为常数(记为0),证明20122200(y)11(y)[()()]11(2)lrNlriiixxyEYfVYYXXnNfSSSn2证明:00202022200(y)[y()]()[()]11y[()]111[()()]11(2)lrNlriiiNiiixxyEEXxEyXExYfVYXXYnNfYYXXnNfSSSn()=3、在简单随机抽样中,已知变量总体均值Y的回归估计量定义为)(xXyylr,若为常数(记为0),且有YyElr)(,求证:(1))2(1)(02202xyxylrSSSnfyV(2)使)(lryV最小的0为xyxxySSSS20;其中yxxySSS.证明:(1)NiiilrYXXYNnfyV120)(111)(210)()(111NiiiXXYYNnf)2(102202xyxySSSnf(2)求)(lryV对0的偏导数:0)22(1)())((200xyxlrSSnfyVxyxxySSSS020将0的值代入)(lryV,验证其最小值存在,此时xyXxyxXyylrSSSSSSSnfyV222221)()2(122222yyySSSnf)1(122ySnf34、研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号文化支出编号文化支出1200111502150121603170131804150141305160151006130161807140171008100181809110191701024020120估计该小区平均的文化支出Y,并给出置信水平95%的置信区间。解析:由已知得:200N20n根据表中数据计算得:5.144201201iiyy06842.827120120122iiyys21808.37)1(1)(2sNnnyV10015.6)(yV因此该小区平均文化支出Y的95%置信区间为:])(y[2yVz即是:[132.544,156.456],故估计该小区平均的文化支出Y=144.5,置信水平95%的置信区间为[132.544,156.456]。5、某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25y,这些企业去年的平均产量为22x。试估计今年该地区化肥总产量。解析:由题可知22x,35.211002135NXX,25y则,该地区化肥产量均值Y的比率估计量为26.24242535.21xyXY该地区化肥产量总值Y的比率估计量为242626.24*100ˆˆRYNY所以,今年该地区化肥总产量的估计值为2426吨。4二、分层随机抽样6、在分层随机抽样的分别比估计中:(1)试证明YyERS)(;(2)求出其方差。(1)证明:根据题意:LhhhhLhhhhLhhhhhRSREXWXRWEXxyWEyE111)ˆ()ˆ()()(又hhhXYRE)ˆ(YYWXYEXWhLhhLhhhhh11)(上式综上可得:YyERS)((2)解:由第一问可知)ˆ()ˆ()(121hhLhhLhhhhRSXRVWXRWVyV而)2(1)()ˆ(222xyxySRRSSnfyVXRV)2(1)(22212xhhyxhhyhhhLhhRSSRSRSnfWyV8、调查某地区居民的奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查后各层样本户的奶制品年消费支出的中间结果如下表所示:层号(h)层权(%)样本量样本平均值(元)第h层样本方差10.07021039.51623.722220.140410105.52166.666730.263210165.08205.555640.52631023.0193.333请估计该地区居民奶制品的年消费总支出及其95%的置信区间。解析:根据表中的数据可得4_^1209650()sthhhYNy元;估计量方差^()stVY的无偏估计为^281()()/5.38610LsthhhhhhvYNNnsn,进而有^8()5.3861023207.6()stvY元。^stY的95%的置信区间为^^0.025()ststYzvY,其中0.025z=1.96,经计算可得^^0.025()2096501.9623207.6164163()ststYzvY元^^0.025()2096501.9623207.6255137()ststYzvY元因此,可以有95%的把握认为该地区居民奶制品的年消费总支出在164163~255137元之间。57、试述分别比估计和联合比估计的比较。答:如果每一层都满足比率估计量有效的条件,则除非hRR,都有分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。实际使用时,如果各层的样本量都较大,且有理由认为各层的比率hR差异较大,则分别比率佑计优于联合比率估计。当各层的样本量不大,或各层比率hR差异很小,则联合比率估计更好些。三、等概率整群抽样和多阶段抽样9、邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群10户,现随机抽取4个群,取得资料如下表所示:群各户订报数ijyiy11,2,1,3,3,2,1,4,1,11921,3,2,2,3,1,4,1,1,22032,1,1,1,1,3,2,1,3,11641,1,3,2,1,5,1,2,3,120试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。解:由题意得到400N,4n,10M,01.04004Nnf故875.1410201620191ˆ1niiyMnyY(份)75.18875.110yMy(份)7500875.140010ˆyNMY(份)niibyynMs122)(1niibyynnMfsnMfyv1222)(1111)(14)75.1820()75.1819(10401.0122200391875.06270000391875.010400)()ˆ(2222yvMNYv于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。610、某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是简单随机抽样,样本宿舍拍照人数样本宿舍拍照人数126120703181429151100试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。解:题目已知200N,10n,6M,3m,05.0200101Nnf,5.02Mmf3.03109ˆ1nmypnii005747.0)(1111)ˆ(12niimpynnfmpv0758.0005747.0)ˆ()ˆ(pvps在置信度95%下,p的置信区间为))ˆ(ˆ(2/pvtp=)0.448568,0.151432()0758.096.13.0(。四、不等概抽样11、某公司欲了解职工上班交通所需的时间,该公司共有5个部门,根据每个部门的人数采用PPS抽样出2个部门,并在2个部门中采用简单随机抽样分别抽出5名职工,调查结果部门i职工人数iM时间(分钟)ijy12040,10,20,30,4023560,30,20,60,30试估计该公司职工上班交通评价所需的时间,并给出估计的标准差。解:已知n=2,m=5,34011nimjijy设公司总人数为0M由于这个样本是自加权的,所以有:001103434010MMynmMYnimjij(分钟)340MYy(分钟),所以该公司职工上班交通平均所需时间为34分钟。7244244010134303460^3410344010112222112nimjijyynmy62.15yys(分钟)。五、系统抽样12、检查某书稿上的错别字,每隔5页检查一页上的错字数,系统抽取30页样品后的检查结10865988599910431234063503004080试估计这本书稿的平均错字数,并估计抽样方差。解:由题,N=30,k=5,则n=30/5=6则按照所给顺序等距抽样,可能样本如下:对于系统抽样,作为Y的简单估计,syy是Y的无偏估计量,根据上表中的数据,5114.733345syrryy总体方差2562111Y11.85751rjrjSYN平均样本内方差21S17.46677.46676.566711.466718.966712.38675r则:221(1)S1.14rsyNknVySNN。jr123456样本均值样本内方差110892305.333317.4667288103546.33337.466736544003.16676.566745930384.666711.466759916004.166718.96678六、综合知识点13、判断题(每题1分,共10分)1、总体比率R与总体比例P两者是一样的概念,只是符号不一样。()2、比估计量是有偏估计量。()3、分层抽样在划分层时,要求层内差异尽可能大,层间差异尽可能小。()4、对于同一总体,样本容量同抽样标准误差之间是正相关关系。()5、整群抽样设计总是比简单随机抽样效率低。()6、其他条件相同时,重复抽样的误差小于不重复抽样的误差。()7、设总体容量为N,样本容量n,采用有顺序放回简单随机抽

1 / 8
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功