应用抽样技术答案第二章抽样技术基本概念2.7(1)抽样分布:33.674.3355.676.3371/101/102/102/102/101/101/10(2)期望为5,方差为4/3(3)抽样标准误1.155(4)抽样极限误差2.263(5)置信区间(3.407,7.933)第三章简单随机抽样3.3为调查某中学学生的每月购书支出水平,在全校名学生中,用不放回简单随机抽样的方法抽得一个的样本。对每个抽中的学生调查其上个月的购书支出金额yi(如表1所示)。(1)在95%的置信度下估计该校学生该月平均购书支出额;(2)试估计该校学生该月购书支出超出70元的人数;(3)如果要求相对误差限不超过10%,以95%的置信度估计该校学生该月购书支出超出70元的人数比例,样本量至少应为多少。样本序号支出额(元)样本序号支出额(元)样本序号支出额(元)12345678910856242155039836532461112131415161718192020753441586395120195721222324252627282930494595362545128452984表130名学生某月购书支出金额的样本数据3.3解:(1)依据题意和表1的数据,有:2216821682,56.07(),(1182661682/30)/30798.7330iyyys元211750300.032764301750fNnbacnnN()0.03276798.7326.168vy()()5.115seyvy因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的t=1.96,所以,可以以95%的把握说该学生该月的人均购书支出额大约在56.07±1.96×5.115,即50.96--61.19元之间。,(2)易知,N=1750,n=30,18nt=1.96180.26730npn11750300.033891(1)291750fNnnnN(1)0.2670.7330.1957pqpp(1)0.033890.19570.081441fpqn10.01672nP的95%的置信区间为:12(1)1()0.267(1.960.081440.0167)12=(0.0907,0.4433) fpqpunn的95%的置信区间为:1N(159,776)(3)N=1750,n=30,n1=8,t=1.96,p=0.267,q=1-0.267=0.733由此可计算得:22021.960.7331054.640.010.267tqnrp计算结果说明,至少应抽取一个样本量为659的简单随机样本,才能满足95%置信度条件下相对误差不超过10%的精度要求。n=n0/[1+(n0—1)/N]=1054.64/[1+1053.64/1750]=658.2942=6593.5要调查甲乙两种疾病的发病率,从历史资料得知,甲种疾病的发病率为8%,乙种疾病的发病率为5%,求:(1)要得到相同的标准差0.05,采用简单随机抽样各需要多大的样本量?(2)要得到相同的变异系数0.05,又各需要多大的样本量?3.5解:已知P1=0.08,Q1=1-P1=0.92;P2=0.05,Q2=1–P2=0.95;V(p)=0.05*0.05,(1)由0()PQnVp得:1020.080.92300.05n2020.050.95190.05n由02()QnCvpP得:(2)1020.9246000.050.08n2020.9576000.050.05n第四章分层抽样4.3解:(1),(2)按比例分配n=186,n1=57,n2=92,n3=37(3)Neyman分配n=175,n1=33,n2=99,n3=434.5,置信区间(60.63,90.95)元。20.07sty(元)()3.08stsy(元)75.79sty(元)4.6解已知W1=0.2,W2=0.3,W3=0.5,P1=0.1,P2=0.2,P3=0.4P=ΣhWhPh=0.28,Q=1—P=0.72n=100的简单随机抽样估计方差:V(Psrs)≈[(1—f’)/100]PQ≈0.28*0.72/100=0.002016按比例分配的分层抽样的估计方差:V(Pprop)≈ΣhWh2[(1—fh)/nh]PhQh≈n-1ΣhWhPhQh=n-1[0.2*0.1*0.9+0.3*0.2*0.8+0.5*0.4*0.6]=0.186n-1故n≈92.26≈934.8解已知W1=0.7,W2=0.3,p1=1/43,p2=2/57(1)简单随机抽样Psrs=(1+2)/100=0.03V(P)=PQ/(n-1)=0.03*0.97/99=0.0002937(2)事后分层Ppst=ΣhWhph=0.7*1/43+0.3*2/57=0.0268V(Ppst)=ΣhWh2[(1—fh)/(nh—1)]phqh=0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57)=0.00031942第五章比率估计与回归估计5.2N=2000,n=36,1-α=0.95,t=1.96,f=n/N=0.018,0.000015359,=0.00392置信区间为[40.93%,42.47%]。)ˆ(Rv)ˆ(Rse第五章比率估计与回归估计5.3当时用第一种方法,当时用第二种方法,当时两种方法都可使用。这是因为:,,若则0YXCC2YXCC2YXCC2=22211)(YYCYnfSnfyV)2(1)ˆ()(222XYXYCCCCRnfRVxyV)(XyV2222211YYCRnfCYXnfYXCC2)2(1)()(2XYXCCCRnfxyVXyVYXCC2=0)2(1)()(2XYXCCCRnfxyVXyVYXCC2)2(1)()(2XYXCCCRnfxyVXyV<﹥05.4解:V(YR)≈[(1—f)/n]Y2[CY2+CX2—2rCYCX]V(Ysrs)=[(1—f)/n]SY2=[(1—f)/n]CY2Y2故V(YR)/V(Ysrs)=1—[2rCX/CY—CX2/CY2]=1-[2*0.696*1.054/1.063-1.0542/1.0632]=1-0.397076=0.6029245.5证明:由(5.6)得:2121)(1)(dNiiiRSNnnNNRXYnfyV,2VSNnnNd令,则22)(ddNSSNVnNVSVSSNVNSndddd22221从而5.6解(1)简单估计:总产量:Ysrs=(N/n)∑i=1nYi=(140/10)[1400+1120+…+480]=176400(斤)v(Ysrs)=[N2(1—f)/n]SY2=[1402(1—10/140)/10]*194911.1=354738222se(Ysrs)=18834.496^^^5.6解(2)比率估计:R=∑i=1nYi/∑i=1nXi=12600/29.7=424.2424YR=XR=460*424.2424=195151.5(斤)v(YR)=[N2(1—f)/n]*∑i=1n(yi—RXi)2/(n--1)=[1402(1—10/140)/90]*124363.5=25149054se(Ysrs)=5014.883面积/亩产量/斤314002.511204.217103.615001.87205.219803.213102.410802.613001.248029.7126005.6解(3)回归估计:回归系数b=Sxy/Sxx2=370.5965ylr=x—b(x—X)=1260—370.5965*(2.97—460/140)=1377.089Ylr=Nylr=192792.47(斤)v(Ylr)=[N2(1—f)/n]*∑i=1n[yi—y—b(xi—x)]2/(n--2)=[1402(1—10/140)/80]*89480.59=20356834se(Ylr)=4511.8555.7解:,)(YyElr)1(1)(22YlrSnfyVniiilrlrXxBynxXByxXByy1)](2[1)(2)(YxEXByEyElrlr)]([)()(})](2[1{)(1niiilrXxBynVyV21])(2[111YXXBYNnfNiii-=)](4[1)44(122222YXxYYXXYSBSBSnfBSSBSnf)()1(11222lrYYyVSnfSnf-故估计量虽然与一样都是的无偏估计,但方差不小于的方差,当时,故不优于。lrylryYlry0)()(lrlryVyVlrylry0.22390.25140.15480.05730.04870.10220.06760.0981第六章不等概率抽样6.1假设对某个总体,事先给定每个单位的与规模成比例的比值Zi,如下表,试用代码法抽出一个n=3的PPS样本。iiziiz表1总体单位规模比值6.1解:令,则可以得到下表,从1-1000中产生n=3个随机数,设为108,597,754,则第二、第六和第七个单位入样。01000MiMi累计Mi代码12345678981025725167481542239820025750857562377710001~9899~200201~257258~508509~575576~623627~777778~1000ΣM0=1000——2819541085162921579892018345678135363965060812387465125941234子公司序号子公司序号6.3欲估计某大型企业年度总利润,已知该企业有8个子公司,下表是各子公司上年利润Xi和当年利润Yi的数据,以Mi作为单位Xi大小的度量,对子公司进行PPS抽样,设n=3,试与简单随机抽样作精度比较。iYiXiYiX表2某企业各子公司上年与当年利润(单位:万元)对子公司进行抽样,根据教材(6.7)式:88116.38,3,6857,7199iiiiNnXXY212211ˆ()()1NiHHiiiNiiiYVYZYnZYXYnX2168577707.8271993342303.5ˆ585.07HHVY显然对抽样,估计量的精度有显著的提高。如果对子公司进行简单随机抽样,同样样本量时的简单估计方差为:Y2ˆSRSyNNnVYSn854580379.69361071729.2ˆ7814.84SRSVYPPS抽样的设计效应是:342303.50.00560561071729.2deffPPS6.4解(1)PPS的样本抽样方法可采用代码法或拉希里法.(2)若在时间长度2、8、1、7h中打入电话数量分别为8、29、5、28,则客户打入电话的总数:YHH=(35/4)[8/2+29/8+5/1+28/7]=145.46875(3)估计量的方差估计v(YHH)=[n(n—1)]-1Σi=1n(yi/zi—YHH)2=[352/(4*3)][(8/2—4.15625)2+(29/8—4.15625)2+(5/1—4.15625)2+(28/7—4.15625)2]=106.46976.5设总体N=3,zi=1/2,1/3,1/6,Yi=10,8,5,采取的n=2的πPS抽样,求πi,πij(i,j=1,2,3)。解:(1)所有可能样本为:(10,8),(10,5),(8,10),(8,5),(5,10),(5,8),其概率分别为:1222361112361333412111341213365301226530