第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r,若r=0或r64则舍弃重抽。(2)总体编号1~64,在0~99中产生随机数r,r处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r。然后用r+19999作为被抽选的数。解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。2.2抽样理论和数理统计中关于样本均值y的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义niiyny11niiyny11性质1.期望YCPENNCNCnn1ini1iii1yyy2.方差iCiiiPyEyyVnN21nNCiiiCyEynN12121Snf1.期望niiynEyE11niyE1in1nn12.方差2iyEyV211niiynEnyn122iE2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值y9.5(千瓦时),2s206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y,2062s1706366666206*300500003001500001)()ˆ(222snfNyNvYV19.413081706366666()yv该市居民用电量的95%置信区间为[])(y[2yVzN=[475000±1.96*41308.19]即为(394035.95,555964.05)由相对误差公式y)(vu2y≤10%可得%10*5.9206*n50000n1*96.1即n≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。解析:由已知得:10000N200n35.0p02.0Nnf又有:35.0)()(ppEpE0012.0)1(11)(ppnfpV该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2PVZPE代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号文化支出编号文化支出1200111502150121603170131804150141305160151006130161807140171008100181809110191701024020120估计该小区平均的文化支出Y,并给出置信水平95%的置信区间。解析:由已知得:200N20n根据表中数据计算得:5.144201201iiyy06842.827120120122iiyys21808.37)1(1)(2sNnnyV10015.6)(yV该小区平均文化支出Y的95%置信区间为:])(y[2yVz即是:[132.544,156.456]故估计该小区平均的文化支出Y=144.5,置信水平95%的置信区间为[132.544,156.456]。2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y=1120(吨),25602S,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。解析:由题意知:y=11201429.035050nNf25602S160s置信水平95%的置信区间为:]1y[2snfz代入数据得:置信水平95%的置信区间为:[1079.872,1160.872]2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差682S,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多少?解析:简单随机抽样所需的样本量22222122SZNdSNZn%7012nn由题意知:1000N2d682S96.12Z代入并计算得:613036.611n87142.87%7012nn故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为872.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25y,这些企业去年的平均产量为22x。试估计今年该地区化肥总产量。解析:由题可知22x,35.211002135NXX,25y则,该地区化肥产量均值Y的比率估计量为26.24242535.21xyXY该地区化肥产量总值Y的比率估计量为242626.24*100ˆˆRYNY所以,今年该地区化肥总产量的估计值为2426吨。2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:单位:元编号文化支出总支出编号文化支出总支出120023001115016002150170012160170031702000131802000415015001413014005160170015150160061301400161001200714015001718019008100120018100110091101200191701800101401500201201300全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。解析:由题可知1580130017002300201xn1xn1ii)(5.144y091.015805.144ˆxyrR又329.14615805.144*1600xyyXR053.826)(11122niiyynS158.3463))((111niiixyxxyynS579.8831)(11122niixxxnS故平均文化支出的95%的置信区间为,)ˆˆ2(1[2222xyxRSRSRSnfZy])ˆˆ2(12222xyxRSRSRSnfZy代入数据得(146.329±1.96*1.892)即为[142.621,150.037]2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个月后再次测量,结果如下:单位:千克编号原重量现重量1951502971553871404120180511017561151857103165810216099215010105170用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。解:由题可知,6.10210595101xn1xn1ii)(163170150101yn1yn1ii)(222.2121910*91)(11122niiyynS333.1461317*91))((111niiixyxxyynS933.1064.926*91)(11122niixxxnS故有368.1933.106333.14620xxySS所以总体均值Y的回归估计量为443.159)6.102100(*368.1163)(0xXyylr其方差估计为:)2(1)(ˆ02202xyxlrSSSnfyV=)333.146*368.1*2933.106*368.1222.212(101201012=1.097而21y(ˆSnfV)=222.212*10120101=19.454显然)(ˆ)(ˆyVyVlr所以,回归估计的结果要优于简单估第三单元习题答案(仅供参考)1解:(1)不合适(2)不合适(3)合适(4)不合适2.将800名同学平均分成8组,在每一级中抽取一名“幸运星”。3.根据表中调查数据,经计算,可得下表:h1102560.30330.039111.22867.294.42104200.49760.023825.510710302.53101680.19910.0595203360355.6总计30844116937.2==20.1V()=-=9.7681-0.2962=9.4719=3.0777(2)置信区间为95%相对误差为10%,则有按比例分配的总量:n==185.4407185=n=56,=92,=37按内曼分配:n==175=33,=99,=434.根据调查数据可知:h10.180.920.210.93330.140.940.080.86750.160.93360.220.967==0.924根据各层层权及抽样比的结果,可得()==0.000396981=1.99%估计量的标准差为1.99%,比例为9.24%按比例分配:n=2663=479,=559,=373,=240,=426,=586内曼分配:n=2565=536,=520,=417,=304,=396,=3925.解:由题意,有==75.79购买冷冻食品的平均支出为75.79元又由V()=+又n=V()=53.8086=7.335495%的置信区间为[60.63,90.95]。7.解:(1)对(2)错(3)错(4)错(5)对8.解:(1)差错率的估计值=70%+30%=0.027估计的方差v()==3.1967标准差为S()=0.0179。(2)用事后分层的公式计算差错率为==0.03估计的方差为;v()=-=2.57269.解:(1)所有可能的样本为:第一层第二层3,50,38,156,93,100,68,256,155,103,615,259,15(2)用分别比估计,有=0.4,=0.65,所以用分别比估计可计算得=6.4。用联合比估计,有=0.5,=0.625,所以用联合比估计可计算得=6.5。第四章习题4.1邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群10户,现随机抽取4个群,取得资料如下表所示:群各户订报数ijyiy11,2,1,3,3,2,1,4,1,11921,3,2,2,3,1,4,1,1,22032,1,1,1,1,3,2,1,3,11641,1,3,2,1,5,1,2,3,120试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。解:由题意得到400N,4n,10M,01.04004Nnf故875.1410201620191ˆ1niiyMnyY(份)75.18875.110yMy(份)750040010ˆyNMY(份)niibyynMs122)(1niibyynnMfsnMfyv1222)(1111)(14)75.1820()75.1819(10401.0122200391875.06270000391875.010400)()ˆ(2222yvMNYv于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订