1第1章绪论P126.答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8kg。7.答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。第2章统计数据的描述——练习题P52●2.解:(1)整理得到频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100~110110~120120~130130~140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0————(2)按题目要求分组并进行统计,得到分组表如下:某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.03.解:得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~3030~3535~4040~4545~5046159610.015.037.522.515.0合计40100.0201020304025~3030~3535~4040~4545~50某百货公司日商品销售额分组表频数(天)某百货公司日商品销售额分组表频率(%)●10.解:设产品单位成本为x,产量为f,则总成本为xf,由于:平均成本x=xff=总成本总产量,而已知数据中缺产量f的数据,又因个别产品产量f=该产品成本该产品单位成本=xfx从而x=xfxfx,于是得:甲企业平均成本=xfxfx=210030001500210030001500152030=19.41(元),乙企业平均成本=xfxfx=325515001500325515001500152030=18.29(元),对比可见,甲企业的总平均成本较高。原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。●11.解:设各组平均利润为x,企业数为f,则组总利润为xf,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:按利润额分组(万元)组中值企业数(个)总利润xfxf200~300250194750300~4003503010500400~5004504218900500~600550189900600以上650117150合计—12051200于是,120家企业平均利润为:3x=xff=51200120=426.67(万元);分组数据的标准差为:s=2()1ixxff=1614666.6681201=116.48(万元)。13.解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。(2)得成年组身高的平均数为172.1,标准差为4.202,从而得:成年组身高的离散系数:024.01.1722.4sv;又得幼儿组身高的平均数为71.3,标准差为2.497,从而得:幼儿组身高的离散系数:2.4970.03571.3sv;由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。14.解:(1)下表给计算出这三种组装方法的一些主要描述统计量:方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准偏差2.13标准偏差1.75标准偏差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值128评价优劣应根据离散系数,据上得:方法A的离散系数VA=2.13165.6=0.0129,方法B的离散系数VB=1.75128.73=0.0136,方法C的离散系数VC=2.77125.53=0.0221;对比可见,方法A的离散系数最低,说明方法A最优。(2)我会选择方法A,因为方法A的平均产量最高而离散系数最低,说明方法A的产量高且稳定,有推广意义。第3章概率与概率分布P11610.解:令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)=0.25,P(A2)=0.30,P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率分别为:(1))|()()|()()|()()(332211ABPAPABPAPABPAPBP==0.25×0.04+0.30×0.05+0.45×0.03=0.0385(2)3506.00385.00135.00.030.450.050.300.040.2503.045.0)|(3==++=BAP11.解:据题意,在每个路口遇到红灯的概率是p=24/(24+36)=0.4。设途中遇到红灯的次数=X,因此,X~B(3,0.4)。其概率分布如下表:4xi0123P(X=xi)0.2160.4320.2880.064期望值(均值)=1.2(次),方差=0.72,标准差=0.8485(次)12.解:设被保险人死亡数=X,X~B(20000,0.0005)。(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X≤10)=0.58304。(2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为:P(X20)=1-P(X≤20)=1-0.99842=0.00158(3)支付保险金额的均值=50000×E(X)=50000×20000×0.0005(元)=50(万元)支付保险金额的标准差=50000×σ(X)=50000×(20000×0.0005×0.9995)1/2=158074(元)16.解:(1))6667.1()30200150()150(ZPZPXP==0.04779合格率为1-0.04779=0.95221或95.221%。(2)设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:|200|(|200|){||}0.93030XKPXKPZ=即:{}0.9530KPZ,K/30≥1.64485,故K≥49.3456。第4章参数估计●3.解:解:由题可得:36,3.317,1.609nxs36n为大样本,则在的显著性水平下的置信区间为:/2/2,ssxzxznn分别按三个置信水平计算总体均值的置信区间:①置信水平为90%时:当/20.1,1.64z,置信区间为(2.88,3.76)②置信水平为95%时:当/20.05,1.96z,置信区间为(2.80,3.84)③置信水平为99%时:当/20.01,2.56z,置信区间为(2.63,4.01)●6.。解:已知样本容量n=200,为大样本,拥有该品牌电视机的家庭比率p=23%,拥有该品牌电视机的家庭比率的抽样标准误差为pσ=(1)ppn=0.230.77200=2.98%⑴双侧置信水平为90%时,通过2β-1=0.90换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得α/2Z=1.64,5此时的置信区间为(1)pppnα/2Z=23%±1.64×2.98%=27.89%18.11%可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%,27.89%)。⑵双侧置信水平为95%时,得α/2Z=1.96,此时的置信区间为(1)pppnα/2Z=23%±1.96×2.98%=28.8408%17.1592%可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为;(17.16%,28.84%)。●7.解:已知总体单位数N=500,重复抽样,样本容量n=50,为大样本,样本中,赞成的人数为n1=32,得到赞成的比率为p=n1n=3250=64%(1)赞成比率的抽样标准误差为(1)ppn=0.640.3650=6.788%由双侧正态分布的置信水平1-α=95%,得α/2Z=1.96,计算得此时总体户数中赞成该项改革的户数比率的置信区间为(1)pppnα/2Z=64%±1.96×6.788%=77.304%50.696%可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为(50.70%,77.30%)。(2)如预计赞成的比率能达到80%,即p=80%,由(1)ppn=6.788%,即0.80.2n=6.788%得样本容量为n=20.80.2(6.788%)=34.72取整为35,即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。9.解:(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。10.解:(1)75.1d,63.2ds;(2)1.75±4.27。11.解:(1)10%±6.98%;(2)10%±8.32%。12.解:(4.06,14.35)。13.解:已知总体比率=2%=0.02,由置信水平1-α=95%,得置信度α/2Z=1.96,允许误差E≤4%即由允许误差公式E=/2Znpασ整理得到样本容量n的计算公式:n=2()Eα/2PZσ=2()Eα/2Zπ(1-π)=2E2α/2Zπ(1-π)≥20.020.980.0421.96=47.0596由于计算结果大于47,故为保证使“≥”成立,至少应取48个单位的样本。●14.解:已知总体标准差x=120,由置信水平1-α=95%,得置信度α/2Z=1.96,允许误差E≤206即由允许误差公式E=/2Znxασ整理得到样本容量n的计算公式:n=2()Eα/2xZσ≥2()201.96120=138.2976由于计算结果大于47,故为保证使“≥”成立,至少应取139个顾客作为样本。第5章假设检验P1804..4.解:提出假设02:6,:6HH已知1.19,100,0.05n(1)检验统计量为60,1axZNn(2)拒绝规则是:若Zz,拒绝0H;否则,不拒绝0H(3)由6.35x得:0.056.3562.941.641.19100Zz,拒绝0H,认为改进工艺能提高其平均强度。6.解:提出假设2222201:0.75,:0.75TVVCRTVHH已知:230,2,0.05ns检验统计量2220.0522129*21032942.5570.75VCRns拒绝0H,可判定电视使用寿命的方差显著大于VCR7.解:提出假设:012112:5,:5HH120.02,100,50nn,独立大样本,则检验统计量为:1222221212514.810.455.14580.80.610050xxzssnn而0.01z2.33因为/2zz,拒绝0H,平均装配时间之差不等于5分钟8.解:匹配小样本提出假设:01:,:ababHH由计算得:0.625,1.302,8,0.05ddsn,检验统计量为70.0500.6251.357771.8946/1.302/8ddttsn,不拒绝0H,不能认为广告提高了潜在购买力的平均得分。9.解:提出假设:012112:,:HH已知:1122197301288