统计学(贾俊平等)第五版课后习题答案(完整版)人大出版社第二部分:练习题整理by__kiss-ahuang3.1为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下:BDABCDBBACEADABAEADBCCBCCCCCBCCBCDEBCECEACCEDCAECDDDAABDDAABCEEBCECBECBCDDCCBDDCAECDBEADCBEEBCCBECBC要求:(1)指出上面的数据属于什么类型。顺序数据(2)用Excel制作一张频数分布表。用数据分析——直方图制作:接收频率E16D17C32B21A14(3)绘制一张条形图,反映评价等级的分布。用数据分析——直方图制作:(4)绘制评价等级的帕累托图。逆序排序后,制作累计频数分布表:接收频数频率(%)累计频率(%)CBDEA35302520151050CDBAE12010080604020032211716143221171614325370861003.2某行业管理局所属40个企业20XX年的产品销售收入数据如下:1521051179712411910888129114105123116115110115100871071191031031371389211812011295142136146127135117113104125108126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。1、确定组数:lg(2)lg2lgn()1.602062k=6,取0.301032、确定组距:组距=(最大值-最小值)÷组数=(152-87)÷6=10.83,取103(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。3.3某百货公司连续40天的商品销售额如下:单位:万元41463542253628362945463747373437383730493436373930454442384326324333383640444435要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。1、确定组数:lgn(lg(2)lg2)1.60206,取0.301032、确定组距:组距=(最大值-最小值)÷组数=(49-25)÷6=4,取53.4利用下面的数据构建茎叶图和箱线图。572335182121294751264643292339504119362818295242312846332820dataStem-and-LeafPlotFrequencyStem&Leaf3.001.8895.002.011337.002.68889992.003.133.003.5693.004.1233.004.6673.005.0121.005.7Stemwidth:10Eachleaf:1case(s)3.6一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:单位:g57464954555849615149516052545155605647475351485350524045575352514648475347534447505253474548545248464952595350435346574949445752424943474648515945454652554749505447484457475358524855535749565657534148要求:(1)构建这些数据的频数分布表。(2)绘制频数分布的直方图。(3)说明数据分布的特征。解:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。1、确定组数:lg(2)lg2lgn()或7,取0.3010322、确定组距:组距=(最大值-最小值)÷组数=(61-40)÷6=3.5,取3或者4、5组距=(最大值-最小值)÷组数=(61-40)÷7=3,3、分组频数表组距3,上限为小于直方图:组距4,上限为小于等于直方图:组距5,上限为小于等于直方图:分布特征:左偏钟型。3.8下面是北方某城市1——2月份各天气温的记录数据:-32-4-7-11-17146-8-14-18-8-6-22-15-12-15-13-9-16-11-9-6-19-12-6-1-15-190-10-22-25-1785-25-24559-4-24-18-4-6-6-9-19-17-9-5-32-4-4-16要求:(1)指出上面的数据属于什么类型。数值型数据(2)对上面的数据进行适当的分组。1、确定组数:lgn(lg(2)lg2)1.778151,取0.301032、确定组距:组距=(最大值-最小值)÷组数=(14-(-25))÷7=5.57,取53(3)绘制直方图,说明该城市气温分布的特点。解:(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。(2)比较两个班考试成绩分布的特点。甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。(3)画出雷达图,比较两个班考试成绩的分布是否相似。分布不相似。3.14已知1995—20XX年我国的国内生产总值数据如下(按当年价格计算):要求:(1)用Excel绘制国内生产总值的线图。(2)绘制第一、二、三产业国内生产总值的线图。(3)根据20XX年的国内生产总值及其构成数据绘制饼图。第四章统计数据的概括性描述4.1一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:24710101012121415要求:(1)计算汽车销售量的众数、中位数和平均数。(2)根据定义公式计算四分位数。(3)计算销售量的标准差。(4)说明汽车销售量分布的特征。解:Statistics汽车销售数量NValidMissingMeanMedianModeStd.DeviationPercentiles2550751009.6010.00104.1696.2510.0012.50单位:周岁19233023411521202720293819223125221934172418162423要求;(1)计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。(2)根据定义公式计算四分位数。Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。(3)计算平均数和标准差;Mean=24.00;Std.Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:lgn(lg(2)lg2)1.398,取0.301032、确定组距:组距=(最大值-最小值)÷组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄(Binned)分组后的均值与方差:分组后的直方图:4.3某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:5.56.66.76.87.17.37.47.87.8要求:(1)画出第二种排队方式等待时间的茎叶图。第二种排队方式的等待时间(单位:分钟)Stem-and-LeafPlotFrequencyStem&Leaf1.00Extremes(=<5.5)3.006.6783.007.1342.007.88Stemwidth:1.00Eachleaf:1case(s)(2)计算第二种排队时间的平均数和标准差。MeanStd.DeviationVariance70.7141430.51(3)比较两种排队方式等待时间的离散程度。第二种排队方式的离散程度小。(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。选择第二种,均值小,离散程度小。4.4某百货公司6月份各天的销售额数据如下:单位:万元257271272276292284297261268252281303238301273310274263240267322236280249265291269278258295要求:(1)计算该百货公司日销售额的平均数和中位数。(2)按定义公式计算四分位数。(3)计算日销售额的标准差。解:Statistics百货公司每天的销售额(万元)NValidMissingMeanMedianStd.DeviationPercentiles255075300274.1000272.500021.17472260.2500272.5000291.2500要求:比较两个企业的总平均成本,哪个高,并分析其原因。产品多,乙的低成本的产品多。要求:(1)计算120家企业利润额的平均数和标准差。(2)计算分布的偏态系数和峰态系数。解:Statistics企业利润组中值Mi(万元)NValidMissingMeanStd.DeviationSkewnessStd.ErrorofSkewnessKurtosisStd.ErrorofKurtosis1200426.6667116.484450.2080.221-0.6250.43817岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?(2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大?(3)两位调查人员得到这l100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大?解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。(2)不一定相同,样本量少的标准差大的可能性大。(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。4.8一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?计算标准分数:Z1==5=-1;Z2==5=1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?计算标准分数:Z1==5=-2;Z2==5=2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。4.9一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试