1第二章习题(P46)14.某天40只普通股票的收盘价(单位:元/股)如下:29.62518.0008.62518.5009.25079.3751.25014.00010.0008.75024.25035.25032.25053.37511.5009.37534.0008.0007.62533.62516.50011.37548.3759.00037.00037.87521.62519.37529.62516.62552.0009.25043.25028.50030.37531.12538.00038.87518.00033.500(1)构建频数分布*。(2)分组,并绘制直方图,说明股价的规律。(3)绘制茎叶图*、箱线图,说明其分布特征。(4)计算描述统计量,利用你的计算结果,对普通股价进行解释。解:(1)将数据按照从小到大的顺序排列1.25,7.625,8,8.625,8.75,9,9.25,9.25,9.375,10,11.375,11.5,14,16.5,16.625,18,18,18.5,19.375,21.625,24.25,28.5,29.625,29.625,30.375,31.125,32.25,33.5,33.625,34,35.25,37,37.875,38,38.875,43.25,48.375,52,53.375,79.375,结合(2)建立频数分布。(2)将数据分为6组,组距为10。分组结果以及频数分布表。为了方便分组数据样本均值与样本方差的计算,将基础计算结果也列入下表。区间组频数累计频数组中值组频数×组中值组频数×组中值×组中值)10,0[99545225)20,10[1019151502250)30,20[524251253125)40,30[11353538513475)50,40[23745904050),50[3406018010800合计4097533925根据频数分布与累积频数分布,画出频率分布直方图与累积频率分布的直方图。2频率分布直方图从频率直方图和累计频率直方图可以看出股价的规律。股价分布10元以下、10—20元、30—40元占到60%,股价在40元以下占87.5%,分布不服从正态分布等等。累积频率分布直方图(3)将原始数据四舍五入取到整数。1,8,8,9,9,9,9,9,9,10,11,12,14,17,17,18,18,19,19,22,24,29,30,30,30,31,32,34,34,34,35,37,38,38,39,43,48,52,53,79以10位数为茎个位数为叶,绘制茎叶图如下茎(十位数)叶(个位数及其小数)01889999991124778899224931244457889438523679由数据整理,按照从小到大的准许排列为:)40()39()2()1(xxxx频率00.050.10.150.20.250.30—1010—2020—3030—4040—5050及以上累计频率00.20.40.60.811.20—1010—2020—3030—4040—5050及以上3最小值25.1)1(x,下四分位数03125.11375.11431041341)11()10(xxQl,中位数9375.22225.24625.2121)21()20(xxMe,上四分位数)30()29(341xxQu3125.3425.35413443,最大值375.79)40(x,四分位数间距28125.2313QQIQR,375.792344.695.1)40(3xIQRQ,因此可以做出箱线图为:茎叶图的外部轮廓反映了样本数据的分布状况。从茎叶图和箱线图可以看出其分布特征:中间(上下四分位数部分)比较集中,但是最大值是奇异点。数据分布明显不对称,右拖尾比较长。(4)现用原始数据计算常用的描述性统计量样本均值:421875.2540/875.1016401401iixx样本方差:196.26340391240122xxsii样本标准差:2233.16196.2634039124012xxsii用分组数据计算常用的描述性统计量:97561kkkxf,33925612kkkxf样本均值:375.2440/97540161kkkxfx样本方差:4968.260403912612xxfskkk样本标准差:1399.164968.260403912612xxfskkk与用原始数据计算的结果差别不大。此外,可以用Excel中的数据分析直接进行描述性统计分析,结果如下:平均25.4219区域78.125标准误差2.5651最小值1.25中位数22.9375最大值79.375众数29.625求和1016.875标准差16.2233观测数40方差263.1961最大(1)79.375峰度1.6025最小(1)1.25偏度1.0235置信度(95.0%)5.18854补充习题:1.测量血压14次,记录收缩压,得样本如下:121,123,119,130,125,115,128,126,109,112,120,126,125,125求样本均值,样本方差,样本中位数,众数和极差。2.根据列表数据分组人数[20,25)2[25,30)6[30,35)9[35,40)4[40,45]1求样本均值,样本方差,样本标准差3.调查30个中学生英语成绩,得样本如下:54,66,69,69,72,75,77,75,76,79,76,77,78,79,81,81,85,87,83,84,89,86,89,89,92,95,96,96,98,99把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图补充习题答案1.测量血压14次,记录收缩压,得样本如下:121,123,119,130,125,115,128,126,109,112,120,126,125,125求样本均值,样本方差,样本中位数,众数和极差。解:排序:109112115119120121123125125125126126128130均值:1niixxn=121.71方差:222211()11nniiiixxxnxsnn=37.76中位数:12202nnxxm=124众数:me=125极差:R=xn-x1=2152.根据列表数据分组人数组中值[20,25)222.5[25,30)627.5[30,35)932.5[35,40)437.5[40,45]142.5求样本均值,样本方差,样本标准差解:分组人数组中值[20,25)222.5[25,30)627.5[30,35)932.5[35,40)437.5[40,45]142.5样本均值:11kiiixxfn=31.59091样本方差:222211()11kniiiiiixxfxfnxsnn=25.32468样本标准差:21()1kiiixxfsn=5.0323调查30个中学生英语成绩,得样本如下:54,66,69,69,72,75,77,75,76,79,76,77,78,79,81,81,85,87,83,84,89,86,89,89,92,95,96,96,98,99把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图解:列表区间频数[50,60)1[60,70)3[70,80)10[80,90)10[90,100]66024681012[50,60)[60,70)[70,80)[80,90)[90,100]第四章习题(p118)21.下面的10个数据是来自一个正态总体的样本数据:10,8,16,12,15,6,5,14,13,9(1)总体均值的点估计是多少?(2)总体标准差的点估计是多少?(3)总体均值99%的置信区间是多少?解:(1)总体均值的点估计8.10108101ˆx(2)总体标准差的点估计7947.34.148.10101296911091ˆ221012xxsii(3)这是正态总体方差未知的条件下,总体均值的区间估计问题99.01,01.0,2498.3)9()1(005.02/tnt总体均值99%的置信区间为:nsntxnsntx)1(,)1(2/2/)(6997.14,9.6107947.32498.38.10,107947.32498.38.10第五章习题(p154)7.某一问题的零假设和备择假设分别如下:725:0H25:1H当某个样本容量为100,总体标准差为12时,对下面每一个样本的结果,都采用显著性水平05.0计算检验统计量的值,并得出相应的结论。(1)0.221x。(2)5.232x。(3)8.223x。(4)0.244x。解:这是总体分布未知,大样本前提下,总体均值的单边检验问题。故,可以用大样本情况下单个总体均值的检验。提出原假设与备择假设:25:0H25:1H选择检验统计量nxz/25,当0H成立时,)1,0(~//25Nnxnxz给定显著性水平05.0,645.105.0zz,拒绝域645.105.0zz(1)0.221x,645.15.2100/122522/25nxz,拒绝0H。接受1H,即不能认为25。(2)5.231x,645.125.1100/12255.23/25nxz,接受0H。即认为25。(3)8.221x,645.183333.1100/12258.22/25nxz,拒绝0H。接受1H,即不能认为25。(4)0.241x,645.18333.0100/122524/25nxz,接受0H。即认为25。12.有一项研究要作的假设检验是:20:0H20:1H某个样本有6个数据,他们分别是:20,18,19,16,17,18。根据这6个数据,分别回答以下问题:(1)它们的均值和标准差各是多少?(2)当显著性水平05.0时,拒绝规则是什么?(3)计算检验统计量t的值。(4)根据以上信息,你所得出的结论是什么?解:说明:本题是小样本,应该有总体服从正态分布),(2N的假定。(1)由样本数据得6n,10861iix,1954612iix样本均值:186/1086161iixx;样本方差:2)1861954(51651226122xxsii8样本标准差:4142.126512612xxsii(2)在总体服从正态分布的假定之下,这是正态总体方差未知的条件下,总体均值的双边检验问题,用t检验。提出原假设与备择假设:20:0H20:1H选择检验统计量:nsxt/20,当原假设0H成立时,)1(~//20ntnsxnsxt当显著性水平05.0时,5706.2)5()1(025.02/tnt,因此:拒绝域为:5706.2)5(025.0tt(3)计算检验统计量t的值236.255/22018/20nsxt(4)5706.2236.2/20nsxt,接受0H。即,总体均值与20没有显著性差异。13.一家钢铁企业主要生产一种厚度为25mm的钢板。历史统计资料显示,其中一台设备生产的钢板的厚度服从正态分布。最近,该厂维修部门对这台设备进行了大修。这台设备重新投入生产后,车间生产监管员担心这台设备经过维修后生产的钢板厚度会发生变化。为验证这一担心是否属实,他随机选出20块钢板,对其厚