用样本的频率分布估计总体分布11

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2.2.1用样本的频率分布估计总体分布统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.统计的核心问题:如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断.用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。整体介绍:将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。频率:每组数据的个数除以全体数据个数的商叫做该组的频率。•根据随机抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。我国是世界上严重缺水的国家之一,城市缺水问题较为突出。2000年全国主要城市中缺水情况排在前10位的城市例1:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:1.求极差:步骤:频率分布直方图2.决定组距与组数:组数=4.3-0.2=4.14.10.5=8.2组距极差=3.将数据分组[0,0.5),[0.5,1),…,[4,4.5]4.列频率分布表100位居民月平均用水量的频率分布表频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.55.画频率分布直方图探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组距=极差/组数三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)练习1.有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?解:组距为3分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.070例2、为了了解一大片经济林的生长情况,随机测量其中的100株的底部周长,得到如下数据表(长度单位:cm):135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少。解:(1)从表中可以看出:这组数据的最大值为135,最小值为80,故极差为55,可将其分为11组,组距为5。从第1组[80,85)开始,将各组的频数、频率和频率/组距填入表中分组频数频率频数/组距[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.03[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135)20.020.004合计10010.2课堂练习:1、为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.(1)列出样本的频率分布表;(2)根据上述结果,估计此种产品为二级品或三级品的概率约是多少.解:(1)样本的频率分布表为:0.134次品0.4313三级品0.278二级品0.175一级品频率频数产品(2)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.00.010.020.030.040.050.06周长(cm)频数/组距808590951351101151201251301001052.有一个容量为50的样本,数据的分组及其频数如下所示,请将其制成频率直方图.频率分布表如下:分组频率[25,30)[30,35)[35,40)[40,45)[45,50)3891110[50,55)[55,60]54合计500.060.160.180.220.200.100.081.00频数3.已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为0.2范围的是()A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5分组频数频率频数累计5.5~7.520.127.5~9.560.389.5~11.580.41611.5~13.540.220合计201.0D4.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.分组频数频率频率累计[12,15)6[15,18)0.08[18,21)0.30[21,24)21[24,27)0.69[27,30)16[30,33)0.10[33,36]1.00合计1001.00•例:已知一个样本,填写下面的频率分布表•7.06.66.87.07.27.47.07.37.57.4•7.37.17.06.96.77.17.27.06.97.1分组频数累计频数频率6.55~6.756.75~6.956.95~7.157.15~7.357.35~7.55合计小结:频率分布直方图应用步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图

1 / 25
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功