用样本的频率分布估计总体分布一、教学目标•1通过实例体会分布的意义和作用。•2在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。•3通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。二、教学重点与难点•重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。•难点:能通过样本的频率分布估计总体的分布。能思考的苇草四川/一考生我很喜欢那样一个比喻一一人是能思考的苇草。也许思考就是那个让人可以凌驾于万物之上的台阶。但也正是这思考的能力赋予了人类以思想,从而把人类置于了很多旭旭的境地,比如亲情与真理。我清楚地记得康德曾经说过:有两样东西我越是思考就越感到无上敬畏之情:我们头上的灿烂星空,我们心中的道德法则。这句镑刻在人类思想史上的话语也许很精当地为人类摆脱揽恤境地提供了柳暗花明的一招坚持自然真理与思想的道德法则。也许这样,人类才可以真正做一棵生长在自然之基上的能思考的苇草。我相信人类在判断认知事物的时候一定都会烙上思想感情的印迹,更何况是那样一种与生俱来挥之不去的神圣感情。中国历史长河中清风明月般的人物当然有,但是完全割裂亲情毫无私念的例子又实在不算多。而我也许真的不太主张做一个冷血无情的人,否则世界没有了感情,也没有了色彩。我很喜欢鲁迅,喜欢他那横眉下的犀利思想。先生一定可以算是一个深刻的人。而先生客观冷静的观点绝不是众叛亲离而来的,无情末必真豪杰,怜子如何不丈夫这是先生的诗,而先生也是这样做的。所以先生的面孔永远是鲜活的,泛着血的殷红。世我国是世界上严重缺水的国家之一,城市缺水问题较为突出。2000年全国主要城市中缺水情况排在前10位的城市某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:1.求极差(即一组数据中最大值与最小值的差)2.决定组距与组数组数=4.3-0.2=4.14.10.5=8.2组距极差=3.将数据分组[0,0.5),[0.5,1),…,[4,4.5]组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,4.列频率分布表100位居民月平均用水量的频率分布表注意:这里出来了条形图中条形的宽度。频率不仅与条形的高度有关,而且与它的宽度有关。为了使选择不同宽度的总体分布相同,我们用另一种图形表示,即直方图——用面积表示概率。频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.55.画频率分布直方图小长方形的面积组距频率=组距×频率=注意:①这里的纵坐标不是频率,而是频率/组距;②某个区间上的频率用这个区间的面积表示;直方图思考:所有小长方形的面积之和等于?一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组距=极差/组数三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗?你认为3吨这个标准一定能够保证85%以上的居民用水量不超过标准吗?频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5分析:月用水量在3t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3t以上,88%的居民月用水量在3t以下.因此,居民月用水量标准定为3t是一个可以考虑的标准.频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5想一想:你认为3t这个标准一定能够保证85%以上的居民用水不超标吗?如果不一定,那么哪些环节可能会导致结论的差别?所得到的结论的统计意义•3t这个标准一定能保证85%以上的居民用水不超标吗?•不一定!•原因1、样本只是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。•原因2、明年的用水情况与今年不可能完全一样,但应该大致一样。广东文11题5分11.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为45,55,55,65,65,75,75,85,85,95,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在55,75的人数是.图30.0400.0350.0300.0250.0200.0150.0100.0050455565758595产品数量频率/组距高考题型:13练习1.有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?解:组距为3分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.07018.521.524.527.5频率/组距0.0200.0530.0600.0730.0670.0330.027所得到的结论的统计意义•一般的,统计得到的结果,是对于总体较为合理的估计或预测,但其误差应该控制在合理的范围之内。•也正因为这样,统计结果的好坏,往往需要进一步的评价,或通过理论方法的检验,或通过实际应用的检验。•频率分布表和频率分布直方图在带给我们许多新的信息的同时,也丢失了一些信息,如原始数据不能在分布表和直方图中很好地体现出来。频率分布直方图的优缺点是什么?例1.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.分组频数频率频率累计[12,15)6[15,18)0.08[18,21)0.30[21,24)21[24,27)0.69[27,30)16[30,33)0.10[33,36]1.00合计1001.00应用举例:•连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。直方图(0.5组距)00.10.20.30.40.50.6频率/组距思考:上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?分析:样本容量越大,这种估计越精确。但随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线.频率组距产品尺寸(mm)ab当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线——总体密度曲线.区间在总体内取值的概率),(ba总体密度曲线总体密度曲线甲乙01234525541616794908463368438911、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图叶就是从茎的旁边生长出来的数,表示得分的个位数。茎是指中间的一列数,表示得分的十位数画茎叶图的步骤:•1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字。•2.将最小茎和最大茎之间的数按大小次序排成一列。•3.将各个数据的叶按读数次序(或按大小次序)写在其茎的左(右)侧。茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。知识回顾频率分布直方图应用步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5频率分布折线图连接频率直方图中各小长方形上端中点的折线,叫频率分布折线图频率组距产品尺寸(mm)当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体在区间内取值的频率),(baS——总体密度曲线.ab例2、对某电子元件进行寿命追踪调查,情况如下:寿命个数100~200200~300300~400400~500500~6002030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h~400h以内的频率;(4)估计电子元件寿命在400h以上的频率;应用举例:(1)列出频率分布表;100~200200~300300~400400~500500~600寿命合计频率频数累积频率20308040302000.100.150.400.200.1510.100.250.650.851100200300400500600)寿命(h频率/组距0.65.0:400~10065.0:400~1003的概率为元件寿命在,所以我们估计电子为的电子元件出现的频率出,寿命在)由频率分布表可以看(hhh..:h...:h3504003501502004004以上的概率为估计电子元件寿命在,故我们元件出现的频率为以上的电子命在由频率分布表可知,寿)(.广东文11题5分11.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为45,55,55,65,65,75,75,85,85,95,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在55,75的人数是.图30.0400.0350.0300.0250.0200.0150.0100.0050455565758595产品数量频率/组距高考题型:探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。例题、从某企业全体员工某月的工资表中随机抽取了50名员工的工资资料如下:800、800、800、800、800、1000、1000、1000、1000、1000、1000、1000、1000、1000、1000、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1500、1500、1500、1500、1500、1500、1500、200