用样本频率分布估计总体分布(课件)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2.2.1用样本的频率分布估计总体分布1、用样本去估计总体,是研究统计问题的一个基本思想2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、分层抽样。要注意这几种抽样方法的联系与区别。3、初中时我们学习过样本的频率分布,包括频数、频率的概念,频数分布表和频数分布直方图的制作。频率分布样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的频率。频率分布的表示形式有:①样本频率分布表②样本频率分布图样本频率分布条形图样本频率分布直方图③样本频率分布折线图所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。知识探究(一):频率分布表【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):篇一:食品安全培训工作总结××X乡《食品安全法》宣传培训工作总结根据《××市食品安全法宣传活动实施方案》的要求,结合××X乡实际,认真开展学习宣传贯彻实施〈食品安全法〉培训工作,现将情况汇报如下:一、召开食品安全培训会,通过培训,提高食品经营户法制安全消费意识。1、5月22日,××X乡组织辖区商铺负责人、食品批发经营大户、超市等人员参加培训会。会议由乡人民政府乡长主持,分管食品安全监管的副乡长××X负责会议主要培训工作,参会人员21人。2、采用多元素形式丰富培训的内容。一是围绕《食品安全法》《消费者权益保护法》以及国务院出台的《国务院关于对加强食品等产品安全监督管理的特别规定》等法律法规进行了重点解读,达到引领的作用,提升经营者对法律法规的认知与学习的积极性,从而提高法律素质。并为每名参会人员送上了一本新颁布的《食品卫生法》读本及行政指导书1份。二是把全国、省内、我县发生的重大食品安全事故以明确的时间、地点、事故原因及造成的国家和人民群众的生命财产损失进行了实例通报。以生活的事例表明,食品安全不仅涉及到广大人民的生命健康,还直接影响到社会稳定、经济根据这些数据你能得出用水量其他信息吗?1.极差:样本数据中的最大值和最小值的差称为极差2.确定组距,组数:.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?0.2~4.3(4.3-0.2)÷0.5=8.23将数据分组,决定分点:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?4画频率分布表:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].分组频数累计频数频率[0,0.5)40.04[0.5,1)正80.08[1,1.5)正正正150.15[1.5,2)正正正正220.22[2,2.5)正正正正正250.25[2.5,3)正正140.14[3,3.5)正一60.06[3.5,4)40.04[4,4.5]20.02合计1001.00知识探究(二):频率分布直方图5画频率分布直方图为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距.频率分布直方图中各小长方形的宽度和高度在数量上有何特点?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距2图形的意义图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距3分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O思考:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?与分组数(或组距)及坐标系的单位长度有关.月均用水量/t频率组距0.40.30.20.112345O1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.(填写频率/组距一栏)5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。4.18.20.5极差组数=组距小结理论迁移例某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组.分组频数频率[27,32)30.06[32,37)30.06[37,42)90.18[42,47)160.32[47,52)70.14[52,57)50.10[57,62)40.08[62,67)30.06合计501.00样本频率分布表:(2)样本频率分布直方图:年龄0.060.050.040.030.020.01273237424752576267频率组距O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32~52岁的知识分子约占70%.90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036〖例2〗:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?作业:P71第一题注意第几组频数(1)第几组频率样本容量(2)纵坐标为:频率组距频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线——总体密度曲线.总体密度曲线用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39甲乙804631253682543893161679449150注:中间的数字表示得分的十位数字。旁边的数字分别表示两个人得分的个位数。茎叶图当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有的信息,而且可以随时记录,给数据的记录和表示都方便。练习:某中学高一(2)班甲,乙两名同学自高中以来每场数学考试成绩情况如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:83,86,93,99,88,96,98,98,79,85,97画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。小结图形优点缺点频率分布1)易表示大量数据丢失一些直方图2)直观地表明分布地情况信息1)无信息损失只能处理样本茎页图2)随时记录方便记录和表示容量较小数据课堂小结表示样本分布的方法:(1)频率分布表(2)频率分布图(包括直方图和条形图)(3)频率分布折线图(4)茎叶图1.频率分布表表示样本的分布的方法:分组个数累计频数频率频率/组距产品尺寸(mm)2.频率分布直方图样本频率分布中,当样本容量无限增大,组距无限缩小样本频率分布直方图接近于一条光滑曲线——总体密度曲线,反映了总体分布。3.频率分布折线图1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。小结

1 / 32
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功