_复习_频率分布直方图

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

【2014年高考会这样考】1.考查频率分布直方图中的相关计算(求解频率、频数等).2.考查用样本估计总体中的样本数据的数字特征(平均数、方差、标准差等).复习用样本估计总体1.用样本的频率分布估计总体分布(1)频率分布表与频率分布直方图频率分布表与频率分布直方图的绘制步骤如下①求极差,即一组数据中最大值与最小值的差.②定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.我国是世界上严重缺水的国家之一,城市缺水问题较为突出。2000年全国主要城市中缺水情况排在前10位的城市引入政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?这些数字告诉我们什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:1.求极差(即一组数据中最大值与最小值的差)2.决定组距与组数4.3-0.2=4.14.10.5=8.2组数=组距极差=3.将数据分组(左闭右开)[0,0.5),[0.5,1),…,[4,4.5]组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,4.列频率分布表分组频数累计频数频率[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计48152225146420.040.080.150.220.250.140.060.041001.00频率=样本容量频数频率分布表一般分“分组”,“频数累计”(可省),“频数”,“频率”,“频率/组距””五列,最后一行是合计注意频数的合计应是样本容量,频率合计应是10.02频率/组距0.080.160.300.440.500.280.120.080.04小矩形的面积组距频率组距×频率==分组频数频率频率/组距[0,0.5)40.040.08[0.5,1)80.080.16[1,1.5)150.150.30[1.5,2)220.220.44[2,2.5)250.250.50[2.5,3)140.140.28[3,3.5)60.060.12[3.5,4)40.040.08[4,4.5]20.020.04合计1005.画频率分布直方图:用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234请计算每个小矩形的面积,它代表什么?为什么?所有小矩形的面积的和是多少?1注意纵坐标是频率/组距用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234频率分布直方图,显示了样本数据落在各个小组的比例的大小,图中最高的小矩形说明了什么?大部分居民的月均用水量都集中在什么之间?月均用水量在[2,2.5)内的居民最多.[1,3)之间.频率分布直方图的特征:优点:从频率分布直方图可以清楚地看出数据分布的总体趋势缺点:从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据就被抹掉了如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗?用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234居民月用水量标准应定为3t.分组频数频率累积频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22[2,2.5)250.25[2.5,3)140.14[3,3.5)60.06[3.5,4)40.04[4,4.5)20.02合计1001.000.040.120.270.490.740.880.940.981.00频率分布折线图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图频率组距月均用水量(mm)ab当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线——总体密度曲线.总体在区间内取值的概率),(baS频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频率分布对总体分布进行相应估计(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。发现:当样本容量无限增大,组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线——总体密度曲线。用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布折线图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。总体密度曲线茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(1)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎(中间一列数)取得分的十位数,叶(两边的数)取得分的个位数,故称为茎叶图。26甲乙0123458463368389125541616794901.认识茎叶图,并学习如何做茎叶图?如图:茎为得分的十位数,叶为得分的个位数思考:数据大于俩位数的整数时又如何选茎,叶?数据为小数时又如何选茎,叶?结论:1、当数据为整数时:通常个位数字在叶上,其他位数在茎上(一位数时,茎为0)2、当数据为小数时:通常小数部分在叶上,整数部分在茎上甲的茎叶图画法也可以画一组数据的茎叶图,竖线左边为茎,右边为叶。两组数据以上也可以分别画在一张图上,但没有两组数据画一起比较起来更那么直观、清晰。0813642368338945127茎叶2.如何通过分析茎叶图了解总体?主要从对称性,中位数(体现成绩好坏),稳定性(即集中程度)来分析甲乙012345846336838912554161679490分析:甲得分除51分外大致对称,乙基本上也对称。甲的中位数为26,乙的中位数为36,所以乙较甲成绩要好,另,乙的叶较甲的更集中于峰值附近,所以乙较甲发挥更稳定优点:1.即茎叶图保留了原始数据并展示了数据的分布情况。2.茎叶图可以在比赛时随时记录,方便记录与表示。缺点:当样本数据较多时,茎叶图就显得不方便3.茎叶图的优缺点考点梳理1.用样本的频率分布估计总体分布(1)频率分布表与频率分布直方图频率分布表与频率分布直方图的绘制步骤如下①求极差,即一组数据中最大值与最小值的差.②定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的______,就得到频率分布折线图.频率分布折线图的优点是它可以表示数量的多少,直观地反映数量的增减情况,即变化趋势;缺点是它不适合总体分布较多的情况.②总体密度曲线:随着样本容量的增加,作图时所分的组数也在增加,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图①茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.②对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶,样本数据为小数时做类似处理.中点考点梳理2.用样本的数字特征估计总体的数字特征(1)众数:在一组数据中,出现次数_______的数据叫做这组数据的众数.体现了样本数据的最大集中点,不受极端值的影响而且不唯一.(2)中位数:将一组数据按大小依次排列,把处在_________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.它不受极端值的影响,仅利用了排在中间数据的信息,只有一个,且在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)平均数:样本数据的算术平均数,即x=__________________,它与每一个样本数据有关,仅有一个.(4)极差:一组数值中最大值与最小值的差,它反映一组数据的波动情况,但极值只考虑两个极端值,可靠性极差.(5)标准差:①考查样本数据的分散程度的大小,最常用的统计量是标准差,标准差是样本数据到平均数的一种平均距离,一般用s表示.s=1n[x1-x2+x2-x2+…+xn-x2].②标准差的平方s2叫做方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].最多最中间1n(x1+x2+…+xn)频率分布表:优点:能看出分布规律.缺点:不直观.频率分布直方图:优点:很直观且能看出分布规律.缺点:数据的轻微变化都要重新作图.茎叶图:优点:很直观,能看出分布规律,还可以添加新数据.缺点:数据少时方便,数据较多时不方便.一个对比助学微博两个特性(1)在频率分布表中,频数的和等于样本容量,每一小组的频率等于这一组的频数除以样本容量,各小组频率的和等于1;(2)在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于该组的频率,所有小矩形的面积之和为1.1.10名工人某天生产同一零件生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是().A.14B.16C.15D.172.(2012·湖北)容量为20的样本数据,分组后的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数234542则样本数据落在区间[10,40)的频率为().A.0.35B.0.45C.0.55D.0.653.(2013·西北工大附中测试)如图是容量为150的样本的频率分布直方图,则样本数据落在[6,10)内的频数为().A.12B.48C.60D.80考点自测单击题号显示结果答案显示单击图标显示详解CBB123单击转4-5题4.如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为().A.84,4.84B.84,1.6C.85,4D.85,1.65.(2012·湖南)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中x为x1,x2,…,xn的平均数)考点自测单击题号显示结果答案显示单击图标显示详解D6.845单击转1-3题【例1】►某班同学利用国庆节进行社会实践,对[25,55]岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:(1)补全频率分布直方图;(2)求n、a、p的值.组数分组低碳族的人数占本组的频率第一组[25,30)1200.6第二组[30,35)195p第三组[35,40)1000.5第四组[40,45)a0.4第五组[45,50)300.3第六组[50,55]150.3【审题视点】解考向一频率分布直方图的绘制与应用(1)要补全频率分布直方图,关键是计算出第二组的频率;(1)第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以小长方形的高为0.35=0.06.频率分布直方图如图所示.(

1 / 57
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功