频率分布直方图应用步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图频率分布直方图各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.复习1.右图是容量为100的样本的频率分布直方图,试根据图中的数据填空:(1)样本数据落在范围[6,10)内的频率为____;(2)样本数据落在范围[10,14)内的频数为____;(3)总体在范围[2,6)内的概率约为_______;O261014180.020.030.080.09样本数据频率组距0.32360.08巩固练习2.一个容量为35的样本,分组后,组距与频数如下:[5,10)5,[10,15)12,[15,20)7,[20,25)5,[25,30)4,[30,35)2,则样本在区间[20,+∞)上的频率为()A.20%B.69%C.31%D.27%C3.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为()A.2B.4C.6D.8B051015202512.515.518.521.524.527.530.5连接频率分布直方图中各个小长方形上端的中点,频率分布折线图随着样本容量的增加,作图时所分的组数也会增加,相应的频率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的曲线为总体密度曲线051015202512.515.518.521.524.527.530.50.060.160.180.200.220.180.10黄色部分取值的百分比为0.20+0.22=0.42总体密度曲线反映了总体在各个范围内的百分比茎叶图例1某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39甲乙804631253682543893161679449150茎叶图:顾名思义,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.中间的数字表示得分的十位数,旁边的数字分别表示两个人得分的个位数.3.茎叶图刻画数据的优缺点:优点:①所有的信息都可以从茎叶图中得到.②茎叶图便于记录与表示.缺点:茎叶图只便于表示有两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰.当然,当样本数据很多时,即使是表示有两位有效数字的数据,茎叶图的效果也不是很好了.画茎叶图的步骤:1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字;2.将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;3.将各个数据的叶按大小次序写在其茎右(左)侧.茎叶08134523683389451茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;(2)茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;(3)茎叶图对重复出现的数据要重复记录,不能遗漏.例2在本赛季的NBA比赛中,我国著名篮球运动员姚明所在的休斯敦火箭队战绩骄人,下面是火箭队在最近10场比塞中,姚明与队友麦克格雷迪各自的得分情况,问谁发挥的更好?姚明麦迪34741421097202216420358茎叶图场次一二三四五六七八九十姚明20121411142227171413麦迪22212624103538222019姚明麦迪744432110972020122463581.右面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()甲012345乙824719936250328754219441AA.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分2.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图:甲乙014235503287542194418247199362(1)甲乙两名队员的最高得分各是多少?(2)哪名运动员的成绩好一些?(1)甲运动员的最高得分为51分,乙运动员的最高分为52分;(2)甲运动员的成绩好于乙运动员.3下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况.茎叶10781102223666778120012234466788130234可以看出30名工人的日加工零件个数稳定在120件左右.4.(2006年全国卷II)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000](元)月收入段应抽出_______人.0.00010.00020.00030.00040.0005月收入(元)频率/组距2510001500200025003000350040005.(2006年重庆卷)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:C0.030.050.07体重(kg)频率/组距54.558.562.566.570.574.5根据上图可得这100名学生中体重在[56.5,64.5]的学生人数是()A.20B.30C.40D.506.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于等于19秒.右图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()A.0.9,35B.0.9,45C.0.1,35D.0.1,45O13141516171819秒频率/组距0.360.340.180.060.040.02A90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.0367为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?8已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为0.2范围的是()A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5分组频数频率5.5~7.520.17.5~9.560.39.5~11.580.411.5~13.540.2合计201.0D9、对某电子元件进行寿命跟踪调查,情况如下:1)列出频率分布表和画频率分布直方图2)估计电子元件寿命在100h~400h以内的频率3)估计电子元件寿命在400h以上频率寿命(h)100~200200~300300~400400~500500~600个数2030804030解:(1)样本频率分布表如下:寿命(h)频数频率100~200200.10200~300300.15300~400800.40400~500400.20500~600300.15合计2001(2)频率分布直方图如下:(3)由频率分布表可以看出,寿命在100h~400h的电子元件出现的频率为0.65,电子元件寿命在400h以上的频率为0.35.10.已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为________,样本数据落在[2,10)内的频率为________.解析:样本数据落在[6,10)内的样本频数为0.08×4×100=32,样本数据落在[2,10)内的频率为(0.02+0.08)×4=0.4.答案:320.4课本P71练习11.求极差(即一组数据中最大值与最小值的差)364.41-362.51=1.90说明样本数据的变化范围大小是1.90cm)2.决定组距与组数取组距为0.4cm,那么组数=极差÷组距=1.90÷0.4=4.75因此可以将数据分成5组,即组距为0.4,组数为53.将数据分组[362.51,362.91),[362.91,363.31),[363.31,363.71),[363.71,364.11),[364.11,364.51]分组频数频率[362.51,362.91)[362.91,363.31)[363.31,363.71)[363.71,364.11)[364.11,364.51)817331660.100.21250.41250.200.075合计801.005.画频率分布直方图4.列频率分布表