§20.1数据的频数分布你能说说这30天空气质量的分布情况吗?提出问题空气污染指数分布表把数据按上述级别分成0~50,51~100,101~150,151~200,201~250共5组进行整理,得下表912333问题2:现在你能说说这30天空气质量的分布情况吗?问题3:你能估计该地今年(按365天计算)空气质量达到优级别的天数吗?空气污染指数分布表下面我们就来通过具体的例子,学习这种分析数据的分布方法?某校体卫组织想对该校八年级全体学生一周内平均每天参加课外锻炼的时间(单位:min)有所了解,从中随机抽查了40名学生,结果如下:40,21,35,24,40,38,23,52,35,62,36,15,51,45,42,40,32,43,36,34,53,38,40,39,32,45,40,50,45,40,50,26,45,40,45,35,40,42,45,40.为了了解这批数据反映的情况,我们可以对它进行怎样的分析呢?有哪些步骤呢?1.计算极差(这批数据中最大数与最小数的差).62-15=47.由此可知这批数据的变动范围.2.决定组距和组数.组距:是指每个小组的两个端点间的距离.如果每组组距相同,并取组距为8,那么4768最大数-最小数组数==组距即把数据分成6组.一般步骤3.决定分点.●将数据按照8min的组距分组,从15开始,分成15~23,23~31,31~39,39~47,47~55,55~63这6组,这时,我们发现数据23,39正好落在分点上,不好决定它们究竟属于哪一组,为了避免这种情况,一般地把表示分点的数比原数据多取一位小数,并把第一组的起点定为比最小的数据稍小一点的数,如把第一组的起点定为14.5,这样所分成的6个组是:14.5~22.5,22.5~30.5,30.5~38.5,38.5~46.5,46.5~54.5,54.5~62.5.4.列频数分布表.★我们把一批数据中落在某个小组内数据的个数称为这个组的频数.★通常用选举时唱票的方法,对落在各个小组内的数据个数进行记录,算出每一个小组的频数,并制成频数分布表.★如果一批数据共有n个,而其中某一组数据是m个,那么就是该组数据在这批数据中出现的频率.mn特别说明:⑴在编制频数分布表时,关键是分组,即确定分几组,组距是多少?⑵一般地,数据越多,分的组数就越多,当数据在100个以内时,可分成5~12组,各组的组距可以相同,也可以彼此不同;⑶分组时,要注意使每个数据只落在一个组内.5.画频数直方图●画出相互垂直的两条直线,用横轴表示分组情况,纵轴表示频数,绘出相应的长方形条,就得到了频数直方图.40名学生平均每天锻炼时间频数分布直方图1.根据频数直方图,说说这40名学生平均每天参加课外锻炼的时间是如何分布的?2.如果该校八年级有500名学生,估计一下平均每天参加课外锻炼达30min以上的有多少人?解:1.有一半的学生的课外活动时间在38.5~46.5min之间,还有一部分学生课外活动时间在30.5~38.5min之间,很少一部分学生的课外活动时间在14.5~30.5min和46.5~62.5min之间.2.根据条形统计图可知锻炼时间达到30min以上的学生有35人,占总人数的87.5%,则估计八年级500名学生每天参加课外活动锻炼达30min以上的有500×87.5%≈438(人).例题讲解某校从七年级中任意抽取一个班,该班学生身高(单位:cm)的频数分布如表所示:分组136.5~141.5141.5~146.5146.5~151.5151.5~156.5156.5~161.5161.5~166.5166.5~171.5171.5~176.5合计频数141015982150根据所给表回答:⑴身高在161.5cm以上的学生有多少?占全班人数的百分之几?⑵估计该校七年级全体400名新生中,身高在161.5cm以上的约有多少人?解:⑴身高在161.5cm以上的学生有:8+2+1=11(人)占全班人数的22%.⑵全体七年级学生中,身高在161.5cm以上的人数约为:400×22%=88(人)随堂练习1.某校为了了解七年级350名学生的数学学习情况,从该年级任意抽取了50名学生进行测试,结果如下:(单位:分)93,92,75,77,72,73,84,67,95,84,86,71,96,84,85,89,92,74,73,83,40,68,81,98,94,89,92,99,70,82,72,93,68,85,86,75,83,78,92,60,89,52,96,83,92,86,67,77,57,77.(1)请你完成下面的频数分布表:分组频数统计频数39.5~49.549.5~59.559.5~69.569.5~79.579.5~89.589.5~99.5合计12513161350(2)画出频数直方图:频数分组0246810121416182039.549.559.569.579.589.599.5(3)试估计该校七年级有多少名学生数学成绩在80分(含80分)以上.经计算,这50名学生测试结果达到80分以上的占58%,用这50名学生测试达到80分以上的比率估计七年级350名学生成绩达到80以上的人数,即350×58%=203(人).小结1.数据分析的一般步骤:⑴计算极差(这批数据中最大数与最小数的差).⑵决定组距和组数.⑶决定分点.⑷列频数分布表.⑸画频数直方图.2.理解几个重要概念:⑴组距:每个小组的两个端点间的距离.最大数-最小数组数=组数⑵⑶频数:把一批数据中落在某个小组内数据的个数称为这个组的频数.⑷如果一批数据共有n个,而其中某一组数据是m个,那么就是该组数据在这批数据中出现的频率.mn3.注意几点:⑴在编制频数分布表时,要确定适当的组距,分好组数,统计频数时不要遗漏数据.⑵画频数直方图时,要注意横坐标是表示分组情况,纵坐标表示频数.