12根据这些数据你能得出用水量其他信息吗?30.511.522.533.544.5频数(个)月平均用水量(t)2724211816139630画频数分布直方图分组频数累计(划记)频数[0,0.5)4[0.5,1)正8[1,1.5)正正正15[1.5,2)正正正正丅22[2,2.5)正正正正正25[2.5,3)正正14[3,3.5)正6[3.5,4)4[4,4.5]丅2合计1004分组频数累计(划记)频数[0,0.5)4[0.5,1)正8[1,1.5)正正正15[1.5,2)正正正正丅22[2,2.5)正正正正正25[2.5,3)正正14[3,3.5)正6[3.5,4)4[4,4.5]丅2合计100频率频率0.040.080.150.220.250.140.060.040.021频率月平均用水量/t0.500.400.300.200.1000.511.522.533.544.55分组频数累计(划记)频数[0,0.5)4[0.5,1)正8[1,1.5)正正正15[1.5,2)正正正正丅22[2,2.5)正正正正正25[2.5,3)正正14[3,3.5)正6[3.5,4)4[4,4.5]丅2合计100频率0.040.080.150.220.250.140.060.040.021频率/组距频率/组距0.080.160.30.440.50.280.120.080.044.列频率分布表6频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.55.画频率分布直方图思考:各小长方形的面积之和等于多少?分组频数累计(划记)频数[0,0.5)4[0.5,1)正8[1,1.5)正正正15[1.5,2)正正正正丅22[2,2.5)正正正正正25[2.5,3)正正14[3,3.5)正6[3.5,4)4[4,4.5]丅2合计100频率0.040.080.150.220.250.140.060.040.021频率/组距频率/组距0.080.160.30.440.500.280.120.080.047同样一组数据,如果组距不同,得到的图的形状也会不同。8问题7如果当地政府希望使80%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗?频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频率0.040.080.150.220.250.140.060.040.0219频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频率0.040.080.150.220.250.140.060.040.021问题9你认为3吨这个标准一定能够保证80%以上的居民用水不超标吗?如果不一定,那么哪些环节可能导致结论的差别?10频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5问题10你能从图中分析出样本的哪些信息?问题11你认为频率分布直方图的优缺点是什么?11频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5请大家阅读第68页,直方图有那些优点和缺点?12小结:频率分布直方图总体分布步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.估计131、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.(学生填写频率/组距一栏)5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。4.18.20.5极差组数=组距14练习1.有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?15解:组距为3分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027第几组频数(1)第几组频率样本容量(2)纵坐标为:频率组距注意:16频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.07017频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图18利用样本频分布对总体分布进行相应估计(3)当样本容量增大时,组数增加,组距减少,那么频率分布直方图就会变成怎么样的图形?(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?19——总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.接近于一条光滑曲线20用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线21注意:•1.不是任意总体都有密度曲线,当总体个数比较少或者数据的分布过于离散不连续时,总体密度曲线都是不存在的•2.总体密度曲线与总体分布相互唯一确定,如果总体分布已知,就可以得到密度曲线。•3.在总体情况未知的情况下,可通过样本频率折线近似估计得到密度曲线,样本容量越大,估计越精确。但是不能通过样本数据准确地画出总体密度曲线。22频率分布折线图的特点是什么?优点:能反映数据的变化趋势;缺点:不能体现数据的分布规律.23总体密度曲线的特点是什么?(,)ab,xaxb24(,)ab,xaxb(1)总体密度曲线精确的反映了一个总体在各个范围内取值的百分比,根据这条曲线,总体在内取值的百分比就是总体密度曲线与直线及x轴所围成的图形的面积.25(2)总体密度曲线呈中间高、两边低的“单峰”分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内.26总体密度曲线和频率分布折线图的关系是怎样的?实际上,尽管有些总体密度曲线是客观存在的,但是在实际使用过程中我们并不知道它的具体表达形式,需要用样本来估计.由于样本是随机的,不同的样本得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,因此不能简单的由样本的频率分布折线图得到准确的总体密度曲线.27练习O0.050.100.150.40123456数据某个容量为100的样本的频率分布直方图如右,则在区间[4,5)上的数据的频数为.28(广东卷11).为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[44,55),[55,65),[65,75),[75,85),[85,95)由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[55,75)的人数是1329用样本频率估计总体分布(第三课时)茎叶图30NBA某赛季甲、乙两名篮球运动员每场比赛的得分的原始纪录如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.问题一:请用适当的方法表示上述数据,并对两名运动员的得分能力进行比较.31频率分布表分组频数频率甲乙甲(11)乙(13)[0,10)100.090.00[10,20)320.270.15[20,30)320.270.15[30,40)360.270.46[40,50)020.000.15[50,60)110.090.083200.0050.010.0150.020.0250.03[0,10)[10,20)[20,30)[30,40)[40,50)[50,60)00.010.020.030.040.05[0,10)[10,20)[20,30)[30,40)[40,50)[50,60)33问题二:用上次课所学的制作样本的频率分布直方图来分析好吗?甲:13,51,23,8,26,38,16,33,14,28,39;乙:49,24,12,31,50,31,44,36,15,37,25,36,39.当数据比较少时,应用列分布直方图反而不方便34简化制图格式和步骤,得到新的统计制图方法:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.茎叶图35茎叶图:顾名思义,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.中间的数字表示得分的十位数,旁边的数字分别表示两个人得分的个位数.36问题三:和直方图比较,茎叶图有什么特点?茎叶图不仅能保留原始数据,而且能够展示数据的分布情况。37乙:得分基本上是对称的,叶的分布是“单峰”的,有10/13的叶是分布在茎2、3、4上,中位数是36.甲:得分除一个特殊得分(51分)外,也大致对称,分布也是“单峰”的,有9/11的叶主要集中在茎1、2、3上,中位数是26.38问题四:由上表,可以得出两名运动员的水平高低吗?从上述中位数的大小就可以看得出,乙运动员的成绩更好.另外,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.39问题五:下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况.40茎叶10781102223666778120012234466788130234可以看出30名工人的日加工零件个数稳定在120件左右.41茎叶图情境:某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39•问题:如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?42茎叶图甲乙01234525541616794908463368389143一般地:当数据是一位和两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。1.茎叶图的概念:442.茎叶图的特征:1)用茎叶图表示数据有