3/2/20202.2.1用样本的频率分布估计总体分布一、导学提示,自主学习二、新课引入,任务驱动三、新知建构,典例分析四、当堂训练,针对点评五、课堂总结,布置作业3/2/2020一、导学提示,自主学习1.本节学习目标(1)了解分析数据的方法,知道估计总体频率分布的方法;(2)了解频率分布折线图和总体密度曲线,会画频率分布直方图和茎叶图;(3)理解频率分布直方图和茎叶图及其应用学习重点:频率分布直方图和茎叶图学习难点:频率分布直方图和茎叶图及其应用3/2/2020一、导学提示,自主学习2.本节主要题型题型一画频率分布直方图题型二画茎叶图题型三理解频率分布直方图题型四理解茎叶图3.自主学习教材P65-P712.2.1用样本的频率分布估计总体分布3/2/2020统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.这里就有过程:一:是如何从总体中科学的抽取样本。二:是如何根据对样本的整理、计算、分析,对总体的情况作出推断。二、新课引入,任务驱动3/2/2020用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。二、新课引入,任务驱动3/2/20201.通过本节的学习你能归纳出频率分布直方图和茎叶图的特点和应用步骤吗?二、新课引入,任务驱动3/2/2020三、新知建构,典例分析1.新知建构一.频率分布直方图二.频率分布折线图三.总体密度曲线四.茎叶图3/2/2020如何用样本的频率分布估计总体分布?三、新知建构,典例分析3/2/2020我国是世界上严重缺水的国家之一,城市缺水问题较为突出。2000年全国主要城市中缺水情况排在前10位的城市三、新知建构,典例分析3/2/2020探究:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?三、新知建构,典例分析3/2/2020我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?探究:①采用抽样调查的方式获得样本数据②分析样本数据来估计全市居民用水量的分布情况3/2/2020下表给出100位居民的月均用水量表讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗?为此我们要对这些数据进行整理与分析3/2/2020思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:3/2/2020我们很难从随意记录的数据中直接看出规律,为此,我们要对数据进行整理与分析.分析数据的方法:1、用图将它们画出来,2、用紧凑的表格改变数据的排列方式.目的:一是从数据中提取信息,二是利用图形传递信息.目的:通过改变数据的构成形式,为我们提供解释数据的新方式.三、新知建构,典例分析3/2/20201.画频率分布直方图其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图分析数据的具体做法:三、新知建构,典例分析3/2/2020•频数:在总体(或样本)中,某个个体出现的次数叫做这个个体的频数。•频率:某个个体的频数与总体(或样本)中所含个体的数量的比叫做这个个体的频率。•性质:在总体(或样本)中,各个个体的频率之和等于1。三、新知建构,典例分析3/2/2020第一步:求极差:(数据组中最大值与最小值的差距)最大值=4.3最小值=0.2所以极差=4.3-0.2=4.1第二步:决定组距与组数:(强调取整)当样本容量不超过100时,按照数据的多少,常分成5~12组.为方便组距的选择应力求“取整”.本题如果组距为0.5(t).则4.18.20.5极差组数=组距第三步:将数据分组:(给出组的界限)所以将数据分成9组较合适.[0,0.5),[0.5,1),[1,1.5),……[4,4.5]共9组.三、新知建构,典例分析3/2/2020第四步:列频率分布表.分组频数频率频率/组距[0,0.5)4[0.5,1)8[1,1.5)15[1.5,2)22[2,2.5)25[2.5,3)15[3,3.5)5[3.5,4)4[4,4.5]2合计100组距=0.50.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.053/2/2020为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t0.511.522.533.544.5频率组距0.500.400.300.200.10O5、画频率分布直方图小长方形的面积总和=?月均用水量最多的在哪个区间?三、新知建构,典例分析3/2/2020一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组数=极差/组距三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)三、新知建构,典例分析3/2/2020月均用水量/t0.511.522.533.544.5频率组距0.50.40.30.20.1O你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?三、新知建构,典例分析3/2/2020(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.月均用水量/t0.511.522.533.544.5频率组距0.50.40.30.20.1O3/2/2020频率/组距0.080.160.300.440.500.280.120.080.04显示了样本数据落在各个小组的比例大小!频率分布表[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计4815222514642100频数分组频率0.040.080.150.220.250.140.060.040.021.003/2/2020[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计4815222514642100频数分组频率0.040.080.150.220.250.140.060.040.021.00直方图(0.5组距)00.10.20.30.40.50.60.511.522.533.544.5频率/组距频率分布直方图1、显示了样本数据落在各个小组的比例大小。2、居民用水量的分布呈两边低,中间高的“山峰状”,而且是“单峰”的。且有一定的对称性。3/2/2020•1、每一区间上面矩形的面积等于该组数据的频率。•2、各个矩形的总面积和为1,这与频率之和为1•一致。•3、易于估计任意区间的频率分布。直方图(0.5组距)00.10.20.30.40.50.60.511.522.533.544.5频率/组距3/2/2020•频率分布表和频率分布直方图在带给我们许多新的信息的同时,也丢失了一些信息,如原始数据不能在分布表和直方图中很好地体现出来。三、新知建构,典例分析3/2/2020思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗?频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频率0.040.080.150.220.250.140.060.040.0213/2/2020频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频率0.040.080.150.220.250.140.060.040.021想一想:你认为3吨这个标准一定能够保证85%以上的居民用水不超标吗?如果不一定,那么哪些环节可能导致结论的差别?3/2/2020所得到的结论的统计意义•3t这个标准一定能保证85%以上的居民用水不超标吗?•不一定!•原因1、样本只是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。•原因2、明年的用水情况与今年不可能完全一样,但应该大致一样。三、新知建构,典例分析3/2/2020所得到的结论的统计意义•一般的,统计得到的结果,是对于总体较为合理的估计或预测,但其误差应该控制在合理的范围之内。•也正因为这样,统计结果的好坏,往往需要进一步的评价,或通过理论方法的检验,或通过实际应用的检验。思考:有其他a值的确定方法吗?•应用统计解决问题的方法不唯一!三、新知建构,典例分析3/2/2020频率分布直方图作法的讨论•为了更加细致地分析样本的频率分布以估计总体的分布,组数是不是越多越好?三、新知建构,典例分析3/2/2020问题:将组距确定为1,作出教材P66页居民月均用水量的频率分布直方图问题:谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?三、新知建构,典例分析3/2/2020同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断3/2/2020频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5问题你认为频率分布直方图的优缺点是什么?3/2/2020频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势。从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。三、新知建构,典例分析3/2/2020•连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。直方图(0.5组距)00.10.20.30.40.50.6频率/组距3/2/2020利用样本频分布对总体分布进行相应估计(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?3/2/2020频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线——总体密度曲线.总体密度曲线3/2/2020用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.三、新知建构,典例分析3/2/20201.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?思考1.①不是任意总体都有密度曲线,当总体个数比较少或者数据的分布过于离散不连续时,总体密度曲线都是不存在的②实际上,尽管有些总体密度