12.2.1《用样本的频率分布估计总体分布》【学习目标】1.通过实例体会分布的意义和作用;2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。【重点难点】教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图教学难点:能通过样本的频率分布估计总体的分布【知识链接】说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。类别共同点各自特点联系适用范围简单随机抽样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取总体个数较少系统抽样将总体均分成几部分,按预先制定的规则在各部分抽取在起始部分样时采用简随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成【引入】在统计中,为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况。这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。下面我们先通过案例来介绍总体分布的估计。【学习过程】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。(见课本66P表2-1)分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。一、频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差2(2)决定组距与组数,组距极差组数=(3)将数据分组(4)列频率分布表(5)画频率分布直方图以课本66P制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。思考探究:(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(3)如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-1和频率分布直方图2.2-1,(见课本67P)你能对制定月用水量标准提出建议吗?二、频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。2.总体密度曲线的定义:在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本69P)思考探究:(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?(2)对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?答:实际上,尽管有些总体密度曲线是客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。三.茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本70P例子)2.茎叶图的特征:(1)用茎叶图表示数据的优点:一是既可以看出样本的分布情况又能看到原始数据;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。【例题精析】例1、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)3区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数1165(1)列出样本频率分布表;(2)画出频率分布直方图;(3)画出频率分布折线图;(4)估计身高小于134cm的人数占总人数的百分比.。分析:根据样本频率分布表、频率分布直方图的一般步骤解题。解:(1)样本频率分布表如下:(2、3)其频率分布直方图如下:(4)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.变式训练:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计12014各组频数之和等于样本容量,频率之和等于1。解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.0824171593由频率=第二小组频数样本容量,得121500.08第二小组频数样本容量第二小组频率(2)由图可估计该学校高一学生的达标率约为171593100%88%24171593(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。例2、从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班:76,74,82,96,66,76,78,72,52,68乙班:86,84,62,76,78,92,82,74,88,85画出茎叶图并分析两个班学生的数学学习情况。解析:2642854682622466868256789乙甲由茎叶图可知,乙班的成绩较好,而且较稳定。【学习反思】1、制作频率分布直方图分几个步骤?各步骤需要注意哪些问题?2、频率分布直方图和茎叶图相比有什么特点?答:1、步骤:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数,组距极差组数=(组距是人为决定的)(3)将数据分组(4)列频率分布表(必须包括分组、频数、频率三部分)(5)画频率分布直方图(注意纵坐标表示什么,各小长方形是连在一起的)3、频率分布直方图无法看到原始数据,而茎叶图能看出原始数据;但频率分布直方图所体现的内容90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.0365比茎叶图多。【书面作业】导学案【拓展提升】62.2.1《用样本的频率分布估计总体分布》导学案【学习目标】1.通过实例体会分布的意义和作用;2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。【重点难点】重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图难点:能通过样本的频率分布估计总体的分布【学法指导】一、预习目标:在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;二、预习内容:阅读课本56P~70P三.完成下列问题:1.一般用频率分布直方图反映样本的频率分布。其一般步骤有哪些?频率分布直方图的特征是什么?2.茎叶图的特征是什么?【知识链接】说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。类别共同点各自特点联系适用范围简单随机抽样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取总体个数较少系统抽样将总体均分成几部分,按预先制定的规则在各部分抽取在起始部分样时采用简随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成【新知探究】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?【学习过程】一、频率分布直方图1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:72.以课本66P制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。3.频率分布直方图的特征:思考探究:(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(3)如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-1和频率分布直方图2.2-1,(见课本67P)你能对制定月用水量标准提出建议吗?二、频率分布折线图、总体密度曲线1.频率分布折线图的定义:2.总体密度曲线的定义:在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本69P)思考探究:(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?(2)对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?三.茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植