-1-用样本的数字特征估计总体的数字特征一.教学任务分析(1)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征,并做出合理的解释.(2)会用样本的基本数字特征估计总体的基本数字特征.形成对数据处理过程进行初步评价的意识.(3)在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解统计的作用二.教学目标:(1)知识与技能:(1)能利用频率颁布直方图估计总体的众数,中位数,平均数.(2)能用样本的众数,中位数,平均数估计总体的众数,中位数,平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法.(3)初步体会、领悟“用数据说话”的统计思想方法.(2)过程与方法:在有关数据的搜集、整理、分析的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。(3)情感态度与价值观:培养学生勇于探索和创新的精神以及优化他们的个性品质;构造和谐的教学氛围,增加互动,促进师生情感交流.[重点]根据实际问题对样本数据中提取基本的数据特征并作出合理解释估计总体的基本数字特征.[难点]用样本的数字特征估计总体的数字特征,统计思维的建立三.教学流程:通过具体实例理解众数,中位数,平均数↓从频率分布直方图估计众数↓从频率分布直方图估计中位数↓从频率分布直方图估计平均数↓问题探究↓小结、作业四.教学情境设计:1.创设情景,揭示课题上一节我们学习了用图、表组织样本数据,并且学习了如何通过图、表提供的信息,用样本的频率分布估计总体的分布.在日常生活中,我们往往并不需要了解总体的分布形态,而是关心总体的某一数字特征,例如:居民月均用水量问题,我们关心的是数字,而不是总体的分布形态.因此我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征(板出课题).2.探究:(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?-2-我们初中时学习众数、中位数、平均数等数字特征.我们共同回忆一下?什么是众数、中位数、平均数?众数—一一组数中出现次数最多的数.中位数——将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数——将所有数相加再除以这组数的个数,所得到得数.热身训练:求下列各组数据的众数、中位数、平均数(1)1,2,3,3,3,4,6,7,7,8,8,8(2)1,2,3,3,3,4,6,7,8,9,9答案:(1)众数是:3和8中位数是:5平均数是:5(2)众数是:3中位数是:4平均数是:5例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和平均数?众数=2.3(t)、中位数=2.0(t)、平均数=1.973(t)那么从频率分布直方图你能得到这些数据的众数,中位数,平均数吗?3.如何在频率直方图中估计众数、中位数、平均数呢?1)如何从频率分布直方图中估计众数?学生交流讨论,回答从频率分布直方图可以看出:月均用水量的众数是2.25t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.思考1:请大家看看原来抽样的数据,有没有2.25这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?4.50.52.521.5143.5300.10.20.30.40.6组距频率月均用水量/t0.5-3-请学生思考交流,回答这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.显然通过频率分布直方图的估计精度较低,其估计结果与数据分组有关,在不能得到样本数据,只能得到频率分布直方图的情况下,也可以估计总体的特征.归纳总结:因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内.众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.2)如何从频率分布直方图估计中位数?学生交流讨论,回答分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计中位数的值.2.20.61.81.21.01.52.02.22.52.82.40.81.71.01.01.62.12.32.62.52.40.51.51.21.41.72.12.42.72.62.30.91.61.31.31.82.32.32.82.52.00.71.81.41.31.92.42.42.93.04.30.81.93.51.41.82.32.42.93.24.10.61.73.61.31.72.22.32.83.33.80.51.53.71.21.62.12.32.73.20.40.30.40.21.21.52.22.22.63.41.61.91.81.61.01.52.02.02.53.1表2-1100为居民的月均用水量(单位:t)观察频率分布直方图估计中位数4.50.521.5143.53频率组距00.10.20.30.40.50.60.080.150.220.250.140.060.040.020.042.5月均用水量/t-4-设中位数为x,则5.05.0)2(22.015.008.004.0x求出02.2x在上图中,红色虚线代表居民月平均用水量的中位数的估计值.其左边的直方图的面积是50个单位.右边的直方图的面积也是50个单位.由此可以估计出中位数的值为2.02.思考2:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(样本数据的频率分布直方图把原始的一些数据给遗失了)3)如何从频率分布直方图中估计平均数?学生交流讨论,回答平均数等于是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.以上图为例来讲解求解过程;02.202.025.404.075.306.025.314.075.225.025.222.075.115.025.108.075.004.025.0平均数为2.02由此居民的月用水量的平均数是2.02t.大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考3:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?让学生讨论,并举例优点:对极端数据不敏感的方法能够有效地预防错误数据的影响.对极端值不敏感有利的例子:如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,如:考察表中2-1中的数据如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能过有效地预防错误数据的影响.用抗极端数据强的中位数表示数据的中心值更准确.缺点:(1)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作.这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.4)对众数,中位数,平均数估计总体数字特征的认识(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.(2)中位数不受少数几个极端值的影响,容易计算,它仅利用了数据排在中间的数据的信息.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.-5-探究:“用数据说话”这是我们经常可以听到的一句话.但是数据有时也会被利用,从而产生误导.例如一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多,尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?以员工平均工资收入水平去描述他们单位的收入情况.这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,平均数受数据中的极端值的影响大,所以平均数不能反映该单位员工的收入水平.这个老板的话有误导与蒙骗行五、例题例:某公司的33名职工的月工资(单位:元)如下表:职务董事长副董事长董事总经理经理管理员职员人数11215320工资5500500035003000250020001500(1)求该公司职工月工资的平均数、中位数、众数.(2)若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么?(3)你认为哪个统计量更能反映这个公司员工的工资水平?解析:(1)公司职工月工资的平均数为:2091336900033201500320005250030002350050005500x(元)若把所有数据从大到小排序,则得到:中位数是1500元,众数是1500元.(2)若董事长、副董事长的工资提升后,职工月工资的平均数为:3288331085003320150032000525003000235002000030000x(元)中位数是1500元,众位是1500元.(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.六、巩固练习假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。中位数是25万元,平均数是100万元,众数是20万元。你会选择哪一种数据特征来表示国家对每一个项目投资的平均金额?你选择这种数字特征的缺点是什么?答:应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息.但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大.七、小结:1.学习利用频率直方图估计总体的众数、中位数和平均数的方法。2.介绍众数、中位数和平均数这三个特征数的优点和缺点。3.学习如何利用众数、中位数和平均数的特征去分析解决实际问题。-6-八、作业:习题2.2第5题