高中数学“统计”教学研究一、整体把握“统计”教学内容(一)统计的起源统计学的英文词statistics源于拉丁文,是由status(状态、国家)和statista(政治家)衍化而来的,可见统计与国家事务的管理需求有关.的确,统计起源于古代政府管理,例如统计人口、寿命等一些数字,但最重要的、超出描述性统计范围的成就是高斯和勒让德关于最小二乘法的工作,二人均独立地发现了最小二乘法,并应用于观测数据的误差分析,导致统计思想上的重大进展:数据是来自服从一定概率分布的总体,而统计学就是用这些可观察到的数据去推断这个分布的未知属性.这个观点强调了推断的地位,使统计学摆脱了单纯描述的性质,是统计的基本的思想.20世纪由于概率论的建立,数理统计才逐步形成一门应用数学学科.(二)知识结构图义务教育阶段,学生已经学习了一些简单的统计知识,了解简单的收集、整理、描述和分析数据的方法,已经会用平均数、中位数、众数等样本数据特征和简单的统计图表(如扇形图等)描述数据,高中阶段,将在此基础上进一步学习统计,不仅学习更多的统计知识和方法,更注重体会用样本估计总体及其特征的统计思想,体会统计思维与确定性思维的差异.顺着这条线索,我们可以整理出高中阶段统计学习的知识结构图。(三)重点、难点分析统计所涉及的知识位于必修三和选修2-3的相关章节.(对于文科来说,是必修三和选修1-2).文理对于统计部分的要求相同.统计在教学内容中占有相当大的比重,课程标准中指出:统计,已成为高中数学的基础知识之一.而在新的高考考试大纲中也明确指出,高考考查的能力要求包括:“空间想象能力、抽象概括能力、推理论证能力、运算求解能力、数据处理能力”以及应用意识和创新意识.其中,“数据处理能力”是考纲中新增加的内容,怎么考查?考纲中也明确指出:主要依据统计或统计案例中的方法对数据进行整理、分析,并解决给定的实际问题.因此,在高中阶段,我们应通过对统计知识的学习,不仅学会收集、整理、分析数据的方法,学会从大量数据中抽取对研究问题有用的信息,并作出准确的判断;同时也要逐步培养数据意识,学会用数据说话,将统计知识主动运用于实践.这就是统计教学的重点.而统计不同于一般的数学内容,统计思维不同于确定性思维,统计推断有可能犯错,教学中如何把握统计思想,而不是把统计教成画图表、或按照公式计算,则是统计教学的难点.突破难点,把握重点的关键在于统计教学,应采用案例教学的方式.二、高中“统计”教与学的策略(一)从实例出发,帮助学生理解抽样的重要性,掌握三种抽样方法统计的特征之一是通过部分的数据来推测全体数据的性质,因此,样本的选取就非常重要,如果样本不具有代表性,统计推断就必然要犯错误.下面的例子容易说明抽样的重要性.1948年:杜鲁门VS杜威——民意调查落笑柄1948年的美国总统大选堪称最出人意料的一次,舆论界一致认为必败的杜鲁门,竟以100多张选举人票的优势击败了共和党人托马斯·杜威,蝉联第二任,令许多人大跌眼镜,也令许多美国媒体颜面扫地.就大选前的形势看,美国历史上恐怕没有哪位在职总统比杜鲁门更不占优势了.作为富兰克林罗斯福的继承者,杜鲁门注定了要生活在伟人的阴影下,加上民主党已连续执政15年,积累了无数社会矛盾,人们对政府怨声载道,舆论认为杜鲁门必定下台.粗略统计,当时预言杜鲁门失败的就有《纽约时报》、《纽约每日镜报》、《芝加哥论坛报》、《生活》周刊、《读者文摘》等多家极富影响力的媒体,以及著名的盖洛普民意测验创始人乔治·盖洛普,《生活》周刊干脆登出杜威的大幅照片,下面标注是“下届美国总统”!他们为什么这么肯定呢?也不完全是主观臆断,主要原因是他们从事的民意调查无一例外地倒向了杜威.根据民意测验的结果,盖洛普最后一次的预测是,杜威将赢得49%的普选票,杜鲁门只能赢得44%.而事实上,1948年大选的最后统计结果是:民主党候选人杜鲁门获得49.5%的普选票,305张选举人票;共和党候选人、纽约州州长杜威获得45.1%的普选票,187张选举人票;这个结果与盖洛普民意测验的结果正好相反,这也是历次盖洛普民意测验的最大误差——几乎整整5个百分点.当杜鲁门赢得这次选举,手持印有“杜威战胜杜鲁门”大幅标题的《芝加哥论坛报》回到华盛顿时,受到75万人的热烈欢迎,而新闻界则沦为全国的笑柄.美国媒体在事后总结教训时认为,民意测验的失误主要是忽略了普通民众的看法.这些调查大都采用电话问询的方式进行,在1948年的美国,电话还是个新鲜玩艺儿,远没有在消费者中得到普及,装有电话的大都是富裕的上流人士.这些人并不能代表美国广大的普通民众.也就是说:样本不具有代表性.那么样本应该如何选取呢?这样的例子容易引发同学的兴趣,就此引入抽样方法.在中学阶段,我们主要学习三种抽样方法:1.简单随机抽样(抽签法、随机数表法)2.系统抽样3.分层抽样可以通过一些例子,说明三种抽样方法的特点及适用范围,并通过比较,分析三种抽样方法的异同.类别共同点各自特点联系适用范围简单随机抽样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取总体个数较少系统抽样将总体均分成几部分,按预先制定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成在学习三种抽样方法之后,再通过一些简单的实例让同学去判断和选择方法.简单的实例如下:例1要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行试验随机数表法例2某校高中三年级的2950名学生已经编号为1,2,……,2950,为了了解学生的学习情况,要按1:5的比例抽取一个样本.系统抽样例3一个城市有210家百货商店,其中大型商店有20家,中型商店有40家,小型商店有150家,为掌握各商店的营业情况,要从中抽取一个容量为21的样本.前两个例子中,总体没有呈现明显的差异,用简单随机抽样(随机数表法)或系统抽样均可.而第三个例子,必须用分层抽样.分层抽样抽样完成之后,则应该是整理数据,用样本估计总体.(二)教学要从具体问题入手,使学生经历数据处理的过程要使学生接受统计基本思想,最有效的方法是让他们真正投入到统计的全过程中去:提出问题,收集、整理数据,分析数据,作出决策,进行交流、评价与改进等.例4中国香港风帆选手李丽珊,以惊人的耐力和斗志,勇夺奥运金牌,为香港体育史揭开了“突破零”的新页.在风帆比赛中,成绩以低分为优胜.比赛共11场,并以最佳的9场成绩计算最终的名次.前7场比赛结束后,排名前5位的选手积分如下表所示:根据比赛结果,我们如何比较各选手之间的成绩及稳定情况呢?如果此时让你预测谁将获得最后的胜利,你会怎么看?解:由上表,我们可以分别计算5位选手前7场比赛积分的平均数和标准差,分别量度各选手比赛的成绩及稳定情况.(结果如下表所示)培养学生的数据意识,让学生学会用数据说话,不能从死记硬背入手,而应该从原始的数据出发,给学生较少的限制,使学生经历较为系统的数据处理全过程,并在此过程中学习一些数据处理的方法.下面的问题是较好的问题:例5:为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下(单位:kg)56.769.36561.564.566.56464.57658.57273.656677057.265.56871756268.862.66659.363.364.567.57368557266.974636055.77064.5586470.85762.5656971.473625876716663.25659.463.5657074.868.66455.572.566.6687657.56071.25769.57464.65961.5676863.8585965.562.569.27264.575.568.5646265.458.667.170.5656666.5706359.5试根据上述数据对相应的这个年龄段男生的体重情况作出估计.选题目的:学会画频率分布直方图,利用频率分布直方图对总体分布作出估计,并为随机变量的密度函数做准备.各类统计图表的特点1.频率分布表:反映总体频率分布的表格.编制频率分布表的步骤如下:(1)计算极差(全距),(2)决定组数和组距,;(3)决定分点,分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(4)登记频数,计算频率,列出频率分布表.2.频率分布直方图:反映样本的频率分布规律.作频率分布直方图的步骤如下:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的(频率密度),这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.3.频率分布折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.4.总体密度曲线:如果样本容量越大,所分组数越多,上述图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小.设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.落在(a,b)内的百分率就是图中带斜线部分的面积.几点说明:1.在编制频率分布表时,要选择适当的组距和起始点才可以使频率分布表更好地反映数据的分布情况.2.在编制频率分布表时,如果取全距时不利于分组(如不能被组数整除),可适当增大全距,如在左右两端各增加适当范围(尽量使两端增加的量相同).选取决定分点一般比原始数据多一位小数,确保每个原始数据都落在某组内部,而不是边界上.3.频率折线图的优点是它反映了数据的变化趋势,如果将样本容量取得足够大,分组的组距取得足够小,则这条折线将趋于一条曲线,我们称这一曲线为总体分布的密度曲线.例6.从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),根据所得数据设计了如下茎叶图:请根据茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①__________________________;②__________________________.了解茎叶图的特点(课标例题).作茎叶图:将所有三位数的百位、十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般由内到外按从小到大的顺序同行列出.茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到,从统计图上没有信息的损失;二是茎叶图便于记录和表示,但数据位数较多时不够方便.统计结论:(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度).(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大).(3)甲品种棉花的纤维长度的中位数为307mm,乙品种棉花的纤维长度的中位数为318mm.(4)乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.(三)线性回归方程和统计案例的教学中,适度说理,注重展现知识形成过程1.关于变量的相关性,课标要求①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.②经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.通过前面的介绍我们已经知道:高斯和勒让德发现了最小二乘法,并应用于观测数据的误差分析,导致了统计思想上的重大进展,使统计学摆脱了单纯描述的性质,强调了推断的地位,是我们现在强调的统计的基本思想.因此,这一部分的教学,一定要注意的是:不要把