3.1回归分析的基本思想及其初步应用(第三课时残差分析)一、内容和内容解析本课时的主要内容是残差和残差分析。残差是观测值减去预测值的差,利用它来研究随机误差e;残差分析是回归诊断的一种方法,最简单的残差分析是通过观察残差图,以发现观测数据中可能出现的错误以及所选用的回归模型是否恰当。《3.1回归分析的基本思想及其初步应用》共安排4个课时,前两个课时主要讲最小二乘估计的推导和函数模型与回归模型的区别,理解回归模型中随机误差e产生的原因,本节课是第三课时,主要讲残差和残差分析,后一个课时讲R2和非线性相关问题(例2)。本课时的重点:如何利用残差图进行残差分析。二、教学目标分析1知识与技能a)了解残差的概念以及引入残差的必要性;会画残差图并进行残差分析。b)培养学生的阅读能力,探究能力,利用数学语言精确地表达自己观点的能力。2过程与方法立足教材,但不拘泥于教材,以破案话题作为新课切入点,调控学生的学习心理,使之更容易接受教师传授的知识和技能;巧妙设计四个探究性问题,为学生营造阅读自学,自主探究,合作交流的学习情境,体现教师“导”,学生“演”的教学原则。3情感、态度与价值观经历知识的形成过程,感受数学的人文价值,体会统计思想在解决实际问题中的作用。三.教学问题诊断分析本课时的教学难点:1残差概念的理解。形成原因有二:相关关系是一种非确定性关系,它不像函数关系具有确定性;第二,“估计”的思想方法是造成学生理解困难的另一个原因;突破方法:采用阅读教学法实现突破,也就是让学生通过阅读教材自己总结出残差的定义和计算方法,促使学生在自我感悟中于润物细无声处突破本堂课的教学难点。2残差点的分布规律性突破方法:利用必修3中探求回归直线的图例对学生点拨。四、教学支持条件分析教学方法:探究教学法,阅读教学法。学习方法:自主探究法。教学手段:多媒体辅助教学。教学基本流程:课题引入阶段(播放视频,激发学习激情,自我预报,引入课题)课堂探究阶段(问题引领,阅读教材,合作交流,自主探究,感悟知识历程)课堂小结,布置作业(归纳梳理、锻炼能力,课件展示,画龙点晴,作业设计,深化目标)五、教学过程(一)感悟故事、引入课题结合已学过的统计知识,你们认为这其中的道理是什么呢?人类的脚掌长度与身高之间存在着相关关系,对吗?课前咱们班的数学兴趣小组收集了咱们班部分同学的鞋码与身高的数据,并从中任意抽取了10位男同学的数据作为样本,利用Excel软件画出了以鞋码来预报男生身高的散点图以及回归直线方程,请看大屏幕。以男生鞋码预报身高16616817017217417617818018218418618839404142434445身高∕cm鞋码ˆ3.449730.757yx现在请同学们利用这条回归直线来预报一下自己的身高,看看你的预报值与实际身高有多大的偏差。【学生活动】:观看视频,计算数据,预报身高。设计意图:通过视频开始新课,以期改变学生对枯燥的数学知识的烦躁,激发学生探求新知识的欲望。展示以鞋码预报身高的散点图和回归方程,并通过学生自己预报自己身高的实践过程,现场作例,不但可以激发学生的学习兴趣,提高学生数学思维的参与度,调动学生的参与激情,在顺便帮助学生回顾已学过的知识的过程中,将学过的知识自然引入新情境,为新课的引入和展开做出了铺垫。【师生互动】:(提问两个同学)大家的预报结果是不是都有偏差啊?这里需要说明一点:由于回归方程一般只适用于所研究的样本总体,所以利用这条回归直线来预报女同学的身高,是不合适的。根据上节课的学习,我们知道,利用这个回归方程我们并不能精确得到自己的身高,会存在着随机误差,事实上,我们无法知道鞋码与身高之间的确切关系是什么,在这【真实故事】吉林省有一个非常普通的农村姑娘,叫董艳珍,18年来,她协助警方破获各类大小刑事案件一千余起,被誉为民间“女神探”。而她破案的绝招就是祖传的“足迹追踪学”,也就是通过犯罪嫌疑人留在现场的脚印,辨别出这个犯罪嫌疑人的身高、性别、年龄等有关特征,根据这些特征,警方就能够很快的确定犯罪嫌疑人的身份,为破案提供了有力的技术支持。(播放视频)里我们只能利用这个回归方程来近似这种关系,根据上一讲我们又知道,这种近似和数据统计中的人为错误等都是随机误差产生的原因,显然研究随机误差,找出数据统计中的人为错误,考察回归模型的拟合效果,对于依靠数据“说话的”统计学来说,显得非常重要。但我们又知道,随机误差是一个不可观测的量,也就是说在实际问题中,我们不可能寄希望于通过某种方法来获取随机误差的值解决问题,那么应该怎样研究随机误差呢?刚才同学们在利用这个回归方程预报自己的身高时,发现身高的实际值与预报值之间存在着偏差,这个差值可能是正值,也可能是负值,当然也可能是0,那么我们能否利用这个偏差来研究随机误差呢?这就是我们今天要讨论的话题(板书课题:§3.1)第三讲残差分析。设计理由与目的:利用回归方程预报身高存在随机误差,这仍是对上节课知识的回顾,但这里的回顾,起到了抛砖引玉,以旧引新,提出问题,自然引入新课的作用。(二)课堂探究阶段【学生阅读,师生互动】请同学们打开课本,翻到第84页,认真阅读课本的前半部分,总结出残差的定义及计算方法(探究一)。巡视学生研读情况,与个别同学交流研读情况。师生互动,得出残差的定义及相应于样本点iixy,的残差计算公式。(板书:残差=观测值-预报值,ˆˆˆˆiiiiieyyybxa)设计意图:阅读是人们学习知识的最重要的一种途径。通过指导学生研读教材,除了达到让学生体验知识(残差的定义和计算公式)的形成过程外,更重要的是,通过学生阅读,合作探究,让学生在润物细无声处突破了本节课的教学难点。【学生活动】利用公式计算10位同学的残差,引导学生完成表格的第三行和第四行。设计目的:让学生熟悉对应样本点残差的计算方法,进一步理解残差的概念。【诱思】我们为什么要研究随机误差呢?研究随机误差是为了准确把握数据,为了让数据更好的为科学决策“说话”。当然了,如果统计数据时有人为的错误,那么这种“说话”还会有分量吗?(学生集体回答:没有),对,这种说话的力度就会大大减弱,甚至会影响科学决策。现在请大家看看我们的这10组数据,有错误的吗?编号12345678910鞋码42404042444341434143身高/cm181168171172186180170176173176身高预报值175.644168.745168.745175.644182.544179.094172.195179.094172.195179.094残差5.356-0.7452.255-3.6443.4560.906-2.195-3.0940.805-3.094(稍停,让学生观察发言,由于数据较少,学生很快就会说出第一组数据可疑,此时及时引导)咱们这里的样本仅仅10个,如果样本数据成百上千,甚至上万,你又如何查找呢?探究二:根据已经计算出的残差,有什么办法既直观又快捷的帮助我们查找可疑数据呢?(已经预习的同学会回答:利用残差图。肯定学生的回答)你回答的很正确,看来课前你已经做了预习。对,我们可以借助图形来分析残差的特性,那么怎么作残差图呢?谁来说说?(根据回答情况作出评价和鼓励)设计理由与目的:部分学生自己通过预习已经知道,利用残差图来研究问题,让学生自己说出残差图的概念和做法,既是对学生预习习惯的鼓励,又是学生主动接受残差图的最好途径。【学生活动】根据学生的回答,明确残差图的作法后,让学生在坐标纸上作图。设计目的:让学生经历数据处理的过程。【师生互动】让学生观察残差图。从图中发现第一个点距离x轴较远,残差比较大,是可疑点,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,那么我们就应该予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要查找其他的原因。设计理由与目的:通过启发引导,让学生在自主探究中学会利用数形结合的思想方法解决问题。教师诱思,学生积极探究,残差图以及它的第一个作用——查找可疑点,也就水到渠成的出现了,这不是强加给学生的知识,问题的解决合情合理,使学生感到数学是自然的。这样本课时的第一个重点也就解决了。【探究三】:利用残差图,我们不但可以查找可疑数据,还可以衡量模型的拟合效果。请大家再来观察上面这个残差图,除了可以看到残差点的分布是离散的以外,还可以看到残差点的分布呈现出一种规律性,这种规律性对模型的评价极为有用,那这是什么规律呢?同学们可以相互讨论一下。(点拨:)注意,这种规律性是用来说明我们所选用的回归模型是否恰当的,所以,这种规律性首先应该是具有一般性,其次是能够用来衡量模型的拟合效果。同学们可以看看大屏幕上右侧的这幅图,它是必修3中我们用以寻找回归直线时所画的示意图。如果从整体上看,各点与拟合直线的距离最小,那么这条直线就是我们所要找的回归直线,所以在这里,我们能否说从整体上看,各点与拟合直线的距离越小,模型的拟合效果就越好呢?而这个距离当时是用偏差,也就是残差来刻画的,因此也就是说从整体上看,各点所对应的残差的绝对值越小越好。那么这种“从整体上看,各点所对应的残差的绝对值越小越好”反映到残差图上,又该如何刻画的呢?男生身高的残差图-5-4-3-2-10123456︱1︱2︱3︱4︱5︱6︱7︱8︱9︱10样本编号残差必修3图2.3-6(试着由学生回答,根据情况点拨:各残差点应偎依在x轴的附近)各残差点应偎依在x轴的附近,用数学语言怎样表达呢?“残差点比较均匀的落在以0为中心的水平带状区域中。”设计理由与目的:学生探究,教师的适当引导,可以让学生学会问题的分析方法。常见的残差图有四种,如下由此可见,若模型选择的正确,残差图中的点应该分布在以0为中心的水平带形区域上。设计理由与目的:教师的启发引导,是学生发现问题的垫脚石,在解决了残差图的第一个应用后,如何自然的引入下一个应用,需要对学生诱思,直接告诉学生利用残差图还可以衡量模型的拟合效果,然后让学生观察图像,探究出结论,这样做,能够突出重点,把主要精力放在关键问题的解决上。【观察探究】下面哪一幅图所表示的模型拟合效果好呢?.43210-1-2-3-401002003004005006007008009001000...................................................................................................................................................................................................................................................................................................................................................................200150100500-50-100-1500102030405060708090100......................................................................................25002000150010005000-500-10000102030405060708090100.................................................................................................................454035302520151050-50102030405060708090100...........................................................................