对一道线性回归分析试题的剖析──探讨2011年广东高考理科数学第13题广东省五华县水寨中学古小玲广东省五华县桥江中学张利平近几年高考的题目愈发突显出其应用性和问题设计的新颖和创造性,如火如荼的新课改时时刻刻在提醒我们“思路决定出路”。2011年普通高等学校招生全国统一考试(广东卷)数学(理科)中第13题是一道一元线性回归分析题型,这是一道问题设计的新颖旧题,但从学生访谈来看,我觉得这道题难倒了不少学生,下面我就这一题进行分析和研究。一、问题诊断分析:1.学生觉得公式复杂,计算繁琐,未做先怕2.学生对线性回归方程的概念理解不够透彻,主要是不确定哪两个变量具有相关关系。二、问题的反思:1.学生对这一题型训练比较少以前复习时对回归直线方程只要求会运用公式进行具体计算a、b,求出回归直线方程即可.不要求掌握回归直线方程的推导过程。所做的题大都已经告诉学生问题具有相关关系的两个变量,要学生依葫芦画瓢的按公式去算线性回归方程和相关问题。2.学生对线性回归分析含义理解不透彻所谓回归分析是指在相关分析的基础上,把变量之间的具体变动关系模型化,求出关系方程式,并据此进行估计和推算,是研究变量间相关关系的一种有力的数学工具。线性回归分析的一般步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画散点图,观察它们之间的关系(如是否存在线性关系等)(3)由经验确定回归方程的类型(如观察到的数据呈线性关系,在选用线性回归方程)(4)按一定规则估计回归方程中的参数(如最小二乘法)(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等)3.我们先看一个例子。例题:从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号12345678身165165157170175165155170高体重4857505464614358求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量.1).画散点图:2).回归方程3).线性相关指数,表明“女大学生的身高解释了的体重变化”三、对问题的探讨200906022011广东高考数学理科第13题题目:某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm。因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_____cm.分析:本题主要考查线性回归分析的知识,考查运用线性回归方程解决实际问题的能力.1.经典的错误做法为:第一组数据为1,2,3,4,第二组数据为173,170,176,182,列表为:x1234y173170176182此时拟合的线性回归的线性相关指数很大,模型的拟合效果很好,但不合题意。因为具有相关关系的是父亲的身高和儿子的身高。2.正确的做法为:第一组数据(父亲的身高),173,170,176,第二组数据为(儿子的身高)170,176,182,列表为:x173170176y170176182这样的拟合的回归方程为y=x+3,当这个数学老师儿子的身高x=182cm时,他孙子的身高y=185cm。3.进一步探讨:回归分析,我们要注意的方面中有一点是:求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。而这道高考题中的线性相关指数,模型的拟合效果很差,偏离直线很大,也就是说,两者的相关关系很弱,此线性回归根本没有实际意义。我们可以用相关指数来刻画回归分析的效果,但有时散点图中的各点并不集中在一条直线的附近,仍可以按照求回归直线方程的步骤求得回归直线方程,显然这种情形下求得的回归直线方程没有实际意义,但我们不能期望回归方程得到的预报值就是预报变量的精确值,事实上,它是预报变量的可能取值的平均值。我想,出题者的意图只在于根据数据找出关系求出回归方程来得出这个数学老师孙子的身高,不强调有没有实际意义吧。经过这一发现的问题,我觉得这以后讲解这一题型时应强调确定哪两个变量具有相关关系、相关关系的特点和判断。找出一些的题目来加强学生对线性回归分析的定义和公式的理解和掌握。例如在2011年广东高考数学文科卷第13题:为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:x12345y0.40.50.60.60.4小李这5天的平均投篮命中率为_________;用线性区分分析的方法,预测小李每月6号打篮球6小时的投篮命中率为________.在讲解时可以拿这道题与理科第13题让学生进行比较、讨论、发现然后区分这两道题的特点进行解答。