课前探究学习课堂讲练互动活页规范训练【课标要求】3.1回归分析的基本思想及其初步应用了解随机误差、残差、残差分析的概念;会用残差分析判断线性回归模型的拟合效果;掌握建立回归模型的步骤;通过对典型案例的探究,了解回归分析的基本思想方法和初步应用.1.2.3.4.课前探究学习课堂讲练互动活页规范训练利用散点图分析两个变量是否存在相关关系,求线性回归方程.(重点)回归模型的选择,特别是非线性回归模型.(难点、易错点)【核心扫描】1.2.课前探究学习课堂讲练互动活页规范训练回归分析回归分析是对具有_________的两个变量进行统计分析的一种常用方法.线性回归模型(1)由散点图易发现,样本点散布在某一条直线附近,而不是一条直线上,不能用一次函数y=bx+a描述它们之间的关系,因此用线性回归模型y=bx+a+e来表示,其中a、b为未知参数,e为_________.自学导引1.2.相关关系随机误差课前探究学习课堂讲练互动活页规范训练(2)对参数a和b的估计,由《数学必修3》可知:最小二乘法估计和就是未知参数a、b的最好估计,其计算公式为b^=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2,a^=y--b^x-,其中x-=_______,y-=_______,(x-,y-)称为样本点的中心.1ni=1nxi1ni=1nyia^b^课前探究学习课堂讲练互动活页规范训练(3)解释变量和预报变量线性回归模型与一次函数模型的不同之处是增加了随机误差项e,因变量y由_________和__________共同确定,即自变量x只解释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变量y称为预报变量.试一试:下表是x和y之间的一组数据,则y关于x的线性回归方程必过().自变量x随机误差ex1234y1357A.点(2,3)B.点(1.5,4)C.点(2.5,4)D.点(2.5,5)提示选C.线性回归方程必过样本点的中心(x-,y-),即(2.5,4).课前探究学习课堂讲练互动活页规范训练刻画回归效果的方式3.残差残差图利用图形来分析残差特性,作图时纵坐标为_____,横坐标可以选为_________,或_________,或___________等,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高数据点和它在回归直线上相应位置的差异(yi-y^i)是随机误差.称e^i=yi-y^i为残差,e^i称为相应于点(xi,yi)的残差.i=1n(yi-y^i)2称为残差平方和样本编号身高数据残差体重估计值课前探究学习课堂讲练互动活页规范训练残差平方和残差平方和为__________,残差平方和_____,模型拟合效果越好相关指数R2越小R2=1-i=1nyi-y^i2i=1nyi-y-2,R2表示_____变量对_____变量变化的贡献率,R2越接近于1,表示回归的效果越好解释预报i=1n(yi-y^)2课前探究学习课堂讲练互动活页规范训练想一想:回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.课前探究学习课堂讲练互动活页规范训练非线性回归分析(1)非线性相关关系:样本点分布在某一条曲线的周围,而不是一条直线附近.我们就称这两个变量之间不具有线性相关关系而是非线性相关关系.(2)非线性回归方程线性化①y=axn(其中a,x,y均为正值)(幂函数型函数)lgy=lga+nlgx,令u=lgy,v=lgx,b=lga,则u=nv+b,图象为一直线.②y=cax(a>0,c>0)(指数型函数)lgy=xlga+lgc,令u=lgy,b=lgc,d=lga,则u=dx+b,图象为一直线.4.课前探究学习课堂讲练互动活页规范训练线性回归方程(1)在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.名师点睛1.(2)求线性回归方程y^=b^x+a^的关键是求未知参数a^和b^,其中b^可借助于计算器求出,因为a^=y--b^x-,即y-=b^x-+a^,所以点(x-,y-)一定满足线性回归方程,即回归直线一定过点(x-,y-).课前探究学习课堂讲练互动活页规范训练线性回归分析(1)由线性回归方程给出的是一个预报值而非精确值.(2)随机误差的主要来源①线性回归模型与真实情况引起的误差;②省略了一些因素的影响产生的误差;③观测与计算产生的误差.(3)残差分析是回归分析的一种方法.(3)求线性回归方程的步骤:①先把数据制成表,从表中计算出x-,y-,x21+x22+…+x2n,x1y1+x2y2+…+xnyn的值;②计算未知参数a^,b^;③写出线性回归方程y^=b^x+a^.2.课前探究学习课堂讲练互动活页规范训练(4)用相关指数R2来刻画回归效果.R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).3.课前探究学习课堂讲练互动活页规范训练(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.课前探究学习课堂讲练互动活页规范训练题型一求线性回归方程某班5名学生的数学和物理成绩如下表:【例1】学生学科ABCDE数学成绩(x)8876736663物理成绩(y)7865716461(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.课前探究学习课堂讲练互动活页规范训练[思路探索]先利用散点图分析物理成绩与数学成绩是否线性相关,若相关再利用线性回归模型求解.解(1)散点图如图.(2)x-=15×(88+76+73+66+63)=73.2,y-=15×(78+65+71+64+61)=67.8.课前探究学习课堂讲练互动活页规范训练所以y对x的回归直线方程是=0.625x+22.05.(3)x=96,则=0.625×96+22.05≈82,即可以预测他的物理成绩是82.≈0.625.a^=y--b^x-≈67.8-0.625×73.2=22.05.y^y^课前探究学习课堂讲练互动活页规范训练规律方法(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.课前探究学习课堂讲练互动活页规范训练以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:【变式1】房屋面积/m211511080135105销售价格/万元24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格.课前探究学习课堂讲练互动活页规范训练解(1)数据对应的散点图如下图所示:课前探究学习课堂讲练互动活页规范训练故所求回归直线方程为=0.1962x+1.8142.回归直线如上图所示.(3)据(2),当x=150m2时,销售价格的估计值为=0.1962×150+1.8142=31.2442(万元).a-=y--b-x-=0.18142.y-y-课前探究学习课堂讲练互动活页规范训练为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:题型二线性回归分析【例2】x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析.[思路探索]作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄.课前探究学习课堂讲练互动活页规范训练[自主解答](1)散点图如图x-=16(5+10+15+20+25+30)=17.5,y-=16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,i=16x2i=2275,i=16xiyi=1076.2课前探究学习课堂讲练互动活页规范训练0.050.005-0.08-0.0450.040.025-2.24-1.37-0.540.411.412.31计算得,b^≈0.183,a^≈6.285,所求回归直线方程为y^=0.183x+6.285.(2)列表如下:yi-y^iyi-y-所以i=16(yi-y^i)2≈0.01318,i=16(yi-y-)2=14.6784.所以,R2=1-0.0131814.6784≈0.9991,回归模型的拟合效果较好.课前探究学习课堂讲练互动活页规范训练(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.规律方法当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面.课前探究学习课堂讲练互动活页规范训练已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:【变式2】x1416182022y1210753求y对x的回归直线方程,并说明回归模型拟合效果的好坏.解x-=15(14+16+18+20+22)=18,y-=15(12+10+7+5+3)=7.4,i=15x2i=142+162+182+202+222=1660,课前探究学习课堂讲练互动活页规范训练i=15xiyi=14×12+16×10+18×7+20×5+22×3=620,所以b^=i=15xiyi-5x-y-i=15x2i-5x-2=620-5×18×7.41660-5×182=-1.15.a^=7.4+1.15×18=28.1,所以所求回归直线方程是:y^=-1.15x+28.1.列出残差表:00.3-0.4-0.10.24.62.6-0.4-2.4-4.4yi-y^iyi-y-课前探究学习课堂讲练互动活页规范训练所以,i=15(yi-y^i)2=0.3,i=15(yi-y-)2=53.2,R2=1-i=15yi-y^i2i=15yi-y-2≈0.994,所以回归模型的拟合效果很好.课前探究学习课堂讲练互动活页规范训练下表为收集到的一组数据:题型三非线性回归分析【例3】x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.审题指导(1)画出散点图或进行相关性检验,确定两变量x、y是否线性相关.由散点图得x、y之间的回归模型.(2)进行拟合,预报回归模型,求回归方程.课前探究学习课堂讲练互动活页规范训练[规范解答](1)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x