课前预习课堂互动课堂反馈§8最小二乘估课前预习课堂互动课堂反馈学习目标1.了解最小二乘法.2.理解线性回归方程的求法(重点).3.掌握线性回归方程的意义(重点、难点).课前预习课堂互动课堂反馈预习教材P54-60完成下列问题:知识点1最小二乘法1.定义:如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:.使得上式达到的直线y=a+bx就是我们所要求的直线,这种方法称为.[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.最小值最小二乘法课前预习课堂互动课堂反馈2.应用:利用最小二乘法估计时,要先作出数据的图.如果呈现出线性关系,可以用最小二乘法估计出线性回归方程;如果呈现出其他的曲线关系,我们就要利用其他的工具进行拟合.知识点2回归直线的求法1.回归直线如果散点图中点的分布从整体上看大致在附近,就称这两个变量之间具有关系,这条直线叫做回归直线.散点图散点图散点一条直线线性相关课前预习课堂互动课堂反馈2.回归方程与最小二乘法我们用yi-y^i来刻画实际观察值yi(i=1,2,…,n)与y^i的偏离程度,yi-y^i越小,偏离越小,直线就越贴近已知点.我们希望yi-y^i的n个差构成的总的差量越小越好,这才说明所找的直线是最贴近已知点的.由于把yi-y^i这个差量作和会使差量中的正负值相互抵消,因此我们用这些差量的平方和即Q=i=1n(yi-a-bxi)2作为总差量,回归直线就是所有直线中Q取最小值的那一条.因为平方又叫二乘方,所以这种使“差量平方和最小”的方法叫做最小二乘法.课前预习课堂互动课堂反馈用最小二乘法求回归方程中的a,b有下面的公式:b=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2,a=y--bx-,其中x-=1ni=1nxi,y-=1ni=1nyi.这样,回归方程的斜率为b,截距为a,即回归方程为y=bx+a.课前预习课堂互动课堂反馈【预习评价】下列有关线性回归的说法(正确的打√,错误的打×)(1)变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系()(2)在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图()(3)回归方程最能代表观测值x、y之间的线性关系()(4)任何一组观测值都能得到具有代表意义的回归直线()提示只有数据点整体上分布在一条直线附近时,才能得到具有代表意义的回归直线.答案(1)√(2)√(3)√(4)×课前预习课堂互动课堂反馈题型一变量间相关关系的判断【例1】某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求回归方程.课前预习课堂互动课堂反馈解(1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.课前预习课堂互动课堂反馈于是可得,b=i=15xiyi-5x-y-i=15x2i-5x-2=1380-5×5×50145-5×52=6.5,a=y--bx-=50-6.5×5=17.5.于是所求的回归方程是y=6.5x+17.5.课前预习课堂互动课堂反馈规律方法1.求回归方程的步骤(1)列表xi,yi,xiyi.(2)计算x-,y-,i=1nx2i,i=1ny2i,i=1nxiyi.(3)代入公式计算b,a的值.(4)写出回归方程y=a+bx.2.求回归方程的适用条件两个变量具有线性相关性,若题目没有说明相关性,则必须对两个变量进行相关性判断.课前预习课堂互动课堂反馈【训练】某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356已知记忆力x和判断力y是线性相关的,求线性回归方程.课前预习课堂互动课堂反馈解x-=6+8+10+124=9,y-=2+3+5+64=4,∑4i=1x2i=62+82+102+122=344,∑4i=1xiyi=6×2+8×3+10×5+12×6=158,b=158-4×9×4344-4×81=1420=0.7,a=y--bx-=4-0.7×9=-2.3.则所求的线性回归方程为y=0.7x-2.3.课前预习课堂互动课堂反馈【探究1】有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度/℃-504712151923273136热饮杯数15615013212813011610489937654课前预习课堂互动课堂反馈(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.解(1)散点图如图所示:课前预习课堂互动课堂反馈(2)从上图看到,各点散布在从左上角到右下角的区域里,因此气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程y=-2.352x+147.772.(4)当x=2时,y=143.068.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.课前预习课堂互动课堂反馈【探究2】某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:广告费用x/万元3456销售额y/万元25304045根据上表可得回归直线方程y=bx+a中的b为7,据此模型,若广告费用为10万元,则预计销售额为________万元.课前预习课堂互动课堂反馈∵回归直线方程y=bx+a中b=7,∴35=7×4.5+a,解得a=3.5,∴y=7x+3.5.∴当x=10时,y=7×10+3.5=73.5(万元).答案73.5解析由题意得x-=3+4+5+64=4.5,y-=25+30+40+454=35.课前预习课堂互动课堂反馈【探究3】调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析由于y=0.254x+0.321知,当x增加1万元时,年饮食支出y增加0.254万元.答案0.254课前预习课堂互动课堂反馈【探究4】某农科所对冬季昼夜温差与某反季节大豆种子发芽多少之间的关系进行分析研究,他们记录了12月1日至5日的昼夜温差与每天100颗种子的发芽数,数据如下表:日期12.112.212.312.412.5温差x(℃)101113128发芽数y(颗)2325302616课前预习课堂互动课堂反馈该农科所确定的研究方案是:先从五组数据中选取两组,用剩下的3组数据求回归方程,再用被选取的两组数据进行检验.(1)若先选取的是12月1日和5日的数据,请根据2日至4日的三组数据,求y关于x的回归方程y=bx+a;(2)若由回归方程得到的估计数据与检验数据的误差均不超过2颗,则认为得到的回归方程是可靠的,试判断(1)中所得的线性回归方程是否可靠?说明理由.课前预习课堂互动课堂反馈解(1)由已知数据,求得x-=12,y-=27,由公式b=i=1nxi-x-yi-y-i=1nxi-x-2,求得b=2.5,再由公式a=y--bx-得a=-3,所以y关于x的回归方程为y=2.5x-3.(2)当x=10时,y=23,y=2.5×10-3=22,|22-23|2同样,当x=8时,y=16,y=2.5×8-3=17,|17-16|2.所以,(1)中得到的回归方程是可靠的.课前预习课堂互动课堂反馈规律方法用线性回归方程进行数据拟合的一般步骤是:(1)把数据列成表格;(2)作散点图;(3)判断是否线性相关;(4)若线性相关,求出系数b,a的值(一般也列成表格的形式,用计算器或计算机计算);(5)写出回归直线方程y=a+bx.课前预习课堂互动课堂反馈课堂达标1.炼钢时钢水的含碳量与冶炼时间有()A.确定性关系B.相关关系C.函数关系D.无任何关系解析炼钢时钢水的含碳量除了与冶炼时间有关外,还受冶炼温度等的影响,故为相关关系.答案B课前预习课堂互动课堂反馈2.设有一个回归方程为y=-1.5x+2,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位解析∵两个变量线性负相关,∴变量x增加一个单位,y平均减少1.5个单位.答案C课前预习课堂互动课堂反馈3.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为y=0.72x-58.2,张明同学(20岁)身高178cm,他的体重应该在________kg左右.解析用回归方程对身高为178cm的人的体重进行预测,当x=178时,y=0.72×178-58.2=69.96(kg).答案69.96课前预习课堂互动课堂反馈4.某产品的广告费用x(单位:万元)与销售额y(单位:万元)的统计数据如下表:广告费用x4235销售额y49263954根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为________.解析x-=4+2+3+54=3.5,y-=49+26+39+544=42.因为回归直线过点(x-,y-),所以42=9.4×3.5+a.解得a=9.1.故回归方程为y=9.4x+9.1.所以当x=6时,y=6×9.4+9.1=65.5.答案65.5万元课前预习课堂互动课堂反馈5.2014年元旦前夕,某市统计局统计了该市2013年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x(万元)24466677810年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)如果已知y与x是线性相关的,求线性回归方程;(2)若某家庭年收入为9万元,预测其年饮食支出.(参考数据:i=110xiyi=117.7,i=110x2i=406)课前预习课堂互动课堂反馈(2)当x=9时,y=0.17×9+0.81=2.34.可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.解(1)依题意可计算得:x-=6,y-=1.83,x-2=36,x-y-=10.98,又∵i=110xiyi=117.7,i=110x2i=406,∴b=i=110xiyi-10x-y-i=110x2i-10x-2≈0.17,a=y--bx-=0.81,∴y=0.17x+0.81.∴所求的线性回归方程为y=0.17x+0.81.课前预习课堂互动课堂反馈课堂小结1.判断变量之间有无相关关系,简便可行的方法就是绘制散点图.根据散点图,可看出两个变量是否具有相关关系,是否线性相关,是正相关还是负相关.2.求回归直线的方程时应注意的问题(1)知道x与y呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验.如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a、b的值时,要先算出b,然后才能算出a.3.利用回归方程,我们可以进行估计和预测.若回归方程为y=bx+a,则x=x0处的估计值为y0=bx0+a.