§1.8最小二乘估计课前新知预习[航向标·学习目标]1.在探索多种方法确定线性回归直线的过程中,体会最小二乘的思想方法.2.能根据给出的线性回归方程系数公式建立线性回归方程.[读教材·自主学习]1.最小二乘法:如果有n个点:(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:________________________________________________________.使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为_______________________.□01[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2□02最小二乘法2.线性回归方程:如果用x-表示x1+x2+…+xnn,用y-表示y1+y2+…+ynn,则可以求得b=x1-x-y1-y-+x2-x-y2-y-+…+xn-x-yn-y-x1-x-2+x2-x-2+…+xn-x-2=__________________________.a=y--bx-.这样得到的直线方程称为线性回归方程,a,b是线性回归方程的系数.□03x1y1+x2y2+…+xnyn-nx-y-x21+x22+…+x2n-nx-2[看名师·疑难剖析]1.求线性回归方程的步骤(1)列表xi,yi,xiyi.(2)计算x-,y-,i=1nx2i,i=1nxiyi.(3)代入公式b=i=1nxiyi-nx-y-i=1nx2i-nx-2,a=y--bx-求出b,a.(4)写出直线方程:y^=bx+a.2.线性回归方程系数公式的推导过程首先将[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2化成关于未知数a的一元二次多项式形式:na2+2n(bx--y-)a+[(y1-bx1)2+(y2-bx2)2+…+(yn-bxn)2]=n[a+(bx--y-)]2-n(bx--y-)2+[(y1-bx1)2+(y2-bx2)2+…+(yn-bxn)2]因此当a=y--bx-时,上式取得最小值,将这个关系代入上式,整理成关于未知数b的一元二次多项式的形式:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2=[(y1-y-)-b(x1-x-)]2+[(y2-y-)-b(x2-x-)]2+…+[(yn-y-)-b(xn-x-)]2=b2[(x1-x-)2+(x2-x-)2+…+(xn-x-)2]-2b[(x1-x-)(y1-y-)+(x2-x-)(y2-y-)+…+(xn-x-)(yn-y-)]+[(y1-y-)2+(y2-y-)2+…+(yn-y-)2],因此,当b=x1-x-y1-y-+x2-x-y2-y-+…+xn-x-yn-y-x1-x-2+x2-x-2+…+xn-x-2=x1y1+x2y2+…+xnyn-nx-y-x21+x22+…+x2n-nx-2=i=1nxiyi-nx-y-i=1nx2i-nx-2时点(x1,y1)(x2,y2)…(xn,yn)与直线y=a+bx最接近(注意并不是点到直线距离之和最小).a,b的意义是:以a为基数,x每增加一个单位,y相应的平均增加b个单位.课堂师生共研考点一线性回归方程的概念例1设有一个线性回归方程为y=4-2x,则变量x增加2个单位时()A.y平均增加1.5个单位B.y平均减少1.5个单位C.y平均增加4个单位D.y平均减少4个单位[解析]该题考查线性回归方程的两个变量之间的线性关系问题.由回归直线方程y=4-2x,知斜率为-2,所以变量x每增加1个单位,y平均减少2个单位,故当变量x增加2个单位时,y平均减少4个单位,所以选D.解析[答案]D答案类题通法根据线性回归方程可获得对两个变量之间整体关系的了解,对于已知的变量x,可以相应估计出变量y的值.[变式训练1]工人月工资(元)依劳动生产率(千元)变化的线性回归方程为y=50+80x,下列判断正确的是()A.劳动生产率为1000元时,工资为130元B.劳动生产率提高1000元时,工资平均提高80元C.劳动生产率提高1000元时,工资平均提高130元D.当月工资为210元时,劳动生产率为2000元答案B答案解析线性回归方程y=a+bx中b的意义是当x增加一个单位时,y的值平均变化b个单位,这是一个平均变化率.线性回归方程只能用于预测变量的值.解析考点二求线性回归方程例2每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压强度y(单位:kg/cm2)之间的关系有如下数据:x150160170180190200210220230240250260y56.958.361.664.668.171.374.177.480.282.686.489.7求两变量间的回归直线方程.[分析]由题目可获取以下主要信息:①两变量具有线性相关关系;②由两变量的对应数据求回归直线方程.解答本题要先列出相应的表格,有了表格中的那些相关数据,回归方程中的系数就都容易求出了.[解]列表如下:i123456xi150160170180190200yi56.958.361.664.668.171.3xiyi8535932810472116281293914260i789101112xi210220230240250260yi74.177.480.282.686.489.7xiyi155611702818446198242160023322x-=205,y-=72.6,i=112x2i=518600,i=112y2i=64572.94,i=112xiyi=182943答案∴b=182943-12×205×72.6518600-12×2052=434714300≈0.304,a=y--bx-=72.6-0.304×205=10.28.于是所求的回归方程是y^=0.304x+10.28.答案类题通法用公式求回归方程的一般步骤是:①列表xi,yi,xiyi.②计算x-,y-,i=1nx2i,i=1ny2i,i=1nxiyi.③代入公式计算b、a的值.④写出回归直线方程.[变式训练2]为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x(cm)174176176176178儿子身高y(cm)175175176177177则y对x的线性回归方程为()A.y=x-1B.y=x+1C.y=88+12xD.y=176答案C答案解析本题考查线性回归方程的求法.设y对x的线性回归方程为y=bx+a,因为b=-2×-1+0×-1+0×0+0×1+2×1-22+22=12,a=176-12×176=88,所以y对x的线性回归方程为y=12x+88.选C.解析规范答题思维规范答题线性相关关系的判断及线性回归方程的求解[例](12分)假设关于某设备使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:x23456y2.23.85.56.57.0(1)请画出上表数据的散点图,判断它们是否具有线性相关关系;若线性相关,用最小二乘法求出y关于x的线性回归方程;(2)试根据(1)求出的线性回归方程,预测使用年限为10年时,维修费用是多少?(一)精妙思路点拨(二)分层规范细解(1)散点图①如图所示:················2分由散点图可知,两变量之间具有相关关系,且为线性相关关系.4分下面用最小二乘法求线性回归方程:列表,计算i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.0x2i49162536x-=4,y-=5,i=15x2i=90,i=15xiyi=112.3②设所求回归方程为:y=bx+a,则由上表可得b=i=15xiyi-5x-y-i=15x2i-5x-2=112.3-5×4×590-5×42=12.310=1.23②,8分a=y--bx-=5-1.23×4=0.08.②∴线性回归方程为y=1.23x+0.08.10分(2)把x=10代入(1)中所求得的线性回归方程得:y=1.23×10+0.08=12.38,11分即使用年限为10年时,维修费用约是12.38万元③.12分(三)来自一线的报告通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的①②③见分层规范细解过程)(四)类题练笔掌握以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积x(m2)80105110115135销售价格y(万元)18.42221.624.829.2(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)试预测90m2的房屋,销售价格是多少?(精确到0.01)解(1)根据表中所列数据可得散点图如下:由图可见两者之间是线性相关的.答案(2)列表,计算:i12345xi80105110115135yi18.42221.624.829.2xiyi14722310237628523942x2i640011025121001322518225x-=109,y-=23.2,i=15x2i=60975,i=15xiyi=12952答案故可求得:b=i=15xiyi-5x-y-i=15x2i-5x-2=12952-5×109×23.260975-5×1092≈0.1962,a=y--bx-=23.2-0.1962×109=1.8142,所以,线性回归方程为y=0.1962x+1.8142,回归直线如(1)中图.答案(3)把x=90代入上述回归方程y=0.1962x+1.8142,即y=0.1962×90+1.8142≈19.47,即这种90m2的房屋,销售价格约是19.47万元.答案(五)解题设问画出散点图的作用是什么?________.答案判断数据是否线性相关答案检测学业达标1.设有一个回归方程为y^=2-1.5x,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减小1.5个单位D.y平均减少2个单位解析由相关系数的意义可知C正确.解析答案C答案2.线性回归方程表示的直线y=a+bx必定过()A.(0,0)点B.(x-,0)点C.(0,y-)点D.(x-,y-)点答案D答案3.试验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的线性回归方程为()A.y=x+1B.y=x+2C.y=2x+1D.y=x-1解析作散点图,利用最小二乘法求线性回归方程.解析答案A答案4.施化肥量xkg与水稻产量ykg在一定范围内线性相关,若线性回归方程为y=5x+250,当施化肥量为80kg时,预计水稻的产量为________.解析将x的值代入线性回归方程即可.解析答案650kg答案5.假设学生在七年级和八年级的数学成绩是线性相关的,若10个学生七年级(x)和八年级(y)数学分数如下:x74717268767367706574y76757170767965776272试求七年级和八年级数学分数间的回归直线方程.解因为x-=71,i=110x2i=50520,y-=72.3,i=110xiyi=51467,所以b=51467-10×71×72.350520-10×712≈1.2182,a=72.3-1.2182×71=-14.192.回归直线方程是y^=1.2182x-14.192.答案本课结束