第三节线性回归方程基础梳理1.两个变量的线性相关能用直线=bx+a近似地表示的相关关系叫做线性相关关系.一般地,设有n对观察数据如下:当a、b使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2取得最小值时,方程=bx+a为拟合这n对数据的线性回归方程.xx1x2…xnyy1y2…yn2.线性回归方程(1)最小二乘法求回归直线使得样本数据的点到回归直线的最小的方法叫做最小二乘法.ba距离的平方和(2)线性回归方程方程=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的线性回归方程,其中a,b是待定参数.nniiiii1i1nn222iii1i1(xx)(yy)xynxy(xx)xnxybx典例分析题型一相关关系的判断【例1】下列两个变量之间的关系是相关关系的是-----------------.①降雪量与交通事故发生率;②单位面积产量为常数时,土地面积与产量;③日照时间与水稻的亩产量;④电压一定时,电流与电阻.分析函数关系和相关关系都是指两个变量之间的关系,函数关系是两变量之间的一种确定关系,而相关关系是一种不确定关系.解②④中两个变量间的关系都是确定的,所以是函数关系;①中两个变量是相关关系,降雪量相同的不同地段,交通事故的发生率也不同;③中的两个变量是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产.学后反思判断两个变量间的关系是函数关系还是相关关系,关键是判断两个变量间的关系是否是确定的,若确定,则是函数关系;若不确定,再判断是否线性相关.判断两个变量之间有无线性相关关系,最简便可行的方法是绘制散点图.散点图是由数据点分布构成的,是分析研究两个变量相关的重要手段,如果发现点的分布从整体上看大致在一条直线附近,那么这两变量是线性相关的.典例分析题型一相关关系的判断【例1】下列两个变量之间的关系是相关关系的是-----------------.①降雪量与交通事故发生率;②单位面积产量为常数时,土地面积与产量;③日照时间与水稻的亩产量;④电压一定时,电流与电阻.分析函数关系和相关关系都是指两个变量之间的关系,函数关系是两变量之间的一种确定关系,而相关关系是一种不确定关系.解②④中两个变量间的关系都是确定的,所以是函数关系;①中两个变量是相关关系,降雪量相同的不同地段,交通事故的发生率也不同;③中的两个变量是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产.学后反思判断两个变量间的关系是函数关系还是相关关系,关键是判断两个变量间的关系是否是确定的,若确定,则是函数关系;若不确定,再判断是否线性相关.判断两个变量之间有无线性相关关系,最简便可行的方法是绘制散点图.散点图是由数据点分布构成的,是分析研究两个变量相关的重要手段,如果发现点的分布从整体上看大致在一条直线附近,那么这两变量是线性相关的.1.有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是.举一反三解析:由相关关系的有关概念可知②⑤正相关,①③为负相关,④为函数关系.答案:②⑤【例2】下面是水稻产量与施化肥量的一组观测数据:施化肥量:15202530354045水稻产量:320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?分析判断变量间是否是线性相关,一种常用的简便可行的方法就是作散点图.解(1)散点图如下:(2)从图中可以发现,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.学后反思散点图是由大量数据点分布构成的,是定义在具有相关关系的两个变量基础之上的.对于性质不明确的两组数据可先作散点图,直观地分析它们有无关系及关系的密切程度.2.下表是某地的年降雨量(mm)与年平均气温(℃)的数据资料,两者是线性相关关系吗?求线性回归方程有意义吗?举一反三年平均气温(℃)12.5112.8412.8413.6913.3312.7413.05年降雨量(mm)748542507813574701432解析:以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如图所示.因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没必要用回归直线进行拟合.如果用公式求线性回归方程也是没有意义的.题型二求线性回归方程【例3】在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:由资料看y对x呈线性相关,试求线性回归方程.温度(x)010205070溶解度(y)66.776.085.0112.3128.0解a==93.6-0.8809×30≈67.173.所求线性回归方程为=0.8809x+67.173.30,x93.65128.0112.385.076.066.7y9.0.880x5xyx5yxb51i22i51iiixby学后反思因为y对x呈线性相关关系,所以可以用线性相关的方法解决问题.(1)画出散点图后,即可观察两个变量是否相关.若知道x与y呈线性相关关系,则无需进行相关性检验,否则应进行相关性检验.如果它们之间相关关系不显著,即使求出回归直线也毫无意义.(2)利用公式:来计算回归系数,有时常制表对应出xiyi,xi2,以便于求和.xbya,xnxyxnyxbn1i22in1iii举一反三3.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:则外语成绩对总成绩的线性回归方程是.学科12345总成绩(x)482383421364362外语成绩(y)7865716461学生解析:设回归直线方程是=bx+a,将以上数据代入bniii1n22ii1xynxyxnxaybx解得b≈0.132,a≈14.683,所以线性回归方程为=0.132x+14.683.y答案:=0.132x+14.683y题型三利用线性回归方程对总体进行估计【例4】(14分)下表是几个国家近年来的男性与女性的平均寿命(单位:岁)情况:国家男性平均寿(x)女性平均寿命(y)调查年号中国70732000韩国73.480.42002马来西亚7175.52003美国78.182.62005法国75.5822001日本78.685.62004(1)如果男性与女性的平均寿命近似成线性关系,求它们之间的线性回归方程;(2)科学家预测,到2075年,加拿大男性平均寿命为87岁.现请你预测,到2075年,加拿大女性的平均寿命(精确到0.1岁).分析(1)本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验.如果两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出线性回归方程也是没有意义的,而且其估计与预测也是不可信的.(2)求线性回归方程的关键:计算出、、、.xyn1i2ixn1iiiyx解列表如下:i123456xi7073.47178.175.578.6yi7380.475.582.68285.6Xiyi51105901.365360.56451.0661916728.16可得=35742.08,=33306.38,≈74.43,=79.85,≈5539.82.8′(1)设所求线性回归方程为=bx+a,则………………………………..10′即所求线性回归方程为=1.23x-11.7.61iiiyx61i2ixxy2xyˆ-11.7.xbya1.23,67.4682.667x6xyx6yxb61i22i61iiiyˆ(2)当x=87时,=1.23×87-11.7=95.31≈95.3…………12′所以可预测,到2075年,加拿大女性的平均寿命为95.3岁.………………………………………………………………….14′学后反思通常在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验;在确认具有线性相关关系后,再求其线性回归方程.一般步骤为:①作出散点图,判断是否线性相关;②若是,则用公式求出a、b,写出线性回归方程;③据方程进行估计.yˆ4.某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下:举一反三月人均收入x(元)3003904205045707007608008501080月人均生活费y(元)255324330345450520580650700750利用上述资料:(1)画出散点图;(2)如果变量x与y之间具有线性相关关系,求出回归直线方程;(3)测算人均收入为280元时,人均生活费支出应为多少元?解析:(1)散点图如图所示.(2)=637.4,=490.4,a=-b=490.4-0.70761×637.4≈39.36939,∴=0.70761x+39.36939.(3)把x=280代入,得y≈237.5元,测算人均收入为280元时,人均生活费支出应为237.5元.xy61,0.707x10xyx10yxb101i22i101iiiyxyˆ考点演练10.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算得,,,,求其线性回归方程.8152iix81228iiy821478iix811849iiixy解析:代入公式得,∴=11.47+2.62x.81849522882.6284785252b11.47aybxy11.要分析学生初中升学考试的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,记录他们入学的数学成绩和高一年级期末数学考试成绩如下表:学生编号入学成绩(x)高一期末考试成绩(y)163652677834552488825819267189752738999895856107675(1)画出散点图;(2)求出线性回归方程;(3)若某学生入学的数学成绩为80分,试估计他高一期末数学考试成绩(保留两位有效数字).解析:(1)入学成绩(x)与高一期末考试成绩(y)两组变量的散点图如图.从散点图看,这两组变量具有线性相关关系;(2)设线性回归方程为=a+bx,在两组变量具有显著的线性相关关系的情况下,因此所求的线性回归方程是=22.41080+0.76556x.①yˆ0.76556,xnxyxnyxbn1i22in1iiiyˆ80.22.410xbya(3)若某学生入学的数学成绩为80分,代入①式可求得≈84,即这个学生高一期末数学考试成绩的预测值为84分.12.某产品的广告支出x与销售收入y之间有下表所对应的数据.(1)画出表中数据的散点图;(2)求出y对x的回归直线方程.广告支出x(万元)1234销售收入y(万元)12284256解析:(1)散点图如下:(2)观察散点图可知各点大致分布在一条直线附近,列出下面表格,以备计算a、b.序号xYxy1112112222845633429126445616224合计10138304182x34.5y于是,,,代入公式,得,故y对x的回归直线方程为,其中回归系数b=14.6,它的意义是:广告支出每增加1万元,销售收入y平均增加14.6万元.2.5x42130iix41418iiixy4142221441842.534.514.63042.54iiiiixyxybxx34.514.62.52aybx14.62yx