2.3.2两个变量的线性相关(二)第二章§2.3变量间的相关关系1.理解两个变量线性相关的概念;2.了解用最小二乘法建立线性回归方程的思想,会用给出的公式建立回归方程;3.理解回归直线与观测数据的关系.问题导学题型探究达标检测学习目标知识点一线性相关问题导学新知探究点点落实思考回顾上一节你看到的散点图,大致呈哪些形状?答案饼状,曲线状,直线状.如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系.两个变量线性相关是相关关系的一种.答案思考数学上的“回归”是什么意思?知识点二回归直线的方程答案“回归”一词最早由英国统计学家(FrancilsGalton)提出的,本意是子女的身高会向一般人的均值靠拢.现在这个概念引伸到随机变量有向回归线集中的趋势.即观察值不是全落在回归线上,而是散布在回归线周围.但离回归线越近,观察值越多,偏离较远的观察值极少,这种不完全呈函数关系,但又有一定数量关系的现象称回归.答案(1)回归直线:如果散点图中点的分布从整体上看大致在附近,就称这两个变量之间具有关系,这条直线叫做回归直线.(2)回归方程:对应的方程叫做回归直线的方程,简称回归方程.(3)回归方程y^=b^x+a^,其中b^是回归方程的斜率,a^是截距.一条直线线性相关回归直线知识点三最小二乘法返回思考具有线性相关关系的散点大致分布在一条直线附近.如何确定这条直线比较合理?答案应该使散点整体上最接近这条直线.最小二乘法是一种求回归直线的方法,用这种方法求得的回归直线能使样本数据的点到回归直线的距离的平方和最小.答案类型一线性相关的概念题型探究重点难点个个击破解析答案反思与感悟例1以下是某地搜集到的新房屋的销售价格和房屋面积的数据:房屋面积(m2)617011511080135105销售价格(万元)12.215.324.821.618.429.222画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.跟踪训练1一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:解析答案零件数x(个)102030405060708090100加工时间y(min)626875818995102108115122(1)画出散点图;解散点图如下:(2)关于加工零件的个数与加工时间,你能得出什么结论?解析答案解加工零件的个数与所花费的时间具有正的线性相关关系.类型二回归方程的求法例2下表为某地近几年机动车辆数与交通事故数的统计资料.解析答案机动车辆数x/千台95110112120129135150180交通事故数y/千件6.27.57.78.58.79.810.213(1)请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果不具有线性相关关系,说明理由;解在平面直角坐标系中画出数据的散点图,如图.直观判断散点在一条直线附近,故具有线性相关关系.(2)如果具有线性相关关系,求出回归方程.解析答案解计算相应的数据之和:i=18xi=1031,i=18yi=71.6,i=18x2i=137835,i=18xiyi=9611.7,x=128.875,y=8.95将它们代入公式计算得b^≈0.0774,a^≈-1.0249,所以,所求回归方程为y^=0.0774x-1.0249.跟踪训练2以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:解析答案房屋面积x(m2)11511080135105销售价格y(万元)24.821.618.429.222(1)画出数据对应的散点图;解数据对应的散点图如图所示:(2)求回归方程,并在散点图中加上回归直线.解析答案类型三回归方程的应用例3有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:解析答案摄氏温度/℃-504712151923273136热饮杯数15615013212813011610489937654(1)画出散点图;解散点图如图所示:(2)从散点图中发现气温与热饮销售杯数之间有什么关系;解析答案解从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)求回归方程;解从散点图可以看出,这些点大致分布在一条直线的附近,利用计算器容易求得回归方程y^=-2.352x+147.767.因此,可用公式求出回归方程的系数.(4)如果某天的气温是2℃,预测这天卖出的热饮杯数;解析答案(5)气温为2℃时,小卖部一定能够卖出143杯左右热饮吗?为什么?解小卖部不一定能够卖出143杯左右热饮,原因如下:①回归方程中的截距和斜率都是通过样本估计出来的,存在误差,这种误差可以导致预测结果的偏差.②即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近.解当x=2时,y^=143.063.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.解析答案跟踪训练3有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数,如下表:人均GDP/万元1086431患白血病的儿童数/人351312207175132180(1)画出散点图,并判定这两个变量是否具有线性相关关系;解散点图如图:根据散点图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.解析答案返回(2)通过计算可知这两个变量的回归方程为=23.25x+102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?y^解上述断言是错误的,将x=12代入y^=23.25x+102.15得y^=23.25×12+102.15=381.15>380,但381.15是对该城市人均GDP为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.1.下列有关线性回归的说法,不正确的是()A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.回归方程最能代表观测值x、y之间的线性关系D.任何一组观测值都能得到具有代表意义的回归方程D达标检测1234答案512342.已知回归直线的斜率的估计值是1.23,样本点中心(即(x,y)为(4,5),则回归直线的方程是()A.y^=1.23x+4B.y^=1.23x+5C.y^=1.23x+0.08D.y^=0.08x+1.23解析回归直线必过样本点的中心.C解析答案53.某产品的广告费用x与销售额y的统计数据如下表:1234解析答案广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元512344.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个结论:①y与x负相关且y^=2.347x-6.423;②y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④解析答案51234解析答案5.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可判定其体重必为58.79kg5规律与方法1.求回归直线方程时应注意的问题(1)知道x与y成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a^、b^的值时,要先计算b^,然后才能算出a^.2.利用回归方程,我们可以进行估计和预测.若回归直线方程为y^=b^x+a^,则x=x0处的估计值为y^0=b^x0+a^.返回