-1-2.3.1变量间的相关关系2.3.2两个变量的线性相关学习目标核心素养1.理解两个变量的相关关系的概念.(重点)2.会画散点图,并利用散点图判断两个变量是否具有相关关系.(重点)3.理解最小二乘法原理,会求回归直线方程.(难点)1.通过两个变量相关关系的概念与判断,体现了数学抽象的数学核心素养.2.借助最小二乘法原理及回归直线方程的求法学习,提升学生的数学运算的数学核心素养.一、变量间的相关关系1.两个变量的关系分类函数关系相关关系特征两变量关系确定两变量关系带有随机性2.散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.二、两个变量的线性相关1.最小二乘法设x、Y的一组观察值为(xi,yi),i=1,2,…,n,且回归直线方程为y^=a+bx.当x取值xi(i=1,2,…,n)时,Y的观察值为yi,差yi-y^i(i=1,2,…,n)刻画了实际观察值yi与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q=i=1n(yi-a-bxi)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.2.回归直线方程的系数计算公式回归直线方程回归系数系数a^的-2-计算公式方程或公式y^=a+bxa^=y--b^x-上方加记号“^”的意义区分y的估计值y^与实际值ya、b上方加“^”表示由观察值按最小二乘法求得的估计值1.设有一个回归方程为y^=-1.5x+2,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位C[当变量x增加一个单位时,y^=-1.5(x+1)+2=(-1.5x+2)-1.5,所以y平均减小1.5个单位.]2.过(3,10),(7,20),(11,24)三点的回归直线方程是()A.y^=1.75+5.75xB.y^=-1.75+5.75xC.y^=5.75+1.75xD.y^=5.75-1.75xC[代入系数公式得b^=1.75,a^=5.75.代入直线方程,求得y^=5.75+1.75x.故选C.]3.如图所示的两个变量不具有相关关系的有________.①④[①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.]4.若施肥量x(kg)与水稻产量y(kg)的线性回归方程为y^=5x+250,当施肥量为80kg时,预计水稻产量约为________kg.650[把x=80代入回归方程得其预测值y^=5×80+250=650(kg).]相关关系的判断-3-【例1】(1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)下列关系中,属于相关关系的是________.①人的身高与视力的关系;②做自由落体运动的物体的质量与落地时间的关系;③降雪量与交通事故的发生率之间的关系.[思路探究]结合相关关系,函数关系的定义及正负相关的定义分别对四个选项作出判断.(1)C(2)③[(1)由图象知,变量x与y呈负相关关系;u与v呈正相关关系.(2)题号判断原因分析①不是相关关系身高与视力无关,不具有函数关系,也不具有相关关系②不是相关关系自由落体的物体的质量与落地时间无关,不具有相关关系③相关关系降雪量越大,交通事故发生率越高,不确定性的关系]判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.1.某公司2014~2019年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:年份201420152016201720182019-4-利润x12.214.6161820.422.3支出y0.620.740.810.8911.11A.利润中位数是16,x与y有正线性相关关系B.利润中位数是18,x与y有负线性相关关系C.利润中位数是17,x与y有正线性相关关系D.利润中位数是17,x与y有负线性相关关系C[由表知,利润中位数是12(16+18)=17,且y随x的增大而增大,故选C.]求回归直线方程[探究问题]1.怎样判断一组数据是否具有线性相关关系?[提示]画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.2.最小二乘法的实质是什么?任何一组数据都可以由最小二乘法得出回归直线方程吗?[提示]实际上,最小二乘法就是从整体上看,使各点与回归直线的距离最小.用最小二乘法求回归直线方程的前提是所给数据是线性相关的,不是线性相关的数据,求出回归直线方程是无意义的.3.回归系数b^的含义是什么?[提示]b^代表x每增加一个单位,y的平均增加单位数.当b^>0时,两变量呈正相关;当b^<0时,两变量呈负相关.【例2】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)102030405060708090100加工时间y(分)626875818995102108115122(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求y关于x的回归直线方程.[思路探究]画散点图→确定相关关系→求回归直线系数→写回归直线方程[解](1)画散点图如下:-5-由上图可知y与x具有线性相关关系.(2)列表、计算:i12345678910xi102030405060708090100yi626875818995102108115122xiyi620136022503240445057007140864010350122001.(变条件)已知变量x,y有如下对应数据:x1234y1345(1)作出散点图,y与x是否具有线性相关关系?(2)如果y与x具有相关关系,用最小二乘法求关于x,y的回归直线方程.[解](1)散点图如图所示:由图知y与x具有线性相关关系.-6-(2)x=1+2+3+44=52,y=1+3+4+54=134,i=14xiyi=1+6+12+20=39,i=14x2i=1+4+9+16=30,b^=39-4×52×13430-4×522=1310,a^=134-1310×52=0,所以y^=1310x为所求回归直线方程.2.(变结论)本例条件不变,若已知y与x具有相关关系,且线性回归方程为y^=kx+60,求k值.[解]由题意可求得x=55,y=91.7,代入y^=kx+60,得k≈0.576.1.求回归直线方程的一般步骤(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出).(2)作出散点图,确定x,y具有线性相关关系.(3)把数据制成表格,计算出x2i,xiyi.(4)计算(5)代入公式计算b^,a^,公式为(6)写出回归直线方程y^=bx+a.2.回归直线方程必过样本中心点(x,y).-7-利用回归方程对总体进行估计【例3】下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出回归直线方程y^=bx+a;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?[思路探究](1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b^,a^的值;(3)实际上就是求当x=100时,对应的v的值.[解](1)画出散点图,如图所示:(2)由题意,得=3×2.5+4×3+5×4+6×4.5=66.5,x=3+4+5+64=4.5,y=2.5+3+4+4.54=3.5,=32+42+52+62=86,∴b^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a^=y-b^x=3.5-0.7×4.5=0.35,故线性回归直线方程为y^=0.7x+0.35.(3)根据回归直线方程的预测,现在生产100吨产品消耗的标准煤为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨)标准煤.-8-回归分析的三个步骤:1判断两个变量是否线性相关:可以利用经验,也可以画散点图;2求线性回归直线方程,注意运算的正确性;3根据回归直线进行预测估计:估计值不是实际值,两者会有一定的误差.2.2020年元旦前夕,某市统计局统计了该市2019年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x(万元)24466677810年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)如果已知y与x是线性相关的,求回归方程;(2)若某家庭年收入为9万元,预测其年饮食支出.(参考数据=117.7,=406)[解](1)由题意可计算得:x=6,y=1.83,x2=36,x-y-=10.98,又∵=117.7,=406,∴≈0.17,a=y--bx-=0.81,∴y^=0.17x+0.81.∴所求的回归方程为y^=0.17x+0.81.(2)当x=9时,y^=0.17×9+0.81=2.34(万元),可估计该年收入为9万元的家庭每年饮食支出约为2.34万元.1.本节课的重点是会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程.难点是了解相关关系、线性相关、回归直线的概念,了解最小二乘法的思想.2.本节课要掌握以下几类问题:(1)准确区分相关关系与函数关系.-9-(2)会利用散点图判断两个变量间的相关关系.(3)掌握用线性回归方程估计总体的一般步骤.3.本节课的易错点有两个:(1)区分不清相关关系与函数关系.(2)求回归直线方程中易出现计算错误.1.思考辨析(1)回归直线方程中,由x的值得出的y值是准确值.()(2)回归直线方程一定过样本点的中心.()(3)回归直线方程一定过样本中的某一个点.()(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.()[答案](1)×(2)√(3)×(4)×2.下列有关线性回归的说法,不正确的是()A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.回归直线方程最能代表观测值x、y之间的线性关系D.任何一组观测值都能得到具有代表意义的回归直线D[只有数据点整体上分布在一条直线附近时,才能得到具有代表意义的回归直线.]3.已知工厂加工零件的个数x与花费时间y(h)之间的线性回归方程为y^=0.01x+0.5,则加工200个零件大约需要________小时.2.5[将x=200代入线性回归方程y^=0.01x+0.5,得y^=2.5.]4.对具有线性相关关系的变量x和y,测得一组数据如下表所示.x24568y3040605070若已求得它们的回归直线的斜率为6.5,求这条回归直线的方程.[解]由题意可知x=2+4+5+6+85=5,-10-y=30+40+60+50+70