2.3变量间的相关关系2.3.1变量之间的相关关系2.3.2两个变量的线性相关第二章统计考点学习目标核心素养相关关系的概念理解两个变量的相关关系的概念数学抽象散点图会作散点图,并利用散点图判断两个变量之间是否具有相关关系逻辑推理、数学建模回归直线方程会求回归直线方程数学运算第二章统计问题导学(1)相关关系分为哪两种?(2)什么叫散点图?(3)什么叫回归直线?求回归直线的方法及步骤是什么?1.两个变量的线性相关(1)散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.(2)正相关与负相关①正相关:散点图中的点散布在从__________到____________的区域;②负相关:散点图中的点散布在从____________到____________的区域.左下角右上角左上角右下角2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在____________附近,我们就称这两个变量之间具有____________关系,这条直线叫做回归直线.(2)回归方程:____________对应的方程叫回归直线的方程,简称回归方程.一条直线线性相关回归直线(3)最小二乘法求回归直线方程y^=b^x+a^时,使得样本数据的点到回归直线的__________________最小的方法叫做最小二乘法.其中b^是回归方程的_______,a^是回归方程在y轴上的截距.距离的平方和斜率■名师点拨(1)散点图的作用散点图形象地反映了各对数据的密切程度.根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.(2)回归直线的性质由a^=y--b^x-可知回归直线一定经过点(x-,y-),因此点(x-,y-)通常称为样本点的中心,其中,x-,y-分别是变量x1,x2,…,xn和y1,y2,…,yn的平均数.(3)线性相关关系强弱的定性分析线性相关关系的强弱体现在散点图中就是样本点越集中在某条直线附近,两变量的线性相关关系越强;样本点在某条直线附近越分散,两变量的线性相关关系越弱.判断正误(对的打“√”,错的打“×”)(1)线性回归方程必经过点(x-,y-).()(2)对于方程y^=b^x+a^,x增加一个单位时,y平均增加b^个单位.()(3)样本数据中x=0时,可能有y=a^.()(4)样本数据中x=0时,一定有y=a^.()解析:根据回归直线方程的意义知,(1)(2)都正确,而(3)(4)中,样本数据x=0时,y的值可能为a^,也可能不是a^,故(3)正确.答案:(1)√(2)√(3)√(4)×下列各图中所示的两个变量具有相关关系的是()A.(1)(2)B.(1)(3)C.(2)(4)D.(2)(3)解析:选D.(1)为函数关系;(2)(3)为相关关系;(4)中,因为点分布得比较分散,两者之间无相关关系.5位学生的数学成绩和物理成绩如下表:学科ABCDE数学8075706560物理7066686462则数学成绩与物理成绩之间()A.是函数关系B.是相关关系,但相关性很弱C.具有较好的相关关系,且是正相关D.具有较好的相关关系,且是负相关解析:选C.数学成绩x和物理成绩y的散点图如图所示.从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关.设有一个回归方程为y^=2-1.5x,则变量x每增加1个单位时,y平均减少____________个单位.解析:因为y^=2-1.5x,所以变量x每增加1个单位时,y1-y2=[2-1.5(x+1)]-(2-1.5x)=-1.5,所以y平均减少1.5个单位.答案:1.5以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.619.429.222(1)画出数据对应的散点图;(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?相关关系的判断【解】(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.相关关系的判断方法(1)两个变量x和y具有相关关系的判断方法①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;②表格、关系式法:结合表格或关系式进行判断;③经验法:借助积累的经验进行分析判断.(2)判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[易错警示]在解答本题过程中,易出现如下错误:虽然五点中有四点大致分布在一条直线附近,但第二个点离这条直线太远,所以两个变量不相关,导致错误的原因是没有看主流点,而过分关注了不影响大局的个别点.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图所示.由这个散点图可以判断()A.变量x与y正相关B.变量x与y不相关C.变量x与y负相关D.变量x与y是函数关系解析:选C.由这个散点图可以判断,变量x与y负相关,故选C.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^.线性回归方程的求法【解】(1)散点图如图.(2)x-=3+4+5+64=4.5,y-=2.5+3+4+4.54=3.5,i=14xiyi=3×2.5+4×3+5×4+6×4.5=66.5,i=14x2i=32+42+52+62=86,所以b^=∑4i=1xiyi-4x-y-∑4i=1x2i-4x-2=66.5-4×4.5×3.586-4×4.52=0.7,a^=y--b^x-=3.5-0.7×4.5=0.35.所以所求的线性回归方程为y^=0.7x+0.35.如果把例题中的y的值2.5及4.5分别改为2和5,如何求回归直线方程?解:散点坐标分别为(3,2),(4,3),(5,4),(6,5).可验证这四点共线,斜率k=3-24-3=1,所以直线方程为y-2=x-3,即回归直线方程为y^=x-1.求线性回归方程的步骤(1)计算平均数x-,y-.(5)用a^=y--b^x-,求a^.(6)写出回归方程.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观测值,计算得:则y关于x的回归直线方程是()A.y^=11.47+2.62xB.y^=-11.47+2.62xC.y^=2.62+11.47xD.y^=11.47-2.62x解析:选A.利用题目中的已知条件可以求出x-=6.5,y-=28.5,然后利用回归直线方程的计算公式得b^=∑8i=1xiyi-8x-y-∑8i=1x2i-8x-2=1849-8×6.5×28.5478-8×6.52≈2.62,a^=y--b^x-=11.47,因此回归直线方程为y^=11.47+2.62x.(2019·黑龙江省大庆铁人中学期末考试)某班主任为了对本班学生的月考成绩进行分析,从全班40名同学中随机抽取一个容量为6的样本进行分析.随机抽取6位同学的数学、物理分数对应如表:学生编号123456数学分数x607080859095物理分数y728088908595线性回归方程的应用(1)根据上表数据用散点图说明物理成绩y与数学成绩x之间是否具有线性相关性?(2)如果具有线性相关性,求出线性回归方程(系数精确到0.1);如果不具有线性相关性,请说明理由;(3)如果班里的某位同学数学成绩为50,请预测这位同学的物理成绩.【解】(1)画出散点图:通过图象可以看出物理成绩y与数学成绩x之间具有线性相关性.(2)x-=16×(60+70+80+85+90+95)=80,y-=16×(72+80+88+90+85+95)=85,故b^=0.6,a^=37.故回归方程是y=0.6x+37.(3)当x=50时,解得y=67.故数学成绩为50,预测这位同学的物理成绩是67.利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据.(2)利用回归方程中系数b^的意义,分析实际问题.(3)利用回归直线进行预测,此时需关注两点:①所得的值只是一个估计值,不是精确值;②变量x与y成线性相关关系时,线性回归方程才有意义,否则即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的.(2019·江西省临川第一中学期末考试)我国西部某贫困地区2011年至2017年农村居民家庭人均年收入y(千元)的数据如下表:年份2011201220132014201520162017年份代号x1234567人均年收入y2.93.33.64.44.85.25.9(1)求y关于x的线性回归方程;(2)利用(1)中的回归方程,预测该地区2019年农村居民家庭人均年收入将达到多少千元.解:(1)依题意x-=4,y-=4.3,从而b^=0.5,a^=y--b^x-=4.3-0.5×4=2.3,故所求线性回归方程为y^=0.5x+2.3.(2)令x=9,得y^=0.5×9+2.3=6.8.预测该地区在2019年农村居民家庭人均年收入为6.8千元.1.我们常说“吸烟有害健康”,吸烟与健康之间的关系是()A.正相关B.负相关C.无相关D.不确定解析:选B.烟吸得越多,则健康程度越差.2.关于回归直线方程y^=a^+b^x的叙述正确的是()①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①②B.②③C.③④D.①④解析:选D.y^=a^+b^x表示y^与x之间的函数关系,而不是y与x之间的函数关系,它反映的关系最接近y与x之间的真实关系.故①④正确.3.在最小二乘法中,用来刻画各个样本点到直线y=a^+b^x的“距离”的量是()A.|yi-y-|B.(yi-y-)2C.|yi-(a^+b^xi)|D.[yi-(a^+b^xi)]2解析:选D.最小二乘法的定义明确给出,用[yi-(a^+b^xi)]2来刻画各个样本点与这条直线之间的“距离”(即二者之间的接近程度),用它们的和表示所有样本点与这条直线的接近程度.4.已知工厂加工零件的个数x与花费时间y(h)之间的线性回归方程为y^=0.01x+0.5,则加工200个零件大约需要________小时.解析:将200代入线性回归方程y^=0.01x+0.5,得y^=2.5.答案:2.5