2.3变量间的相关关系第二章统计课前自主预习1.散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.2.正相关与负相关(1)正相关:散点图中的点散布在从到的区域.(2)负相关:散点图中的点散布在从到的区域.□01左下角□02右上角□03左上角□04右下角3.回归直线:如果散点图中点的分布从整体上看大致在附近,就称这两个变量之间具有关系,这条直线叫做回归直线.4.回归方程:对应的方程叫回归直线的方程,简称回归方程.□05一条直线□06线性相关□07回归直线5.回归方程的推导过程(1)假设已经得到两个具有线性相关关系的变量的一组数据,,…,(2)设所求回归方程为y^=b^x+a^,其中a^,b^是待定参数.(3)由最小二乘法得□08(x1,y1)□09(x2,y2)□10(xn,yn).1.判一判(正确的打“√”,错误的打“×”)(1)已知变量x的值,可由回归方程y^=b^x+a^得到变量y的精确值.()(2)回归方程y^=b^x+a^必经过点(x-,y-).()(3)由一组数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程y^=b^x+a^至少经过(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()√××(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.()×2.做一做(1)下列命题正确的是()①任何两个变量都具有相关关系②圆的周长与该圆的半径具有相关关系③某商品的需求量与该商品的价格是一种非确定性关系④根据散点图求得的回归直线方程可能是没有意义的⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究A.①③④B.②③④C.③④⑤D.②④⑤解析①显然不对;②是函数关系,③④⑤正确.(2)(教材改编P95T1)若施肥量x(kg)与水稻产量y(kg)的线性回归方程为y^=5x+250,当施肥量为80kg时,预计水稻产量约为________kg.650解析把x=80代入回归方程可得其预测值y^=5×80+250=650(kg).(3)某同学在求解某回归方程的过程中,已知x,y的取值结果(y与x呈线性相关)如下表:并且求得了线性回归方程为y^=-12x+132,则m等于________.5解析由x=2+3+43=3,线性回归方程y^=-12x+132必经过样本点的中心(x,y),将x=3代入,得y=5.由y=6+4+m3=5,得m=5.课堂互动探究探究1相关关系的判断例1在下列两个变量的关系中,哪些是相关关系?①正方形边长与面积之间的关系②作文水平与课外阅读量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系[解]两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系;②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系;③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具备相关关系;④降雪量与交通事故的发生率之间具有相关关系.综上,②④中的两个变量具有相关关系.拓展提升函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.【跟踪训练1】下列两个变量间的关系不是函数关系的是()A.正方体的棱长与体积B.角的度数与它的正弦值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻的单位产量解析函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项V=a3,B项y=sinα,C项y=ax(a0,且a为常数),所以这三项均是函数关系;D项是相关关系.探究2散点图例25名学生的数学和物理成绩(单位:分)如下:判断它们是否具有线性相关关系.[解]以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示:由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.拓展提升(1)判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.(2)画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.【跟踪训练2】如图所示的两个变量不具有相关关系的是________(填序号).①④解析①是确定的函数关系;②中的点大都分布在一条曲线附近;③中的点大都分布在一条直线附近;④中点的分布没有任何规律可言,x,y不具有相关关系.探究3求线性回归直线方程例3(1)已知变量x与y正相关,且由观测数据算得样本平均数x-=3,y-=3.5,则由该观测数据算得的线性回归方程可能是()A.y^=0.4x+2.3B.y^=2x-2.4C.y^=-2x+9.5D.y^=-0.3x+4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985①画出散点图;②如果y对x有线性相关关系,请画出一条直线近似地表示这种线性关系;③在实际生产中,若它们的近似方程为y=5170x-67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[答案](2)见解析[解析](1)依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确.(2)①散点图如图所示:②近似直线如图所示:③由y≤10得5170x-67≤10,解得x≤14.9,所以机器的运转速度应控制在14转/秒内.拓展提升求回归直线方程的步骤(1)收集样本数据,设为(xi,yi),(i=1,2,…,n)(数据一般由题目给出).(2)作出散点图,确定x,y具有线性相关关系.(3)把数据制成表格xi,yi,x2i,xiyi.(4)计算x-,y-,∑ni=1x2i,∑ni=1xiyi.(5)代入公式计算b^,a^,公式为b^=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2,a^=y--b^x-.(6)写出回归直线方程y^=b^x+a^.【跟踪训练3】已知变量x,y有如下对应数据:x1234y1345(1)作出散点图;(2)用最小二乘法求关于x,y的回归直线方程.解(1)散点图如图所示:(2)x-=1+2+3+44=52,y-=1+3+4+54=134,∑4i=1xiyi=1+6+12+20=39.∑4i=1x2i=1+4+9+16=30,b^=39-4×52×13430-4×522=1310,a^=134-1310×52=0,所以y^=1310x为所求的回归直线方程.探究4利用线性回归直线方程对总体进行估计例4某城市理论预测2017年到2021年人口总数y(单位:十万)与年份(用2017+x表示)的关系如下表所示:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程y^=b^x+a^;(3)据(2)中的回归方程估计2022年该城市的人口总数.参考数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30.[解](1)根据表格数据画出散点图,如图所示,可得y与x成正相关.(2)由题中表格知:x=15×(0+1+2+3+4)=2,y=15×(5+7+8+11+19)=10,∴b^=i=15xiyi-5x-y-i=15x2i-5x2=3.2,a^=y-b^x-=3.6,∴回归方程为y^=3.2x+3.6.(3)当x=5时,y^=19.6(十万)=196(万).∴估计2022年该城市的人口总数为196万.拓展提升解答回归分析问题的四个注意点(1)先用散点图确定是否线性相关.(2)准确计算回归方程中的各个系数.(3)回归直线必过样本中心.(4)利用回归直线方程求出的值只是估计值,会与实际值有一定的误差.【跟踪训练4】在物理实验中,为了研究所挂物体的质量x对弹簧长度y的影响.某学生通过实验测量得到物体的质量与弹簧长度的对比表:(1)画出散点图;(2)利用所给的参考公式,求y对x的回归直线方程;(3)预测所挂物体质量为8g时的弹簧长度.解(1)作出散点图如图所示.(2)x=15×(1+2+3+4+5)=3,y=15×(1.5+3+4+5+6.5)=4,i=15x2i=12+22+32+42+52=55,i=15xiyi=1×1.5+2×3+3×4+4×5+5×6.5=72,∴b^=72-5×3×455-5×32=1.2,a^=4-1.2×3=0.4.∴y对x的回归直线方程为y^=1.2x+0.4.(3)当x=8时,y^=1.2×8+0.4=10.故当所挂物体质量为8g时,弹簧的长度约为10cm.1.相关关系和函数关系的异同点(1)相同点:两者均是指两个变量的关系.(2)不同点:①函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系;相关关系是一种非确定的关系,如一块农田的水稻产量与施肥量之间的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系,然而学会新词并不能使脚变大,而是涉及第三个因素——年龄,当儿童长大一些,他的阅读能力会提高,而且由于长大,脚也变大.2.两个随机变量x和y之间相关关系的确定方法(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断.(2)表格、关系式法:结合表格或关系式进行判断.(3)经验法:借助积累的经验进行分析判断.3.回归直线方程的求法(1)用计算机,例如用Excel软件.(2)用计算器可算出a^,b^,从而得到回归直线方程.(3)用公式求出a^,b^,从而得到回归直线方程.随堂达标自测1.下列变量具有相关关系的是()A.人的体重与视力B.圆心角的大小与所对的圆弧长C.收入水平与购买能力D.人的年龄与体重解析A.人的体重与视力之间没有相关关系;B.圆心角的大小与所对的圆弧长之间是确定的函数关系;D.人的年龄到一定的时候,体重不会有大的变化了,人的年龄与体重没有相关关系.故选C.2.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为()A.y^=1.5x+2B.y^=-1.5x+2C.y^=1.5x-2D.y^=-1.5x-2解析设回归方程为y^=b^x+a^,由散点图可知变量x,y之间负相关,回归直线在y轴上的截距为正数,所以b^0,a^0,因此方程可能为y^=-1.5x+2.3.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是()A.直线l过点(x-,y-)B.回归直线必通过散点图中的多个点C.x和y的相关系数在0和1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同解析A是正确的;回归直线可以不经过散点图中的任何点,故B错误;x和y的相关系数r∈[-1,1],r=1时,表示完全正相关,r=-1时,表示完全负相关,故C错误;分布在l两侧的样本点的个数不一定相同,故D错误.4.对有线性相关关系的两个变量建立的回归直线方程y^=a^+b^x中,回归系数b^()A.不能小于0B.不能大于0C.不能等于0D.只能小于0解析当b^=0时,r=0,这时不具有线性相关关系,但b^能大于0,也能小于0.5.已知x,y之间的一组数据如下:x0123y8264则线性回归方程y^=a^+b^x所表示的直线必经过点________.(1.5,5)解析∵x=14×(0+1+2+3)=