1变量间的相关关系____________________________________________________________________________________________________________________________________________________________________1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.1.相关关系(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的________性,那么这两个变量之间的关系,叫做相关关系.(2)两类特殊的相关关系:如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为负相关.随机左下右上左上右下两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系.2.线性相关(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条________附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做_________.(2)最小二乘法:求线性回归直线方程y^=b^x+a^时,使得样本数据的点到它的________________最小的方法叫做最小二乘法,其中a,b的值由以下公式给出:2直线回归直线距离的平方和其中,b^是回归方程的________,a^是回归方程在y轴上的________.ˆybx-斜率截距线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程.因此在学习过程中,要重视信息技术的应用.类型一变量之间的相关关系的判断例1:(1)下列变量之间的关系不是相关关系的是()A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩田施肥量和粮食亩产量(2)现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如下:学号12345678910x12010811710410311010410599108y84648468696869465771请利用散点图判断这10名学生的两次数学考试成绩是否具有相关关系.[解析](1)在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确这了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.故选A.(2)两次数学考试成绩散点图如图所示,由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系.因此,这10名学生的两次数学考试成绩具有相关关系.3练习1:对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[答案]C类型二回归直线方程例2:随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用y(万元)有如下的数据资料:使用年限x23456总费用y2.23.85.56.57.0若由资料,知y对x呈线性相关关系.试求:(1)线性回归方程y^=b^x+a^的回归系数a^、b^;(2)估计使用年限为10年时,车的使用总费用是多少?[解析]第一步,列表xi,yi,xiyi;第二步,计算x-,y-,i=1nx2i,i=1ny2i,i=1nxiyi;第三步,代入公式计算b,a的值;第四步,写出回归直线方程.(1)利用公式:b^=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2a^=y--b^x-,4来计算回归系数.有时为了方便常列表,对应列出xiyi、x2i,以利于求和.(2)获得线性回归方程后,取x=10,即得所求.[答案](1)列表:i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.0x2i49162536x-=4,y-=5,i=15x2i=90,i=15xiyi=112.3于是b^=112.3-5×4×590-5×42=12.310=1.23;a^=y--bx-=5-1.23×4=0.08.(2)线性回归直线方程是y^=1.23x+0.08,当x=10(年)时,y^=1.23×10+0.08=12.38(万元),即估计使用10年时,支出总费用是12.38万元.练习1:(2015·石家庄高二检测)已知回归直线的斜率的估计值是1.23,样本点中心(即(x,y))为(4,5),则回归直线的方程是()A.y^=1.23x+4B.y^=1.23x+5C.y^=1.23x+0.08D.y^=0.08x+1.23[答案]C练习2:某公司的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:x24568y3040605070资料显示y对x呈线性相关关系.根据上表提供的数据得到回归方程y^=b^x+a^中的b^=6.5,预测销售额为115万元时约需________万元广告费.[答案]15有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童年数量,如下表:人均GDP/万元1086431患白血病的儿童数/人351312207175132180(1)画出散点图,并判定这两个变量是否具有线性相关关系;(2)通过计算可知这两个变量的回归直线方程为=23.25x+102.15,假如一个城市的人均GDP为512万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?[解析](1)根据表中数据画散点图,如图所示,从图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.(2)上述断言是错误的,将x=12代入y^=23.25x+102.15得y^=23.25×12+102.15=381.15>380,但381.15是对该城市人均GDP为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.练习1:某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y^=b^x+a^,其中b^=-20.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[答案](1)由于x=16(x1+x2+x3+x4+x5+x6)=8.5,y=16(y1+y2+y3+y4+y5+y6)=80.所以a^=y-b^x=80+20×8.5=250,从而回归直线方程为y^=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得是大值,故当单价定为8.25元时,工厂可获得最大利润.1.下列两个变量之间的关系:①角度和它的余弦值;②正n边形的边数与内角和;③家庭的支出与收入;④某户家庭用电量与电价间的关系.其中是相关关系的有()6A.1个B.2个C.3个D.4个[答案]A2.下列图形中两个变量具有相关关系的是()[答案]C3.设一个回归方程为y^=3+1.2x,则变量x增加一个单位时()A.y平均增加1.2个单位B.y平均增加3个单位C.y平均减少1.2个单位D.y平均减少3个单位[答案]A4.现有5组数据A(1,3)、B(2,4)、C(4,5)、D(3,10)、E(10,12),去掉________组数据后,剩下的4组数据的线性相关性最大.[答案]D5.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?[解析](1)散点图,如图所示.(2)由题意,得i=1nxiyi=3×2.5+4×3+5×4+6×4.5=66.5,x=3+4+5+64=4.5,y=2.5+3+4+4.54=3.5,7i=1nx2i=32+42+52+62=86,∴b^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a^=y-b^x=3.5-0.7×4.5=0.35,故线性回归方程为y^=0.7x+0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,故耗能减少了90-70.35=19.65(吨标准煤).__________________________________________________________________________________________________________________________________________________________________基础巩固一、选择题1.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程y^=bx+a,那么下面说法不正确的是()A.直线y^=bx+a必经过点(x-,y-)B.直线y^=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点C.直线y^=bx+a的斜率为i=1nxiyi-nx-y-i=1nx2i-nx-2D.直线y^=bx+a和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差i=1n[yi-(bxi+a)]2是该坐标平面上所有直线与这些点的偏差中最小的直线.[答案]B[解析]由a=y-bx知y^=y-bx+bx,∴必定过(x,y)点.回归直线方程对应的直线是与样本数据距离最小的,但不一定过原始数据点,只须和这些点很接近即可.2.下列说法正确的是()8A.对于相关系数r来说,|r|≤1,|r|越接近0,相关程度越大;|r|越接近1,相关程度越小B.对于相关系数r来说,|r|≥1,|r|越接近1,相关程度越大;|r|越大,相关程度越小C.对于相关系数r来说,|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小D.对于相关系数r来说,|r|≥1,|r|越接近1,相关