1相关关系1.相关关系(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的________性,那么这两个变量之间的关系,叫做相关关系.(2)两类特殊的相关关系:如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为负相关.答案:随机左下右上左上右下两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系.2.线性相关(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条________附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做_________.(2)最小二乘法:求线性回归直线方程y^=b^x+a^时,使得样本数据的点到它的________________最小的方法叫做最小二乘法,其中a,b的值由以下公式给出:答案:直线回归直线距离的平方和3.其中,b^是回归方程的________,a^是回归方程在y轴上的________.答案:ˆybx-斜率截距线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程.因此在学习过程中,要重视信息技术的应用.2练习:1.列变量之间的关系不是相关关系的是()A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩田施肥量和粮食亩产量2.现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如下:学号12345678910x12010811710410311010410599108y84648468696869465771请利用散点图判断这10名学生的两次数学考试成绩是否具有相关关系.[解析](1)在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确这了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.故选A.(2)两次数学考试成绩散点图如图所示,由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系.因此,这10名学生的两次数学考试成绩具有相关关系.3.有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童年数量,如下表:人均GDP/万元1086431患白血病的儿童数/人351312207175132180(1)画出散点图,并判定这两个变量是否具有线性相关关系;3(2)通过计算可知这两个变量的回归直线方程为=23.25x+102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?[解析](1)根据表中数据画散点图,如图所示,从图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.(2)上述断言是错误的,将x=12代入y^=23.25x+102.15得y^=23.25×12+102.15=381.15>380,但381.15是对该城市人均GDP为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.4.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y^=b^x+a^,其中b^=-20.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[答案](1)由于x=16(x1+x2+x3+x4+x5+x6)=8.5,y=16(y1+y2+y3+y4+y5+y6)=80.所以a^=y-b^x=80+20×8.5=250,从而回归直线方程为y^=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得是大值,故当单价定为8.25元时,工厂可获得最大利润.45.已知变量x与y正相关,且由观测数据算得样本的平均数x=2.5,y=3.5,则由观测的数据得线性回归方程可能为()A.y^=0.4x+2.3B.y^=2x-2.4C.y^=-2x+9.5D.y^=-0.3x+4.4[答案]A[解析]∵y^=b^x+a^,正相关则b>0,∴排除C,D.∵过中点心(x,y)=(3,3.5),∴选A.6.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是s和t,那么下列说法中正确的是()A.直线l1、l2一定有公共点(s,t)B.直线l1、l2相交,但交点不一定是(s,t)C.必有直线l1∥l2D.l1、l2必定重合[答案]A[解析]线性回归直线方程为y^=bx+a,而a^=y-b^x,即a=t-bs,t=bs+a,所以(s,t)在回归直线上,直线l1、l2一定有公共点(s,t).7.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.[答案]0.254[解析]由于y^=0.254x+0.321知,当x增加1万元时,年饮食支出y增加0.254万元.58.某单位为了解用电量y(度)与气温x(℃)之间的关系,随机抽查了某4天的用电量与当天气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864由表中数据得线性回归方程y^=b^x+a^中b^=-2,预测当气温为-4℃时,用电量约为________度.[答案]68[解析]x=18+13+10-14=10,y=24+34+38+644=40,因为回归方程一定过点(x,y),所以y=b^x+a^,则a^=y-b^x=40+2×10=60.则y^=-2x+60,当x=-4时,y^=-2×(-4)+60=68.9.某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元)x24568y3040605070(1)画出散点图;(2)从散点图中判断销售金额与广告费支出成什么样的关系?[解析](1)以x对应的数据为横坐标,以y对应的数据为纵坐标,所作的散点图如下图所示:(2)从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.6能力提升一、选择题1.根据如下样本数据得到的回归方程为y^=bx+a,则()3456784.02.5-0.50.5-2.0-3.0A.a>0,b<0B.a>0,b>0C.a<0,b<0D.a<0,b>0[答案]A[解析]由于x增大y减小知b<0,又x=3时y>0,∴a>0,故选A.2.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元[答案]B[探究]由线性回归方程的图象过样本点的中心,可求得线性回归方程,然后结合该方程对x=6时的销售额作出估计.[解析]样本点的中心是(3.5,42),则a^=y-b^x=42-9.4×3.5=9.1,所以线性回归方程是y^=9.4x+9.1,把x=6代入得y^=65.5.4.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:x1020304050y62▲758189由最小二乘法求得回归方程为y^=0.67x+54.9,现发现表中有一个数据模糊不清,请推断该数据的值为()A.60B.62C.68D.68.3[答案]C[解析]由题意可得x=30,代入回归方程得y=75.7设看不清处的数为a,则62+a+75+81+89=75×5,∴a=68.[点评]表中所给的数据只反映x与y的线性关系,并非函数关系,因而不能直接代入线性方程求预报值y^,应根据线性回归方程性质,即线性回归方程经过中心点(x,y)求解.二、填空题5.2010年4月初,广东部分地区流行手足口病,党和政府采取果断措施,防治结合,很快使病情得到控制.下表是某同学记载的2010年4月1日到2010年4月12日每天广州手足口病治愈出院者数据,根据这些数据绘制散点图如图.日期123456人数100109115118121134日期789101112人数141152168175186203下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系;②根据此散点图,可以判断日期与人数且有一次函数关系;③后三天治愈出院的人数占这12天治愈出院人数的30%多;④后三天治愈出院的人数均超过这12天内北京市治愈出院人数的20%.其中正确的个数是________.[答案]26.改革开放30年以来,我国高等教育事业迅速发展,对某省1990~2000年考大学升学百分比按城市、县镇、农村进行统计,将1990~2000年依次编号为0~10,回归分析之后得到每年考入大学的百分比y与年份x的关系为:城市:y^=2.84x+9.50;县镇:y^=2.32x+6.67;农村:y^=0.42x+1.80.根据以上回归直线方程,城市、县镇、农村三个组中,________的大学入学率增长8最快.按同样的增长速度,可预测2010年,农村考入大学的百分比为________%.[答案]城市10.2[探究]增长速度可根据回归直线的斜率来判断,斜率大的增长速度快,斜率小的增长速度慢.[解析]通过题目中所提供的回归方程可判断,城市的大学入学率增长最快;2010年农村考入大学的百分比为0.42×20+1.80=10.2.11.某市民用水拟实行阶梯水价,每人用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(I)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(II)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.9(II)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组频率根据题意,该市居民该月的人均水费估计为:(元).考点:频率分布直方图求频率,频率分布直方图求平均数的估计值.12.某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:2,44,66,88,1010,1212,1717,2222,270.