会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解回归的基本思想、方法及简单应用.4.了解独立性检验的基本思想、方法及简单应用.用辽大教辅考名牌大学复习策略本讲的复习,应联系具体实际问题,理解回归分析和独立性检验的基本思想、方法,掌握基本公式.在2011年高考中,江西卷第8题、山东卷第8题、湖南卷第5题、陕西卷第9题等都对本讲进行了考查.重点解决:(1)两个随机变量间的相关关系;(2)求线性回归方程;(3)独立性检验.相关关系:两个变量之间的关系可能是__________(如:函数关系),或______________.当自变量取值一定时,因变量也确定,则为____________;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为________.相关关系是一种_____________.确定性关系非确定性关系确定性关系相关关系非确定性关系.回归分析:对具有________的两个变量进行统计分析的方法叫做回归分析,实际上就是寻找________中不确定关系的某种确定性.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有______________,这条直线叫做回归直线.相关关系相关关系线性相关关系.回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:y∧=b∧x+a∧.其中b∧=i=1nxi-xyi-yi=1nxi-x2=,a∧=i=1nxiyi-nxyi=1nx2i-nx2y-b^x的回归直线方程.其中x=________,y=________,________称为样本点的中心.1ni=1nxi1ni=1nyi(x,y)函数关系函数关系是确定性的关系,变量之间的关系可以用函数表示,例如:圆的面积S与半径长r之间就是确定性关系,可以用函数S=πr2表示.2.相关关系相关关系是变量之间有一定的联系,但不能完全用函数来表达,例如,人的体重y与身高x有关.一般来说,身体越高体重越重,但不能用一个函数来严格地表示身高与体重之间的关系..相关关系与函数关系的异同点:关系异同点函数关系相关关系相同点两者均是指两个变量之间的关系是一种确定性关系是一种非确定性的关系是两个可控变量之间的关系①一个为可控变量,另一个为随机变量;②两个都是随机变量是一种因果关系不一定是因果关系,也可能是伴随关系不同点是一种理想关系模型是更为一般的情况散点图(1)散点图定义将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.用辽大教辅考名牌大学(2)利用散点图可以判断变量之间有无相关关系利用散点图可以作出如下判断:①如果所有样本点都落在某一函数图象上,那么变量之间具有函数关系,就用该函数来描述它们之间的关系.②如果所有样本点都落在某一函数图象附近,那么变量之间具有相关关系.③如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系.用辽大教辅考名牌大学(3)正相关、负相关如果散点图中点散布的位置是从左下角到右上角的区域,即一个变量由小变大时,另一个变量的值也由小变大,这种相关称为正相关.如年龄由小变大时(一定范围内),体内脂肪含量也在由小变大.反之,如果散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一变量的值由大变小,这种相关称为负相关.用辽大教辅考名牌大学(4)散点图和回归直线的画法①建立直角坐标系,两轴的长度单位可以不一致.②将n个数据点(xi,yi)(n=1,2,3,…,n)描在平面直角坐标系中.③描的点可以是实心点,也可以是空心点.④画回归直线时,一定要画在多数点经过的区域,实际画线时,先观察有哪两个点在直线上.⑤具体作回归直线时,用一条透明的直尺边缘在这些点间移动,使它尽量靠近或通过大多数点,然后画出直线.用辽大教辅考名牌大学例题示范[典例1]5个学生的数学和物理成绩如下表:学生学科ABCDE数学8075706560物理7066686462画出散点图,并判断它们是否有相关关系.【分析】涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考查因变量物理成绩的变化趋势.用辽大教辅考名牌大学【解析】以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示:由散点图可见,两者之间具有相关关系.【点评】判断变量之间有无相关关系,一种常用的简便可行的方法就是绘制散点图.用辽大教辅考名牌大学我来试试[练习1]对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断().变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【答案】C【解析】本题考查相关关系的正相关和负相关.夹在带状区域内的点,总体上呈上升趋势的属于正相关,总体呈下降趋势的属于负相关.由这两个散点图可以判断,变量x与y负相关,u与v正相关,选C.线性回归方程(1)线性回归方程一般地,设有(x,y)的n对观察数据如下:xx1x2x3…xnyy1y2y3…yn=bx+a使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2取得最小值时,就称y∧=b∧x+a∧为适合这n对数据的线性回归方程,将该方程所表示的直线称为回归直线.其中b∧=i=1nxiyi-nxyi=1nx2i-nx2,a∧=y-b∧x(x=1ni=1nxi,y=1ni=1nyi)用辽大教辅考名牌大学①用此法推导出的直线方程表示直线上各点与对应的散点的坐标差的平方和最小,这种思想方法叫做最小二乘法,利用的是二次函数的最值问题.②由不具有线性相关关系的两个变量推出的回归方程没有意义.用辽大教辅考名牌大学(2)回归直线方程的应用:研究变量间的相关关系,能帮助发现事物发展的一些规律,为我们的判断和决策提供依据.(3)回归直线中一次项系数为b∧,常系数为a∧,这与一次函数习惯表示不同.(4)回归直线一定过样本点中心(x,y).求回归直线方程的步骤:(1)计算出x、y、i=1nx2i、i=1nxiyi的值;(2)计算回归系数a∧、b∧;(3)写出回归直线方程y∧=b∧x+a∧..回归直线方程的应用:(1)描述两变量之间的依存关系;利用回归直线方程即可定理描述两个变量间依存的数量关系.(2)利用回归方程进行预测:把自变量x代入回归方程对因变量进行估计,即可对个体值进行估计.(3)一般地,我们可以利用回归直线方程进行预测,但这里所得的值是预测值,而不是精确值,它带有很大的随机性,可能对于某一次实际值会有很大的出入,尽管我们利用回归直线方程所得到的值仅是一个预测值,它具有随机性,但它是我们根据统计规律所得到的结论,因而结论正确的概率是最大.故我们可以放心大胆地利用回归直线方程进行预测..线性回归与线性相关(1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)相关系数r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2用辽大教辅考名牌大学(3)用r来描述线性相关关系的强弱.当r>0时,两个变量正相关.当r<0时,两个变量负相关.当|r|越接近1相关性越强,r越接近0时,几乎不存在线性相关关系.当|r|>0.75时,认为两个变量有很强的线性相关关系.因而求回归直线方程才有意义..非线性回归问题两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系.可以通过变换的方法转化为线性回归模型.如y=c1ec2x.我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.用辽大教辅考名牌大学一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y^=b^x+a^);(4)按一定规则估计回归方案中的参数(如最小平方法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等.用辽大教辅考名牌大学例题示范[典例2]下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据x3456y2.5344.5用辽大教辅考名牌大学(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y关于x的线性回归方程y∧=b∧x+a∧;(3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤;试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(3×2.5+4×3+5×4+6×4.5=66.5)用辽大教辅考名牌大学【分析】本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验.如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归直线方程也是没有意义的,而且其估计与预测也是不可信的.用辽大教辅考名牌大学【解析】(1)如图所示:用辽大教辅考名牌大学(2)由系数公式可知,x=4.5,y=3.5,b∧=66.5-4×4.5×3.586-4×4.52=66.5-635=