第3讲变量间的相关关系、统计案例第十章统计、统计案例及算法初步栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步1.变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是___________;与函数关系不同,___________是一种非确定性关系.相关关系相关关系栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有____________________,这条直线叫_____________.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为________,点分布在左上角到右下角的区域内,两个变量的相关关系为________.(3)回归方程为y^=b^x+a^,其中b^=∑ni=1xiyi-nx-y-∑ni=1x2i-nx2,a^=________________.线性相关关系回归直线正相关负相关y-b^x栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步(4)相关系数当r0时,表明两个变量________;当r0时,表明两个变量________.r的绝对值越接近于1,表明两个变量的线性相关性____.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于________时,认为两个变量有很强的线性相关性.正相关负相关越强0.75栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步3.非线性回归分析如果在样本数据的散点图中,样本点并没有分布在某一条直线附近,而是分布在某一条曲线(如二次函数、指数函数、对数函数等)的周围,我们就称这两个变量之间不具有线性相关关系,而是非线性相关关系.对这样的两个变量进行回归分析,称为非线性回归分析.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步4.独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=________________________________________________(其中n=a+b+c+d为样本容量).n(ad-bc)2(a+b)(a+c)(b+d)(c+d)栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步1.辨明四个易误点(1)易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.(2)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x,y)点,可能所有的样本数据点都不在直线上.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步(3)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).(4)虽然任何一组不完全相同的数据都可以求出回归直线方程,但只有具有线性相关关系的一组数据才能得到有意义的回归直线方程,求出的方程才具有实际价值.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步2.求回归方程的方法(1)求线性回归方程的方法求解回归方程的关键是确定回归系数a^,b^,因求解b^的公式计算量太大,一般题目中给出相关的量,如x,y,∑ni=1x2i,∑ni=1xiyi等,便可直接代入求解.充分利用回归直线过样本中心点(x,y),即有y=b^x+a^,可确定a^.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步(2)非线性回归分析的步骤①通过散点图,判断回归模型的形式是线性的还是非线性的,若为非线性的,可以通过变化趋势选择合适的模型,求出模型后,通过相关指数判断哪个模型拟合效果较好;②非线性回归问题可以通过变换转化为用线性回归方法去解决,转化过程中,注意数据也相应地跟着变化;③利用变量替换转化为线性问题,解决后要再转化回来.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步1.有关线性回归的说法,不正确的是()A.具有相关关系的两个变量是非确定关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.散点图中的点越集中,两个变量的相关性越强D栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步2.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是:有多少的把握认为“学生性别与支持该活动有关系”.()附:P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828A.0.1%B.1%C.99%D.99.9%C栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步解析:因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步3.(2014·高考湖北卷)根据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为y^=b^x+a^,则()A.a^>0,b^<0B.a^>0,b^>0C.a^<0,b^<0D.a^<0,b^>0A栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步解析:作出散点图如下:观察图象可知,回归直线y^=b^x+a^的斜率b^<0,当x=0时,y^=a^>0.故a^>0,b^<0.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步4.下面是一个2×2列联表y1y2总计x1a2173x222527总计b46则表中a、b处的值分别为____________.52、54解析:因为a+21=73,所以a=52.又因为a+2=b,所以b=54,栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步考点一相关关系的判断(2015·高考湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关C栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步[解析]因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=b^y+a^,b^0,则z=b^y+a^=-0.1b^x+b^+a^,故x与z负相关.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r0时,正相关:r0时,负相关.(3)线性回归方程中:b^0时,正相关;b^0时,负相关.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步1.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关C栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步解析:由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步考点二线性回归方程及其应用(高频考点)线性回归问题是高考中的热点问题,考查形式可以是小题,也可以是解答题.高考中对线性回归问题的考查主要有以下两个命题角度:(1)求回归直线方程;(2)利用回归方程进行预测.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步(2015·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程y^=b^t+a^;栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程y^=b^t+a^中,b^=i=1ntiyi-nt-y-i=1nt2i-nt-2,a^=y--b^t-.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步[解](1)列表计算如下:itiyit2itiyi11515226412337921448163255102550∑153655120这里n=5,t-=1ni=1nti=155=3,y-=1ni=1nyi=365=7.2.栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步又ltt=i=1nt2i-nt-2=55-5×32=10,lty=i=1ntiyi-nt-y-=120-5×3×7.2=12,从而b^=ltyltt=1210=1.2,a^=y--b^t-=7.2-1.2×3=3.6,故所求回归方程为y^=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y^=1.2×6+3.6=10.8(千亿元).栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步最小二乘估计的三个步骤(1)作出散点图,判断是否线性相关.(2)如果是,则用公式求a^,b^,写出回归方程.(3)根据方程进行估计.[注意]回归直线方程恒过点(x-,y-).栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步2.(1)(2015·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程y^=b^x+a^,其中b^=0.76,a^=y--b^x.据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元B栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步(2)为了