第三节变量的相关性与统计案例内容索引必备知识·自主学习核心考点·精准研析核心素养·微专题核心素养测评【教材·知识梳理】1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种_____________关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为___________,点散布在从左上角到右下角的区域内,两个变量的相关关系为___________.非确定性正相关负相关2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的_____________附近,称两个变量之间具有_________________,这条直线叫做回归直线.(2)回归方程为=bx+a,其中(3)通过求Q=的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的离差平方和最小,这一方法叫做最小二乘法.一条直线线性相关关系baybx.niii1n22ii1xynxyˆb,xnx=n2iii1ybxa(4)相关系数:当r0时,表明两个变量___________;当r0时,表明两个变量___________.r的绝对值越接近于1,表明两个变量的线性相关性_________;r的绝对值越接近于0,表明两个变量之间___________________________.3.独立性检验(1)2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:正相关负相关越强几乎不存在线性相关关系y1y2合计x1n11n12n1+x2n21n22n2+合计n+1n+2n(2)χ2统计量χ2=(其中n=n11+n12+n21+n22为样本容量).2112212211212nnnnnnnnn【常用结论】1.函数关系与相关关系的区别与联系(1)区别:①函数关系是一种确定性关系,相关关系是一种非确定性关系.②函数关系是一种因果关系,相关关系不一定是一种因果关系,也可能是伴随关系.(2)联系:对于线性相关关系,求出线性回归方程后,可以通过确定的函数关系进行两个变量取值的预测.2.回归直线及其方程的性质(1)回归直线不一定过样本点,但是一定过样本中心点().(2)在回归直线方程=bx+a中,0时,两个变量呈正相关关系;0时,两个变量呈负相关关系.x,yˆyˆbˆb【知识点辨析】(正确的打“√”,错误的打“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()(2)散点图是判断两个变量是否相关的一种重要方法和手段.()(3)通过回归直线方程可以估计预报变量的取值和变化趋势.()ybxa,(4)回归直线方程至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(5)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()(6)事件X,Y关系越密切,则由数据计算得到的χ2的值越大.()ybxa,提示:(1)√.名师出高徒显示的是正相关关系.(2)√.散点图可以直观反映是否相关.(3)√.由回归直线方程的意义可知其正确.(4)×.回归直线可能不经过任意一个数据点.(5)×.由任何一组观测值都可以求得一个线性回归方程,但可能没有任何意义.(6)√.χ2的值越大,有关的可能性越大.【易错点索引】序号易错警示典题索引1相关系数r与相关性强弱的关系考点一、T2,32χ2的值越大,相关的可能性越大.考点二、典例3先由散点图、相关系数确定相关性,再计算回归方程,预测才有意义考点三、角度2【教材·基础自测】1.(必修3P74例1改编)某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表:x681012y2356则y对x的线性回归直线方程为()A.=2.3x-0.7B.=2.3x+0.7C.=0.7x-2.3D.=0.7x+2.3yyyy【解析】选C.易求=9,=4,样本点的中心(9,4)代入验证,满足=0.7x-2.3.yxy2.(选修2-3P86例2改编)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是()A.模型1的相关系数r为0.98B.模型2的相关系数r为0.80C.模型3的相关系数r为0.50D.模型4的相关系数r为0.25【解析】选A.在两个变量y与x的回归模型中,它们的相关系数r越接近于1,拟合效果越好,在四个选项中A的相关系数最大,所以拟合效果最好的是模型1.3.(必修3P76例2改编)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kgyxy【解析】选D.由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确;又线性回归方程必过样本点的中心(,),故B正确;由线性回归方程中系数的意义知,x每增加1cm,其体重约增加0.85kg,故C正确;当某女生的身高为170cm时,其体重估计值是58.79kg,而不是具体值,故D不正确.xy4.(选修2-3P81习题3-1AT1改编)为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(χ2≥3.841)≈0.05.根据表中数据,得到χ2=≈4.844.则认为选修文科与性别有关系出错的可能性为_________.250(1320107)23272030-【解析】χ2≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%核心素养数据分析——线性回归方程应用中的数据分析能力【素养诠释】在现实生活中有许多问题应当先做调查研究,收集数据,通过分析作出判断,体会数据中蕴涵的信息;对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面,对于同样的事情每次收集到的数据可能不同;另一方面,只要有足够的数据就可能从中发现规律.数据分析是统计的核心.【典例】某电视厂家准备在五一举行促销活动,现在根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万台)的数据如下:年份2012201320142015201620172018广告费支出x1246111319销售量y1.93.24.04.45.25.35.4(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程(其中xiyi=279.4;)(2)若用模型y=c+d拟合y与x的关系,可得回归方程=1.63+0.99,经计算线性回归模型和该模型的相关系数r分别约为0.75和0.88,请用r说明选择哪个回归模型更好.7i1niii1n22ii1xynxy,aybxxnx-b-xxy(3)已知利润z与x,y的关系为z=200y-x.根据(2)的结果回答:当广告费x=20时,销售量及利润的预测值是多少?(精确到0.01)参考数据:≈2.236.5【素养立意】将数据代入相关公式计算,运用获得的结果结合相关系数的意义进行解释,通过回归方程进行预测.【解析】(1)由题意有=8,=4.2,xiyi=279.4,=708,所以=0.17,所以y关于x的线性回归方程为=0.17x+2.84;(2)r越接近于1,模型的拟合效果越好,故选用=1.63+0.99更好;(3)广告费x=20时,销售量预测值为=1.63+0.99≈6.057≈6.06(万台),故利润的预测值为xy7i172ii1x7iii17222ii1xy7xy279.4784.2b70878x7x----aybx4.20.1782.84,yxy20z200(1.630.9920)201191.46().-万元y