第三节变量的相关性与统计案例内容索引必备知识·自主学习核心考点·精准研析核心素养·微专题核心素养测评必备知识·自主学习【教材·知识梳理】1.独立性检验一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B(如吸烟与不吸烟);Ⅱ也有两类取值,即类1和类2(如患呼吸道疾病和未患呼吸道疾病).我们得到如下列联表所示的抽样数据:Ⅱ类1类2合计Ⅰ类Aaba+b类Bcdc+d合计a+cb+da+b+c+d必备知识·自主学习要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0;Ⅰ与Ⅱ没有关系.(2)根据2×2列联表与公式χ2=计算χ2的值.(3)参照表中临界值,作出判断.2n(adbc)(ab)(cd)(ac)(bd)必备知识·自主学习2.回归分析(1)线性回归方程直线称为线性回归方程.yabx必备知识·自主学习(2)样本相关系数r.①计算公式r=②性质:A.|r|≤1;B.|r|越接近于1,x,y的线性相关程度越强;C.|r|越接近于0,x,y的线性相关程度越弱.必备知识·自主学习③基本步骤:A.提出统计假设H0:变量x,y不具有线性相关关系;B.如果以95%的把握作出推断,那么可以根据1-0.95=0.05与n-2在附录2中查出一个r的临界值r0.05(其中1-0.95=0.05称为检验水平);C.计算样本相关系数r;D.作出统计推断:若|r|r0.05,则否定H0,表明有95%的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.必备知识·自主学习【知识点辨析】(正确的打“√”,错误的打“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()(2)散点图是判断两个变量是否相关的一种重要方法和手段.()(3)通过回归直线方程可以估计预报变量的取值和变化趋势.()ybxa必备知识·自主学习(4)回归直线方程至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(5)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()(6)事件X,Y关系越密切,则由数据计算得到的χ2的值越大.()ybxa必备知识·自主学习提示:(1)√.名师出高徒显示的是正相关关系.(2)√.散点图可以直观反映是否相关.(3)√.由回归直线方程的意义可知其正确.(4)×.回归直线可能不经过任意一个数据点.(5)×.由任何一组观测值都可以求得一个线性回归方程,但可能没有任何意义.(6)√.χ2的值越大,相关的可能性越大.必备知识·自主学习【易错点索引】序号易错警示典题索引1相关系数r与相关性强弱的关系考点一、T2,32χ2的值越大,相关的可能性越大.考点二、典例3先由散点图、相关系数确定相关性,再计算回归方程,预测才有意义考点三、角度2必备知识·自主学习【教材·基础自测】1.(必修3P76例1改编)某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表:x681012y2356则y对x的线性回归直线方程为()A.=2.3x-0.7B.=2.3x+0.7C.=0.7x-2.3D.=0.7x+2.3yyyy必备知识·自主学习【解析】选C.易求=9,=4,样本点的中心(9,4)代入验证,满足=0.7x-2.3.yxy必备知识·自主学习2.(选修2-3P109练习T1改编)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kgyxy必备知识·自主学习【解析】选D.由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确;又线性回归方程必过样本点的中心(,),故B正确;由线性回归方程中系数的意义知,x每增加1cm,其体重约增加0.85kg,故C正确;当某女生的身高为170cm时,其体重估计值是58.79kg,而不是具体值,故D不正确.xy必备知识·自主学习3.(选修2-3P97练习T2改编)为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.根据表中数据,得到χ2=≈4.844.则有________的把握认为选修文科与性别有关系.250(1320107)23272030-必备知识·自主学习【解析】χ2≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定有95%的把握认为选修文科与性别之间有关系.答案:95%核心素养·微专题核心素养数据分析——线性回归方程应用中的数据分析能力【素养诠释】在现实生活中有许多问题应当先做调查研究,收集数据,通过分析作出判断,体会数据中蕴涵的信息;对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面,对于同样的事情每次收集到的数据可能不同;另一方面,只要有足够的数据就可以从中发现规律.数据分析是统计的核心.核心素养·微专题【典例】某电视厂家准备在五一举行促销活动,现在根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万台)的数据如下:年份2012201320142015201620172018广告费支出x1246111319销售量y1.93.24.04.45.25.35.4核心素养·微专题(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程(其中xiyi=279.4;)(2)若用模型y=c+d拟合y与x的关系,可得回归方程=1.63+0.99,经计算线性回归模型和该模型的R2分别约为0.75和0.88,请用R2说明选择哪个回归模型更好.7i1niii1n22ii1xynxy,aybxxnx-b-xxy核心素养·微专题(3)已知利润z与x,y的关系为z=200y-x.根据(2)的结果回答:当广告费x=20时,销售量及利润的预测值是多少?(精确到0.01)参考数据:≈2.236.5核心素养·微专题【素养立意】将数据代入相关公式计算,运用获得的结果结合相关指数的意义进行解释,通过回归方程进行预测.核心素养·微专题【解析】(1)由题意有=8,=4.2,xiyi=279.4,=708,所以=0.17,所以y关于x的线性回归方程为=0.17x+2.84;(2)R2越接近于1,模型的拟合效果越好,故选用=1.63+0.99更好;(3)广告费x=20时,销售量预测值为=1.63+0.99≈6.057≈6.06(万台),故利润的预测值为xy7i172ii1x7iii17222ii1xy7xy279.4784.2b70878x7x----aybx4.20.1782.84,yxy20z200(1.630.9920)201191.46().-万元y核心素养测评