2020版高考数学大一轮复习 第十章 算法、统计与统计案例 10.4 变量的相关性课件 文 新人教A

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十章算法、统计与统计案例§10.4变量的相关性NEIRONGSUOYIN内容索引基础知识自主学习题型分类深度剖析课时作业1基础知识自主学习PARTONE1.变量间的相关关系知识梳理ZHISHISHULI两个变量间的关系函数关系相关关系单调递增单调递减正相关负相关确定性随机性2.散点图以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中描点,这样的图形叫做散点图.3.回归直线方程与回归分析(1)直线方程,叫做Y对x的,b叫做.要确定回归直线方程,只要确定a与回归系数b.(2)用最小二乘法求回归直线方程中的a,b有下列公式______________,其中的________,表示是由观察值按最小二乘法求得的a,b的估计值.y^=a+bx回归直线方程回归系数b^=∑ni=1xiyi-nxy∑ni=1x2i-nx2a^=y-b^x其中的a^,b^(3)相关性检验①计算相关系数r,r具有以下性质:|r|1,并且|r|越接近1,线性相关程度_____;|r|越接近0,线性相关程度;②,表明有95%的把握认为x与Y之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义.≤越强越弱|r|r0.054.独立性检验(1)2×2列联表:B合计An11n12n1+n21n22n2+合计n+1n+2nBA其中n1+=n11+n12,n2+=n21+n22,n+1=,n+2=,n=__________________.n11+n21n12+n22n11+n12+n21+n22(2)χ2统计量:χ2=______________.(3)两个临界值:3.841与6.635当时,有95%的把握说事件A与B有关;当时,有99%的把握说事件A与B有关;当时,认为事件A与B是无关的.nn11n22-n12n212n1+n2+n+1n+2χ23.841χ26.635χ2≤3.8411.变量的相关关系与变量的函数关系有什么区别?提示相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.如何判断两个变量间的线性相关关系?提示散点图中点的分布从整体上看大致在一条直线附近,或者通过计算相关系数作出判断.【概念方法微思考】3.独立性检验的基本步骤是什么?提示列出2×2列联表,计算χ2值,根据临界值表得出结论.4.回归直线方程是否都有实际意义?根据回归直线方程进行预报是否一定准确?提示(1)不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.题组一思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归直线方程=-2.352x+147.767,则气温为2℃时,一定可卖出143杯热饮.()(5)事件X,Y关系越密切,则由观测数据计算得到的χ2的值越大.()×基础自测JICHUZICE123456×y^√√√题组二教材改编1234562.为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力A.回归分析B.期望与方差C.独立性检验D.概率√解析“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.则表中a,b的值分别为A.94,72B.52,50C.52,74D.74,52√1234563.下面是2×2列联表:y1y2合计x1a2173x2222547合计b46120解析∵a+21=73,∴a=52.又a+22=b,∴b=74.4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.现发现表中有一个数据看不清,请你推断出该数据的值为____.设表中的“模糊数字”为a,则62+a+75+81+89=75×5,∴a=68.123456y^零件数x(个)1020304050加工时间y(min)6275818968解析由x=30,得y=0.67×30+54.9=75.题组三易错自纠5.某医疗机构通过抽样调查(样本容量n=1000),利用2×2列联表和χ2统计量研究患肺病是否与吸烟有关.计算得χ2=4.453,经查阅临界值表知P(χ23.841)≈0.05,现给出四个结论,其中正确的是A.在100个吸烟的人中约有95个人患肺病B.若某人吸烟,那么他有95%的可能性患肺病C.有95%的把握认为“患肺病与吸烟有关”D.只有5%的把握认为“患肺病与吸烟有关”123456√解析由已知数据可得,有1-0.05=95%的把握认为“患肺病与吸烟有关”.1234566.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)现已知其回归直线方程为,则根据此线性回归方程估计数学得90分的同学的物理成绩为____.(四舍五入到整数)学生的编号i12345数学成绩x8075706560物理成绩y7066686462y^=0.36x+a^732题型分类深度剖析PARTTWO题型一相关关系的判断例1(1)观察下列各图形,其中两个变量x,y具有相关关系的图是A.①②B.①④C.③④D.②③师生共研解析由散点图知③中的点都分布在一条直线附近.④中的点都分布在一条曲线附近,所以③④中的两个变量具有相关关系.√(2)(2018·沈阳质检)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)的柱形图.以下结论不正确的是A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关√判定两个变量正,负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:当r0时,正相关;当r0时,负相关.(3)回归直线方程中:当0时,正相关;当0时,负相关.思维升华b^b^跟踪训练1在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的样本相关系数为A.-1B.0C.-D.1解析完全的线性关系,且为负相关,故其相关系数为-1,故选A.1212√题型二回归分析命题点1线性回归分析多维探究例2下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2011~2017.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.附注:参考数据:i=17yi=9.32,i=17tiyi=40.17,i=17yi-y2=0.55,7≈2.646.参考公式:相关系数r=i=1nti-tyi-yi=1nti-t2i=1nyi-y2,回归方程y^=a^+b^t中斜率和截距的最小二乘估计公式分别为:b^=i=1nti-tyi-yi=1nti-t2,a^=y-b^t.命题点2非线性回归例3某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.46.65636.8289.81.61469108.8xywi=18(xi-x)2i=18(wi-w)2i=18(xi-x)·(yi-y)i=18(wi-w)·(yi-y)表中wi=xi,w=18i=18wi.(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)x解由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.x(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;解令w=x,先建立y关于w的线性回归方程,由于d^=i=18wi-w·yi-yi=18wi-w2=108.81.6=68,c^=y-d^w=563-68×6.8=100.6,所以y关于w的回归直线方程为y^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v^=α^+β^u的斜率和截距的最小二乘估计分别为β^=i=1nui-uvi-vi=1nui-u2,α^=v-β^u.回归分析问题的类型及解题方法(1)求回归方程①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.②利用公式,求出回归系数.③待定系数法:利用回归直线过样本点的中心求系数.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.思维升华b^a^b^跟踪训练2(2018·全国Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.y^y^(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预报值;解利用模型①,可得该地区2018年的环境基础设施投资额的预报值为=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2018年的环境基础设施投资额的预报值为=99+17.5×9=256.5(亿元).y^y^(2)你认为用哪个模型得到的预报值更可靠?并说明理由.题型三独立性检验师生共研例4(2017·全国Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;解旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量≥50kg旧养殖法新养殖法解箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量

1 / 68
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功