2021高考数学大一轮复习 第十章 算法初步、统计与统计案例 10.4 变量间的相关关系、统计案例课

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第八单元考点一考点二核心素养专项提升10.4变量间的相关关系、统计案例第八单元考点一考点二核心素养专项提升考点二-2-知识梳理双基自测234151.变量间的相关关系(1)定义:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种.(2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.若这些点分布在从左下角到右上角的区域,则称两个变量;若这些点分布在从左上角到右下角的区域,则称两个变量.(3)线性相关关系、回归直线:如果散点图中的点的分布从整体上看大致在,那么就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.非确定性关系正相关负相关一条直线附近第八单元考点一考点二核心素养专项提升考点二-3-知识梳理双基自测23415(4)非线性相关:若散点图上所有点看上去都在附近波动,则称这两个变量为非线性相关.此时,可以用来拟合.(5)不相关:如果所有的点在散点图中,那么称这两个变量是不相关的.某条曲线(不是一条直线)一条曲线没有显示任何关系第八单元考点一考点二核心素养专项提升考点二-4-知识梳理双基自测234152.回归分析对具有相关关系的两个变量进行统计分析的方法叫做回归分析.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为,因变量y称为.解释变量预报变量第八单元考点一考点二核心素养专项提升考点二-5-知识梳理双基自测234153.回归方程与最小二乘法若变量x与y具有线性相关关系,有n个样本数据(xi,yi)(i=1,2,…,n),则回归方程为𝑦^=b^x+𝑎^,其中𝑏^=∑𝑖=1𝑛𝑥𝑖𝑦𝑖-𝑛𝑥𝑦∑𝑖=1𝑛𝑥𝑖2-𝑛𝑥2,𝑎^=𝑦−𝑏^𝑥,它主要用来估计和预测取值,从而获得对这两个变量之间整体关系的了解.求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.第八单元考点一考点二核心素养专项提升考点二-6-知识梳理双基自测234154.相关系数,它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当r0时表示两个变量正相关,当r0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性;当|r|接近0时,表明两个变量间几乎不存在.r=∑𝑖=1𝑛xiyi-𝑛xy∑i=1n𝑥𝑖2-𝑛𝑥2∑𝑖=1𝑛𝑦𝑖2-𝑛𝑦2越强线性相关性第八单元考点一考点二核心素养专项提升考点二-7-知识梳理双基自测234155.独立性检验(1)分类变量:变量的不同“值”表示个体所属的,像这类变量称为分类变量.(2)列联表:列出两个分类变量的,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d不同类别频数表第八单元考点一考点二核心素养专项提升考点二-8-知识梳理双基自测23415(3)独立性检验:利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.构造一个随机变量K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑),其中n=为样本容量.a+b+c+d第八单元考点一考点二核心素养专项提升考点二2-9-知识梳理双基自测34151.下列结论正确的打“√”,错误的打“×”.(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)若事件X,Y的关系越密切,则由观测数据计算得到的K2的观测值越大.()(5)通过回归方程𝑦^=b^x+𝑎^可以估计和观测变量的取值和变化趋势.()×√√√√第八单元考点一考点二核心素养专项提升考点二-10-知识梳理双基自测234152.(2019广西柳州高中一模)根据如下样本数据:x345678y4.02.5-0.50.5-2.0-3.0得到了回归方程𝑦^=b^x+𝑎^,则()A.𝑎^0,𝑏^0B.𝑎^0,𝑏^0C.𝑎^0,𝑏^0D.𝑎^0,𝑏^0答案解析解析关闭由表格数据可知,y与x是负相关关系,所以𝑏^0,且当x=0时,y0,所以a^0,故选C.答案解析关闭C第八单元考点一考点二核心素养专项提升考点二-11-知识梳理双基自测234153.广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元):广告费x23456销售额y2941505971由表可得到回归方程为𝑦^=10.2x+a^,据此模型,预测广告费为10万元时的销售额约为()A.101.2万元B.108.8万元C.111.2万元D.118.2万元答案解析解析关闭由题意,得𝑥=4,𝑦=50.∴50=4×10.2+𝑎^,解得a^=9.2.∴回归方程为𝑦^=10.2x+9.2.∴当x=10时,𝑦^=10.2×10+9.2=111.2.故选C.答案解析关闭C第八单元考点一考点二核心素养专项提升考点二-12-知识梳理双基自测234154.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三名学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其两科总成绩名次靠前的学生是;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.答案解析解析关闭(1)由题图可知,甲的语文成绩名次比总成绩名次靠后;而乙的语文成绩名次比总成绩名次靠前.故填乙.(2)由题图可知,比丙的数学成绩名次还靠后的人比较多;而总成绩名次中比丙名次靠后的人数比较少,所以丙的数学成绩名次更靠前.故填数学.答案解析关闭(1)乙(2)数学第八单元考点一考点二核心素养专项提升考点二-13-知识梳理双基自测234155.为了考察某种病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,在犯错误的概率最多不超过(填百分比)的前提下,可认为“该种疫苗有预防这种病毒感染的效果”.感染未感染总计服用104050未服用203050总计3070100参考公式:K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑)P(K2≥k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828答案解析解析关闭由题意,计算K2的观测值k=100×(10×30-20×40)250×50×30×70≈4.7623.841,参照附表,可得在犯错误的概率不超过5%的前提下,认为“小鼠是否被感染与有没有服用疫苗有关”.故答案为5%.答案解析关闭5%第八单元考点一考点二核心素养专项提升核心素养专项提升-14-考点1考点2考点3考点1相关关系的判断例1(1)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,b的值为1.25B.线性相关关系较强,b的值为0.83C.线性相关关系较强,b的值为-0.87D.线性相关关系较弱,无研究价值𝑦^=b^x+𝑎^答案解析解析关闭由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.答案解析关闭B第八单元考点一考点二核心素养专项提升核心素养专项提升-15-考点1考点2考点3(2)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:则哪位同学的试验结果体现A,B两个变量有更强的线性相关性?()A.甲B.乙C.丙D.丁思考如何判断两个变量有无相关关系?甲乙丙丁r0.820.780.690.85m106115124103答案解析解析关闭在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两个变量有更强的线性相关性,故选D.答案解析关闭D第八单元考点一考点二核心素养专项提升核心素养专项提升-16-考点1考点2考点3解题心得判断两个变量有无相关关系有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的.第八单元考点一考点二核心素养专项提升核心素养专项提升-17-考点1考点2考点3对点训练1(1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2r40r3r1B.r4r20r1r3C.r4r20r3r1D.r2r40r1r3A第八单元考点一考点二核心素养专项提升核心素养专项提升-18-考点1考点2考点3(2)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,则这组样本数据的样本相关系数为()A.-3B.0C.-1D.1C解析:(1)易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,故r2r40r3r1.(2)因为所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,所以回归直线方程是y=-3x+1,可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,且所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,则|r|=1,相关系数r=-1,故选C.第八单元考点一考点二核心素养专项提升核心素养专项提升-19-考点1考点2考点3考点2回归方程的求法及回归分析例2PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:时间周一周二周三周四周五车流量x/万辆100102108114116浓度y/(微克/立方米)7880848890(1)根据上表数据,用最小二乘法求出y与x的线性回归方程;(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少.第八单元考点一考点二核心素养专项提升核心素养专项提升-20-考点1考点2考点3参考公式:𝑏^=∑i=1n(𝑥𝑖-𝑥)(𝑦𝑖-𝑦)∑𝑖=1𝑛(𝑥𝑖-𝑥)2,𝑎^=𝑦−𝑏^𝑥.思考对已知的两个变量的一组数据如何做回归分析?第八单元考点一考点二核心素养专项提升核心素养专项提升-21-考点1考点2考点3解:(1)由条件可知,𝑥=15∑𝑖=15xi=5405=108,y=15∑i=15yi=4205=84,∑𝑖=15(xi-𝑥)(yi-𝑦)=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144,∑𝑖=15(xi-𝑥)2=(-8)2+(-6)2+02+62+82=200,𝑏^=∑𝑖=15(𝑥𝑖-𝑥)(𝑦𝑖-𝑦)∑𝑖=15(𝑥𝑖-𝑥)2=144200=0.72,𝑎

1 / 37
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功