课时跟踪检测(五十二)变量间的相关性与统计案例一、综合练——练思维敏锐度1.(2020·全国卷Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx解析:选D用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应该是对数函数类型的,故应该选用的函数模型为y=a+blnx.2.(多选)(2021·济宁模拟)下列说法正确的是()A.在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越差B.某地气象局预报:6月9日本地降水概率为90%,结果这天没下雨,这表明天气预报并不科学C.回归分析模型中,残差平方和越小,说明模型的拟合效果越好D.在回归直线方程y^=0.1x+10中,当解释变量每增加1个单位时,预报变量增加0.1个单位解析:选CD对A项,在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,故A错误;对B项,概率只说明事件发生的可能性,某次事件不一定发生,所以并不能说明天气预报不科学,故B错误;对C项,在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,故C正确;对D项,在回归直线方程y^=0.1x+10中,当解释变量x每增加1个单位时,预报变量y^增加0.1个单位,故D正确,故选C、D.3.某模具厂采用了新工艺后,原材料支出费用x与销售额y(单位:万元)之间有如下数据,由散点图可知,销售额y与原材料支出费用x有较好的线性相关关系,其线性回归方程是y^=b^x+48,则当原材料支出费用为40时,预估销售额为()x1015202530y110125160185220A.252B.268C.272D.288解析:选C由题意得x=20,y=160,将点()x,y代入回归方程y^=b^x+48中,得b^=5.6,∴回归方程为y^=5.6x+48,∴当x=40时,y^=272,故选C.4.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线总计愿生452065不愿生132235总计5842100计算得,K2≈9.616.参照下表,P(K2≥k0)0.0500.0100.001k03.8416.63510.828下列结论正确的是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过5%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”解析:选C因为K2≈9.6166.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.5.(多选)我国5G技术研发试验在2016~2018年进行,分为5G关键技术试验、5G技术方案验证和5G系统验证三个阶段.2020年初以来,5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升.某手机商城统计了近5个月来5G手机的实际销量,如下表所示:月份2020年8月2020年9月2020年10月2020年11月2020年12月月份编号x12345销量y/部5096a185227若y与x线性相关,且求得线性回归方程为y^=45x+5,则下列说法正确的是()A.a=142B.y与x正相关C.y与x的相关系数为负数D.2021年2月该手机商城的5G手机销量约为365部解析:选ABx=1+2+3+4+55=3,y=50+96+a+185+2275=558+a5,因为点(x,y)在回归直线上,所以558+a5=45×3+5,解得a=142,所以选项A正确;从表格数据看,y随x的增大而增大,所以y与x正相关,所以选项B正确;因为y与x正相关,所以y与x的相关系数为正数,所以选项C错误;2021年2月对应的月份编号x=7,当x=7时,y^=45×7+5=320,所以2021年2月该手机商城的5G手机销量约为320部,所以选项D错误.故选A、B.6.(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:夜晚天气日落云里走下雨未下雨出现255未出现2545临界值表P(K2≥k0)0.100.050.0100.001k02.7063.8416.63510.828并计算得到K2≈19.05,下列小波对地区A天气判断正确的是()A.夜晚下雨的概率约为12B.未出现“日落云里走”夜晚下雨的概率约为514C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨解析:选D由题意,把频率看作概率可得夜晚下雨的概率约为25+25100=12,故A判断正确;未出现“日落云里走”,夜晚下雨的概率约为2525+45=514,故B判断正确;由K2≈19.0510.828,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C判断正确,D判断错误,故选D.7.为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y与x的回归直线方程为y^=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,则年教育支出平均增加________万元.解析:因为回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.答案:0.158.心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)几何题代数题总计男同学22830女同学81220总计302050根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过________.附表:P(K2≥k0)0.100.050.0250.0100.001k02.7063.8415.0246.63510.828解析:由列联表计算K2的观测值k=50×22×12-8×8230×20×20×30≈5.5565.024.∴推断犯错误的概率不超过0.025.答案:0.0259.(2021·甘肃兰州一诊)近五年来某草场羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:年份12345羊只数量/万只1.40.90.750.60.3草地植被指数1.14.315.631.349.7根据表及图得到以下判断:①羊只数量与草地植被指数成减函数关系;②若利用这五组数据得到的两变量间的相关系数为r1,去掉第一年数据后得到的相关系数为r2,则|r1|<|r2|;③可以利用回归直线方程,准确地得到当羊只数量为2万只时的草地植被指数.以上判断中正确的个数是________.解析:对于①,羊只数量与草地植被指数成负相关关系,不是减函数关系,所以①错误;对于②,用这五组数据得到的两变量间的相关系数为r1,因为第一年数据(1.4,1.1)是离群值,去掉后得到的相关系数为r2,其相关性更强,所以|r1|<|r2|,②正确;对于③,利用回归直线方程,不能准确得到当羊只数量为2万只时的草地植被指数,得到的只是预测值,所以③错误.综上知,正确的判断序号是②,共1个.答案:110.(2021·佛山质检)“学习强国”APP是由中宣部主管以习近平新时代中国特色社会主义思想和党的十九大精神为主要内容的“PC端+手机客户端”两大终端二合一模式的学习平台,2019年1月1日上线后便成了党员干部群众学习的“新助手”,为了调研某地党员在“学习强国”APP的学习情况,研究人员随机抽取了200名该地党员进行调查,将他们某两天在“学习强国”APP上所得的分数统计如表(1)所示:表(1)分数[60,70)[70,80)[80,90)[90,100]人数501002030(1)现用分层抽样的方法从80分及以上的党员中随机抽取5人,再从抽取的5人中随机选取2人作为学习小组长,求所选取的两位小组长的分数都在[]90,100上的概率;(2)为了调查“学习强国”APP得分情况是否受到所在单位的影响,研究人员随机抽取了机关事业单位党员以及国有企业党员作出调查,得到的数据如表()2所示:表(2)机关事业单位党员国有企业党员分数超过80220150分数不超过808050判断是否有99%的把握认为“学习强国”APP得分情况受所在单位的影响.附:K2=n()ad-bc2()a+b()c+d()a+c()b+d,n=a+b+c+d.P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828解:(1)由题意得,分数在[)80,90上抽取2人,记为a,b;分数在[]90,100上抽取3人,记为A,B,C.选取2人作为学习小组长的基本事件有10个,即(a,b),(a,A),(a,B),(a,C),(b,A),(b,B),(b,C),(A,B),(A,C),(B,C),其中两位小组长的分数都在[]90,100上的有(A,B),(A,C),(B,C)共3个基本事件,∴所求概率P=310.(2)完善表格如下:机关事业单位党员国有企业党员总计分数超过80220150370分数不超过808050130总计300200500K2=500×220×50-150×802300×200×130×370≈0.1736.635,故没有99%的把握认为“学习强国”APP得分情况受所在单位的影响.11.一汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销售量之间的关系进行分析研究并做了记录,得到如下资料:日期第一年第二年第三年第四年优惠金额x/千元10111312销售量y/辆22243127(1)求出y关于x的线性回归方程y^=b^x+a^;(2)若第5年优惠金额8.5千元,估计第5年的销售量y(辆)的值.参考公式:b^=∑ni=1xiyi-nxy∑ni=1x2i-nx2,a^=y-b^x.解:(1)由题中数据可得x=11.5,y=26,∑4i=1xiyi=1211,∑4i=1x2i=534,∴b^=∑4i=1xiyi-4xy∑4i=1x2i-4x2=1211-4×11.5×26534-4×11.52=155=3,故a^=y-b^x=26-3×11.5=-8.5,∴y关于x的线性回归方程为y^=3x-8.5.(2)由(1)得,当x=8.5时,y^=17,∴第5年优惠金额为8.5千元时,销售量估计为17辆.二、自选练——练高考区分度某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xywi=18(xi-x)2i=18(wi-w)2i=18(xi-x)·(yi-y)i=18(wi-w)·(yi-y)46.65636.8289.81.61469108.8表中wi=xi,w=18i=18wi.(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的