专题10.2统计案例题型一相关关系与相关系数题型二回归直线方程与样本中心题型三线性回归方程题型四非线性回归方程题型五误差分析题型六独立性检验题型一相关关系与相关系数例1.(2022春·河南省直辖县级单位·高一济源高中校考期末)下列两个变量具有相关关系的是()A.正方形的边长与面积B.匀速行驶的车辆的行驶距离与时间C.人的身高与视力D.人的身高与体重【答案】D【分析】根据函数关系及相关关系的定义判断即可.【详解】对于A,由正方形的面积S与边长a的公式知2Sa,即正方形的边长与面积具有函数关系,故A错误;对于B,匀速行驶车辆的行驶距离S与时间t为Svt,其中v为匀速行驶的速度,即匀速行驶的车辆的行驶距离与时间具有函数关系,故B错误;对于C,人的身高与视力无任何关系,故C错误;对于D,人的身高会影响体重,但不是唯一因素,即人的身高与体重具有相关关系,故D正确.故选:D.例2.(2023春·河南濮阳·高二统考期末)某公司对其产品研发的年投资额x(单位:百万元)与其年销售量y(单位:千件)的数据进行统计,整理后得到如下统计表;x12345y1.523.5815(1)求变量x和y的样本相关系数r(精确到0.01),并推断变量x和y的线性相关程度;(参考;若0.75r,则线性相关性程度很强;若0.300.75r,则线性相关性程度一般,若0.25r,则线性相关性程度很弱.)(2)求年销售量y关于年投资额x的经验回归方程.参考公式:样本相关系数112222221111nniiiiiinnnniiiiiiiixxyyxynxyrxxyyxnxyny;经验回归方程ˆˆˆybxa中1122211ˆˆˆ,nniiiiiinniiiixxyyxynxybaybxxxxnx;参考数据517.14【答案】(1)0.92,变量x和y线性相关性程度很强(2)ˆ3.33.9yx【分析】(1)根据公式求出相关系数约等于0.92,从而得到答案;(2)根据公式计算出ˆ3.3b,ˆ3.9a,得到答案.【详解】(1)由题意,3,6xy,因为5552211155,307.5,123iiiiiiixyxy,所以5155222211555iiiiiiixyxyrxxyy123536330.925559307.5536551因为0.75r,所以变量x和y线性相关性程度很强.(2)51522215123536ˆ3.355535iiiiixyxybxx根据ˆˆaybx得,ˆ63.333.9a所以年销售量y关于年投资额x的经验回归方程为ˆ3.33.9yx.练习1.(2023春·山东·高三济南市章丘区第四中学校联考阶段练习)(多选)在以下4幅散点图中,所对应的成对样本数据呈现出线性相关关系的是()A.B.C.D.【答案】AB【分析】根据数据点的分布情况直观判断是否有线性相关关系即可.【详解】A、B中各点都有线性拟合趋势,其中A样本数据正相关,B样本数据负相关;C中各点有非线性拟合趋势,D中各点分布比较分散,它们不具有线性相关.故选:AB练习2.(2023秋·高三课时练习)相关系数r是衡量两变量之间的线性相关程度的,对此有下列说法:①r越接近于1,相关程度越大;②r越接近于0,相关程度越小;③r越接近于1,相关程度越小;④r越接近于0,相关程度越大.其中正确的是()A.①②B.②④C.②③D.①④【答案】A【分析】根据相关系数的性质可得结论.【详解】由相关系数性质:r越接近于1,成对样本数据的线性相关程度越强,r越接近于0,成对样本数据的线性相关程度越弱,可知①②正确;故选:A.练习3.(2023春·江苏常州·高三常州高级中学校考阶段练习)(多选)某学校一名同学研究温差x℃与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据:x568912y1720252835经过拟合,发现基本符合经验回归方程2.6yxa,则下列说法正确的有()参考公式:相关系数公式12211niiinniiiixxyyrxxyyA.样本中心点为8,25B.4.2aC.当5x时,残差为0.2D.若去掉样本点8,25,则样本的相关系数r增大【答案】ABC【分析】根据平均数公式计算可得A正确;由ˆ2.6ayx计算可得B正确;根据残差的定义计算可得C正确;根据相关系数r的公式分析可得D不正确.【详解】56891285x,1720252835255y,所以样本中心点为8,25,则A正确;由ˆ2.6yxa,得ˆ2.6252.684.2ayx,则B正确;由B知,2.64.2yx,当5x时,ˆ2.654.217.2y,则残差为1717.20.2,则C正确;因为38xx,325yy,30xx,30yy,所以33()()0xxyy,23()0xx,23()0yy,所以去掉样本点8,25后,相关系数r的公式中的分子、分母的大小都不变,故相关系数r的大小不变,故D不正确.故选:ABC练习4.(2023春·全国·高三卫辉一中校联考阶段练习)(多选)沃柑,因其口感甜柔、低酸爽口,且营养成分高,成为大家喜欢的水果之一,目前主要种植于我国广西、云南、四川、湖南等地.得益于物流的快速发展,沃柑的销量大幅增长,同时刺激了当地农民种植沃柑的热情.根据对广西某地的沃柑种植面积情况进行调查,得到统计表如下:年份t20182019202020212022年份代码x12345种植面积y/万亩814152028附:①样本相关系数12211niiinniiiixxyyrxxyy;②ybxa$$$为经验回归方程,1122211nniiiiiinniiiixxyyxynxybxxxnx,aybx$$,224047.33.根据上表,下列结论正确的是()A.该地区这5年沃柑的种植面积的方差为212B.种植面积y与年份代码x的样本相关系数约为0.972(精确到0.001)C.y关于x的经验回归方程为4.63.2yxD.预测该地区沃柑种植面积最早在2027年能突破40万亩【答案】BC【分析】根据样本方差、相关系数、回归方程等知识对选项进行分析,从而确定正确答案.【详解】根据题意,得1234535x,814152028175y,2222221(9)(3)(2)31144.85yS,A错误;由题意得5118214315420528301iiixy,522222211234555iix,522222218141520281669iiy,所以511522222211155515555iiiiiiiiiiiiiixxyyxyxyrxxyyxxyy3015317460.97247.33554516691445,B正确;所以551221530153174.655455iiiiixyxybxx,174.633.2aybx.所以y关于x的经验回归方程为4.63.2yx,C正确;令4.63.240yx,得8x,所以最小的整数为8,201782025,所以该地区沃柑种植面积最早在2025年能突破40万亩,D错误.故选:BC练习5.(2023春·重庆沙坪坝·高三重庆一中校考期中)根据国家统计局统计,我国2018—2022年的新生儿数量如下:年份编号x12345年份20182019202020212022新生儿数量y(单位:万人)1523146512001062956(1)由表中数据可以看出,可用线性回归模型拟合新生儿数量y与年份编号x的关系,请用相关系数r说明相关关系的强弱;(0.751r,则认为y与x线性相关性很强)(2)建立y关于x的回归方程,并预测我国2025年的新生儿数量.参考公式及数据:𝑟=∑𝑥𝑖𝑦𝑖−𝑛𝑥̅⋅𝑦̅𝑛𝑖=1√(∑𝑥𝑖2−𝑛𝑥̅2𝑛𝑖=1)(∑𝑦𝑖2−𝑛𝑦̅2𝑛𝑖=1),𝑏̂=∑𝑥𝑖𝑦𝑖−𝑛𝑥̅⋅𝑦̅𝑛𝑖=1∑𝑥𝑖2−𝑛𝑥̅2𝑛𝑖=1,𝑎̂=𝑦̅−𝑏̂𝑥̅,∑𝑦𝑖=6206,5𝑖=1∑𝑦𝑖=5𝑖=16206, ∑𝑥𝑖𝑦𝑖−5𝑥̅⋅𝑦̅=−15375𝑖=1, √(∑𝑥𝑖2−5𝑥̅25𝑖=1)(∑𝑦𝑖2−5𝑦̅25𝑖=1)≈1564.【答案】(1)答案见解析;(2)153.71702.3yx,472.7万人.【分析】(1)求出相关系数即得解;(2)利用最小二乘法求出y关于x的回归方程,再预测我国2025年的新生儿数量.【详解】(1)5155222211515370.98156455iiiiiiixyxyrxxyy,0.75r,故y与x的线性相关性很强..从而可以用线性回归模型拟合y与x的关系.(2)51111123453,62061241.2555iixyy,52222222215123455310iixx.故51522151537ˆ153.7105iiiiixyxybxx,所以ˆˆ1241.2153.731702.3aybx,所以y关于x的回归方程为153.71702.3yx,将2025年对应的年份编号8x代入回归方程得153.781702.3ˆ472.7y所以我国2025年的新生儿数量约为472.7万人.题型二回归直线方程与样本中心例3.(2023春·上海宝山·高二上海市行知中学校考期中)已知x,y的对应值如下表所示:x02468y11m21m33m13若y与x线性相关,且回归直线方程为1.20.2yx,则m______.【答案】1【分析】根据线性回归方程过样本中心点直接计算即可.【详解】根据表格可知,0246845x,1121331361955mmmmy,因为y与x线性相关,且回归直线方程为1.20.2yx,所以1.240.26195m,得61925m,解得1m.故答案为:1例4.(2023春·湖北武汉·高二武钢三中校考阶段练习)已知由样本数据点集合{,|1,2,,}iixyin,求得的回归直线方程为1.50.5yx,且3x,现发现两个数据点1.2,2.2和4.8,7.8误差较大,去除后重新求得的回归直线l的斜率为1.2,则去除后当4x时,y的估计值为__________.【答案】6.2/315【分析】根据给定条件,求出去除前后的样本中心点,求出新的回归方程即可求解作答.【详解】将3x代入ˆ1.50.5yx得5y,即样本中心点为(3,5),由数据点12,2(2)..和4.8,(7)8.知:1.24.832,2.27.852,因此去除这两个数据点后,样本中心点不变,设新的回归直线方程为1.2ˆyxb,则1.21.4byx,即新的回归直线方程为ˆ1.21.4yx,当4x时,y的估计值为6.2,所以y的估计值为6.2.故答案为:6.2.练习6.(2023·上海奉贤·校考模拟预测)已知一组成对数据18,24,13,34,10,38,1,m的回归方程为259.5yx,则该组数据的相关系