专题10.2统计案例题型一相关关系与相关系数题型二回归直线方程与样本中心题型三线性回归方程题型四非线性回归方程题型五误差分析题型六独立性检验题型一相关关系与相关系数例1.(2022春·河南省直辖县级单位·高一济源高中校考期末)下列两个变量具有相关关系的是()A.正方形的边长与面积B.匀速行驶的车辆的行驶距离与时间C.人的身高与视力D.人的身高与体重例2.(2023春·河南濮阳·高二统考期末)某公司对其产品研发的年投资额x(单位:百万元)与其年销售量y(单位:千件)的数据进行统计,整理后得到如下统计表;x12345y1.523.5815(1)求变量x和y的样本相关系数r(精确到0.01),并推断变量x和y的线性相关程度;(参考;若0.75r,则线性相关性程度很强;若0.300.75r,则线性相关性程度一般,若0.25r,则线性相关性程度很弱.)(2)求年销售量y关于年投资额x的经验回归方程.参考公式:样本相关系数112222221111nniiiiiinnnniiiiiiiixxyyxynxyrxxyyxnxyny;经验回归方程ˆˆˆybxa中1122211ˆˆˆ,nniiiiiinniiiixxyyxynxybaybxxxxnx;参考数据517.14练习1.(2023春·山东·高三济南市章丘区第四中学校联考阶段练习)(多选)在以下4幅散点图中,所对应的成对样本数据呈现出线性相关关系的是()A.B.C.D.练习2.(2023秋·高三课时练习)相关系数r是衡量两变量之间的线性相关程度的,对此有下列说法:①r越接近于1,相关程度越大;②r越接近于0,相关程度越小;③r越接近于1,相关程度越小;④r越接近于0,相关程度越大.其中正确的是()A.①②B.②④C.②③D.①④练习3.(2023春·江苏常州·高三常州高级中学校考阶段练习)(多选)某学校一名同学研究温差x℃与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据:x568912y1720252835经过拟合,发现基本符合经验回归方程2.6yxa,则下列说法正确的有()参考公式:相关系数公式12211niiinniiiixxyyrxxyyA.样本中心点为8,25B.4.2aC.当5x时,残差为0.2D.若去掉样本点8,25,则样本的相关系数r增大练习4.(2023春·全国·高三卫辉一中校联考阶段练习)(多选)沃柑,因其口感甜柔、低酸爽口,且营养成分高,成为大家喜欢的水果之一,目前主要种植于我国广西、云南、四川、湖南等地.得益于物流的快速发展,沃柑的销量大幅增长,同时刺激了当地农民种植沃柑的热情.根据对广西某地的沃柑种植面积情况进行调查,得到统计表如下:年份t20182019202020212022年份代码x12345种植面积y/万亩814152028附:①样本相关系数12211niiinniiiixxyyrxxyy;②ybxa$$$为经验回归方程,1122211nniiiiiinniiiixxyyxynxybxxxnx,aybx$$,224047.33.根据上表,下列结论正确的是()A.该地区这5年沃柑的种植面积的方差为212B.种植面积y与年份代码x的样本相关系数约为0.972(精确到0.001)C.y关于x的经验回归方程为4.63.2yxD.预测该地区沃柑种植面积最早在2027年能突破40万亩练习5.(2023春·重庆沙坪坝·高三重庆一中校考期中)根据国家统计局统计,我国2018—2022年的新生儿数量如下:年份编号x12345年份20182019202020212022新生儿数量y(单位:万人)1523146512001062956(1)由表中数据可以看出,可用线性回归模型拟合新生儿数量y与年份编号x的关系,请用相关系数r说明相关关系的强弱;(0.751r,则认为y与x线性相关性很强)(2)建立y关于x的回归方程,并预测我国2025年的新生儿数量.参考公式及数据:𝑟=∑𝑥𝑖𝑦𝑖−𝑛𝑥̅⋅𝑦̅𝑛𝑖=1√(∑𝑥𝑖2−𝑛𝑥̅2𝑛𝑖=1)(∑𝑦𝑖2−𝑛𝑦̅2𝑛𝑖=1),𝑏̂=∑𝑥𝑖𝑦𝑖−𝑛𝑥̅⋅𝑦̅𝑛𝑖=1∑𝑥𝑖2−𝑛𝑥̅2𝑛𝑖=1,𝑎̂=𝑦̅−𝑏̂𝑥̅,∑𝑦𝑖=6206,5𝑖=1∑𝑦𝑖=5𝑖=16206, ∑𝑥𝑖𝑦𝑖−5𝑥̅⋅𝑦̅=−15375𝑖=1, √(∑𝑥𝑖2−5𝑥̅25𝑖=1)(∑𝑦𝑖2−5𝑦̅25𝑖=1)≈1564.题型二回归直线方程与样本中心例3.(2023春·上海宝山·高二上海市行知中学校考期中)已知x,y的对应值如下表所示:x02468y11m21m33m13若y与x线性相关,且回归直线方程为1.20.2yx,则m______.例4.(2023春·湖北武汉·高二武钢三中校考阶段练习)已知由样本数据点集合{,|1,2,,}iixyin,求得的回归直线方程为1.50.5yx,且3x,现发现两个数据点1.2,2.2和4.8,7.8误差较大,去除后重新求得的回归直线l的斜率为1.2,则去除后当4x时,y的估计值为__________.练习6.(2023·上海奉贤·校考模拟预测)已知一组成对数据18,24,13,34,10,38,1,m的回归方程为259.5yx,则该组数据的相关系数r__________(精确到0.001).练习7.(2023春·山东聊城·高三山东聊城一中校联考阶段练习)为研究变量,xy的相关关系,收集得到如下数据:x56789y98643若由最小二乘法求得y关于x的经验回归方程为1.6axy,则据此计算残差为0的样本点是()A.5,9B.6,8C.7,6D.8,4练习8.(2023春·江苏连云港·高三校考阶段练习)某人工智能公司近5年的利润情况如下表所示:第x年12345利润y/亿元23457已知变量y与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为1.2yxa,预测该人工智能公司第6年的利润约为____亿元.练习9.(2023春·山东青岛·高三青岛市即墨区第一中学统考期中)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,据统计得出了昼夜温差x(℃)与实验室种子浸泡后的发芽数y(颗)之间的线性回归方程:ˆ2.1yxa,且对应数据如下表:温差x(℃)12345发芽数y/颗3781012如果昼夜温差为13℃时,那么种子的发芽数大约是()A.20颗B.29颗C.30颗D.36颗练习10.(2023春·江苏淮安·高三淮阴中学校联考阶段练习)用模型ebxya拟合一组数据组,1,2,,7iixyi,其中1276xxx.设lnzy,变换后的线性回归方程为ˆ5zx,则127yyy_________.题型三线性回归方程例5.(2023春·重庆北碚·高三重庆市兼善中学校考阶段练习)近年来随着教育科研的不断进步,兼善中学教育质量不断提高,某知名机构对近年来升入北京航天航空大学兼善学子人数作了如下统计年份20182019202020212022时间代号t12345人数y(人)567810附:回归方程ˆˆˆybta中,1221,ˆˆˆniiiniityntybaybttnt.(1)求y关于t的回归方程ˆˆˆybta;(2)用所求回归方程预测兼善中学2023年(t=6)升入北航的人数例6.(2023春·陕西延安·高二陕西延安中学校考期中)某校在一次强基计划模拟考试后,从全体考生中随机抽取52名,获取他们本次考试的数学成绩(x)和物理成绩(y),绘制成如图散点图:根据散点图可以看出y与x之间有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于重感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据作处理,得到一些统计的值:5015800iix,5013900iiy,501462770iiixy,5021()28540iixx,5021()18930iiyy,其中ix,iy分别表示这50名考生的数学成绩、物理成绩,1i,2,…,50,y与x的相关系数0.45r.(1)若不剔除A,B两名考生的数据,用52组数据作回归分析,设此时y与x的相关系数为r0.试判断r0与r的大小关系(不必说明理由);(2)求y关于x的线性回归方程(系数精确到0.01),并估计如果B考生加了这次物理考试(已知B考生的数学成绩为125分),物理成绩是多少?(精确到0.1)附:线性回归方程中ˆˆˆyabx中:121()()ˆ()niiiniixxyybxx,ˆˆaybx.练习11.(2023·安徽亳州·蒙城第一中学校联考模拟预测)为调查某地区植被覆盖面积x(单位:公顷)和野生动物数量y的关系,某研究小组将该地区等面积花分为400个区块,从中随机抽取40个区块,得到样本数据,iixy(1,2,,40i),部分数据如下:x…2.73.63.23.9…y…50.663.752.154.3…经计算得:401160iix,4012400iiy,4021160iixx,4011280iiixxyy.(1)利用最小二乘估计建立y关于x的线性回归方程;(2)该小组又利用这组数据建立了x关于y的线性回归方程,并把这两条拟合直线画在同一坐标系xOy下,横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致.设前者与后者的斜率分别为1k,2k,比较1k,2k的大小关系,并证明.附:y关于x的回归方程yabx中,斜率和截距的最小二乘估计公式分别为:1221ˆniiiniixynxybxnx,aybx$$,1222211niiinniiiixynxyrxnxyny练习12.(2023春·陕西宝鸡·高三眉县中学校考阶段练习)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若0.75r,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式212222221111nniiiiiinnnniiiiiiiixxyyxynxyrxxyyxnxyny,回归方程ˆˆˆybxa中斜率和截距的最小二乘估计公式分别为:111222111ˆnniiiiinniiixxyyxynxybxxxnx,aybx.练习13.(2023春·贵州黔东南·高三校考阶段练习)随着农村电子商务体系和快递物流配送体系加快贯通,以及内容电商、直播电商等模式不断创新落地,农村电商呈现高速发展的态势,下表为2017-2022年中国农村网络零售额规模(单位:千亿元),其中2017-2022年对应的代码分别为1~6.年份代码x123456农村网络零售额y12.513.717.118.020.523.02(1)根据2017-2021年的数据求农村网络零售额规模关于年度代码x的线性回归方程ˆˆybxa(ˆa,ˆb的值精确到0.01);(2)若由回归方程得到的