试卷第1页,总6页线性回归方程——非线性方程转化为线性方程例1.(2015·高考全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的宣传费𝑥𝑖和年销售量𝑦𝑖(𝑖=1,2,⋯,8)数据作了初步处理,得到下面的散点图及一些统计量的值.𝑥̅𝑦̅𝑤̅46.65636.8289.81.61469108.8表中𝑤𝑖=√𝑥𝑖,𝑤̅=18∑𝑤𝑖8𝑖=1.(I)根据散点图判断,𝑦=𝑎+𝑏𝑥与𝑦=𝑐+𝑑√𝑥,哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由);(II)根据(I)的判断结果及表中数据,建立y关于x的回归方程;(III)已知这种产品的年利润z与x,y的关系为𝑧=0.2𝑦−𝑥,根据(II)的结果回答下列问题:(i)年宣传费𝑥=49时,年销售量及年利润的预报值是多少?(ii)年宣传费𝑥为何值时,年利润的预报值最大?附:对于一组数据(𝑢1,𝑣1),(𝑢2,𝑣2),…,(𝑢𝑛,𝑣𝑛),其回归直线𝑣=𝛼+𝛽𝑢的斜率和截距的最小二乘估计分别为:𝛽̂=∑(𝑢𝑖−𝑢)(𝑣𝑖−𝑣)𝑛𝑖=1∑(𝑢𝑖−𝑢)2𝑛𝑖=1,𝛼̂=𝑣−𝛽̂𝑢.【答案】(Ⅰ)𝑦=𝑐+𝑑√𝑥适宜作为年销售量𝑦关于年宣传费𝑥的回归方程类型;(Ⅱ)𝑦̂=100.6+68√𝑥;(Ⅲ)(i)答案见解析;(ii)46.24千元.【解析】(I)由散点图可以判断,𝑦=𝑐+𝑑√𝑥适宜作为年销售量𝑦关于年宣传费𝑥的回归方程类型.(II)令𝑤=√𝑥,先建立𝑦关于𝑤的线性回归方程,由于𝑑̂=∑(𝑤𝑖−𝑤)(𝑦𝑖−𝑦)8𝑖=1∑(𝑤𝑖−𝑤)28𝑖=1=108.81.6=68,∴𝑐̂=𝑦−𝑑̂𝑤=563−68×6.8=100.6,∴𝑦关于𝑤的线性回归方程为𝑦̂=100.6+68𝑤,因此𝑦关于𝑥的回归方程为𝑦̂=100.6+68√𝑥.(III)(ⅰ)由(II)知,当𝑥=49时,年销售量𝑦的预报值𝑦̂=100.6+68√49=576.6,年利润z的预报值为𝑧̂=576.6×0.2−49=66.32.(ⅱ)根据(II)的结果知,年利润z的预报值𝑧̂=0.2(100.6+68√𝑥)−𝑥=−𝑥+13.6√𝑥+20.12,所以当√𝑥=13.62=6.8,即𝑥=46.24时,𝑧̂取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.试卷第2页,总6页例2.某地级市共有200000中小学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元。经济学家调查发现,当地人均可支配年收入较上一年每增加𝑛%,一般困难的学生中有3𝑛%会脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生中有2𝑛%转为一般困难,特别困难的学生中有𝑛%转为很困难。现统计了该地级市2013年到2017年共5年的人均可支配年收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份𝑥取13时代表2013年,𝑥与𝑦(万元)近似满足关系式𝑦=𝐶1⋅2𝐶2𝑥,其中𝐶1,𝐶2为常数。(2013年至2019年该市中学生人数大致保持不变)其中𝑘𝑖=log2𝑦𝑖,𝑘̅=15∑5𝑖=1𝑘𝑖(Ⅰ)估计该市2018年人均可支配年收入;(Ⅱ)求该市2018年的“专项教育基金”的财政预算大约为多少?附:对于一组具有线性相关关系的数据(𝑢1,𝑣1),(𝑢2,𝑣2),⋯,(𝑢𝑛,𝑣𝑛),其回归直线方程𝑣=𝛽𝑢+𝛼的斜率和截距的最小二乘估计分别为𝛽̂=∑𝑛𝑖=1(𝑢𝑖−𝑢̅)(𝑣𝑖−𝑣̅)∑𝑛𝑖=1(𝑢𝑖−𝑢̅)2,𝛼̂=𝑣̅−𝛽̂𝑢̅.【答案】(Ⅰ)2.8(万);(Ⅱ)1624万.【详解】(Ⅰ)因为𝑥̅=15(13+14+15+16+17)=15,所以∑5𝑖=1(𝑥𝑖−𝑥̅)2=(−2)2+(−1)2+12+22=10.由𝑘=log2𝑦得𝑘=log2𝐶1+𝐶2𝑥,所以𝐶2=∑5𝑖=1(𝑥𝑖−𝑥̅)(𝑘𝑖−𝑘̅)∑5𝑖=1(𝑥𝑖−𝑥̅)2=110,log2𝐶1=𝑘̅−𝐶2𝑥̅=1.2−110×15=−0.3,所以𝐶1=2−0.3=0.8,所以𝑦=0.8×2𝑥10.当𝑥=18时,2018年人均可支配年收入𝑦=0.8×21.8=0.8×3.5=2.8(万)(Ⅱ)由题意知2017年时该市享受“国家精准扶贫”政策的学生共200000×7%=14000人一般困难、很困难、特别困难的中学生依次有7000人、4200人、2800人,2018年人均可支配收入比2017年增长0.8×21.8−0.8×21.70.8×21.7=20.1−1=0.1=10%所以2018年该市特别困难的中学生有2800×(1-10%)=2520人,很困难的学生有4200×(1-20%)+2800×10%=3640人一般困难的学生有7000×(1-30%)+4200×20%=5740人.所以2018年的“专项教育基金”的财政预算大约为5740×1000+3640×1500+2520×2000=1624万.试卷第3页,总6页例3.近期,某公交公司分别推出支付宝和徽信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表l所示:表1根据以上数据,绘制了如右图所示的散点图.(1)根据散点图判断,在推广期内,𝑦=𝑎+𝑏𝑥与𝑦=𝑐⋅𝑑𝑥(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表1中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次;参考数据:其中𝜐𝑖=1𝑔𝑦𝑖,𝜐=17∑𝜐𝑖7𝑖=1参考公式:对于一组数据(𝑢1,𝜐1),(𝑢2,𝜐2),⋅⋅⋅,(𝑢𝑛,𝜐𝑛),其回归直线𝜐̂=𝑎̂+𝛽̂𝑢的斜率和截距的最小二乘估计公式分别为:𝛽̂=∑𝑢𝑖𝜐𝑖−𝑛𝑢𝜐𝑛𝑖=1∑𝑢𝑖2−𝑛𝑢2𝑛𝑖=1,𝑎̂=𝜐−𝛽̂𝑢̂.【答案】(1)𝑦=𝑐⋅𝑑𝑥(2)3470【详解】(1)根据散点图判断,𝑦=𝑐⋅𝑑𝑥适宜作为扫码支付的人数𝑦关于活动推出天数𝑥的回归方程类型;(2)∵𝑦=𝑐⋅𝑑𝑥,两边同时取常用对数得:1𝑔𝑦=1𝑔(𝑐⋅𝑑𝑥)=1𝑔𝑐+1𝑔𝑑⋅𝑥;设1𝑔𝑦=𝑣,∴𝑣=1𝑔𝑐+1𝑔𝑑⋅𝑥∵𝑥=4,𝑣=1.54,∑𝑥𝑖27𝑖=1=140,∴l𝑔̂𝑑=∑𝑥𝑖𝑣𝑖7𝑖=1−7𝑥𝑣∑𝑥𝑖2−7𝑥27𝑖=1=50.12−7×4×1.54140−7×42=728=0.25,把样本中心点(4,1.54)代入𝑣=1𝑔𝑐+1𝑔𝑑⋅𝑥,得:l𝑔̂𝑐=0.54,∴𝑣̂=0.54+0.25𝑥,∴l𝑔̂𝑦=0.54+0.25𝑥,∴𝑦关于𝑥的回归方程式:𝑦̂=100.54+0.25𝑥=100.54×(100.25)𝑥=3.47×100.25𝑥;把𝑥=8代入上式,𝑦̂=3.47×102=347;活动推出第8天使用扫码支付的人次为3470;试卷第4页,总6页例4.近年来,随着我国汽车消费水平的提高,二手车流通行业得到迅猛发展.某汽车交易市场对2017年成交的二手车交易前的使用时间(以下简称“使用时间”)进行统计,得到频率分布直方图如图1.图1图2(1)记“在2017年成交的二手车中随机选取一辆,该车的使用年限在(8 , 16]”为事件𝐴,试估计𝐴的概率;(2)根据该汽车交易市场的历史资料,得到散点图如图2,其中𝑥(单位:年)表示二手车的使用时间,𝑦(单位:万元)表示相应的二手车的平均交易价格.由散点图看出,可采用𝑦=e𝑎+𝑏𝑥作为二手车平均交易价格𝑦关于其使用年限𝑥的回归方程,相关数据如下表(表中𝑌𝑖=ln𝑦𝑖,𝑌=110∑𝑌𝑖10𝑖=1):①根据回归方程类型及表中数据,建立𝑦关于𝑥的回归方程;②该汽车交易市场对使用8年以内(含8年)的二手车收取成交价格4%的佣金,对使用时间8年以上(不含8年)的二手车收取成交价格10%的佣金.在图1对使用时间的分组中,以各组的区间中点值代表该组的各个值.若以2017年的数据作为决策依据,计算该汽车交易市场对成交的每辆车收取的平均佣金.附注:①对于一组数据(𝑢1,𝑣1),(𝑢2,𝑣2),⋯(𝑢𝑛,𝑣𝑛),其回归直线𝑣=𝛼+𝛽𝑢的斜率和截距的最小二乘估计分别为𝛽̂=∑𝑢𝑖𝑣𝑖𝑛𝑖=1−𝑛𝑢̅ 𝑣̅∑𝑢𝑖2𝑛𝑖=1−𝑛𝑢̅2,𝛼̂=𝑣̅−𝛽̂ 𝑢̅;②参考数据:e2.95≈19.1 , e1.75≈5.75 , e0.55≈1.73 , e−0.65≈0.52 , e−1.85≈0.16.【答案】(1)0.40;(2)𝑦̂=e3.55−0.3𝑥0.29万元【详解】(1)由频率分布直方图得,该汽车交易市场2017年成交的二手车使用时间在(8,12]的频率为0.07×4=0.28,在(12,16]的频率为0.03×4=0.12,所以𝑃(𝐴)=0.28+0.12=0.40.(2)①由𝑦=𝑒𝑎+𝑏𝑥得ln𝑦=𝑎+𝑏𝑥,即𝑌关于𝑥的线性回归方程为𝑌̂=𝑎+𝑏𝑥.因为𝑏̂=∑𝑥𝑖𝑌𝑖−10𝑥̅⋅𝑌̅10𝑖=1∑𝑥𝑖2−10𝑥̅210𝑖=1=79.75−10×5.5×1.9385−10×5.52=−0.3,𝑎̂=𝑌̅−𝑏̂⋅𝑥̅=1.9−(−0.3)×5.5=3.55所以𝑌关于𝑥的线性回归方程为𝑌̂=3.55−0.3𝑥,即𝑦关于𝑥的回归方程为𝑦̂=e3.55−0.3𝑥②根据①中的回归方程𝑦̂=e3.55−0.3𝑥和图1,对成交的二手车可预测:使用时间在(0,4]的平均成交价格为e3.55−0.3×2=e2.95≈19.1,对应的频率为0.2;使用时间在(4,8]的平均成交价格为e3.55−0.3×6=e1.75≈5.75,对应的频率为0.36;使用时间在(8,12]的平均成交价格为e3.55−0.3×10=e0.55≈1.73,对应的频率为0.28;试卷第5页,总6页使用时间在(12,16]的平均成交价格为e3.55−0.3×14=e−0.65≈0.52,对应的频率为0.12;使用时间在(16,20]的平均成交价格为e3.55−0.3×18=e−1.85≈0.16,对应的频率为0.04所以该汽车交易市场对于成交的每辆车可获得的平均佣金为(0.2×19.1+0.36×5.75)×4%+(0.28×1.73+0.12×0.52+0.04×0.16)×10%=0.29092≈0.29万元试卷第6页,总6页例5.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的数据作了初步处理,得到下面的散点图及一些统计量的