31回归分析的基本思想及其初步应用学案(选修2-3)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

3.1回归分析的基本思想及其初步应用问题导学一、求线性回归方程活动与探究1某工厂1~8月份某种产品的产量与成本的统计数据见下表:月份12345678产量(吨)5.66.06.16.47.07.58.08.2成本(万元)130136143149157172183188以产量为x,成本为y.(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程.迁移与应用1.(2013海南海口模拟)在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为()A.y^=x+1B.y^=x+2C.y^=2x+1D.y^=x-12.某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:x35404550y56412811(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程.(方程的斜率精确到个位)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.二、线性回归分析活动与探究2某运动员训练次数与运动成绩之间的数据关系如下:次数(x)3033353739444650成绩(y)3034373942464851(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算R2,并说明其含义.迁移与应用1.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元2.在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:x(元)1416182022y(件)1210753且知x与y具有线性相关关系,求出y对x的回归直线方程,并说明拟合效果的好坏.“相关指数R2、残差图”在回归分析中的作用:(1)相关指数R2是用来刻画回归效果的,由R2=1-i=1nyi-y^i2i=1nyi-y2可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.三、非线性回归分析活动与探究3下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.迁移与应用1.在彩色显影中,由经验知形成染料光学密度y与析出银的光学密度x由公式y=ebxA(b<0)表示,现测得试验数据如下:xi0.050.060.250.310.070.100.380.430.140.200.47yi0.100.141.001.120.230.371.191.250.590.791.29则y对x的回归方程是__________.2.在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521试建立y与x之间的回归方程.非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.答案:课前·预习导学【预习导引】1.(1)确定性非确定性(2)相关(3)i=1n(xi-x)(yi-y)i=1n(xi-x)2=1221niiiniixynxyxnxy-b^x样本点的中心(4)随机误差解释变量预报变量预习交流1D2.yi-bxi-ayi-y^iyi-b^xi-a^3.1-i=1n(yi-y^i)2i=1n(yi-y)2解释变量预报变量1预习交流2提示:散点图可以说明变量间有无线性相关关系,只能粗略地说明两个变量之间关系的密切程度,而相关指数R2能精确地描述两个变量之间的密切程度.预习交流3提示:(1)回归方程只适用于所研究的样本的总体.(2)所建立的回归方程一般都有时间性.(3)样本的取值范围会影响回归方程的适用范围.(4)不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.课堂·合作探究【问题导学】活动与探究1思路分析:画出散点图,观察图形的形状得x与y是否具有线性相关关系.把数值代入回归系数公式求回归方程.解:(1)由表画出散点图,如图所示.(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表.序号xiyixi2yi2xiyi15.613031.3616900728.026.013636.0018496816.036.114337.2120449872.346.414940.9622201953.657.015749.00246491099.067.517256.25295841290.078.018364.00334891464.088.2[18867.24353441541.6∑54.81258382.022011128764.5x=6.85,y=157.25.∴b^=81822188iiiiixyxyxx=8764.5-8×6.85×157.25382.02-8×6.852≈22.17,a^=y-b^x=157.25-22.17×6.85≈5.39,故线性回归方程为y^=22.17x+5.39.迁移与应用1.A解析:方法一:x=1+2+3+44=52,y=2+3+4+54=72.故b^=1-522-72+2-523-72+3-524-72+4-525-721-522+2-522+3-522+4-522=322+122+122+322322+122+122+322=1,a^=y-b^x=72-52=1.因此,y^=x+1,故选A.方法二:也可由回归直线方程一定过点(x,y),即52,72,代入验证可排除B,C,D.故应选A.2.解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为y^=b^x+a^,由题知x=42.5,y=34,则求得b^=i=14(xi-x)(yi-y)i=14(xi-x)2=-370125≈-3.a^=y-b^x=34-(-3)×42.5=161.5.∴y^=-3x+161.5.(2)依题意有P=(-3x+161.5)(x-30)=-3x2+251.5x-4845=-3x-251.562+251.5212-4845.∴当x=251.56≈42时,P有最大值,约为426.即预测销售单价为42元时,能获得最大日销售利润.活动与探究2思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合的效果和R2的含义.解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)x=39.25,y=40.875,i=18x2i=12656,i=18y2i=13731,i=18xiyi=13180,∴b^=i=18(xi-x)(yi-y)i=18(xi-x)2=i=18xiyi-8xyi=18x2i-8x2≈1.0415,a^=y-b^x=-0.003875,∴线性回归方程为y^=1.0415x-0.003875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算得相关指数R2≈0.9855,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.迁移与应用1.B解析:∵a^=y-b^x=49+26+39+544-9.4×4+2+3+54=9.1,∴回归方程为y^=9.4x+9.1.令x=6,得y^=9.4×6+9.1=65.5(万元).2.解:x=15×(14+16+18+20+22)=18,y=15×(12+10+7+5+3)=7.4,521iix=142+162+182+202+222=1660,521iiy=122+102+72+52+32=327,i=15xiyi=14×12+16×10+18×7+20×5+22×3=620,∴b^=51522155iiiiixyxyxx=620-5×18×7.41660-5×182=-4640=-1.15.∴a^=7.4+1.15×18=28.1,∴回归直线方程为y^=-1.15x+28.1.列出残差表为:yi-y^i00.3-0.4-0.10.2yi-y4.62.6-0.4-2.4-4.4∴i=15(yi-y^i)2=0.3,i=15(yi-y)2=53.2,R2=1-i=15(yi-y^i)2i=15(yi-y)2≈0.994.故R2≈0.994说明拟合效果较好.活动与探究3思路分析:先由数值表作出散点图,然后根据散点的形状模拟出近似函数,进而转化为线性函数,由数值表求出回归函数.解:(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线21ecxyc的周围,其中c1,c2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z=lny,则有变换后的样本点应分布在直线z=bx+a,a=lnc1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为z^=0.272x-3.849,∴y^=e0.272x-3.849.残差yi711212466115325y^i6.44311.10119.12532.95056.770128.381290.325e^i0.557-0.1011.875-8.9509.23-13.38134.675(3)当x=40时,y=e0.272x-3.849≈1131.迁移与应用1.0.151.73exy解析:由题给的经验公式y=ebxA,两边取自然对数,便得lny=lnA+bx.与线性回归直线方程相对照,只要取u=1x,v=lny,a=lnA,就有v=a+bu,这是v对u的线性回归方程.对此我们已经掌握了一套相关性检验,求a与回归系数b的方法.题目所给数据经变量置换u=1x,v=lny变成如下表所示的数据:ui20.00016.6674.0003.22614.28610.000vi-2.303-1.96600.113-1.470-0.994ui2.6322.3267.1435.0002.128vi0.1740.223-0.528-0.2360.255|r|≈0.998>0.75,故v与u之间具有很强的线性相关关系,求回归直线方程是有意义的.由表中数据可得b^≈-0.15,a^≈0.55,即v^=0.55-0.15u.把u与v换回原来的变量x与y,即u=1x,v=lny,故lny^=0.55-0.15x,即y^=0.150.55ex=e0.550.15ex≈0.151.7

1 / 10
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功