2019-2020学年高中数学 第1章 统计 1-8 最小二乘估计课件 北师大版必修3

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计第一章§8最小二乘估计自主预习学习目标目标解读1.掌握最小二乘法的思想.2.能根据给出的线性回归方程系数公式建立线性回归方程.重点:最小二乘法的思想.难点:线性回归方程系数公式的应用.1.如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.使得上式达到的直线y=a+bx就是我们所要求的直线,这种方法称为.知识梳理最小值最小二乘法问题探究1:学习最小二乘法有何意义与作用?提示:最小二乘法(又称最小平方法)是一种数学优化技术.它通过最小化误差的平方和寻找数据的最佳函数匹配.利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小.2.如果用x-表示x1+x2+…+xnn,用y-表示y1+y2+…+ynn,则可求得b=,a=,这样得到的直线方程称为,a,b是线性回归方程的系数.x1y1+x2y2+…+xnyn-nx-y-x21+x22+…+x2n-nx-2y--bx-线性回归方程求回归直线方程的步骤:(1)列表求xi,yi,xiyi;(2)计算x-,y-,i=1nx2i,i=1ny2i,i=1nxiyi;(3)代入公式计算b,a的值;(4)写出直线方程.3.利用最小二乘法估计时,要先作出数据的.如果散点图呈现一定的规律性,我们再根据这个规律进行拟合.如果散点图呈现出线性关系,我们可以用估计出线性回归方程;如果散点图呈现出其他的曲线关系,我们就要利用其他的曲线进行拟合.散点图最小二乘法问题探究2:具有线性相关的两个变量的散点图,各点大致分布在一条直线的附近,那么,这样的散点图中回归直线是唯一的吗?提示:在最小二乘法下,回归直线方程有且只有一个,这个方程所确定的直线是所有直线中接近程度最高的一条.要点导学知道x与y线性相关,就无需进行相关性检验,否则,应先进行相关性检验.若两个变量不具备相关关系,或者说,它们之间的线性相关关系不显著,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.要点一明确两个变量线性相关,求回归直线方程假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:x23456y2.23.85.56.57.0若由资料知,y与x线性相关.(1)求回归直线方程y=bx+a中a与b的值;(2)估计使用年限为10年时,维修费用是多少?【思路启迪】(1)求回归直线方程的步骤是什么?(2)如何求a,b?(3)怎样利用回归直线方程估计维修费用?【解】(1)列表:ixiyix2ixiyi122.24.44233.811.49345.522.016456.532.525567.042.036合计2025112.390其中,b=i=15xiyi-5x-y-i=15x2i-5x-2=112.3-5×4×590-5×42=12.310=1.23,a=y--bx-=5-1.23×4=0.08.所以a=0.08,b=1.23.(2)回归直线方程为y=1.23x+0.08.当x=10时,y=1.23×10+0.08=12.38,即使用年限为10年时,维修费用约为12.38万元.求回归直线方程的步骤:第一步列表xi,yi,xiyi,x2i;第二步计算x,y;第三步代入公式计算a,b的值;第四步写出直线方程.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y=bx+a,其中b=-20,a=y--bx-.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)因为x-=16(8+8.2+8.4+8.6+8.8+9)=8.5,y-=16(90+84+83+80+75+68)=80.又因为b=-20,所以a=y--bx-=80+20×8.5=250,从而回归直线方程为y=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20x-3342+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.要点二未明确两个变量线性相关,求回归直线方程某市近5年的煤气消耗量与使用煤气户数如下表:年份20082009201020112012x(万户)11.11.21.61.8y(百万立方米)6791112(1)检验是否线性相关;(2)若线性相关,求y对x的回归直线方程.【思路启迪】(1)怎样检验两变量是否线性相关?(2)求回归直线方程的步骤是什么?【解】(1)作出散点图,观察呈线性正相关,如图所示.(2)x-=1+1.1+1.5+1.6+1.85=75,y-=6+7+9+11+125=9,i=15x2i=12+1.12+1.52+1.62+1.82=10.26,i=15xiyi=1×6+1.1×7+1.5×9+1.6×11+1.8×12=66.4,∴b^=i=15xiyi-5x-y-i=15x2i-5x-2=66.4-5×75×910.26-5×4925=17023,a^=y--b^x-=9-17023×75=-3123,∴y对x的回归直线方程为y^=17023x-3123.求回归直线方程,通常是用计算器来完成的.在有的科学计算器中,可通过直接按键得出回归直线方程中的a,b.如果用一般的计算器进行计算,则要先列出相应的表格,有了表格中的相关数据,回归直线方程中的a,b就容易求出来了.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)如果x与y具有线性相关关系,求回归方程y=bx+a,并说明b的意义.解:(1)散点图如下图所示.(2)由散点图知x与y具有线性相关关系.x-=5,y-=50,i=15xiyi=1380,i=15x2i=145,∴b=i=15xiyi-5x-y-i=15x2i-5x-2=1380-5×5×50145-5×52=6.5,a=y--bx-=50-6.5×5=17.5.所求回归方程为y=6.5x+17.5.b表示广告费每增加100万元,销售额平均增加650万元.利用回归直线,我们可以进行预测.若回归直线方程为y=bx+a,则x=x0处的估计值为:y0=bx0+a.要点三利用回归直线方程对总体进行估计某5名学生的总成绩和数学成绩如下表所示:学生ABCDE总成绩(x)482383421364362数学成绩(y)7865716461(1)画出散点图;(2)求数学成绩y对总成绩x的回归方程;(3)如果一个学生的总成绩为450,试预测这个同学的数学成绩.【思路启迪】(1)画散点图时应注意什么?(2)求回归方程的步骤是什么?(3)如何预测该同学的数学成绩?【解】(1)散点图如下图所示:(2)列表:i12345xi482383421364362yi7865716461xiyi3759624895298912329622082x-=20125,y-=3395,i=15x2i=819794,i=15xiyi=137760,b=i=15xiyi-5x-y-i=15x2i-5x-2=137760-5×20125×3395819794-5×201252≈0.132452,a=y--bx-≈3395-0.132452×20125≈14.501315.∴回归方程y=0.132452x+14.501315.(3)当x=450时,y≈74,即当一个学生的总成绩为450分时,他的数学成绩约为74分.此类问题求线性回归方程是关键,只有确定了回归直线方程,才能估计和预测,求回归方程的关键是求系数a,b,注意用公式时要先求b,再求a.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能源y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)散点图如图所示:(2)由题意,得i=14xiyi=3×2.5+4×3+5×4+6×4.5=66.5,x-=3+4+5+64=4.5,y-=2.5+3+4+4.54=3.5,i=14x2i=32+42+52+62=86,∴b=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a=y--bx-=3.5-0.7×4.5=0.35.故线性回归方程为y=0.7x+0.35.(3)根据回归方程可预测,现在生产100吨甲产品的生产能耗为0.7×100+0.35=70.35(吨标准煤),故预测生产100吨甲产品的生产能耗比技改前减少了90-70.35=19.65(吨标准煤).易错点忽视相关关系、散点图、回归直线间的联系某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5易错盘点(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程y=bx+a,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:b=i=1nxiyi-nxyi=1nx2i-nx-2,a=y-bx-.)【错因分析】如果忽视相关关系、散点图、回归直线间的联系,孤立的学习,就难以灵活运用所学知识解决实际问题.【正确解答】(1)散点图如图.(2)由表中数据得i=14xiyi=52.5,x=3.5,y-=3.5,i=14x2i=54,∴b=0.7,∴a=1.05,∴y=0.7x+1.05.回归直线如图所示.(3)将x=10代入回归直线方程,得y=0.7×10+1.05=8.05(小时).∴预测加工10个零件需要8.05小时.直线回归图包括回归直线的图象和散点图,它可以醒目地表示x和y的数量关系.某工厂在2004年的各月中,一产品的月总成本y(万元)与月产量x(吨)之间有如下数据:x4.164.244.384.564.724.965.185.365.65.745.966.14y4.384.564.64.834.965.135.385.555.715.896.046.25若2005年1月份该产品的计划产量是6吨,试估计该产品1月份的总成本.解:(1)散点图如下图,从图中可以看到,各点大致在一条直线附近,说明x与y有较强的线性相关关系.(2)代入公式得:b≈0.9100,a≈0.6475,回归直线方程是y=0.9100x+0.6475.(3)当x=6时,y=0.9100×6+0.6475≈6.11(万元),即该产品1月份的总成本的估计值为6.11万元.1.“回归”和“相关”含义是不同的;如果两个变量中的一个变量是人力可以控制、非随机的,另一变量的变化是随机的且随控制变量的变化而变化,则这两变量间的关系就称为回归关系;若两个变量都是随机的,则称它们之间的关系为相关关系,在本教材中,两者不加区别.学习小结2.回归直线是将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用,应用回归方程可以把非确定性问题转化为确定性

1 / 69
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功