选修1-2《1.1回归分析的基本思想及其初步应用》课件

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1.1回归分析的基本思想及其初步应用填一填·知识要点、记下疑难点1.线性回归模型(1)函数关系是一种关系,而相关关系是一种关系.(2)回归分析是对具有关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回归直线的斜率和截距的最小二乘估计公式分别为b^==∑ni=1xiyi-nxy∑ni=1x2i-nx2,a^=,其中称为样本点的中心.确定性非确定性相关∑ni=1xi-xyi-y∑ni=1xi-x2(x,y)y-b^x填一填·知识要点、记下疑难点(4)线性回归模型y=bx+a+e,其中a和b是模型的未知参数,e称为,自变量x称为,因变量y称为.2.残差的概念对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,它们的随机误差为ei=,i=1,2,…,n,其估计值为e^i==,i=1,2,…,n,e^i称为相应于点(xi,yi)的.随机误差解释变量预报变量yi-bxi-ayi-y^iyi-b^xi-a^残差填一填·知识要点、记下疑难点3.刻画回归效果的方式(1)残差图法作图时为残差,可以选为的样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.在残差图中,残差点地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度,说明模型拟合精度越高.(2)残差平方和法残差平方和∑ni=1(yi-y^i)2,残差平方和,模型拟合效果越好.纵坐标横坐标比较均匀越窄越小填一填·知识要点、记下疑难点(3)利用R2刻画回归效果R2=;R2表示变量对于变量变化的贡献率.R2越接近于,表示回归的效果越好.解释预报11-∑ni=1yi-y^i2∑ni=1yi-y2研一研·问题探究、课堂更高效例1若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.解(1)画散点图选取身高为自变量x,体重为因变量y,画出散点图形象展示两个变量之间的关系,并判断二者是否具有线性关系.研一研·问题探究、课堂更高效由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归直线近似刻画它们之间的关系.(2)建立回归方程由计算器可得b^=0.849,a^=-85.712.于是得到回归方程为y^=0.849x-85.712.(3)预报和决策当x=172时,y^=0.849×172-85.712=60.316(kg).即一名身高为172cm的女大学生的体重预报值为60.316kg.研一研·问题探究、课堂更高效思考根据前面得到的回归方程,能否预测一名女运动员的体重?建立回归模型后能否一劳永逸,在若干年后还可以使用?用身高预报体重时,还需要注意什么?在使用回归方程进行预报时要注意:(1)回归方程只适用于我们所研究的样本的总体;(2)我们建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.研一研·问题探究、课堂更高效跟踪训练1某班5名学生的数学和物理成绩如表:学生学科ABCDE数学成绩(x)8876736663物理成绩(y)7865716461(1)求物理成绩y对数学成绩x的回归方程;(2)一名学生的数学成绩是96,试预测他的物理成绩.解(1)散点图如图.研一研·问题探究、课堂更高效x=15×(88+76+73+66+63)=73.2.y=15×(78+65+71+64+61)=67.8.∑5i=1xiyi=88×78+76×65+73×71+66×64+63×61=25054.∑5i=1x2i=882+762+732+662+632=27174.∴b^=∑5i=1xiyi-5x·y∑5i=1x2i-5x2≈0.625.∴a^=y-b^x=67.8-0.625×73.2=22.05.∴y对x的回归方程是y^=0.625x+22.05.(3)当x=96时,y^=0.625×96+22.05≈82.可以预测他的物理成绩是82.研一研·问题探究、课堂更高效探究线性回归分析问题1给出两个变量的回归方程,怎样判断拟合效果的好坏?一般有三种方法来判断拟合效果:(2).残差平方和法:残差平方和越小,拟合效果越好;(3).相关指数法:相关指数R2越接近于1,模型的拟合效果越好.问题2如果R2≈0.64,表示什么意义?表明“解释变量对于预报变量的贡献率为64%.”(1).残差图法:残差图中的点分布的带形区域宽度越窄,拟合精度越高;练一练·当堂检测、目标达成落实处1.下列各组变量之间具有线性相关关系的是()A.出租车费与行驶的里程B.学习成绩与学生身高C.身高与体重D.铁的体积与质量C练一练·当堂检测、目标达成落实处2.若劳动生产率x(千元)与月工资y(元)之间的线性回归方程为y^=50+80x,则下列判断正确的是()A.劳动生产率为1000元时,月工资为130元B.劳动生产率提高1000元时,月工资平均提高80元C.劳动生产率提高1000元时,月工资平均提高130元D.月工资为210元时,劳动生产率为2000元B练一练·当堂检测、目标达成落实处3.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是()A.y^=1.23x+4B.y^=1.23x+5C.y^=1.23x+0.08D.y^=0.08x+1.23C4.已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y对x的回归直线方程,并说明回归模型拟合效果的好坏.x1416182022y1210753练一练·当堂检测、目标达成落实处解x=15(14+16+18+20+22)=18,y=15(12+10+7+5+3)=7.4,i=15xiyi=14×12+16×10+18×7+20×5+22×3=620,i=15x2i=142+162+182+202+222=1660,∴b^=i=15xiyi-5xyi=15x2i-5x2=620-5×18×7.41660-5×182=-1.15.∴a^=y-b^x=7.4+1.15×18=28.1,练一练·当堂检测、目标达成落实处列出残差表:yi-y^i00.3-0.4-0.10.2yi-y4.62.6-0.4-2.4-4.4所以,i=15(yi-y^i)2=0.3,i=15(yi-y)2=53.2,R2=1-∑ni=1yi-y^i2∑ni=1yi-y2≈0.994,所以回归模型的拟合效果很好.所以y对x的回归方程是y^=-1.15x+28.1.练一练·当堂检测、目标达成落实处建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y^=b^x+a^);(4)按一定规则(如最小二乘法)估计回归方程中的参数;(5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等.

1 / 18
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功