线性回归模型[优质ppt]

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

线性回归模型学习目标•了解:经济变量之间的关系“回归”名称的来源、逐个剔除法、逐步回归法的优缺点•理解:多元线性回归模型的一般形式、随机项的来源及基本假定、回归分析的基本思想和方法、t检验、f检验、r检验的关系、判定系数、选元的标准。•掌握:线性回归模型的一般形式、误差随机项的基本假定、回归分析的主要内容、普通最小平方法、t检验、f检验、r检验的检验思想及步骤、点预测、区间预测、应用计算机软件进行线性回归分析内容2.1回归模型的一般描述2.2一元线性回归的参数估计2.3一元线性回归的显著性检验2.4一元线性回归的预测2.5多元线性回归模型及其假设2.6多元线性回归的参数估计2.7多元线性回归的显著性检验2.8利用多元线性回归方程进行预测2.9解释变量的选择2.10残差分析与异常值检测2.11模型的结构稳定性检验:Chow检验2.12正态性检验:Jarque—Bera检验1回归模型的一般描述一、变量间的关系1.函数关系:变量间却定性的对应关系2.相关关系:变量间不确定的对应关系(1)相关关系强弱的测度——相关系数:(2)相关系数的取值范围[-1,1],正负号仅表示方向,不表示大小。22)y(y)x(x)x)(xy(yriiii1回归模型的一般描述二、回归模型的一般形式三、一元线性回归模型Yf(X)u01iiiYββXu1回归模型的一般描述四、一元回归模型的基本假定(最小二乘假定)(1)(2)等方差性(3)无序列相关(4)进一步假定,n,,i)E(ui210,n,,iσ)Var(uui212,n,,j,i,ji),uCov(uji210,n,,i),XCov(uii210),σu~N(u201回归模型的一般描述五、回归分析预测的一般步骤1.以预测对象为因变量建立回归模型;2.利用样本数据对模型的参数进行估计;3.对参数的估计值及回归方程进行显著性检验;4.利用通过检验的方程进行预测。2一元线性回归的参数估计一、散点图与回归直线1.散点图:将n组相关数据在直角坐标系中描述出来即为散点,由坐标系和散点共同构成的图形称作散点图。作用:直观描述变量间的关系。例如:电的供应量与产值之间的关系05010015020025030035040045001020304050电的供应量(万度)产值(万元)2一元线性回归的参数估计2.回归直线当散点图的数据点的走向大致趋于一条直线时,通过散点图作一条直线,使它能够拟合这些点,近似的描述变量间的关系,称这条直线为回归直线,记作iixbbYˆ05010015020025030035040045001020304050电的供应量(万度)产值(万元)2.2一元线性回归的参数估计二、最小二乘法1.基本原理:找到一条直线,使直线上的点与实际观察值之间的距离最小,即,其中。3.根据微分极值原理求解解该方程组得其中,,minˆ2)y(yQiiioixββy1ˆˆˆiiiii)xxbb(ybQ)xbb(ybQxbyb)x(x)x)(xy(ybiiiixnx1iyny12一元线性回归的参数估计例已知一个工厂的年产值与电的供应量之间存在一元线性关系,数据如右表所示,试求该回归方程。解:使用Excel实现回归于是所求的方程为这说明,该厂电的供应量每增加一万度,年产值增加6.9712万元。产值(万元)Y电的供应量(万度)X21312.524216.328620.730522.43062334228.635130.137332.537932.63773338435.439537.93873740239.241840.7.xβyb.)x(x)x)(xy(ybiiiˆiix..y971263480138ˆ2.3一元线性回归的显著性检验一、经济检验二、拟合优度检验三、回归方程的显著性检验四、回归系数的显著性检验3一元线性回归的显著性检验一、经济检验(逻辑检验)检验内容:参数估计值的符号和大小是否与经济理论和经济实际相符合,是否有经济意义。二、拟合优度检验1.拟合优度(可决系数):回归直线与实际数据的拟合程度,记作。2.回归变差的分解:TSS=RSS+ESS3.拟合优度4.经验结果,通常要求。2RSSRTSS802.R2R3一元线性回归的显著性检验三、回归方程的显著性检验1.检验内容:检验因变量和所有自变量的线性关系。2.建立原假设和备择假设:3.构造统计量4.在显著性水平条件下的临界值5.判断:如果采用样本数据计算的结果,则拒绝原假设,认为自变量和因变量之间的线性关系显著。1~122MSRRSSFF(,n)MSEESSn-),n(F21),n(FF21001110:βH:βH3一元线性回归的显著性检验四、回归系数的显著性检验1.检验内容:检验因变量和每个自变量的线性关系。2.建立原假设和备择假设:3.构造统计量,其中4.在显著性水平条件下的临界值5.判断:如果采用样本数据计算的结果,则拒绝原假设,认为因变量和该自变量之间的线性关系显著。001110:βH:βH)~t(n)S(bbT)x(x)(n)y(y)S(biiiˆ)(ntα22)(ntα2T23一元线性回归的显著性检验五、一元回归方程的显著性检验小结1.拟合优度通常要求,且与相关系数之间的关系,但通常不用相关系数判断拟合优度;2.对于一元回归,方程的显著性检验和回归系数的显著性检验是一致的,做一个即可。802.R22rR3一元线性回归的显著性检验六、续例,给定显著性水平,进行统计检验解:根据运行结果(1)方程的拟合优度较高;(2)209908RSSR..TSS0051710254671132.RSSF..F(,)ESSn-05.02.4一元线性回归的预测一、回归预测1.定义:给定自变量一个特定的值,利用回归方程对因变量的值进行估计。2.分类:点预测、区间预测3.二、点预测4.定义:假定Y与X的回归方程为,对于给定的自变量,求得,称这种预测为点预测。5.续例,已求出该厂产值与电的供应量之间的回归方程为,并通过检验。如果电的供应量达到50万度,对产值进行点预测,iix..y971263480138ˆioixybbˆ0xX00bbˆxyo(万元)91.486509712.63480.138971263480138ˆiix..y4一元线性回归的预测三、区间预测1.预测误差:点预测值与实际观测值之间的差异。2.可以证明,其中3.给定置信水平,置信区间为,其中,是自由度为年n-2的t分布临界值,4.其中5.4.例置信水平95%的置信区间(464.73,509.09)。000ˆyye))(e,σ~N(e0200]11[220202)x-(x)x(xnσ)(eσiu1))(ˆˆ)(ˆˆ(eσty,eσtyαα2i20u0)xx()xx(n11ˆ)(ˆeαtn)y(yn-eσiiiuˆˆ5多元线性回归模型及其假设一、线性回归模型的一般形式如果因变量(被解释变量)与各自变量(解释变量)之间有线性相关关系,那么它们之间的线性总体回归模型可以表示为:写成矩阵形式为:其中nyyyY01122kkyxxxuYXUknnnkkxxxxxxxxxXk10nuuuU2.5多元线性回归模型及其假设二、多元回归模型的基本假定(1)(2)等方差性(3)无序列相关(4)(5)进一步假定(6)各自变量之间不存在显著相关关系,n,,i,n,,i,n,,j,i,ji),uCov(uji210,n,,i),XCov(uii210),σ~N(uuinkXrank)(12[|,,]0iiikiEuxxx212(|,,...,)iiikiuVaruxxx2.6多元线性回归的参数估计一、参数估计方法1.基本原理:2.根据微分极值原理,采用矩阵形式求解一元回归的参数估计是多元回归参数估计的特例。minˆ2)y(yQiiYXXXT1T)(B2.6多元线性回归的参数估计二、利用Excel进行参数估计其操作步骤为:点击[工具]→点击[数据分析]→选择[回归]→点击[确定]→输入[值输入区域]→输入[值输入区域]→输入[置信度]→在[输出选项]选择[输出区域]或[新工作组表]或[新工作簿]→点击[确定],即可得到输出结果2.6多元线性回归的参数估计三、最小二乘估计量(OLSE)的统计性质⒈线性=+最小二乘估计量B不仅是Y的线性组合,也是U的线性组合。⒉无偏=+=⒊最优性最小二乘估计量B的最优性,又称有效性或最小方差性。==()其中,是主对角线上的元素。可以证明,具有最小方差的特性。(证明略)1()TTXXXU1()()TTXXXEU21()TujjXX2ujjC0,1,2,,jkjjC1()TXX)B(EYX)XX(BT1T)Var(jbjb2.6多元线性回归的参数估计四、随机误差项的方差的估计量是的无偏估计量(m=k+1,为变量个数或参数个数,k为自变量个数)。它的算术方根称为估计标准误差,记为:222211ˆ()ˆ1nniiiiiueeyySnmnk2u2211ˆ()ˆ1nniiiiiueeyySnmnk2.6多元线性回归的参数估计此时,估计量的标准差可表示为:是主对角线上的元素(j=0,1,…,k)。ˆ()jjbbjSVarb221ˆ()ˆ1niiijjujjyyCCnkjjC1()TXX2.6多元线性回归的参数估计五、回归系数的置信区间由于;;故可得的置信度为的置信区间为:Excel能够自动给出各回归系数的上下限()jjEb2var()jjjubC122ˆ[(1),jjjubtnkC22ˆ(1)]jjjubtnkC2.6多元线性回归的参数估计六、例2.2已知某地区的相关数据如右表所示,试求该回归方程。解:使用Excel实现回归,得到的方程为这说明,该地区收入每增加1万元,消费增加0.497万元,人口每增加1万人消费增加0.665万元。iiix.x..yˆ年份消费收入人口1994913.148.219959.513.948.919961013.849.54199710.614.850.25199813.416.451.02199916.220.951.84200017.724.253.76200120.128.153.69200221.830.154.55200325.335.855.35200431.348.556.1620053654.856.982.7多元线性回归的显著性检验一、经济检验二、拟合优度检验三、回归方程的显著性检验四、回归系数的显著性检验五、序列相关检验2.7多元线性回归的显著性检验一、经济检验(逻辑检验)1.检验内容:参数估计值的符号和大小是否与经济理论和经济实际相符合。2.回归系数的估计值与实际相反的原因(1)某些变量的取值范围太窄;(2)模型中遗漏了某些重要因素;(3)模型中自变量之间有较强的线性关系。2.7多元线性回归的显著性检验二、拟合优度检验1.判定系数与修正判定系数2.判定系数的大小还取决于包含在模型中的自变量的个数。3.2.修正判定系数的计算4.5.注:6.(1)如果k=0,则7.(2)如果k0,则8.(3)有可能为负值。2R

1 / 37
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功