第三讲 多元回归分析:估计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1计量经济学导论多元回归分析:估计y=b0+b1x1+b2x2+...bkxk+u2引例研究的目的要求为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入增长的数量规律预测中国税收未来的增长趋势,需要建立计量经济模型。研究范围:1978年-2007年全国税收收入理论分析:为了全面反映中国税收增长的全貌,选择包括中央和地方税收的“国家财政收入”中的“各项税收”(简称“税收收入”)作为被解释变量;选择国内生产总值(GDP)作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表;选择“商品零售价格指数”作为物价水平的代表。3年份税收收入(亿元)(Y)国内生产总值(亿元)(X2)财政支出(亿元)(X3)商品零售价格指数(%)(X4)1978519.283624.11122.09100.71979537.824038.21281.79102.01980571.704517.81228.83106.01981629.894862.41138.41102.41982700.025294.71229.98101.91983775.595934.51409.52101.51984947.357171.01701.02102.819852040.798964.42004.25108.819862090.7310202.22204.91106.019872140.3611962.52262.18107.319882390.4714928.32491.21118.519892727.4016909.22823.78117.819902821.8618547.93083.59102.119912990.1721617.83386.62102.919923296.9126638.13742.20105.4419934255.3034634.44642.30113.219945126.8846759.45792.62121.719956038.0458478.16823.72114.819966909.8267884.67937.55106.119978234.0474462.69233.56100.819989262.8078345.210798.1897.4199910682.5882067.513187.6797.0200012581.5189468.115886.5098.5200115301.3897314.818902.5899.220022003200420052006200717636.4520017.3124165.6828778.5434804.3545621.97104790.6135822.8159878.3183217.4211923.5249529.922053.1524649.9528486.8933930.2840422.7349781.3598.799.9102.8100.8101103.85序列Y、X2、X3、X4的线性图可以看出Y、X2、X3都是逐年增长的,但增长速率有所变动,而且X4在多数年份呈现出水平波动。说明变量间不一定是线性关系,可探索将模型设定为以下对数模型:注意这里的“商品零售价格指数”1222334lnlnlntttttYXXXubbbb(X4)未取对数。6三、估计参数模型估计的结果为:234ˆln2.84910.4123ln0.6664ln0.0115iYXXX20.9873R20.9858R(0.6397)(0.1355)(0.1557)(0.0055)t=(-4.4538)(3.0420)(4.2788)(2.0856)F=673.7521n=307模型检验:1、经济意义检验:模型估计结果说明,在假定其它变量不变的情况下,当年GDP每增长1%,税收收入会增长0.4123%;当年财政支出每增长1%,平均说来税收收入会增长0.6664%;当年商品零售价格指数上涨一个百分点,平均说来税收收入会增长1.15%。这与理论分析和经验判断相一致。2、统计检验:拟合优度:,表明样本回归方程较好地拟合了样本观测值。F检验:对已得到F=673.7521,给定查表得自由度k-1=3和n-k=26的临界值:,因为F=673.7521,说明模型总体上显著,即“国内生产总值”、“财政支出”、“商品零售价格指数”等变量联合起来确实对“税收收入”有显著影响。05.020.9873R20.9858R0234:0Hbbb(3,26)2.98F(3,26)2.98Ft检验分别针对,给定显著性水平,查t分布表得自由度为n-k=26的临界值。由回归结果已知与、、对应的t值分别为:-4.4538、3.0420、4.2788、2.0856,其绝对值均大于,这说明在显著性水平下,分别都应当拒绝说明当在其它解释变量不变的情况下,解释变量“国内生产总值”、“财政支出”、“商品零售价格指数”分别对被解释变量“税收收入”Y都有显著的影响。05.082()2.056tnk0(1,2,3,4)jjb0:H1ˆb2ˆb3ˆb4ˆb2()2.056tnk0:H0(1,2,3,4)jjb05.0本章STATA命令语句Genlny=log(y)Genlnx1=log(x1)Genlnx2=log(x2)reglnylnx1lnx2x3Vif(方差膨胀因子)pwcorrx1x2x3x4x5stepwise,pe(0.05):regressYX1X2X3X4X5(增加解释变量的显著性)stepwise,pr(0.05):regressYX1X2X3X4X5(删除解释变量的显著性)103.1多重共线性的检验●简单相关系数检验法●方差扩大(膨胀)因子法●直观判断法●逐步回归法11简单相关系数检验法含义:简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。判断规则:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,例如大于0.8,则可认为存在着较严重的多重共线性。12注意:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。13方差扩大(膨胀)因子法统计上可以证明,解释变量的参数估计式的方差可表示为其中的是变量(VarianceInflationFactor),即的方差扩大因子其中是多个解释变量辅助回归的可决系数21VIF=1-jjR22__2221ˆVar()==VIF1-))jjjjjσσβR(xx(xxVIFjjXjXˆjβ2jR14经验规则●方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。●经验表明,方差膨胀因子≥10(R—平方大于等于0.9)时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。15直观判断法1.有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。或者总体解释较高但是存在一个或多个很不显著的解释变量。2.当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线性。163.解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题(两个自变量间的共线性)。4.对于多个自变量间存在共线性时,如果一些重要的解释变量的回归系数的标准误差较大,并且在回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。17逐步回归检测法逐步回归的基本思想将变量逐个的引入模型,每引入一个解释变量后,都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。18计量经济学导论3.2使用多元回归的动因含有两个自变量的模型19计量经济学导论01122011222012yxxuxyxyconsincincubbbbbbbbb为截距;衡量了当其他因素不变时,对的影响;衡量了当其他因素不变时,对的影响;如何解释上述方程中的参数?保持其他因素不变的效应在上述方程中是否存在?3.33.420计量经济学导论consincconsmax122yxxbb21计量经济学导论关键的假设是方程3.5中u与x1和x2的关系。12,0Euxx3.522计量经济学导论有K个自变量的模型y=b0+b1x1+b2x2+...bkxk+u3.623计量经济学导论多元回归方程的相关定义及性质b0为截距;b1到bk为斜率参数;u仍然为误差项或扰动项;零条件均值假设:E(u|x1,x2,…,xk)=0;残差平方和最小化,可得k+1个一阶条件。24计量经济学导论25计量经济学导论OLS的机制与解释OLSEstimates结果是OLS方法选择最小化残差平方和的估计值,即使3.10式尽可能的小。26计量经济学导论OLSFirstOrderConditionSRFSSR27计量经济学导论刘愿OLS回归方程的解释28计量经济学导论例子3.1:大学生GPA的决定因素29计量经济学导论例子3.2:小时工资方程30计量经济学导论在多元回归中保持其他因素不变的含义多元回归分析的作用是,提供了一个“在其他因素保持不变”下的解释,尽管我们的数据并非以这种方式搜集。31计量经济学导论同时改变两种以上因素时参数的含义32计量经济学导论OLS拟合值与残差项iiyyNormally,33计量经济学导论121122OLSˆ0;2.OLSOLSˆˆˆ0;0.3.,,,,OLSˆˆˆˆiiiiikokkuxuyuxxxyyxxxbbbb拟合值及残差有与单变量回归同样的重要性质:1.样本残差均值为零:每个自变量与残差之样本协方差均为零,拟合值与残差之样本协方差也为零:样本均值点总是在样本回归线上:34计量经济学导论多元回归参数估计值表达式1211111221121ˆˆˆˆ=ˆˆiiiiiiiiryrrxxxxxxybbb在二元回归中,具有如下的表达式:其中,是中与无关的部分,或者说是的效应被排除(partialledout)之后的。因此,衡量了排除了的影响后与的关系。35计量经济学导论证明:111111101112110111211111111111ˆˆˆˆ,0ˆˆˆˆˆˆ0ˆˆˆˆˆ0ˆˆ0(2,3,)ˆˆˆˆˆˆˆniiiiiiniiiiikikiniiiikikinijiinniiiijiiiiiixxrxuxryxxxryxxxxrforalljkryxryxrrbbbbbbbbbb111111111111111211ˆˆˆˆˆˆˆˆ0ˆˆˆnniiiiiiniiiiniiiniiyrxrryrryrbbbb36计量经济学导论简单线性回归与多元线性回归估计值比较01101122ˆˆˆˆyxyxxbbbbbSRFMRF以下两种情况简单回归函数和多元回归函数参数估计值相等:37计量经济学导论例子3.3401(K)养老金计划的参与率简单回归与多元回归中,mrate的系数差异不大,原因在于mrate与age的相关性不大(相关系数只有0.12)38计量经济学导论拟合优度39计量经济学导论例子3.4大学GPA的决定因素如何理解模型的拟合优度R2?40计量经济学导论例子3.5解释被逮捕的记录41计量经济学导论OLS估计的期望值多元回归的假设:Assumptio

1 / 75
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功