计量经济学 第4讲 线性回归模型的扩展

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第四讲线性回归分析的扩展LinearRegressionAnalysis:Extension一、引言:放宽经典模型的假设二、多重共线性三、异方差性四、序列相关五、设定误差o管理资源吧(),提供海量管理资料免费下载!一、引言:放宽经典模型的假设o管理资源吧(),提供海量管理资料免费下载!引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的假定(一)关于模型的假定1.回归模型对参数而言是线性的2.模型是正确设定的(二)关于解释变量的假定3.解释变量X是确定性变量4.若X是随机的,则误差项与X不相关5.解释变量的取值有足够变异6.解释变量之间不存在完全的线性关系o管理资源吧(),提供海量管理资料免费下载!引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的假定(三)关于误差项的假定7.对于给定的X,误差项均值为08.对于给定的X,误差项方差相等9.对于给定的X,误差项之间不存在序列相关10.误差项服从正态分布o管理资源吧(),提供海量管理资料免费下载!引言:放宽经典模型的假设放宽的假定相应的问题假定1、2模型设定问题假定3、4随机解释变量假定5过度决定(微数缺测性)假定6多重共线性假定7误差项均值非零假定8异方差性假定9序列相关假定10误差项非正态分布假定3和4在联立方程模型中讨论对假定5我们做简单讨论假定7影响参数估计的无偏性,暂不讨论假定10对于大样本数据不是必需的假定。本讲主要考虑放宽了其余假定后面临的问题o管理资源吧(),提供海量管理资料免费下载!引言:放宽经典模型的假设微数缺测性o从理论上讲,样本容量n和解释变量数目k必须满足nk+2,才能进行OLS估计和假设检验。但事实上,即便n满足上述条件,但如果样本很小,那么虽然能够进行估计和检验,也很难通过t检验。越大。就越小,即从而的变异性就越小,如果样本容量越小,则;)(VarTSSX)(Var)(SE)R(TSS)(Varjjjjjjjj2211o管理资源吧(),提供海量管理资料免费下载!1.什么是多重共线性2.多重共线性的影响3.多重共线性的诊断4.多重共线性的处理二、多重共线性o管理资源吧(),提供海量管理资料免费下载!什么是多重共线性o多重共线性(multicollinearity):回归模型中的一些或全部解释变量之间存在一定程度的线性关系)(eXXXeXXX0.b)(XXXXXX0.auXXXYikikiiikikiikkikiikikiikikikiii010001112121221111121212211122110或:令,、、的不同时为多重共线性:存在一组或:令,、、的不同时为完全共线性:存在一组对于o管理资源吧(),提供海量管理资料免费下载!什么是多重共线性例题4.1其他例题:p200X1X2X3X410555267158075251895973424125129183015515289:低度多重共线性:高度多重共线性:完全共线性25320995901141312.r.rro管理资源吧(),提供海量管理资料免费下载!什么是多重共线性图形表示:巴伦坦图YX1X2YX1X2低度多重共线性高度多重共线性o管理资源吧(),提供海量管理资料免费下载!什么是多重共线性产生多重共线性的原因1)样本过小2)模型设定有误:添加了过多的解释变量由于样本过小,即便在总体中解释变量之间没有线性关系,也可能在获得的样本中观察到较强的线性关系o管理资源吧(),提供海量管理资料免费下载!多重共线性的影响存在完全线性关系时的OLS估计o无法得到OLS估计量例题:p201-20221010203322033211201021013322110、、已知,但无法得到、,虽然和只能得到估计实际上只有两个,根据这样,真正的解释变量则有:若,对于OLSuXXuXX)()(YXXuXXXYiiiiiiiiiiiiiio管理资源吧(),提供海量管理资料免费下载!多重共线性的影响存在多重共线性关系时的OLS估计o可以证明即便存在多重共线性,OLS估计量仍然是BLUE,但系数估计量的方差较大,从而不容易通过t检验,同时预测区间变宽,降低了预测精确度。)(VarR)(VarRXTSS)(Var)(SE)R(TSS)(Varjjjjjjjjjjj,则特别地,若越大。越大,从而则联程度越强,与其他自变量的线性关这样,如果,和计算出对于给定的样本,可以;11122222例题:p202-203o管理资源吧(),提供海量管理资料免费下载!多重共线性的影响影响程度的度量:方差膨胀因子(variance-inflationfactor)越大越大,从而则共线性程度越高,与其他解释变量的多重易知,如果定义方差膨胀因子:,有对于jjjjjjjjVIFRXRVIF),R(TSS)(Vark,,j222211111o管理资源吧(),提供海量管理资料免费下载!多重共线性的影响例题4.2RjVIFj0.001.00A0.501.331.33A0.905.765.76A0.9510.2610.26A0.9950.2550.25A)(VarjjjjjTSSAVIFTSS)(Var22)(SEjAA15.1A40.2A20.3A.097o管理资源吧(),提供海量管理资料免费下载!多重共线性的诊断简单诊断方法oR2高而单个系数的t值小,换言之,F检验显著,但显著的t值少o任意两个解释变量之间的相关系数较大,比如大于0.9o解释变量之间的偏相关系数较大简单方法一般来说不很精确o管理资源吧(),提供海量管理资料免费下载!多重共线性的诊断运用回归分析进行诊断o逐步分析法:先引入经济意义明显,并且在统计上最显著的解释变量,然后逐步引入其他解释变量。如果新引入的解释变量使原有解释变量的系数估计值发生明显变化,或t统计量明显变小,则说明新引入的解释变量与原有解释变量之间存在多重共线性,可以去掉新引入的解释变量o辅助回归法:做每一个解释变量对其余解释变量的回归,得出相应的F统计值,如果在给定的显著性水平下F统计值是显著的,说明该解释变量与其他解释变量之间存在线性关系,可以去掉该解释变量(p207,p211)o管理资源吧(),提供海量管理资料免费下载!多重共线性的诊断运用一些指标进行诊断1)方差膨胀因子:计算每个解释变量的方差膨胀因子VIF,一般认为如果VIF大于10,说明该变量与其他变量存在高度共线性2)容许度(tolerance):定义容许度TOL如下,一般认为如果TOL小于0.1,说明该变量与其他变量存在高度共线性3)条件指数(conditionindex,CI):一般认为,如果条件指数在10到30之间,存在较强的多重共线性,如果大于30,则存在严重的多重共线性jjjVIFRTOL112o管理资源吧(),提供海量管理资料免费下载!多重共线性的诊断例题4.3(p218)YConsumptionX1IncomeX2Wealth708081065100100990120127395140142511016016331151801876120200205214022022011552402435150260268625.16602.013.482:9531.0,9635.0,9990.04019.92,7,10)615.0()290.0()008.0()526.0()144.1()669.3()081.0()823.0()752.6(042.0942.0775.242121221221CITOLTOLVIFVIFsdiagnostictyCollineariRRrFdfnptseXXYiii例题:p209-211o管理资源吧(),提供海量管理资料免费下载!多重共线性的诊断几点说明o多重共线性是一个程度问题而不是存在与否的问题o多重共线性是关于样本的一种特征o如果研究是为了估计斜率系数和预测,多重共线性不是一个严重的问题;但如果研究的主要目的是假设检验,则高度多重共线性的危害就很大o管理资源吧(),提供海量管理资料免费下载!多重共线性的处理1)剔除共线性变量中不太重要的解释变量2)补充新数据3)重新设定模型o练习题:p216-217,习题10.14-10.19o管理资源吧(),提供海量管理资料免费下载!1.什么是异方差性2.异方差性的影响3.异方差性的诊断4.异方差性的处理三、异方差性o管理资源吧(),提供海量管理资料免费下载!什么是异方差性o异方差性(heteroscedasticity):回归模型误差项的方差不相同o同方差性(homoscedasticity):回归模型误差项的方差不相同2212212212221222110)X,,X,X|Y(Var)X,,X,X|Y(Var)X,,X,X|u(E)u(Var)X,,X,X|u(E)u(VaruXXXYkiiiiikiiiikiiiiiikiiiiiikikiii同方差性:异方差性:也即:同方差性:异方差性:对于o管理资源吧(),提供海量管理资料免费下载!什么是异方差性同方差性XY概率密度X:受教育年限Y:工资o管理资源吧(),提供海量管理资料免费下载!什么是异方差性异方差性XY概率密度X:收入Y:消费支出o管理资源吧(),提供海量管理资料免费下载!什么是异方差性异方差性XY概率密度X:时间Y:打字错误例题:p220-224o管理资源吧(),提供海量管理资料免费下载!什么是异方差性产生异方差性的原因原因解释变量:收入被解释变量:消费支出解释变量与误差项相关随着收入的增加,支出差异性更大有重要的解释变量未被包含在回归模型中物价也是影响支出的因素,物价上涨时,高收入者有可能拿出更多的钱来消费,因而支出差异性更大异常值(outliers)o管理资源吧(),提供海量管理资料免费下载!异方差性的影响1)回归系数的OLS估计量虽然是无偏的、一致的,但不再是有效的2)回归标准差的估计不再是无偏的3)回归系数OLS估计量的方差估计不再是无偏的,因而t统计量不再服从t分布,F统计量不再服从F分布,从而无法进行区间估计和假设检验4)无法根据回归结果进行预测o管理资源吧(),提供海量管理资料免费下载!异方差性的诊断1)图解法2)布罗施-培甘检验(Breusch-Pagantest)3)怀特检验(Whitetest)4)帕克检验(Parktest)5)Glesjertest6)戈德菲尔德-匡特检验(Goldfeld-Quandttest)o管理资源吧(),提供海量管理资料免费下载!异方差性的诊断图解法在同方差假定下作回归分析,用残差项平方与解释变量做散点图2uXo管理资源吧(),提供海量管理资料免费下载!异方差性的诊断图解法

1 / 93
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功