7.第六章内生解释变量

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第六章内生解释变量第一节解释变量内生性的成因与检验第二节解释变量内生性检测第三节内生性问题的解决办法第一节解释变量内生性的成因与检验解释变量与随机误差项之间往往存在某种程度的相关性,即:cov(,)0jiixu(1,2,,jk1,2,,)in此时,就称模型存在内生性问题,与随机误差项相关的解释变量称为内生解释变量。一、解释变量内生性及其影响cov(,)0jiixu(1,2,,jk1,2,,)in这称为解释量的外生性假定。解释变量与随机误差项是线性无关的(甚至是均值独立的),即要求内生性会对OLSE的统计性质产生不良影响1、影响无偏性如果假定SLR.3′(不相关假定)不成立,则一定违背古典假定SLR.3的均值独立假定,即一定不成立。而假定SLR.3(均值独立)是OLSE无偏性成立的关键假定。由(2.22)知:0)|(iixuE=1ˆ(|)iEx1()(|)iiiEEkux1(|)iiikEux=≠01112112()ˆlim()lim()lim()lim[]()1lim[()]cov(,)1var()lim[()]iiiiiiiiiiixxuPPkuPPxxPxxuxunxPxxn2、影响一致性cov(,)iixu111cov(,)ˆlim()var()iiixuPx如果≠0,则,,OLSE不再具有一致性。3、其它影响其它不良影响还包括,随机误差项的方差估计量是有偏的,由此导致回归系数的方差估计量是有偏的,进而与方差相关的假设检验、区间估计容易导出错误的结论。这些影响需要结合内生性产生的具体的原因进行分析。二、内生性产生的原因横截面回归中解释变量内生性产生的原因主要有遗漏变量、错误的函数形式、测量误差和联立性。1、遗漏变量在建立计量经济模型时,由于人们认识上的偏差,理论分析的缺陷,或者是有关统计数据的影响,导致有意或无意地忽略了某些重要变量,未能将其作为解释变量引入模型,这种变量就称为遗漏变量(OmittedVariable)。被遗漏的变量虽未引入模型,但其对因变量的影响还是存在的,其影响由随机误差项体现出来。如果被遗漏变量和模型中现有的解释变量存在相关,则会造成解释变量与随机误差项的相关,即产生内生性问题。考虑成年劳动者的工资方程中存在未观测到的能力的问题01122yxxu(6.1)其中y代表工资的对数,x1代表受教育年限,x2代表个人能力,u是随机误差项。011yxv(6.2)若x2无法准确测量,将其归入随机误差项中,得到如下回归模型:其中v中包含了x2。显然,若是x2与x1相关,则会导致,从而产生内生性问题。1cov(,)0xv将正确模型(6.1)式代入(6.3)式得对(6.2)式进行回归,x1的系数估计量为:111211()()ˆ()xxyyxx(6.3)111211()()ˆ()xxyyxx110112201122211()[()()]()xxxxuxxuxx11221112221111()()()()()()xxxxxxuuxxxx(6.3)(1)若遗漏的x2与x1相关,则(6.4)、(6.5)式中的第二项在小样本的期望与大样本下的概率极限都不会为零,使得普通最小二乘估计量OLSE是有偏的,在大样本下也是不一致的。121121cov(,)ˆlimvar()xxPx(6.5)(2)若x2与x1不相关,则由(6.4)、(6.5)易知的估计量满足无偏性与一致性,但这时的估计却是有偏的。10(3)随机误差项的方差估计也是有偏的。2ˆu21211ˆvar()()vxx21221112ˆvar()()(1)uxxr(4)的方差是真实估计量的方差的有偏估计。1ˆ1ˆ在搜集数据时,如果遇到所搜集的数据不能确实地反映变量间经济行为的情况,就称模型中包含了测量误差(MeasurementErrors)。具体来说,测量误差是指在收集数据过程中的登记误差、在数据加工整理过程中的整理误差以及其他统计误差。测量误差出现的原因是多方面的。首先,调查登记本身就可能产生误差;其次,数据的加工处理过程中也可能导致一定的误差;此外,数据的不当使用也会出现误差,测量误差可能是被解释变量的测量误差,也可能是解释变量的测量误差。2、测量误差(1)因变量存在测量误差,且与自变量不相关,,则OLS估计量具有良好的性质,是无偏和一致的。(2)因变量存在测量误差,且与自变量相关,,则产生内生性问题,OLSE是有偏且不一致的。测量误差造成的内生性也会影响回归分析的结果。(3)自变量存在测量误差,且与自变量测量值不相关、与随机误差不相关,则估计值是一致的,但方差会变大。(4)自变量存在测量误差,且与自变量测量值相关,则产生内生性问题,OLSE是不一致的。OLSE常常会低估真实的回归参数。注意:回归变量的测量误差是数据问题,目前计量经济学家们还提不出有效的解决方法。一般的做法往往是忽略测量误差问题,主观上希望测量误差足够小,从而不破坏回归分析假定的合理性。例如,如果“真实”的回归函数为但却将模型设定为错误的函数形式(WrongFunctionalForm)是指在设定模型时,选取了不正确的函数形式。最常见的就是当“真实”的函数形式为非线性时,却选取了线性的函数形式。3、错误的函数形式1212uyxxe01122yxxv由错误的函数形式造成了内生性,即使其他假设均成立,且样本很大,普通最小二乘估计量也是不一致的。由于经济现象的错综复杂,大多数经济问题中各变量之间存在反馈效应。要描述经济现象的这种复杂关系,必须从整体和系统的角度进行,建立由多个相互联系的单一方程组成的联立方程模型才能完整表达。正如单方程模型会遇到内生性问题,联立方程模型更容易遇到内生性问题。因为在联立方程模型中,结构式中已包含有其它的内生变量,所以在从结构式到简约式的转化中,自然也把误差项带入了其它的结构式中,产生联立性(Simultaneity),进而不可避免地造成内生性。由于内生性的存在,会使得OLS估计量是有偏的和不一致的。4、联立性检验的基本思想:如果不知道遗漏了哪个变量,可寻找一个替代变量来进行遗漏变量检验,替代变量通常选用所设定模型被解释变量的拟合值的若干次幂的线性组合。若模型估计所得的残差包含着遗漏的相关变量,那么这个残差可用被解释变量拟合值若干次幂的线性组合近似表示;若这个线性组合是显著的,则认为原模型设定有误(遗漏变量)。由于可引入若干个替代变量去判断是否有多个变量被遗漏,所以该方法被称为一般性设定误差检验。拉姆齐(Ramsey,1969)提出了一种“回归设定误差检验”(RegressionSpecificationErrorTest),简称RESET检验。第二节解释变量内生性检测一、RESET检验第一步:用OLS法对模型(6.7)进行回归估计RESET检验的基本步骤为:ikikiiuxxy110(6.7)第二步:用被解释变量的拟合值的若干次幂的线性组合,测度残差中是否包含着遗漏的相关变量。ˆiy具体做法为,在第一步的模型(6.7)中增加一个包含拟合值的函数。这个函数通常选择为拟合值的平方、立方和四次方的线性组合。例如:ˆiyˆiyiiiikikiiyyyxxy433221110ˆˆˆ其中,RSSU为对模型(6.8)(相当于无约束模型)进行回归得到的残差平方和,RSSR为模型(6.7)(有约束模型)进行回归得到的残差平方和,dfU和dfR分别为前二者的自由度。针对模型(6.8),(6.9)式可以写为:其中n为样本个数,k为解释变量个数。第三步:提出原假设:。构造F统计量:01230H:()()RURUUURSS-RSSdf-dfFRSSdf(6.9)3((3)1)RUURSSRSSFRSSnk(6.10)第四步:给定显著性水平,若F统计值大于等于临界值,则拒绝原假设,表明存在设定误差(遗漏变量),否则,说明不存在设定误差(遗漏变量)。类似的,也可以利用F统计值对应的概率值来判断:如果概率值小于等于,则拒绝原假设,表明存在设定误差(遗漏变量),否则,说明不存在设定误差(遗漏变量)。F表6-1城镇居民人均可支配收入和人均消费性支出抽样调查数据(元)〔例6-1〕关于城镇居民的消费行为,某些研究者认为由于有较高的社会福利保障,以绝对收入假说消费函数模型为理论模型,能够得到理想的拟合结果,因而得出城镇居民的消费行为应该服从绝对收入消费理论假说,收入是唯一显著的变量。用表6-1的样本数据验证这一结论是否正确。家庭序号可支配收入消费性支出y家庭序号可支配收入消费性支出y11510.21278.891162804998.0021700.61554.86126859.65309.0032026.61840.59137702.86030.0042577.42110.81148472.26510.9453496.22852.34159421.67182.00642833537.5716104937943.0074838.93919.471711759.58696.5585160.34186.001813785.89997.4795425.14331.611915780.7611242.85105854.024619.9120-25410.00xx模型的参数均通过了0.01水平下的显著性检验,R2=0.998表明拟合效果很好。但是由于我们仅用当期收入来解释消费支出的变化,因此,可能遗漏了相关变量。下面进行RESET检验。利用EViews做回归,得样本回归方程:ˆ468.620.7003iiyx(6.11)由式(6.11)估计出消费性支出,在原回归模型中加入新的解释变量、后重新估计,发现的系数不显著,因此,加入变量进行估计,得到估计结果:ˆiy2ˆiy3ˆiy3ˆiy2ˆiy2ˆˆ141.3660.8220.0000142iiiyxy(6.12)F统计量的值大于0.05显著性水平下自由度为(1,16)的F分布的临界值4.49,因此拒绝原假设,表明原模型确实存在设定误差,遗漏了相关变量,所以我们认为消费与收入之间的关系可能并不像一元线性模型那么简单。RESET检验也可以利用EViews直接来完成。操作方法如下:作y关于x的回归,然后在输出结果窗口选择View/StabilityTest/RamseyRESETTest…,在弹出的“NumberofFitted”对话框中,设定代理变量个数为1。点击“OK”,检验结果如下:计算F统计量:()()(311458.8-40698.67)/(17-16)40698.67/16RURUUURSS-RSSdf-dfFRSSdf=106.4448由于F统计量对应的概率为0,显然小于0.05,故拒绝原假设,认为遗漏了相关变量。由此可见,我国城镇居民的消费行为,不能认为服从绝对收入消费理论假说,线性模型设定有误。表6-4EViews输出结果RamseyRESETTest:F-statistic106.4448Probability0.000000Loglikelihoodratio38.66636Probability0.000000TestEquation:DependentVariable:YVariableCoefficientStd.Errort-StatisticProb.C141.365539.013553.6234990.0023X0.8219870.01214967.659220.0000YF^2-1.42E-051.38E-06-10.317210.0000R-squared0.999723Meandependentvar5165.361AdjustedR-squared0.999689S.D.d

1 / 52
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功