第8章内生性、工具变量与GMM估计•外生性与常见的内生性问题•矩估计(MM)与工具变量法(IV)•线性模型的两阶段最小二乘估计(2SLS)•线性模型的广义矩估计(GMM)§8.1外生性与常见的内生性问题一、外生性假设与内生性问题二、常见的内生性一、外生性假设与内生性问题线性回归模型中一个重要的假设是“严格外生性”:E(|X)=0严格外生性(strictlyexogeneity)的含义是:各期的解释变量Xt独立于所有期的随机扰动项t。在严格外生性与球型假设下,OLS估计量是BLUE。这两大假设也称为Yt或t是独立同分布的(iid)。对模型Yt=0+1Xt1+…+kXtk+t或Yt=Xt’+t或Y=X+1、外生性与OLS估计量的统计性质如果X的严格外生性不满足,则需假设Xt与t的同期无关性(contemporaneouslyuncorrelated):E(t|Xt)=0且t~iid(0,2)E(t|Xt)=0称为解释变量与随机扰动项同期无关。或称Xt为外生的(exogenous),否则,称为同期相关或内生的(endogenous)XX=Plim(X’X/n)=E(XtXt’)2、出现同期相关OLS估计的后果Question:WhatwillhappenifE(t|Xt)=0fails?于是:Plim(b1)=1+Cov(Xt,t)/Var(Xt)1假设有一元模型Yt=0+1Xt+t出现Xt与t的同期相关性:Cov(Xt,t)=E(Xtt)0后果:OLS估计量不一致,(当然也是有偏的)。将原模型Yt代入上式得:对多元模型Yt=Xt’+t或Y=X+小样本下:E(b|X)=+(X’X)-1X’E(|X)+0=在X内生的情况下:OLS估计量有偏且不一致假设模型为Yt=0+1Xt+2Yt-1+t=Xt*’+t其中Xt*=[1,Xt,Yt-1]’,t=t-1+vt二、几种常见的同期相关/内生的情形)(00)()()(111ttttttttYEYEXEEE*tXE(Yt-1t-1)0•情形1:随机扰动项自相关且模型含滞后被解释变量注意:(1)如果t不存在自相关,则E(Xt*t)=0,但有E(Xt+1*t)0,即不存在同期相关,只存在异期相关。问题:如果t只存在2阶自相关,情形会如何?•情形2:存在遗漏变量,且遗漏变量与解释变量相关如,当设定如下工资方程时:lnWaget=0+1educt+ut一个重要的影响因素“能力”被遗漏了,而“能力”与“受教育程度”往往有较强的相关性。假设模型为Yt=0+1Xt1+2Yt-1+t=Xt*’+t但t中包含了一个与Xt1同期相关另一变量X2t:t=Xt2+ut这时,X1的严格外生性不满足,它与t的同期不相关性也不满足。•情形3:存在测量误差假设模型Yt=0+1Xt+t假设收集不到Xt的精确观测值,收集到的Xt*包含了测量误差vt:Xt*=Xt+vt由于实际估计的是如下可观测变量的回归模型:Yt=0+1Xt*+ut于是:ut=Yt-0-1Xt*=[0+1Xt+t]-0-1(Xt+vt)=t-1vtE(Xt*ut)=E(Xt+vt)ut]=E(Xtut)+E(vtut)=E(Xtt)-1E(Xtvt)+E(tvt)-1E(vt2)=-1v20问题:如果X可观测,而Y不可观测,情况如何?•情形4.联立方程偏误设有如下简单的Keynsian模型Ct=0+1Yt+tYt=Ct+It其中,Yt、Ct、It分别表示国民收入、消费与投资。Ct、Yt也称为模型的内生变量(endogenousvariables),It称为外生变量(exogenousvariable)。则:E(Ytt)=E[(Ct+It)t]=E(Ctt)+E(Itt)=E(Ctt)0事实上,E(Ytt)=E[(0+1Yt+t)t]=1E(Ytt)+E(t2)从而:Cov(Yt,t)=E(Ytt)=2/(1-1)0§8.2矩估计与工具变量法一、矩估计二、矩估计中的工具变量法三、工具变量法的统计性质四、弱工具变量带来的估计偏误内生性的核心问题是E(t|Xt)0,而工具变量法则是寻找一组工具变量Z,满足E(t|Zt)=0,并按矩估计的思想来进行参数估计的。一、矩估计1、矩估计(MethodofMoment,MM)矩估计是一种类比方法,该方法从总体具有的某些固有的特征(总体矩)出发,认为如果样本是从某总体中抽出的,则样本也应具有类似的特征(样本矩),从而通过计算样本的相关特征,寻找总体参数的估计。例:对于总体均值,=E(X),这时g(X)=X对于总体方差,2=E(X-)2,这时g(X)=(X-)2总体均值称为总体的1阶原点矩,总体方差称为总体的2阶中心矩。总体矩M可以简单地定义为一随机变量X的某个连续函数g的数学期望:M=E[g(X)]根据类比法的原理,可以用样本矩(或样本矩函数)来估计总体矩(或总体矩函数),而且,样本矩在大样本下往往具有一致性。这一类比法也称为矩法。矩法可用于估计总体的参数例1.设{Xi}是从某一服从指数分布的总体f(X,)=exp(-X),X0中抽出的。由于指数分布的均值为:M1=()=E(X)=1/2、OLS作为一个矩问题对模型Y=X+假设模型的设定是正确的,则有E(X’)=0,从而有矩条件:M()=E[X’(Y-X)]=0根据矩法(类比法),相应的样本矩为:m()=(1/n)X’(Y-Xb)问题归结为,寻找适当的b,使得m(b)=0或:(1/n)X’(Y-Xb)=0解为:b=(X’X)-1X’Y线性模型的OLS估计可以看成是矩估计。二、矩估计中的工具变量(IV)法假设有如下模型:Yt=Xt1’1+Xt22+t其中:X2为单一变量,X1为包括截距项的k维行向量2、1为对应的参数变量与参数向量。如果模型设定正确,则有如下总体矩条件E(Xt1t)=0,E(Xt2t)=0(1/n)Xt1(Yt-Xt1’b1-Xt2b2)=0(1/n)Xt2(Yt-Xt1’b1-Xt2b2)=0(1/n)Xt1(Yt-Xt1’b1-Xt2b2)=0(1/n)Xt2(Yt-Xt1’b1-Xt2b2)=0正规方程组如果缺少矩条件,如E(Xt2t)0,则上述正规方程组最后一个方程不存在,则无法求解。这时,如果能寻找一工具变量Z2,满足Cov(Zt2,t)=E(Zt2t)=0,Cov(Zt2,Xt2)0。使得原模型的矩条件变为E(Xt1t)=0,E(Zt2t)=0bIV=(ZtXt’)-1ZtYt=(Z’X)-1(Z’Y)(1/n)Xt1(Yt–Xt1’b1,IV–Xt2b2,IV)=0(1/n)Zt2(Yt–Xt1’b1,IV–Xt2b2,IV)=0相应的样本矩方程组为假设有一元模型Yt=0+1Xt+t出现Xt与t的同期相关性:Cov(Xt,t)=E(Xtt)0例:一元回归例这时,寻找一工具变量Z,满足Cov(Zt,t)=E(Ztt)=0,Cov(Zt,Xt)0。使得原模型的矩条件变为E(Ztt)=0相应的样本矩方程组为(1/n)(Yt–b0,IV–Xtb1,IV)=0(对应E(t)=0)(1/n)Zt(Yt–b0,IV–Xtb1,IV)=0(对应E(Ztt)=0)解得:对于矩阵形式:Y=X+如果E(X’)0,(假设Xk与随机项相关),用工具变量Z替代X(如用Zk替代Xk):由于Z与X的列相同L=K,Z’X满秩,解为:bIV=(Z’X)-1Z’Y则相应的样本矩条件为:(1/n)Z’(Y-Xb)=0或Z’Xb=Z’Y得到总体矩条件E(Z’)=0注意:工具变量矩阵中所含的模型已有的外生解释变量可看成自己的工具变量。•工具的选择在单方程的估计中,工具变量的寻找较困难。这时,对时间序列模型,可用随机解释变量的滞后期变量作为工具变量。理论上,Z中保留了X中所有被认为是外生的且与随机扰动项无关的变量,而那些内生的与随机扰动项相关的变量被工具(变量)所取代。C的估计可用外生变量I作为Y的工具变量,1仍是1的工具变量,这时Z=(1I),于是三、工具变量(IV)法的统计性质一元模型Yt=0+1Xt+t出现Xt与t的同期相关性:Cov(Xt,t)=E(Xtt)0这时,寻找一工具变量Z,满足Cov(Zt,t)=0,Cov(Zt,Xt)0于是:注意:在小样本下,工具变量法估计量仍是有偏的:1、一致性对于矩阵形式:Y=X+如果E(X’)0,用工具变量Z替代X,有总体矩条件E(Z’)=0解为:bIV=(Z’X)-1Z’Y注意:这里要求工具变量与解释变量间的关满足:Plim(Z’X/n)=E(ZtXt’)=zx是一满秩有限矩阵Proof:由于bIV=+(Z’X)-1Z’或b-=(Z’X)-1Z’另一方面,由于E[Ztt]=0,由中心极限定理:而Var(Ztt)=E(t2ZtZt’)=E[E(t2ZtZt’|Zt)]=E[ZtZt’E(t2|Zt)]=2E(ZtZt’)=2ZZ2、渐近正态性3、IV估计量不具有渐近有效性Z的不同取法,都可得到参数的一致估计,但渐近方差不同。当取Z=X时,bIV具有最小的渐近方差。由于2(ZX)-1ZZ(ZX’)-1=2plim(n-1Z’X)-1(n-1Z’Z)(n-1X’Z)-1=2plim[n-1X’Z(Z’Z)-1Z’X]-1=2plim[n-1X’PZX)]-1(*)如果,Z=X,则(*)退化为2plim[n-1X’X(X’X)-1X’X]-1=2plim[n-1X’X)]-1(**)于是:X’X-X’PZX=X’MZX=(MZX)’(MZX)=半正定矩阵下面证明2(XX)-1=2plim(n-1X’X)-1是最小的渐近方差。对任意可行的Z,相应的bIV的渐近方差为(1/n)2plim[n-1X’Z(Z’Z)-1Z’X]-1=(1/n)2plim[n-1X’PZX)]-1这也简接证明了第4章中曾指出的如下一类估计量的渐近有效性只需证明,对任意nN,X’X与其他估计的方差之差为半正定矩阵。gj(X)=Zj时,即为IV估计gj(X)=Xj时,即为OLS估计4、弱工具变量带来的估计偏误工具变量Z要求:(1)与随机扰动项不相关,(2)与解释变量X高度相关但在应用研究中,这样的工具变量Z很难找到:一般找到的工具变量往往是:(1)与随机扰动项有轻度相关,(2)与解释变量X也是轻度相关当工具变量Z与解释变量有轻度相关性时,称之为弱工具变量(weakIV)。在弱工具变量情形下,IV估计可能会带来比OLS估计量更严重的不一致性对一元模型Yt=0+1Xt+t出现Xt与t的同期相关性时:Cov(Xt,t)=E(Xtt)0采用工具变量Z得到:因此,尽管Corr(Z,)较小,而Corr(Z,X)更小时,可能出现Corr(Z,)/Corr(Z,X)Corr(X,)从而有:bIV比bOLS偏差更大(更不具有一致性)。而OLS估计量例(内生性问题,MonteCarlo实验)对Keynsians模型简化式为假设=7.0,=0.8,且t~N(0,1.2)(*)n=10OLS:E()=0.8060IVE()=0.7979由上述假设生成序列Yt与Ct,并对(*)式进行OLS及IV估计(I为工具变量),记录参数、的估计结果重复200次,并求200次估计的、的均值与标准差n=20OLS:E()=0.802IV:E()=0.799n=30OLS:E()=0.80093IV:E()=8.0003n=200OLS:E()=0.800021IV:E()=8.00