第6章内生性和工具变量估计方法内生性和工具变量估计方法6.1 内生性6.1.1OLS估计的不⼀致性6.1.2内⽣性产⽣的原因6.2 工具变量估计方法6.2.1⼯具变量估计法6.2.2两阶段最小⼆乘法:TSLS6.3 内生性检验重要概念6.1 内生性6.1.1OLS估计的不⼀致性6.1.2内⽣性产⽣的原因6.1 内生性6.1.1OLS估计的不⼀致性模型:若则为内生自变量。• 存在内⽣自变量时,OLS估计不再有⼀致性uXXXYkk+++++=ββββ!221100),(Cov≠uXrrX6.1 内生性6.1.1OLS估计的不⼀致性以一元回归模型为例:• 多元线性模型下,不仅内⽣变量前的回归系数不⼀致,外⽣变量前的系数也可能不⼀致。uXY++=10ββ0)Var()Cov()()()()(ˆ1211112111≠→−−=−−=−∑∑∑∑=−=−==XX,uXXnuXXnXXuXXniiniiiniiniiiββ6.1 内生性6.1.1OLS估计的不⼀致性以不带截距项的二元回归模型为例:uXXY++=2211ββ0),(Cov1≠uX0),(Cov2=uX)ˆ1(ˆˆ2,2,,2,222212112121XXXXuXXXuXXSSSSSρρββ−−=−6.1 内生性6.1.1OLS估计的不⼀致性只要,不以概率收敛到。)()(2,1,)(2,1,)(2211112,112,121221XXXXnSjuXXnSjXXnSiniiXXniijjiuXnijjiXjj−−==−==−=∑∑∑=−=−=−)]1([),(Cov),(Covˆ2,1,22222121121XXXXXXXuXuXρσσρσββ−−→−021,≠XXρ2ˆβ2β6.1 内生性6.1.1OLS估计的不⼀致性u 结论1:OLS估计的不一致性(1)线性回归模型内生自变量回归系数的OLS估计不是一致估计;(2)如果和内生自变量相关,外生自变量回归系数的OLS估计不是一致估计6.1 内生性6.1.1OLS估计的不⼀致性内生性影响图示:是对的估计。XYudXdudXdY//+=ββˆdXdu/+β6.1 内生性6.1.2内⽣性产⽣的原因模型设定错误、测量误差和联立性• 模型设定错误是导致内生性昀常见的原因,模型设定错误往往表现为相关变量的缺失,缺失变量成为错误设定模型误差项的一部分,当缺失变量和模型中其他变量相关时,就会导致这些变量的内生性。(工资与教育、能力)、 • 不相干变量引入不会影响参数估计的无偏性和一致性,但是会影响参数估计的有效性。 6.2 工具变量估计方法6.2.1⼯具变量估计法6.2.2两阶段最小⼆乘法:TSLS6.2 工具变量估计方法6.2.1⼯具变量估计法⼯具变量估计法一元线性回归模型Ø 定义1:如果存在变量,满足(1)与不相关(2)与相关称为的工具变量,也称工具(instrument)。uXY++=10ββZXZu0),(Cov=uZX0),(Cov≠XZ⼯具变量估计法一元线性回归模型总体矩条件:类比出样本矩条件:uXY++=10ββ0)(E)(E0])[()()Cov(1010=−−==−−==XYuZXYEZuEZ,uββββ0)ˆˆ(0)ˆˆ(1i1011i101=−−=−−∑∑=−=−niiniiiXYnZXYnββββ⼯具变量估计法一元线性回归模型uXY++=10ββ∑∑==−−−−=−=niiiniiiIVIVIVXXZZYYZZY11110))(())((ˆˆˆβββ⼯具变量估计法一元线性回归模型u 结论2:工具变量估计的性质(1)工具变量估计是一致估计 (2)工具变量估计具有渐进正态分布uXY++=10ββZXYu⼯具变量估计法一元线性回归模型u 结论3:OLS估计和工具变量估计一元线性回归模型的自变量为外生时,OLS估计可看做以自变量本身为工具的工具变量估计。例⼦6.1⽓温与冷饮消费(续)用住房面积作为⼯具变量uXY++=10ββu++=AirCdColdr10ββHouse⼯具变量估计法一元线性回归模型方差估计:若其中,uXY++=10ββ22)|(E)|(Varσ==ZuZu2,1222ˆ)(ˆS1XZniiXXIVρσβ∑=−=∑∑∑∑====−−−−=−=niiniiniiiXZniiZZXXZZXXun12121,122)()())((ˆˆ21ˆρσiIVIViiXYu10ˆˆˆββ−−=⼯具变量估计法一元线性回归模型假设检验:统计量给定误差项服从正态分布,则若没给定分布,大样本情况下服从标准正态分布。uXY++=10ββIVIVt11Sˆ1ββ≡)2(~1−nttβ⼯具变量估计法一元线性回归模型例⼦6.2已婚⼥性小时⼯资直接OLS:fathedu作工具变量:educwage)785.7()000.1(109.0185.0)ln(+−=−educwage)686.1()989.0(059.0441.0)ln(+−=⼯具变量估计法多元线性回归模型定义2:如果存在变量,满足(1)与不相关,(2)与相关,称为的工具变量,也称工具,。uXXXXYkkrrrr++++++=++βββββ!!11110lZu0),(Cov=uZllX0),(Cov≠llXZlZlXrl,,1!=⼯具变量估计法多元线性回归模型同一元情形一样,总体矩条件:类比原则得样本矩条件,可解得参数估计。uXXXXYkkrrrr++++++=++βββββ!!11110krmXXYXuXuXrlXXYZuZuZkkmmmkklll,,1,0)](E[)(E),(Cov,,1,0)](E[)(E),(Cov110110!!!!+==−−−−====−−−−==ββββββ⼯具变量估计法多元线性回归模型u 结论4:工具变量估计的性质(1) (2)其中为的方差,。uXXXXYkkrrrr++++++=++βββββ!!11110jIVpjIVββ⎯→⎯ˆ),0(~)ˆ(2ˆ)(jIVNnajIVjIVβσββ−2ˆjIVβσjIVβˆkj,,1,0!=⼯具变量估计法多元线性回归模型例⼦6.3在职男性⼯资由于能力变量的缺失,导致经验和教育都具内生性,因此Kling用居住地附近是否有四年制大学(虚拟变量)作为的工具变量,以年龄和年龄的平方作为和的工具变量εβββββ+++++=Xeduexperexperwage32210)log(eduexper2exper⼯具变量估计法EViews操作例⼦6.2已婚⼥性小时⼯资(续)暂时只考虑的内生性,用作其工具变量。EViews实现步骤:建立工作文件,组(group)打开相关变量,在数据表格界面点击Proc→Make Equaon进入模型设定对话框并依次输入因变量和自变量,点击Esmaon se?ngs下拉菜单中的TSLS-Two-Stage Least Squares,在弹出对话框中输入工具变量ueduexperexperwage++++=32210)log(ββββedumothedu⼯具变量估计法EViews操作例⼦6.2已婚⼥性小时⼯资(续)ueduexperexperwage++++=32210)log(ββββ⼯具变量估计法EViews操作例⼦6.2已婚⼥性小时⼯资(续)点击选择按钮(Opons)对参数估计协方差矩阵的估计方法进行选择,本例采用的是横截面数据,因此采用怀特异方差一致的协方差矩阵估计。ueduexperexperwage++++=32210)log(ββββ6.2 工具变量估计方法6.2.2两阶段最小⼆乘法:TSLS两阶段最小⼆乘法:TSLS一个内生自变量 为内生变量, 和 为外生变量,、为的工具变量。 两阶段昀小二乘步骤: 第一阶段(first stage):以内生变量为因变量,所有外生变量为自变量做回归 得拟合值uXXXY++++=3322110ββββ1X2X3X1Z2Z1XvXXZZX+++++=3423221101ααααα3423221101ˆˆˆˆˆˆXXZZXααααα++++=两阶段最小⼆乘法:TSLS一个内生自变量 为内生变量, 和 为外生变量,、为的工具变量。 两阶段昀小二乘步骤: 第二阶段(second stage):将作为的工具变量,对模型 实施工具变量估计 uXXXY++++=3322110ββββ1X2X3X1Z2Z1X1ˆX1XuXXXY++++=3322110ββββ两阶段最小⼆乘法:TSLS一个内生自变量 对模型的参数约束检验可以验证工具变量的优良性。 原假设: • 用第五章构造的统计量进⾏F检验,若值够⼤,通常⼤于10则认为相关性⾜够,可做⼯具变量。• 若接受原假设,则表明⼯具变量与内⽣变量相关性太弱,其不适宜做⼯具 uXXXY++++=3322110ββββvXXZZX+++++=3423221101ααααα0:H210==ααrTrT两阶段最小⼆乘法:TSLS一个内生自变量 EViews实现两阶段昀小二乘: 例⼦6.2已婚⼥性小时⼯资(续)的工具变量:、、在EViews的工具变量设定框中输入: eduueduexperexperwage++++=32210)log(ββββfathedumotheduhusedu两阶段最小⼆乘法:TSLS一个内生自变量 EViews实现两阶段昀小二乘: 例⼦6.2已婚⼥性小时⼯资(续) ueduexperexperwage++++=32210)log(ββββ两阶段最小⼆乘法:TSLS一个内生自变量 EViews实现两阶段昀小二乘: 例⼦6.2已婚⼥性小时⼯资(续)估计结果与前面相差很大,检验工具变量与内生变量的相关性,发现用三个工具变量时相关性大大提升,故应采用mothedu,fathedu,husedu一起做工具变量。• ⼯具变量的好坏直接影响估计结果,实际应用中,寻找合适的⼯具变量是解决问题的关键,也是困难所在。 ueduexperexperwage++++=32210)log(ββββ两阶段最小⼆乘法:TSLS一个内生自变量 例⼦6.4中国⼥性劳动参与率与家庭结构但是Hours和withP的互相影响导致withP的内生性,选用女性是否有存活的兄弟()和该女性在家中排行是否昀小()做工具变量。 XRecpPensnagePkidsagewithPHoursββˆ74.598.4_048.0559.0724.0272.3ˆ)178.2()607.2()350.0()590.0()675.3()374.1(0++−−+−+=−−−1Z2ZXRecpPensnagePkidsagewithPHoursIVIVββˆ795.534.5_14.0135.1765.073.18ˆ)104.2()73.2()952.0()128.1()77.3()39.2(0++−−+−+=−−−两阶段最小⼆乘法:TSLS多个内生自变量 、为内生变量,为外生变量,和为的工具变量,为的工具变量 两阶段昀小二乘估计的步骤: 第一阶段(first stage): 分别以内生变量和为因变量,以所有外生变量、、和为自变量进行回归,即 uXXXY++++=3322110ββββ1X2X3X1Z2Z1XW2X1X2X1Z2ZW3Xεγγγγγααααα+++++=+++++=343221102343221101XWZZXvXWZZX两阶段最小⼆乘法:TSLS多个内生自变量 、为内生变量,为外生变量,和为的工具变量,为的工具变量 两阶段昀小二乘估计的步骤: 得拟合值 第二阶段(second stage): uXXXY++++=3322110ββββ1X2X3X1Z2Z1XW2X34232211023423221101ˆˆˆˆˆˆˆˆˆˆˆˆXXZZXXXZZXγγγγγααααα++++=++++=两阶段最小⼆乘法:TSLS多个内生自变量 、为内生变量,为外生变量,和