第2部分单方程回归模型第5章回归模型的应用第6章序列相关和异方差性第7章工具变量法和模型的确认第8章单方程回归模型预测第9章单方程估计:高级问题第7章工具变量法和模型的确认•本章讨论以下问题:•1.每个自变量都与误差项相互无关的假定不成立•2.用工具变量估计技术代替OLS•3.模型的确认错误问题第7章工具变量法和模型的确认•7.1自变量与误差项相关•7.2变量的测量误差•7.3确认失误•7.4回归诊断•7.5确认检验7.1自变量与误差项相关•一元回归模型斜率的OLS为:•其中:•所以:•在一般情况下,我们不专注于有偏还是无偏,而是研究大样本性质.•当自变量与误差项相关时,一般都会导致不具一致性的OLS估计.iiixy222iiiiiixxxxxˆ2iiixyxˆ的无偏估计。不是则若ˆ,0iix7.2变量的测量误差•从以下三种情形来讨论测量误差:•1.Y具有测量误差•因变量存在测量误差的唯一影响是增加了误差项的方差.•2.X具有测量误差•回归参数的OLS估计将是有偏和非一致的•3.X和Y都有测量误差•OLS估计常常低估真正的回归参数.•4.工具变量估计法•能够解决测量误差问题的方法是工具变量估计法7.2.1Y具有测量误差•假定真正的回归模型为:•假设变量,不是.是从下面的测量过程中得到的:•等价于:•进行回归.•注意*iyiiiuyy*iiixyiy)(*iiiiuxy0),(iixuCov7.2.2X具有测量误差•假定,其中真正的值,是观测到的值.真正的回归模型为:•而实际的回归模型为•即使我们假设X的测量误差服从均值为0的正态分布,不存在序列相关,与真正的回归方程中的误差相互独立,以OLS作为回归仍然会存在问题.•由于•因此回归参数的最小二乘估计将是有偏和非一致的.iiivxx**ixiiixyix***)(iiiiiixvxy2iiiiiiivxvExCov)])([(),(**7.2.3X和Y都有测量误差•假定,•相互无关,也与无关,各序列本身都没有序列相关.则估计的回归模型为:•我们做OLS估计回归参数•因此回归参数的最小二乘估计将常常低估真正的回归参数.iiiuyy*iivu和****)(iiiiiixvuxyiiivxx*ixˆ)(/limˆlimxVarvxxppviii222217.2.4工具变量估计法•原理:寻找一个与自变量高度相关,同时与方程中误差项不相关的新变量Z.•如果变量Z满足以下条件,就是一个工具变量:•1.当样本容量增大时,Z与模型中的各个误差项之间的相关系数都趋于0.•当样本容量增大时,Z与X之间的相关系数不为0.•为了简单起见,考虑情形2.•那么回归斜率的估计为•可以证明该参数一致无偏估计.•工具变量法确定了一个能够得到一致估计量的方法,困难之处在于很难得到工具变量iiiiIVzxzyˆ7.2.4工具变量估计法•进一步讨论工具变量法:•对于情形2的回归模型而言,OLS估计是通过下式得到的•当x与误差项相关时,就无法用上式估计了.如果能够找到变量z与误差项无关,但与x相关,那么上式可变为•解得:•结论:首先,普通最小二乘法实际上是工具变量法的一个特例.第二,每一个自变量都可用工具变量替代.最后工具变量法能够保证估计的一致性,但不能保证估计的无偏性.0)ˆ(xyxxy0)ˆ(xyziiiiIVzxzyˆ7.3确认失误•7.3.1被忽略的变量•7.3.2不相干变量的存在•7.3.3非线性•7.3.4建模时的有效与有偏7.3.1被忽略的变量•假设真正的模型是方程(7-7),而实际采用的回归模型是(7-8),假定有关古典线性模型的假设对于(7-7)都成立.•根据(7-8)得到参数估计为:•将式(7-7)代入上式得到:•由于第二项不一定为0,所以上式不一定是无偏估计.只有当时,偏误才会完全消失.032),(xxCov)(),()ˆ(*232322xVarxxCovE2222iiixyx*ˆ7.3.1被忽略的变量•关于被忽略的变量的讨论:•首先,当两个自变量不相关时,是无偏估计量,并且具有相同的方差.•当两个自变量相关时,两个估计量不再具有相同的方差.7.3.2不相干变量的存在•假设真正模型为式(7-11),而回归模型为式(7-12).我们对式(7-12)进行估计得到参数估计,然后将式(7-11)代入,并求期望得到用加入不相干变量的模型估计的参数为无偏估计量.•但不相干变量的存在会影响OLS估计量的有效性.7.3.3非线性•当真正的模型是非线性的时候,用线性模型会导致有偏和非一致的参数估计.7.3.4建模时的有效与有偏•对于那些变量应该包含在模型中,要进行权衡和选择:如果一个变量应该被包含而没有包含,则损失就是无偏性和一致性;如果包含不相干变量,损失是失去有效性,在大样本情形下不要紧,但小样本就比较严重了.•模型形式的选择取决于对偏误和有效做权衡.极小化平均误差平方和是合理的.•采用标准的t检验,可以检验单个变量是否相干.F检验可以检验一组变量是否相干.•如果不清楚那些变量应该出现在模型中,就不能用这样的检验,而应该用模拟技术对平均误差平方和进行比较.•例7.1货币需求量7.4回归诊断•对残差规律的探讨:回归诊断能使我们看出一个或多个数据或一个或多个自变量对回归参数估计会不会有不正常的、过大的影响.•7.4.1学生氏残差•7.4.2DFBETAS7.4.1学生氏残差•较大的残差对于回归诊断十分有用,但去掉某个特别观测后的数据进行回归,分析得到的残差会很有帮助.•对于一元线性回归模型,令代表去掉第i个观测后,回归模型斜率的估计.特别注意残差•我们用去掉第i个观测的回归估计标准误差来除残差,得到学生氏残差的定义绝对值大于1.96的残差可以被认为是异常的.iixiyi)()()(isi)(i)()(*isxiyiiii7.4.2DFBETAS•DFBETAS度量了参数的OLS估计和去掉该观测值后参数估计之间按比例调整的差.•大于1.96的DFBETAS值表明这个值具有特殊的影响力.•例7.2生活质量和房地产价格之间的关系)()]([iisiDFBETAS7.5确认检验•7.5.1关于变量是否应当从线性回归模型中去掉的检验•7.5.2关于是否存在测量误差的检验7.5.1关于变量是否应当从线性回归模型中去掉的检验•适当的模型应当是:•若确定变量应当保留在模型中,但不能确定和是否应当保留在模型中,可用联合的F检验:•对于某个系数是否应当保留在模型中可用t检验.iiiiiXXXY3322110iX1iX3iX20327.5.2关于是否存在测量误差的检验•总结:通过简单的两步法对测量误差进行检验:1)•2)•以上检验是:HausmanTest•例7.3检验公共开支模型中的测量误差.wZXˆ*回归得到残差对检验。检验。多元则用变量的系数进行进行回归,对和对FtwwXYˆˆ*作业