第四章经典单方程计量经济学模型:放宽基本假定的模型一、内容提要本章主要介绍计量经济模型的二级检检验问题,即计量经济检验。主要讨论对回归模型的若干基本经典假定是否成立进行检验、当检验发现不成立时继续采用OLS估计模型所带来的不良后果以及如何修正等问题。具体包括异方差性问题、序列相关性问题、多重共线性问题以及随机解释变量这四大类问题。异方差是模型随机扰动项的方差不同时产生的一类现象。在异方差存在的情况下,OLS估计尽管是无偏、一致的,但通常的假设检验却不再可靠,这时仍采用通常的t检验和F检验,则有可能导致出现错误的结论。同样地,由于随机项异方差的存在而导致的参数估计值的标准差的偏误,也会使采用模型的预测变得无效。对模型的异方差性有若干种检测方法,如图示法、Park与Gleiser检验法、Goldfeld-Quandt检验法以及White检验法等。而当检测出模型确实存在异方差性时,通过采用加权最小二乘法进行修正的估计。序列相关性也是模型随机扰动项出现序列相关时产生的一类现象。与异方差的情形相类似,在序列相关存在的情况下,OLS估计量仍具无偏性与一致性,但通常的假设检验不再可靠,预测也变得无效。序列相关性的检测方法也有若干种,如图示法、回归检验法、Durbin-Watson检验法以及Lagrange乘子检验法等。存在序列相关性时,修正的估计方法有广义最小二乘法(GLS)以及广义差分法。多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t-统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。当模型中的解释变量是随机解释变量时,需要区分三种类型:随机解释变量与随机扰动项独立,随机解释变量与随机扰动项同期无关、但异期相关,随机解释变量与随机扰动项同期相关。第一种类型不会对OLS估计带来任何问题。第二种类型则往往导致模型估计的有偏性,但随着样本容量的增大,偏误会逐渐减小,因而具有一致性。所以,扩大样本容量是克服偏误的有效途径。第三种类型的OLS估计则既是有偏、也是非一致的,需要采用工具变量法来加以克服。二、典型例题分析1、下列哪种情况是异方差性造成的结果?(1)OLS估计量是有偏的(2)通常的t检验不再服从t分布。(3)OLS估计量不再具有最佳线性无偏性。解答:第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起OLS估计量出现偏误。2、已知模型ttttuXXY22110222)(tttZuVar式中,Y、X1、X2和Z的数据已知。假设给定权数tw,加权最小二乘法就是求下式中的各β,以使的该式最小2221102)()(tttttttttXwXwwYwuwRSS(1)求RSS对1、2和2的偏微分并写出正规方程。(2)用Z去除原模型,写出所得新模型的正规方程组。(3)把ttZw/1带入(1)中的正规方程,并证明它们和在(2)中推导的结果一样。解答:(1)由2221102)()(tttttttttXwXwwYwuwRSS对各β求偏导得如下正规方程组:0)(22110ttttttttwXwXwwYw0)(122110tttttttttXwXwXwwYw0)(122110tttttttttXwXwXwwYw(2)用Z去除原模型,得如下新模型tttttttttZuZXZXZZY22110对应的正规方程组如下所示:01)(22110ttttttttZZXZXZZY0)(122110tttttttttZXZXZXZZY0)(222110tttttttttZXZXZXZZY(3)如果用1tZ代替(1)中的tw,则容易看到与(2)中的正规方程组是一样的。3、已知模型iiiiuXXY22110式中,iY为某公司在第i个地区的销售额;iX1为该地区的总收入;iX2为该公司在该地区投入的广告费用(i=0,1,2……,50)。(1)由于不同地区人口规模iP可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项ui是异方差的。假设i依赖于总体iP的容量,请逐步描述你如何对此进行检验。需说明:1)零假设和备择假设;2)要进行的回归;3)要计算的检验统计值及它的分布(包括自由度);4)接受或拒绝零假设的标准。(2)假设iiP。逐步描述如何求得BLUE并给出理论依据。解答:(1)如果i依赖于总体iP的容量,则随机扰动项的方差2i依赖于2iP。因此,要进行的回归的一种形式为iiiP2102。于是,要检验的零假设H0:10,备择假设H1:01。检验步骤如下:第一步:使用OLS方法估计模型,并保存残差平方项2~ie;第二步:做2~ie对常数项C和2iP的回归第三步:考察估计的参数1的t统计量,它在零假设下服从自由度为2的t分布。第四步:给定显著性水平面0.05(或其他),查相应的自由度为2的t分布的临界值,如果估计的参数1ˆ的t统计值大于该临界值,则拒绝同方差的零假设。(2)假设iiP时,模型除以iP有:iiiiiiiiiPuPXPXPPY221101由于222/)/(iiiiPPuVar,所以在该变换模型中可以使用OLS方法,得出BLUE估计值。方法是对iiPY/关于iP/1、iiPX/1、iiPX/2做回归,不包括常数项。4、以某地区22年的年度数据估计了如下工业就业回归方程321ln62.0ln25.0ln51.089.3XXXY(-0.56)(2.3)(-1.7)(5.8)20.996R147.1DW式中,Y为总就业量;X1为总收入;X2为平均月工资率;X3为地方政府的总支出。(1)试证明:一阶自相关的DW检验是无定论的。(2)逐步描述如何使用LM检验解答:(1)由于样本容量n=22,解释变量个数为k=3,在5%在显著性水平下,相应的上下临界值为664.1Ud、503.1Ld。由于DW=1.147位于这两个值之间,所以DW检验是无定论的。(2)进行LM检验:第一步,做Y关于常数项、lnX1、lnX2和lnX3的回归并保存残差te~;第二步,做te~关于常数项、lnX1、lnX2和lnX3和1~te的回归并计算2R;第三步,计算检验统计值(n-1)2R=210.996=20.916;第四步,由于在不存在一阶序列相关的零假设下(n-1)2R呈自由度为1的2分布。在5%的显著性水平下,该分布的相应临界值为3.841。由于20.9163.841,因此拒绝零假设,意味着原模型随机扰动项存在一阶序列相关。5、某地区供水部门利用最近15年的用水年度数据得出如下估计模型:rainpricepcypophousewater123.187.17005.0363.0305.09.326(-1.7)(0.9)(1.4)(-0.6)(-1.2)(-0.8)93.02RF=38.9式中,water——用水总量(百万立方米),house——住户总数(千户),pop——总人口(千人),pcy——人均收入(元),price——价格(元/100立方米),rain——降雨量(毫米)。(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符号与你的直觉相符吗?(2)在10%的显著性水平下,请进行变量的t-检验与方程的F-检验。T检验与F检验结果有相矛盾的现象吗?(3)你认为估计值是(1)有偏的;(2)无效的或(3)不一致的吗?详细阐述理由。解答:(1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望house和pop的符号为正;收入较高的个人可能用水较多,因此pcy的预期符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期price的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望rain的系数符号为负。从估计的模型看,除了pcy之外,所有符号都与预期相符。(2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的。这里t-检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所有参数估计值的t值的绝对值都小于该值,所以即使在10%的水平下这些变量也不是显著的。这里,F-统计值的分子自由度为5,分母自由度为9。10%显著性水平下F分布的临界值为2.61。可见计算的F值大于该临界值,表明回归系数是联合显著的。T检验与F检验结果的矛盾可能是由于多重共线性造成的。house、pop、pcy都是高度相关的,这将使它们的t-值降低且表现为不显著。price和rain不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度量。(3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS估计量的无偏性、一致性和有效性仍然成立,即仍是BLUE估计量。但共线性往往导致参数估计值的方差大于不存在多重共线性的情况。6、一个对某地区大学生就业增长影响的简单模型可描述如下tttttgGDPgGDPgPOPgMINgEMP4132110式中,为新就业的大学生人数,MIN1为该地区最低限度工资,POP为新毕业的大学生人数,GDP1为该地区国内生产总值,GDP为该国国内生产总值;g表示年增长率。(1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为基础来选择最低限度工资,则OLS估计将会存在什么问题?(2)令MIN为该国的最低限度工资,它与随机扰动项相关吗?(3)按照法律,各地区最低限度工资不得低于国家最低工资,哪么gMIN能成为gMIN1的工具变量吗?解答:(1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型的随机扰动项中,因此gMIN1与不仅异期相关,而且往往是同期相关的,这将引起OLS估计量的偏误,甚至当样本容量增大时也不具有一致性。(2)全国最低限度的制定主要根据全国国整体的情况而定,因此gMIN基本与上述模型的随机扰动项无关。(3)由于地方政府在制定本地区最低工资水平时往往考虑全国的最低工资水平的要求,因此gMIN1与gMIN具有较强的相关性。结合(2)知gMIN可以作为gMIN1的工具变量使用。三、习题(一)基本知识类题型4-1.解释下列概念:(1)异方差性(2)序列相关性(3)多重共线性(4)偏回归系数(5)完全多重共线性(6)不完全多重共线性(7)随机解释变量(8)差分法(9)广义最小二乘法(10)D.W.检验4-2.判断下列各题对错,并简单说明理由:1)在存在异方差情况下,普通最小二乘法(OLS)估计量是有偏的和无效的;2)如果存在异方差,通常使用的t检验和F检验是无效的;3)在存在异方差情况下,常用的OLS法总是高估了估计量的标准差;4)如果从OLS回归中估计的残差呈现系统模式,则意味着数据中存在着异方差;5)当存在序列相关时,OLS估计量是有偏的并且也是无效的;6)消除序列相关的一阶差分