1在前面几章里我们讨论的回归模型中都有一些基本的假定。只有当一个回归模型满足经典假定条件时,才能得到一个较好的估计。然而,在研究实际的社会经济等问题时,经常会遇到一些违背经典假定的情况。第四章违背经典假定的回归模型2在这些情况下,如果直接用普通最小二乘法建立模型,会得到很不理想的结果。因此,如何处理这些问题,就是我们需要面对的问题。3在这一章里我们将重点讨论模型中出现了违背经典假定的几种情况时的诊断及解决办法。异方差序列相关多重共线性4第一节异方差性一、异方差性的概念和产生的原因(一)异方差性的概念5在回归模型的基本假设中,假定随机误差项u1,u2,…,un具有相同的方差,独立或不相关,即对于所有样本点,有:(),(1,2,,),(),i2ijEu0inσijCovu,u0ij),,2,1,(nji(4.1)6但是在建立实际问题的回归模型时,经常存在与此假设相违背的情况,一种是经济计量建模中常说的方差非齐性或异方差性,即:()()ijVaruVaruji当时(4.2)7异方差性:在线性模型的基本假定中,关于方差不变的假定不成立,其他假定不变的情形称为异方差性。8(二)异方差产生的原因实际问题是非常错综复杂的,因而在建立实际问题的回归分析模型时,经常会出现某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同的影响,导致随机误差项产生不同方差。通过下面的几个例子,我们可以了解产生异方差性的背景和原因。9【例4.1】按照差错—学习模式,当人们学习时,动作上出现的差错随时间的增加而逐渐减少。如在某一时期内测验打字差错数(Y)与打字实习小时数(X)之间的关系。随着打字实习小时数的增加,打字差错平均字数及它们的方差不是不变的,而是随之减少的。这个模型中就出现了异方差。10【例4.2】在研究城镇居民收入与消费的关系时,我们知道居民收入与消费水平有着密切的关系。用Xi表示第i户的收入,Yi表示第i户的消费额,那么反映收入与消费之间的模型为:niuXYii,,2,1,21(4.3)11在式(4.3)的模型中,因为各户的收入不同,消费观念和习惯的差异,导致消费的差异非常大,模型中存在明显的异方差性。一般情况下,低收入的家庭购买差异性较小,大都购买生活必需品;12但是高收入的家庭购买行为差异就很大,高档消费品很多,房子、汽车的规格选择余地也很大,这样购买金额的差异就很大;导致消费模型的随机误差项具有不同的方差。13【例4.3】利用某行业的不同企业的截面样本数据估计C-D生产函数uYAKLe(4.4)由于这里的u表示了包括不同企业的工艺、地理条件、工人素质、管理水平上的差异以及其他因素。对于不同企业,这些因素对产出的影响程度不同,引起ui偏离0均值的程度不同,出现了异方差。14引起异方差的原因还有很多,如模型中省略了重要的解释变量,模型的函数形式设定不准确等都容易产生异方差。一般情况下样本数据为截面数据时容易产生异方差性。15二、异方差产生的后果当一个回归模型中的随机误差项存在异方差时,是否可以继续使用普通的最小二乘法?倘若我们仍然使用,将会产生什么样的后果?16当模型中存在异方差时,参数的方差将大于在同方差条件下的方差。如果用普通最小二乘法估计参数,将出现低估的真实方差的情况。进一步将导致回归系数的检验值高估,可能造成本来不显著的某些回归系数变成显著。这将给回归方程的应用效果带来一些影响。ˆˆ172222)]ˆ(Eˆ[E)ˆ(Var)22(1121212222222121nnnnnnuukkuukkukukukE2]ukΣ[Eii18当模型中存在异方差时,普通最小二乘估计存在以下问题。191.参数估计量虽是无偏的,但不是最小方差线性无偏估计根据经典线性回归中关于参数估计量的无偏性和有效性的证明过程,可以看出,当线性回归模型出现异方差性时,其普通最小二乘法参数估计量仍然具有无偏性,但不具有有效性。202.参数的显著性检验失效在经典线性回归模型中,关于变量的显著性检验构造了t统计量,在该统计量中包含有随机误差项共同的方差,并且该t统计量服从自由度为(n-k)的t分布。如果出现了异方差性,t检验就失去意义。采用其他检验也是如此。2u213.回归方程的应用效果极不理想,或者说模型的预测失效。一方面,由于上述后果,使得模型不具有良好的统计性质;另一方面,在预测值的置信区间中也包含有随机误差项共同的方差。所以,当模型出现异方差性时,它的预测功能失效。2u22三、异方差性的检验对于异方差性的检验,人们进行了大量的研究,提出的诊断方法已有10多种,但没有一个公认的最优方法,下面介绍几种常见的方法。23(一)残差图分析法残差图分析法是一种直观、方便的分析方法。它以残差为纵坐标,以其他适宜的变量为横坐标画散点图。常用的横坐标有三种选择:(1)以拟合值为横坐标;(2)以Xi为横坐标;(3)以观测时间或序号为横坐标。2ieˆiY24X2e图4.1252eX图4.226图4.1和图4.2是以X为横坐标,残差e2为纵坐标的残差图,表现出残差有一定的趋势。这样的情况下,我们就可以判断出该回归模型有一定的异方差性。图4.1表明ui的方差反比于解释变量Xi,图4.2表明ui的方差正比于解释变量Xi。2i2i27在EViews软件包中,直接给出了以ei为纵坐标,以观测时间或序号为横坐标的残差图。28如果回归模型适合于样本数据,那么残差ei应反映ui所假定的性质,因此可以根据ei来判断回归模型ui是否具有某些性质。一般情况下,当回归模型满足所有假定时,以ei为纵坐标的残差图上的n个点散布应是随机的、无任何规律。29等级相关系数法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既适用于大样本,也适用于小样本。将异方差性与误差项和某个解释变量之间相关程度联系起来,从而将对异方差性的研究转化为对它们之间相关程度的研究。(二)等级相关系数法30进行等级相关系数检验通常有三个步骤:第一步,作Y关于X的普通最小二乘估计,求出ui的估计值,即ei的值。31第二步,取ei的绝对值,即,把Xi和按递增或递减的次序划分等级。按下式计算出等级相关系数ieiXieniisdnnr122)1(61(4.5)其中,n为样本容量,di为对应于Xi和的等级的差数。ie32第三步,做等级相关系数的显著性检验。在n8的情况下,用下式对样本等级相关系数rs进行t检验。检验的统计量为212ssrnrt(4.6)33如果,则可以认为异方差性问不存在,如果,说明Xi和之间存在系统关系,则说明模型中存在异方差。)2(2ntt)2(2nttie34在多元的情况下,需对每一个解释变量做等级相关系数检验。只有当每个解释变量检验都不存在异方差时模型中才不存在异方差。否则,模型中存在异方差。35首先将样本按某个解释变量的大小顺序排列,并将样本从中间截成两段;然后各段分别用普通最小二乘法拟合回归模型,并分别计算各段的残差平方和。(三)戈德菲尔德-匡特检验(样本分段比检验)36令第一段为高方差段,第二段为低方差段,并记两段的样本容量分别为n1和n2,模型参数个数为k,两段样本回归残差分别为e1i和e2i,则两段的残差平方和分别为和,从而可计算出各段模型的随机误差项的方差估计量分别为和2111ˆRSSnk2222ˆRSSnk12111niiRSSe22221niiRSSe37由此可构造出检验统计量为21112222ˆ/()ˆ/()RSSnkFRSSnk(4.7)38该统计量服从自由度为(n1-k)和(n2-k)的F分布。在给定的显著性水平α之下,若此统计量F的值大于临界值则可认为有异方差的存在。12,Fnknk39为了提高此检验的功效,戈德菲尔德和匡特曾经建议,将观测样本分成两段时,可将中间的部分数据删掉。然而,删掉的数据越多,各段中估计的自由度就越小,从而又会影响检验的功效。因此,删掉的中间部分数据也不能太多。一般地,删掉的数据不应多于样本观测数据的1/3。40用残差绝对值对每个解释变量建立各种回归模型,如ie12iiieXv121iiievX12iiieXv等等,并检验回归系数α2是否为0。(四)戈里瑟(Glejser)检验41设原假设为H0:α2=0,备择假设为H1:α2≠0,应用t检验判断,如果α2≠0则有异方差。这种方法不仅能检验出模型中存在的异方差,而且把异方差的表现形式找出来便于后面改进时使用。42(五)怀特检验用残差平方对所有解释变量及其平方项和交叉乘积项进行线性回归,并检验各回归系数是否为0。2ie22232323,,,,,,,XXXXXX43对于两个解释变量的回归模型iiiiuXXY33221(4.8)怀特检验步骤如下:第一步,使用普通最小二乘法估计模型(4.8),并获得残差ei。44第二步,做如下的辅助回归iiiiiiiivXXXXXXe326235224332212(4.9)就是将残差ei的平方对所有的解释变量及解释变量的平方与交叉积回归,求这个辅助回归的判定系数R2。2ie45第三步,在无异方差的原假设下,可以证明,辅助回归的R2乘以样本容量n,渐近地服从自由度为辅助回归中解释变量个数r(不包括常数项)的x2分布,即)(~22rRn(4.10)在本例中,辅助回归有5个解释变量,因此r=5。46第四步,如果nR2大于选定显著性水平的临界χ2值,则有异方差。如果不大于临界χ2值,则无异方差,即在辅助回归中,α2=α3=α4=α5=α6=0.在EViews软件中,给出了怀特检验程序,可以直接输入相应条件,即可获得怀特检验的结果。47四、异方差性的修正办法当我们所研究的问题存在异方差性时,就违背了线性回归模型的经典假定。此时,就不能用普通最小二乘法进行参数估计。48必须寻求适当的补救方法,对原来的模型进行变换,使变换后的模型满足同方差性假定,然后进行模型参数的估计,就可得到理想的回归模型。49我们考虑一元线性回归模型niuXYii,,2,1,21(4.11)加权最小二乘法50(一)已知时2i如果每个观察值的误差项方差是已知的,使用为权数,对模型(4.11)作如下变换:2ii/112iiiiiiiYXu(4.12)51由于22211()()1iiiiiiuVarVaru通过加权变换使误差项变成同方差了。52如果模型的其他假定条件都满足,则模型(4.12)就变成满足经典假定的回归模型了,就可利用普通最小二乘法估计参数,得到的估计量是最佳线性无偏估计量。53通过加权变换使原模型中的异方差误差项转换为同方差误差项,使加权变换后的模型满足最小二乘法的假定,从而使用普通最小二乘法估计参数,这种方法称为加权最小二乘法。54(二)未知时2i如果是未知的,一般情况下,我们可根据误差与解释变量或被解释变量的关系来确定变换的权数。一般我们先采用戈里瑟检验方法确定ei与Xi之间的关系。2i551.如之间为线性关系,则可认为iiXe与iiiXuE222(4.13)这时,选择为权数,即对模型(4.11)两边同时乘以,将异方差模型变为同方差模型。iX1iX156即将模型(4.11)变为iiiiiiXuXXXY21(4.14)57容易证实模型(4.14)为同方差模型。可用普通最小二乘法估计模型(4.14)的参数,得到最佳线性无偏估计量。模型(4.14)是无截距模型,要用过原点回归去估计参数,EViews软件包提供了这种功能。21,582.如之间为线性关系,则可认为iiXe与2222)(iiiXuE(4.15)59这时,选择1/Xi为权数,可将模型(4.11)变换为如下模型:iiiiiXuXXY21(4.16)60容易证实,模型(4.