七、异方差与自相关一、背景我们讨论如果古典假定中的同方差和无自相关假定不能得到满足,会引起什么样的估计问题呢?另一方面,如何发现问题,也就是发现和检验异方差以及自相关的存在性也是一个重要的方面,这个部分就是就这个问题进行讨论。二、知识要点1、引起异方差的原因及其对参数估计的影响2、异方差的检验(发现异方差)3、异方差问题的解决办法4、引起自相关的原因及其对参数估计的影响5、自相关的检验(发现自相关)6、自相关问题的解决办法(时间序列部分讲解)三、要点细纲1、引起异方差的原因及其对参数估计的影响原因:引起异方差的众多原因中,我们讨论两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响。这样,遗漏的变量就进入了模型的残差项中。当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差。二是截面数据中总体各单位的差异。后果:异方差对参数估计的影响主要是对参数估计有效性的影响。在存在异方差的情况下,OLS方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质。一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t统计量偏大,使得本应该被接受的原假设被错误的拒绝。2、异方差的检验(1)图示检验法由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差。具体的做法是,以回归的残差的平方2ie为纵坐标,回归式中的某个解释变量ix为横坐标,画散点图。如果散点图表现出一定的趋势,则可以判断存在异方差。(2)Goldfeld-Quandt检验Goldfeld-Quandt检验又称为样本分段法、集团法,由Goldfeld和Quandt1965年提出。这种检验的思想是以引起异方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本。用两个子样本分别进行回归,并计算残差平方和。用两个残差平方和构造检验异方差的统计量。Goldfeld-Quandt检验有两个前提条件,一是该检验只应用于大样本(n30),并且要求满足条件:观测值的数目至少是参数的二倍;二是除了同方差假定不成立以外,要求其他假设都成立,随机项没有自相关并且服从正态分布。Goldfeld-Quandt检验假设检验设定为:H0:具有同方差,H1:具有递增型异方差。具体实施步骤为:①将观测值按照解释变量x的大小顺序排列。②将排在中间部分的c个(约n/4)观测值删去,再将剩余的观测值分成两个部分,每个部分的个数分别为n1、n2。③分别对上述两个部分的观测值进行回归,得到两个部分的回归残差平方和。④构造F统计量222111/()/()eenkFeenk,其中k为模型中被估参数个数。在H0成立条件下,21(,)FFnknk⑤判别规则如下,若FF(n2-k,n1-k),接受H0(具有同方差)若FF(n2-k,n1-k),拒绝H0(递增型异方差)注意:①当摸型含有多个解释变量时,应以每一个解释变量为基准检验异方差。②此法只适用于递增型异方差。(3)Breusch-Pagan/GodfreyLM检验该方法的基本思想是构造残差平方序列与解释变量之间的辅助函数,得到回归平方和ESS,从而判断异方差性存在的显著性。该检验假设异方差的形式为:220()ifiαz其中iz是解释变量构成的向量,当α0时,模型是同方差的。具体设模型为:表示是某个解释变量或全部。同样,该检验也可以通过一个简单的回归来实现。提出原假设为,具体步骤如下:01234567050100150200XYY12233iiikikiYu201122var()iiiipipiuv12,,p012:0p①构造变量2()ienee:用OLS方法估计方程中的未知参数,得和(n为样本容量)②以2()ienee为被解释变量,iz为解释变量进行回归,并计算回归平方和ESS。构造辅助回归函数③构造LM统计量为:LM=12ESS当有同方差性,且n无限增大时有④对于给定显著性水平,如果2()2ESSp,则拒绝原假设,表明模型中存在异方差。为了计算的简便,LM统计量的构造也可以采取如下形式:1[]2LM-1gZ(ZZ)Zg其中,Z是关于(1,)iz的nP观测值矩阵,g是观测值21()iiegnee排成的列向量。由于上述统计量的构造过分依赖于残差的正态性假定,因此,Koenker和Bassett对该统计量进行了修正,令2211()niiVenneeu()nee则1()LMV-1u-u)Z(ZZ)Z(u-u(4)White检验White检验由H.White1980年提出。和Goldfeld-Quandt检验相比,White检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造2统计量进行异方差检验。White检验的提出避免了Breusch-Pagan检验一定要已知随机误差的方差产生的原因且要求随机误差服从122ˆˆˆiiikikeY22ˆien2011222ˆiiipipiev2~2pESS正态分布。White检验与Breusch-Pagan检验很相似,但它不需要关于异方差的任何先验知识,只要求在大样本的情况下。White的检验的思想直接来源于其异方差一致估计。当存在异方差时,传统的方差估计式21(|)()VarbXXX不再是估计量方差的一致估计,而应该使用White一致性估计:21()niiiie-1-1(XX)(XX)x'x。通过检验21()XX是不是参数估计方差的一致估计,可以检验是否存在异方差。在实际的应用过程中,可以通过回归的步骤来简单的实现上述思想。以二元回归模型yi=0+1xi1+2xi2+ui为例,White检验的具体步骤如下:①首先对上式进行OLS回归,求残差平方2ie。②做如下辅助回归式,2ie=0+1xi1+2xi2+3xi12+4xi22+5xi1xi2+vi即用残差平方2ie对原回归式中的各解释变量、解释变量的平方项、交叉乘积项进行OLS回归。注意,上式中要保留常数项。求辅助回归式的可决系数R2。③White检验的原假设和备择假设是H0:ui不存在异方差,H1:ui存在异方差④利用回归②得到的2R,计算统计量2nR。在同方差假设条件下,统计量nR22(5)其中n表示样本容量,R2是辅助回归式的OLS估计的可决系数。自由度5表示辅助回归式中解释变量项数(注意,不计算常数项)。nR2属于LM统计量。统计量2nR渐进服从自由度为1k的卡方分布,其中k是辅助回归中参数的个数(包括常数项)。⑤判别规则是若nR22(5),接受H0(ui具有同方差)若nR22(5),拒绝H0(ui具有异方差)(5)ARCH检验自回归条件异方差(ARCH)检验主要用于检验时间序列中存在的异方差。ARCH检验的思想是,在时间序列数据中,可认为存在的异方差性为ARCH过程,并通过检验这一过程是否成立来判断时间序列是否存在异方差。ARCH过程可以表述为:222011ttptptv其中p是ARCH过程的阶数,并且00,0,(1,2,)iip;tv为随机误差。ARCH检验的基本步骤如下:①提出假设:012:0;pH1:(1,2,)jHjp中至少一个不为零。②对原模型做OLS估计,求出残差te,并计算残差平方序列2(1,2,)tetT,分别作为对2t的估计。③作辅助回归222011ˆˆˆttptpeee并计算上式的可决系数2R,可以证明,在原假设成立的情况下,基于大样本,有2()TpR近似服从自由度为p的卡方分布。如果22()()TpRp,则拒绝原假设,表明原模型的误差项存在异方差。(6)Park检验法Park检验法就是将残差图法公式化,提出是解释变量的某个函数,然后通过检验这个函数形式是否显著,来判定是否具有异方差性及其异方差性的函数结构。(7)Glejser检验法这种方法类似于Park检验。首先从OLS回归取得残差ie之后,用ie的绝对值对被认为与方差密切相关的X变量作回归。3、异方差的解决办法(详细见板书)对异方差的传统解决办法是通过加权最小二乘WLS将残差向同方差转换。一般认为,异方差的产生是由于残差项中包含了解释变量的相关信息,也就是说,可以将残差项e表达成解释变量x的函数:2iix()egx其中x是1k的向量,()g可以是关于x的线性函数,也可以是非线性的。如果知道()gx的函数形式,那么可以通过加权最小二乘的方法对模型进行修正,在不存在自相关的假定下,在回归方程()yfx两边同乘以1()gx可以对残差进行修正,从而消除残差的异方差性使得OLS估计量仍然具有有效性。但是,这样的方法却有两个方面的问题——首先,是()g的形式难以确定(为了简便,我们往往假设()g是关于x的线性函数,但实际上真实的函数形式很可能是非线性的),从而相应的WLS的权重设定也就往往是不正确的了;其次,即使知道()gx的真实函数形式,通过加权得出的参数估计也已经不是原来的关注参数了;最后,在强外生性条件(|)0Ex不满足的条件下,WLS估计量也往往是不一致的。因此,从现代的观点来看,从模型设定的角度对异方差进行修正才是可行的方法。4、引起自相关的原因及其对参数估计的影响引起自相关的原因主要可以归纳为三点:①经济数据的固有的惯性(inertia)带来的相关,比如经济系统自身的惯性,经济活动的滞后效应。这主要出现在时间序列数据当中,经济变量在时间上的惯性往往是造成自相关的主要原因。滞后效应指的是某一经济变量对另一经济变量的影响不仅影响于当期,而是延续若干期,由此带来变量的自相关。②模型的设定误差,主要仍然是遗漏变量的影响,将遗漏的变量归入了残差项,由于遗漏的变量在不同时间点上是相关的,这就造成了残差项的自相关。③对数据的处理造成了数据的内在联系,从而引起自相关现象。自相关对参数估计的影响仍然是影响参数估计的有效性,自相关的存在使得OLS得到的参数估计不再具有最小方差性质。一般而言,在存在自相关的情况下,如果仍然用满足古典假定的OLS去估计参数及其方差,会低估真实的2,更会低估参数估计的方差,从而是t统计量被高估,致使原来不显著的解释变量变得显著,夸大的参数的显著水平。5、自相关的检验(1)图示检验图示检验是一种直观的检验自相关的方法。与上述检验异方差的方法略有不同的是,该方法是通过做残差的当期值与其滞后期的值的散点图来判断是否存在自相关。具体做法是,以OLS回归的残差当期值为纵坐标,以其滞后值为横坐标(可以是滞后一期,也可以是滞后一期以上)画散点图。如果该图形有明显的趋势,则可以认为残差存在自相关。(2)相关系数检验法相关系数的方法是检验自相关的一个简单方法。其基本思想就是通过计算OLS回归得到的残差之间的一阶自相关系数,来确认是否存在自相关的现象。具体表示如下:tteytxb做辅助回归1ttterev21121TTtttttreee显然,r是对相关系数的一个估计。但是这个方法的问题是:没有一个确定的标准来判断究竟多大的相关悉数才能认为存在自相关。(3)Breusch-GodfreyLM检验Breusch-GodfreyLM检验的原假设是不存在自相关,备择假设是存在自相关1:()tHARp。基本步骤如下:①提出假设:012:0;pH1:(1,2,)jHjp中至少一个不为零。其中p是阶数。②对原模型做OLS估计,求出残差te(1,2,)tT。③作辅助回归011ttptpteeev并得到上面回归的可决系数2R,可以证明,在原