第六章自相关自相关的概念自相关的后果自相关的检验自相关的补救措施第一节自相关概述一、自相关的概念⒈概念:违反无序列相关的假定:⒉相关程度计算:自相关系数自相关时序数据空间相关截面数据)(0),cov(jijinjtjtnjttnjtjttjtt12121,在其他假设仍成立的条件下,序列相关即意味着0)(jiE2112)()()()(nnEEECovμμμ2112nnIΩ22或二、自相关产生的原因经济系统的惯性:GDP、价格经济活动的滞后效应数据处理:季节调整蛛网现象:模型设定偏误:真实模型:采用模型:tttt121消费收入消费tttPS1tttt221产出产出边际成本ttt产出边际成本1三、自相关的表现形式P阶自回归模型AR(p):特例:AR(1)q阶移动平均模型MA(q)移动平均自回归模型ARMA(p,q)tptpttt2211ttt1qtqtttt2211qtqtttptpttt22112211第三节自相关的检验一、图示法由于扰动项是不可观测的,而残差又看做扰动项的估计,因此可以通过检验的变化判断是否存在自相关。图示法的具体步骤是:1)用给定的样本估计回归模型,计算残差;2)绘制残差图,主要有两种形式:将残差按照时间顺序绘制时序图;做对的散点图;3)分析残差图。tettettete1te二、DW检验DW检验是J.Durbin,G.S.Watason于1951年提出的,利用残差构成的统计量推断误差项是否存在一阶自相关,统计量如下:其中,即可表示为对做回归的系数估计值,可等价于与的相关系数。tet)ˆ1(2)1(2222)(221212212122112212212212221TttTtttTttTtttTttTttTtttTttTttTttTttteeeeeeeeeeeeeeeDWˆte1tete1teD.W检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断若0D.W.dL存在正自相关dLD.W.dU不能确定dUD.W.4-dU无自相关4-dUD.W.4-dL不能确定4-dLD.W.4存在负自相关0dLdU24-dU4-dL正相关不能确定无自相关不能确定负相关DW检验临界值与三个参数有关:检验水平;样本容量;解释变量个数k注意:DW检验的使用条件:(1)扰动项的自相关形式是一阶自回归形式。(2)解释变量中不能包含被解释变量的滞后期。(3)样本容量应充分大(T〉15)。(4)模型中有截距项,没有数据缺失。〉当DW值落在“不确定”区域时,有两种处理方法:加大样本容量或重新选取样本,重做DW检验;选用其他检验方法。〉不适用对高阶自相关的检验。DW检验是最早出现的检验方法之一,标志着计量经济模型的开始,现在看来,该检验只有在特殊的情形下才能用,因而如今就基本看不到他的应用了。——菲利浦.汉斯.费朗西斯(2005)t拉格朗日乘数(Lagrangemultiplier)检验拉格朗日乘数(LM)检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为BG检验。三、LM检验(BG检验)与DW检验相比,LM检验是一个使用性更强的自相关检验方法,即可检验一阶自相关,也可检验高级自相关,即可检验普通的回归模型,也可检验ARMA模型,即可检验解释变量中包含滞后被解释变量的模型。具体步骤如下:对回归模型考虑扰动项存在p阶自回归形式:其中vt为随机项,符合各种假定条件。构造原假设:此假设表明扰动项不存在p阶自相关。对回归模型估计,得到残差,构建辅助回归模型:tktktttXXXY2211tptjttt2211021ptktktttXXXY2211对上式估计,计算可决定系数R2,构造LM统计量:其中,n表示样本容量。在零假设成立的条件下,LM渐近服从分布,判别规则:tktkttptptttXXXeeee22112211)(2p022022H),(H),(拒绝接受pRTLMpRTLM)(~)(22pRpnLM注意1.回归模型可以包括被解释变量的滞后值2.干扰项服从q阶移动平均(MA)过程,(LM)BG检验也适用。3.LM检验的一个缺陷在于,滞后长度p值不能事先确定。这就需要对p值多次试验。也用所谓的赤池和施瓦茨信息准则(AIC)来筛选滞后长度。qtqtttt2211四、回归检验法回归检验法的优点是:(1)适合于任何形式的自相关检验,(2)若结论是存在自相关,则同时能提供出自相关的具体形式与参数的估计值。缺点是计算量大。回归检验法的步骤如下:①用给定样本估计模型并计算残差et。②对残差序列et,(t=1,2,…,T)用普通最小二乘法进行不同形式的回归拟合。如:对上述各种拟合式进行显著性检验,从而确定误差项ut存在哪一种形式的自相关。tttttttttteeeeeee2122111第五节自相关的处理如果模型的扰动项存在自相关,首先应分析产生自相关的原因。如果自相关是由于错误地设定模型的数学形式所致,那么就应当修改模型的数学形式。怎样查明自相关是由于模型数学形式不妥造成的?可用残差et对解释变量的较高次幂进行回归,然后对新的残差作DW检验,如果此时自相关消失,则说明模型的数学形式不妥。如果自相关是由于模型中省略了重要的解释变量造成的,那么解决办法就是找出省略的解释变量,把它做为重要解释变量列入模型。怎样查明自相关是由于略去重要解释变量引起的?可用残差et对那些可能影响被解释变量但又没列入模型的解释变量做回归,并做显著性检验,从而确定该解释变量的重要性。如果是重要解释变量,应该列入模型。只有当以上两种引起自相关的原因都消除后,才认为扰动项“真正”存在自相关。在这种情况下,可采用广义最小二乘法。何为虚假自相关广义最小二乘法原回归模型:则:假定扰动项具有一阶自回归行为:则:即:令:…则:————广义差分变换tktktttXXXY2211ttt1111221111tktktttXXXY111221111tktktttXXXY两式相减1112222111111ttktkktkttttttXXXXXXYYtktktkttttttXXXXXXYY)()()()1(1122211111*1tttYYY*1111tttXXX*)1(*2122tttXXXtktktttXXXY**22*11**注意:(1)对原模型进行OLS估计得到的的估计量称作普通最小二乘估计量;对差分后的回归模型进行OLS估计得到的的估计量称作广义最小二乘估计量。(2)由于差分变换损失了一个观测值,为了避免这种损失,可采取普莱斯-温斯滕变换(praiswinstentransformation)(3)当误差项具有高级自回归形式时,仍可用上述类似的方法进行广义差分变换。(4)当用广义差分变量回归的结果中仍存在自相关时,可以对广义差分变量继续进行广义差分直到回归模型中不存在自相关为止。,,21*11YY),,2,1(121*1kjXXjj一阶差分法自相关系数一般是未知的,可采取以下方法:①直接取,则差分后的模型变为:适用条件:如果自相关系数很高或者DW的d统计量很低,一阶差分可能合适。粗略经验法则:只要dR2就能用一阶差分形式。注意:一阶差分模型不含有截距项。1tktktttXXXY2211②用DW统计量估计:③科克伦-奥科特迭代:步骤:第一步:按照OLS对原模型估计,并获得残差第二步:利用估计的残差做一阶自相关回归:第三步:利用得到的做广义差分方程,并估计出广义最小二乘估计量第四步:利用广义最小二乘估计量,计算原模型参数估计值:21ˆDWtetttee1ˆtktktkttttttXXXXXXYY)ˆ()ˆ()ˆ()ˆ1(ˆ1122211111tktktttXXXY**22*11**ˆ1ˆˆ*ˆˆ第五步:根据原回归模型及估计值计算残差:第六步:利用估计的残差做一阶自相关回归:由于不知道这一轮估计的是否接近的真实值,可以进入第三轮估计,并如此继续下去,直到相邻两次估计值相差很小,如0.01或0.005为止。利用EVIEWS,可直接在原模型中输入AR(1),自动完成迭代。方法:LSYCX1X2…XkAR(1)tektkttttXXXYeˆˆˆˆ2211tttee1ˆ案例:中国商品进口模型经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。表4.2.11978~2001年中国商品进口与国内生产总值国内生产总值GDP(亿元)商品进口M(亿美元)国内生产总值GDP(亿元)商品进口M(亿美元)19783624.1108.9199018547.9533.519794038.2156.7199121617.8637.919804517.8200.2199226638.1805.919814862.4220.2199334634.41039.619825294.7192.9199446759.41156.119835934.5213.9199558478.11320.819847171.0274.1199667884.61388.319858964.4422.5199774462.61423.7198610202.2429.1199878345.21402.4198711962.5432.1199982067.461657198814928.3552.7200089442.22250.9198916909.2591.4200195933.32436.1资料来源:《中国统计年鉴》(1995、2000、2002)。1.通过OLS法建立如下中国商品进口方程:ttGDPM02.091.152ˆ(2.32)(20.12)2.进行序列相关性检验。•DW检验取=5%,由于n=24,k=2(包含常数项),查表得:dl=1.27,du=1.45由于DW=0.628dl,故:存在正自相关。••拉格朗日乘数检验2阶滞后:21~786.0~094.10003.0593.6~tttteeGDPe(0.23)(-0.50)(6.23)(-3.69)R2=0.6614于是,LM=220.6614=14.55取=5%,2分布的临界值20.05(2)=5.991LM20.05(2)故:存在正自相关3阶滞后:321~032.0~819.0~108.10003.0692.6~tttteeeGDPe(