第6章自相关非自相关假定自相关的来源与后果自相关检验自相关的解决方法克服自相关的矩阵描述(不讲)自相关系数的估计案例分析6.1非自相关假定:Cov(ui,uj)=E(uiuj)=0,(i,jT,ij)如果Cov(ui,uj)0,(i,jT,ij)则称误差项ut存在自相关。自相关又称序列相关。也是相关关系的一种。自相关按形式可分为两类:(1)一阶自回归形式。ut=f(ut-1)(2)高阶自回归形式。ut=f(ut–1,ut–2,…)经济计量模型中自相关的最常见形式是一阶线性自回归形式。ut=a1ut-1+vtE(vt)=0,t=1,2…,TVar(vt)=v2,t=1,2…,TCov(vi,vj)=0,ij,i,j=1,2…,TCov(ut-1,vt)=0,t=1,2…,T依据普通最小二乘法公式,模型ut=a1ut-1+vt中a1的估计公式是,1ˆa=TttTtttuuu22121。若把ut,ut-1看作两个变量,则它们的相关系数是ˆ=TttTttTtttuuuu2212221。对于充分大的样本显然有Tttu22Tttu221。把这种关系代入上式得122121ˆˆaTttTtttuuu对于总体参数有=a1,回归模型中误差项ut的一阶自回归形式可表示为,ut=ut-1+vt序列的自相关特征分析。给出具有正自相关,负自相关和非自相关三个序列。-4-2024102030405060708090100X-6-4-20246-6-4-20246X(-1)X-6-4-20246102030405060708090100X-6-4-20246-6-4-20246X(-1)Xc.负自相关序列d.负自相关序列散点图-3-2-10123102030405060708090100U-4-2024-4-2024U(-1)Ue.非自相关序列f非自相关序列散点图a.正自相关序列b.正自相关序列散点图6.2自相关的来源与后果自相关的来源:1.模型的数学形式不妥。2.惯性。大多数经济时间序列都存在自相关。3.回归模型中略去了带有自相关的重要解释变量。6.2自相关的来源与后果模型存在自相关的后果1.回归系数的最小二乘估计量jˆ仍具有无偏性。2.Var(jˆ)不再具有最小方差性。3.有可能低估误差项ut的方差(估计小了)。4.由于ut存在自相关时,Var(1ˆ)和su2都变大,都不具有最小方差性。用依据普通最小二乘法得到的回归方程去预测,预测无有效性。6.3自相关检验(1)图示法:依据残差et对时间t的序列图作出判断。(2)DW(Durbin-Watson)检验法使用DW检验,应首先满足如下三个条件。(1)误差项ut的自相关为一阶自回归形式。(2)因变量的滞后值Yt-1不能在回归模型中作解释变量。(3)样本容量应充分大(T15)DW检验步骤如下。H0:=0(ut不存在自相关)。H1:0(ut存在一阶自相关)用残差值et计算统计量DW。DW=TttTttteee12221)(=TttTtTtTttttteeeee1222212122因为在样本容量充分大条件下有Ttte22≈Ttte221≈Ttte12所以DW可以近似表示为,DW≈TttTtTtttteeee2212212122=2(1-TttTttteee22121)=2(1-ˆ)与DW值的对应关系及意义DWut的表现=0DW=2ut非自相关=1DW=0ut完全正自相关=-1DW=4ut完全负自相关010DW2ut有某种程度的正自相关-102DW4ut有某种程度的负自相关当DW值落在“不确定”区域时,有两种处理方法。(1)加大样本容量或重新选取样本,重作DW检验。有时DW值会离开不确定区。(2)选用其它检验方法。DW检验临界值与三个参数有关。(1)检验水平a,(2)样本容量T,(3)原回归模型中解释变量个数k(不包括常数项)。的取值范围是[-1,1],所以DW统计量的取值范围是[0,4]。6.3自相关检验6.3自相关检验(3)LM检验(亦称BG检验)法LM统计量既可检验一阶自相关,也可检验高阶自相关。LM检验是通过一个辅助回归式完成的,具体步骤如下。Yt=0+1X1t+2X2t+…+kXkt+ut考虑误差项为n阶自回归形式ut=1ut-1+…+nut-n+vtH0:1=2=…=n=0用多元回归式得到的残差建立辅助回归式,et=1ˆet-1+…+nˆet-n+0+1X1t+2X2t+…+kXkt+vt估计并计算确定系数R2。构造LM统计量,LM=TR2若LM=TR22(n),接受H0;若LM=TR22(n),拒绝H0。6.4自相关的解决方法1.如果自相关是由于错误地设定模型的数学形式所致,那么就应当修改模型的数学形式。方法是用残差et对解释变量的较高次幂进行回归。2.如果自相关是由于模型中省略了重要解释变量造成的,那么解决办法就是找出略去的解释变量,把它做为重要解释变量列入模型。怎样查明自相关是由于略去重要解释变量引起的?一种方法是用残差et对那些可能影响被解释变量,但又未单列入模型的解释变量回归,并作显著性检验。只有当以上两种引起自相关的原因都排除后,才能认为误差项ut真正存在自相关。在这种情况下,解决办法是变换原回归模型,使变换后模型的随机误差项消除自相关。这种估计方法称作广义最小二乘法。6.4自相关的解决方法Yt=0+1X1t+2X2t+…+kXkt+ut(t=1,2,…,T)其中ut具有一阶自回归形式ut=ut-1+vt其中vt满足通常的假定条件Yt=0+1X1t+2X2t+…+kXkt+ut-1+vt用第1式求(t-1)期关系式,并在两侧同乘:Yt-1=0+1X1t-1+2X2t-1+…+kXkt-1+ut-1上两式相减,得Yt-Yt-1=0(1-)+1(Xt-X1t-1)+…+k(Xkt-Xkt-1)+vt作广义差分变换:Yt*=Yt-Yt-1;Xjt*=Xjt-Xjt-1,j=1,2,…k;0*=0(1-)则模型如下Yt*=0*+1X1t*+2X2t*+…+kXkt*+vt(t=2,3,…T)vt满足通常的假定条件,可以用OLS法估计上式。6.4自相关的解决方法注意:(1)上式中的1,…,k就是原模型中的1,…,k。0*与原模型中的0有如下关系,0=0*/(1-)上述方法得到的0ˆ,1ˆ,…,kˆ称作回归系数的广义最小二乘估计量。(2)当误差项ut的自相关具有高阶自回归形式时,仍可用与上述相类似的方法进行广义差分变换。(3)当用广义差分变量回归的结果中仍存在自相关时,可以对广义差分变量继续进行广义差分,直至回归模型中不存在自相关为止。6.5自相关系数的估计1.用DW统计量的值计算。ˆ=1-(DW/2)2.直接拟合估计。6.6案例分析例6.1天津市城镇居民人均消费与人均可支配收入的关系。改革开放以来,天津市城镇居民人均消费性支出(CONSUM),人均可支配收入(INCOME)以及消费价格定基指数(PRICE)数据(1978~2000年)见表6.2。现在研究人均消费与人均可支配收入的关系。先定义不变价格(1978=1)的人均消费性支出(Yt)和人均可支配收入(Xt)。令Yt=CONSUM/PRICE,Xt=INCOME/PRICE假定所建立的回归模型形式是Yt=0+1Xt+ut2004006008001000120014000500100015002000XY-60-40-20020406080100788082848688909294969800RESIDYt和Xt散点图残差图(1)估计线性回归模型并计算残差。=111.44+0.7118Xt(6.5)(42.1)R2=0.9883,s.e.=32.8,DW=0.60,T=23(2)分别用DW、LM统计量检验误差项ut是否存在自相关。已知DW=0.60,若给定a=0.05,查附表4,得DW检验临界值dL=1.26,dU=1.44。因为DW=0.601.26,认为误差项ut存在严重的正自相关。LM(BG)自相关检验辅助回归式估计结果是et=0.6790et-1+3.1710–0.0047Xt+vt(3.9)(0.2)(-0.4)R2=0.43,DW=2.00LM=TR2=230.43=9.89。因为20.05(1)=3.84,LM=9.893.84,所以LM检验结果也说明误差项存在一阶正自相关。EViews的LM自相关检验操作:点击最小二乘回归窗口中的View键,选ResidualTests/SerialCorrelationLMTest…,在随后弹出的滞后期对话框中给出最大滞后期。点击OK键。例6.1天津市城镇居民人均消费与人均可支配收入的关系。tYˆ(3)用广义最小二乘法估计回归参数。首先估计自相关系数ˆ。ˆ=1-2DW=1-260.0=0.70对原变量做广义差分变换。令GDYt=Yt-0.70Yt-1GDXt=Xt-0.70Xt–1以GDYt,GDXt,(1979~2000年),为样本再次回归,得GDYt=45.2489+0.6782GDXt(3.7)(20.0)R2=0.95,DW=2.31,T=22,(1979~2000)DW=2.31。查附表4,dL=1.26,dU=1.43。因为DW=2.31(4-1.43)=2.57,依据判别规则,误差项已消除自相关。例6.1天津市城镇居民人均消费与人均可支配收入的关系。0ˆ*=45.2489。0ˆ=0ˆ*/(1-ˆ)=45.2489/(1-0.70)=150.8297则原模型的广义最小二乘估计结果是tYˆ=150.8297+0.6782Xt经济含义是天津市城镇居民人均消费性支出平均占人均可支配收入的67.82%。-60-40-200204060788082848688909294969800RESID例6.1天津市城镇居民人均消费与人均可支配收入的关系。注意:(1)R2值有所下降。不应该不相信估计结果。原因是两个回归式所用变量不同,所以不可以直接比较确定系数R2的值。(2)两种估计方法的回归系数有差别。计量经济理论认为回归系数广义最小二乘估计量优于误差项存在自相关的OLS估计量。所以0.6782应该比0.7118更可信。特别是最近几年,天津市城镇居民人均收入的人均消费边际系数为0.6782更可信。(3)用EViews生成新变量的方法:从工作文件主菜单中点击Quick键,选择GenerateSeries…功能。打开生成序列(GenerateSeriesbyEquation)对话框。在对话框中输入如下命令(每次只能输入一个命令),Y=CONSUM/PRICEX=INCOME/PRICE按OK键。变量Y和X将自动显示在工作文件中。例6.1天津市城镇居民人均消费与人均可支配收入的关系。例6.2天津市保费收入和人口的回归关系本案例主要用来展示当模型误差项存在2阶自回归形式的自相关时,怎样用广义差分法估计模型参数。1967~1998年天津市的保险费收入(Yt,万元)和人口(Xt,万人)数据散点图见图。Yt与Xt的变化呈指数关系。对Yt取自然对数。LnYt与Xt的散点图见图。可以在LnYt与Xt之间建立线性回归模型。LnYt=0+1Xt+ut0100000200000300000650700750800850900950XY468101214700800900XLnYYt和Xt散点图LnYt和Xt散点图(1)估计线性回归模型并计算残差。tLnY=-11.18+0.0254Xt(-20.9)(37.2)R2=0.9788,s.e.=0.34,DW=0.36,T=32,(1967-1998)(2)检验误差项ut是否存在自相关。已知D