第6章自相关(第6讲)张晓峒(2014年9~12月)南开大学数量经济研究所博士生导师、所长中国数量经济学会副理事长zhangnk710@126.com第6章自相关非自相关假定自相关的来源与后果自相关检验自相关的解决方法克服自相关的矩阵描述(不讲)自相关系数的估计案例分析(2例)file:li-6-1,li-6-2(第4版第135页)6.1非自相关假定:Cov(ui,uj)=E(uiuj)=0,(i,jT,ij)如果Cov(ui,uj)0,(i,jT,ij)则称误差项ut存在自相关。自相关又称序列相关。也是相关关系的一种。自相关按形式可分为两类。(1)一阶自回归形式。ut=f(ut-1)(2)高阶自回归形式。ut=f(ut-1,ut-2,…)经济计量模型中自相关的最常见形式是一阶线性自回归形式。ut=1ut-1+vtE(vt)=0,t=1,2…,TVar(vt)=v2,t=1,2…,T。Cov(vi,vj)=0,ij,i,j=1,2…,TCov(ut-1,vt)=0,t=1,2…,T(第4版第136页)依据OLS公式,模型ut=1ut-1+vt中1的估计公式是1ˆa=TttTtttuuu22121。若把ut,ut-1看作两个变量,则它们的相关系数是ˆ=TttTttTtttuuuu2212221。对于充分大的样本显然有Tttu22Tttu221。代入上式得122121ˆˆTttTtttuuu。对于总体参数有=1。ut的一阶自回归形式可表示为,ut=ut-1+vt下面以一元线性回归模型,Yt=0+1Xt+ut,(t=1,2,…T),其中ut=ut-1+vt,(存在一阶自相关)为例,推导ut的期望、方差与协方差公式。E(ut)=E(ut-1+vt)=E(ut-1)+E(vt)(1-)E(ut)=E(vt)=0E(ut)=E(vt)=0Var(ut)=E(ut)2=E(ut-1+vt)2=E(2ut-12+vt2+2ut-1vt)=2E(ut-12)+E(vt2)+2E(ut-1vt),(E(ut-1vt)=0)(1-2)Var(ut)=E(vt2)=v2Var(ut)=22-1v,(ut的自相关越严重,2越大,Var(ut)越大)Cov(ut,ut-1)=E(utut-1)=E[(ut-1+vt)ut-1]=E(ut-12+ut-1vt)=E(ut-12)+E(ut-1vt)(E(ut-1vt)=0)=Var(ut-1)=Var(ut)(Var(ut)越大,Cov(ut,ut-1))Cov(ut,ut-2)=E(utut-2)=E[(ut-1+vt)ut-2]=E(ut-1ut-2+ut-2vt)=E(ut-1ut-2)+E(ut-2vt)=Cov(ut,ut-1)=2Var(ut)。(E(ut-2vt)=0)同理,Cov(ut,ut-s)=sVar(ut)(第4版137页)序列的自相关特征分析。-4-2024102030405060708090100Xa.正自相关序列b.正自相关序列散点图-6-4-20246102030405060708090100Xc.负自相关序列d.负自相关序列散点图-3-2-10123102030405060708090100Ue.非自相关序列f非自相关序列散点图-6-4-20246-6-4-20246X(-1)X-6-4-20246-6-4-20246X(-1)X-4-2024-4-2024U(-1)U6.2自相关的来源与后果自相关的来源:1.模型的数学形式不妥。2.惯性。大多数经济时间序列都存在自相关。3.回归模型中略去了带有自相关的重要解释变量。(第4版139页)04812162024280.00.20.40.60.81.01.2YYF1YF2X-3-2-10123478808284868890929496980002RESID06.2自相关的来源与后果012345-1.0-0.50.00.51.01.52.02.53.03.5B1F1B1F2B1F3(第4版140页)模型存在自相关的后果:1.回归系数的最小二乘估计量jˆ仍具有无偏性。E(ˆ)=E[(X'X)-1X'Y]=E[(X'X)-1X'(X+u)]=+(X'X)-1X'E(u)=以一元线性回归模型,Yt=0+1Xt+ut,(t=1,2,…T),其中ut=ut-1+vt,(存在一阶自相关)为例,推导1ˆ的期望。121212121)()()()()()(])([)()())(()ˆ(XXuEXXXXuXXEXXuXXXXEXXYYXXEEttttttttttttt同理可证,E(0ˆ)=0。对于多元回归模型也有E(0ˆ)=0。2.Var(jˆ)不再具有最小方差。以一元线性回归模型,Yt=0+1Xt+ut,(t=1,2,…T),其中ut=ut-1+vt,(存在一阶自相关)为例,推导1ˆ的方差。222111)()()()ˆ()ˆ(XXuEXXEEVarttt2221122)(...)()()(1TTtuXXuXXuXXEXX]}))((...)()()()(2[)(...)()()(11133112211222222212122TTTTTTtuuXXXXuXXuXXuXXuXXuXXuXXuXXEXX=ststTttsttTttTttuuEXXXXXXuEXXXX)()())((2)()()(212221212Var(jˆ)=ststTttsttTttTttuuEXXXXXXuEXXXX)()())((2)()()(212221212=ststTttstTtttuuCovXXXXXXXXuVar),()())((2)()(21212当ut不存在自相关时,Cov(ut,us)=0,st,Var(1ˆ)=TtttXXuVar12)()(。当ut具有一阶自回归形式时,Var(1ˆ)=sttsTttstTtttuVarXXXXXXXXuVar)()())((2)()(21212,st对于经济序列,上式右侧第二项常常是正的(为什么?),所以1ˆ不再具有最小方差。对于多元回归模型,1ˆ同样不再具有最小方差。Var(1ˆ)=sttsTttstTtttuVarXXXXXXXXuVar)()())((2)()(21212,stVar(ut)=22-1v3.ut存在自相关时,低估误差项ut的方差,低估1ˆ的方差(估计小了)。4.由于ut存在自相关时,Var(1ˆ)和su2都不具有最小方差性。用依据OLS法得到的回归方程去预测,预测无有效性。6.3自相关检验(1)图示法:依据残差et对时间t的序列图作出判断。(2)DW(Durbin-Watson)检验法使用DW检验,应首先满足如下三个条件。(1)误差项ut的自相关为一阶自回归形式。(2)因变量的滞后值Yt-1不能在回归模型中作解释变量。(3)样本容量应充分大(T15)DW检验步骤如下。H0:=0(ut不存在自相关)。H1:0(ut存在一阶自相关)用残差值et计算统计量DW。DW=TttTttteee12221)(=TttTtTtTttttteeeee1222212122因为在样本容量充分大条件下有Ttte22≈Ttte221≈Ttte12所以DW可以近似表示为,DW≈TttTtTtttteeee2212212122=2(1-TttTttteee22121)=2(1-ˆ)(第4版142页)当DW值落在“不确定”区域时,有两种处理方法。(1)加大样本容量或重新选取样本,重作DW检验。有时DW值会离开不确定区。(2)选用其它检验方法。DW检验临界值与三个参数有关。的取值范围是[-1,1],所以DW统计量的取值范围是[0,4]。6.3自相关检验(第4版144页)与DW值的对应关系及意义DWut的表现=0DW=2ut非自相关=1DW=0ut完全正自相关=-1DW=4ut完全负自相关010DW2ut有某种程度的正自相关-102DW4ut有某种程度的负自相关DW=2(1-ˆ)不确不确拒绝H0定区接受H0定区拒绝H0DW0dLdU24-dU4-dL4附表4DW检验临界值表(=0.05)Tk=1k=2k=3k=4k=5dLdUdLdUdLdUdLdUdLdU151.081.360.951.540.821.750.691.970.562.21161.101.370.981.540.861.730.741.930.622.15171.131.381.021.540.901.710.781.900.672.10181.161.391.051.530.931.690.821.870.712.06191.181.401.081.531.971.680.861.850.752.02201.201.411.101.541.001.680.901.830.791.99211.221.421.131.541.031.670.931.810.831.96221.241.431.151.541.051.660.961.800.861.94231.261.441.171.541.081.660.991.790.901.92241.271.451.191.551.101.661.011.780.931.90251.291.451.211.551.121.661.041.770.951.89261.301.461.221.551.141.651.061.760.981.88271.321.471.241.561.161.651.081.761.011.86281.331.481.261.561.181.651.101.751.031.85291.341.481.271.561.201.651.121.741.051.84注:1.表示检验水平,T表示样本容量,k表示回归模型中解释变量个数(不包括常数项)。2.dU和dL分别表示DW检验上临界值和下临界值。3.摘自Dubrin-Watson(1951)。DW检验临界值与三个参数有关。(1)检验水平,(2)样本容量T,(3)原回归模型中解释变量个数k(不包括常数项)。6.3自相关检验(3)LM检验(亦称BG检验)法(第4版145页)LM统计量既可检验一阶自相关,也可检验高阶自相关。LM检验是通过一个辅助回归式完成的,具体步骤如下。Yt=0+1X1t+2X2t+…+kXkt+ut考虑误差项为n阶自回归形式ut=1ut-1+…+nut-n+vtH0:1=2=…=n=0用多元回归式得到的残差建立辅助回归式,et=1ˆet-1+…+nˆet-n+0+1X1t+2X2t+…+kXkt+vt估计并计算确定系数R2。构造LM统计量,LM=TR2若LM=TR22(n),接受H0;若LM=TR22(n),拒绝H0。6.4自相关的解决方法(第4版146页)如果自相关是由于错误地设定模型的数学形式所致,那么就应当