第8章、单位根、协积和格兰杰因果关系谬误回归(spuriousregression):两个没有任何逻辑联系的序列进行回归,含有很高的R2,因为两个序列都与时俱进(具有时间趋势)。例子,考研人数与手机数量。那么,消费函数Cy也是谬误回归吗?点击美国消费数据文件,工具栏中选择quick/graph,输入coy,观察图形。当我们引入平稳和非平稳的概念。如果消费、收入和残差是非平稳的,那么所有的统计量全部失效了。并且,我们将发现,消费和收入确实是非平稳的。本节使用单位根、协积和格兰杰因果关系来研究这个问题。§1、单位根1、平稳性定义:随机过程{yt}是弱平稳的(weaklystationary,covariancestationary),若(1)Eyt与t无关(2)var(yt)是与t无关的常数(3)cov(yt,ys)是t-s的函数,但不是t或s的函数2、AR(1)过程定义:yt服从一阶自回归过程(autoregressiveprocess),记为AR(1),若1tttyy其中t是白噪声(whitenoise,即0,tE2var()t,cov(,)0ts),||1。3、AR(1)过程是平稳序列吗?若yt服从AR(1)过程,1tttyy试计算yt的均值、方差和自相关函数。定理:若||1,则AR(1)过程是平稳过程。因为(1)1tEy(2)2||2cov(,)1htthyy,22var()1ty(3)||(,)hth证明:(1)1()11ittitiEyE(2)依据协方差的定义,有00000020cov(,)cov(,)cov(,)cov(,)var()iitthitijthjijijtithjijjitithjhjjthjyy220221hjjh(3)||cov(,)(,)var()htthtyythy观察:若||1,{yt}还是平稳过程吗?为什么?看图识平稳。下面分别给出时间序列的图形和程序。是平稳过程吗?y(1)=0;fort=1:1200y(t+1)=5+0.8*y(t)+2*randn;end;plot(y)y(1)=0;fort=1:1200y(t+1)=5+0.1*y(t)+2*randn;end;plot(y)y(1)=0;fort=1:1200y(t+1)=5+0.0001*y(t)+2*randn;end;plot(y)y(1)=0;fori=1:1200y(t+1)=5+0.95*y(t)+2*randn;end;plot(y)y(1)=0;fort=1:1200y(t+1)=5+0.9999*y(t)+2*randn;end;plot(y)y(1)=0;fort=1:1200y(t+1)=5+1.0*y(t)+2*randn;end;plot(y)y(1)=0;fort=1:1200y(t+1)=5+1.1*y(t)+2*randn;end;plot(y)4、积分过程积分过程(integratedprocess),也译为“单整过程”或者“求和过程”。定义:{yt}是非平稳过程,但是一阶差分以后1(1)ttttyLyyy是平稳过程。称{yt}为一阶积分过程,记为I(1)。定义:I(d)过程,若(1)ddttyLy是平稳过程。显然,I(0)过程是平稳序列。习题:将yt进行d阶差分,即1()ddttyy,展开以后观察是否等于(1)dtLy。Ld表示d阶滞后算子,即Ldyt=yt-d。当回归模型中含有非平稳的I(d)序列时,常规的统计推断都不再成立,因此必须检验被解释变量和解释变量是不是平稳的。标准的检验方法是“单位根检验”。5、单位根单位根过程(unitroot)随机游动(randomwalk)I(1)过程1的AR(1)过程使用数学记号表示为1tttyy其中t是白噪声。练习:计算I(1)过程的均值和方差12101()tttttttiiyyyyt0tEyEyt20var()var()tyyt6、单位根检验(1)DF检验(Dickey-Fullertest)1tttyy等价于11(1)ttttyyy1tttyy其中1。如果存在单位根,即1,那么0。因此定义原假设H0:0等价于0H:1似乎可以直接对1tttyy进行线性回归,并进行系数的t检验,但是这是不对的。因为在存在单位根的原假设下,系数的t统计量不再服从常规的t分布了。Dickey和Fuller(1979)证明了分布不是标准的t分布,并模拟了给定样本大小的临界值。比如,下面的定理。定理(Dickey-Fuller检验):若H0为真,那么0Pr((1)21.8|H0.05TT为真)0Pr(3.41|H0.05Tt为真)证明:见《FinancialEconometrics》,GourierouxandJasiak。使用这个定理不太方便,Eview给出了更加方便的结果。(2)使用Eviews进行单位根检验Eviews提供了如下三种检验形式:包含常数项1tttyy包含常数项和线性时间调整项1tttyty无常数项和线性时间调整项1tttyy如果时间趋势和常数都不显著,就改为无常数项和线性时间调整项的情形。选择Quick/SeriesStatistics/UnitRoottest,输入序列名即可。Laggeddifferences为0即为DF检验Laggeddifferences不为0即为ADF检验例子:美国消费和可支配收入的ADF检验消费和收入的图形为0100020003000400030354045505560657075808590COY感觉消费和收入是平稳序列吗?对y进行ADF检验。滞后期为0,即DF检验。ADFTestStatistic-2.1899751%CriticalValue*-4.10355%CriticalValue-3.479010%CriticalValue-3.1669*MacKinnoncriticalvaluesforrejectionofhypothesisofaunitroot.AugmentedDickey-FullerTestEquationDependentVariable:D(Y)Method:LeastSquaresDate:11/26/04Time:17:14Sample(adjusted):19301994Includedobservations:65afteradjustingendpointsVariableCoefficientStd.Errort-StatisticProb.Y(-1)-0.0467090.021329-2.1899750.0323C2.3552289.6814460.2432720.8086@TREND(1929)3.8440711.1485743.3468210.0014R-squared0.359151Meandependentvar49.99385AdjustedR-squared0.338478S.D.dependentvar47.27257S.E.ofregression38.44867Akaikeinfocriterion10.18158Sumsquaredresid91654.63Schwarzcriterion10.28194Loglikelihood-327.9014F-statistic17.37329Durbin-Watsonstat1.693296Prob(F-statistic)0.000001表中Y(-1)、C和@Trend分别表示模型中的参数,和。D(Y)表示消费的一阶差分。观察下面的命令:如何读表?注意1,从而0,因此观察分布的左边即可。Eviews软件给出了ADF统计量(统计量)的数值以及1%、5%和10%三个显著性水平的临界值。如果以5%作为显著性水平,那么若统计量在5%CV左边,则拒绝H0,即无单位根,序列是平稳的。若统计量在5%CV右边,并且为负,则不能拒绝H0,即有单位根,序列是非平稳的。若统计量在5%CV右边,并且为正,则序列是爆炸性的,显然也是非平稳的。ADFTestStatistic为10.16257,比显著性水平为10%的临界值都大,因此不能拒绝原假设,即序列存在单位根,是非平稳的。实际上,是爆炸性的序列。注意:按照多元线性回归的t统计量,Y(-1)的系数是显著的!!!1YYttt按照ADF检验,不显著。因此,这说明非平稳时间序列的回归的t统计量和F统计量是无效的。不能使用非平稳时间序列的t统计量做显著性检验。7、ADF检验当yt为AR(1)过程时,DF检验是有限的。若ty为AR(p)过程,那么必须使用ADF检验(AugmentedDF)。将AR(p)过程写成如下差分的形式,1112211ttttptptyyyyy注意p等于1时,ADF检验就退化为DF检验。因此,DF是ADF的特例:110p。Eviews实现:与DF一样,除了Laggeddifferences选择p即可。如何选择p:找AIC和SC最小的p。回顾AIC和SC定义:AIC准则(Akaikeinformationcriterion)2ln2AICLKnnAIC越小越好,结合如下两者:K(自变量个数)减少,模型简洁LnL增加,模型精确SC准则(Schwazcriterion)2lnln()SCLKnnn例子:消费和收入的ADF检验通过调整ADF检验的滞后期,取AIC和SC最小的滞后期。8、PP检验(Pillips-perron)不作要求。9、I(d)过程的检验d阶积分过程的定义:原始序列是非平稳过程,但是经过d次差分后是平稳过程,记为I(d)。我们按照这个定义进行检验,以I(1)为例。检验yt是I(1)过程:step1:yt是非平稳的step2:差分序列yt是平稳的(单位根检验时,改为1stdifference)例子:消费、收入和GDP是积分过程吗?§2、协积协积(cointegration,协整)的重要意义:1.两个非平稳时间序列之间的线性回归的t检验和F检验是无效的。但是,Granger指出如果两个非平稳时间序列之间有协积关系,那么线性回归的t检验和F检验是有效的。2.Granger还指出,如果两个时间序列存在协积关系,那么这两个序列至少在一个方向上存在Granger因果关系。不是谬误回归。1、协积定义随机过程tx和ty都是非平稳的,但两者的线性组合却有可能是平稳的,这个线性组合反映了tx和ty之间存在长期的均衡关系。协积的数学定义:考虑下面的回归方程tttyx其中tx和ty都是I(d)过程(一般情况下,t也是I(d)),但t是I(0)即为平稳过程。那么称tx和ty是协积的,(1,)是协积向量。协积的含义:如果回归残差是平稳的,那么t检验和F检验仍然可用。反过来想,若残差不平稳,不满足2()0,var()ttE,无自相关,违反了多项线性回归的第三个假设,t检验和F检验都无效。因此,单位根和协积的意义在于迫使我们去检查回归残差是否平稳。(※※※※)2、协积检验:Engle-Granger检验多变量协积的定义和检验要用VAR模型和Johansen检验。下面只考虑最常见的两变量情形。EG检验:依据定义即可,下面以消费函数为例step1:消费co是I(d)过程1step2:收入y也是I(d)过程step3