第3章现代时间序列计量经济学模型本章说明•关于经典的平稳时间序列分析模型,即自回归模型(AR)、移动平均模型(MA)、自回归移动平均模型(ARMA)等,在一般的中级计量经济学教科书或者经典的时间序列分析教科书中,都有详细的介绍,本章将不予涉及。•本章所讨论的,主要是非平稳时间序列。重点是单位根检验、协整检验和误差修正模型。•向量自回归模型(VAR)已经成为一类广泛应用的现代时间序列分析模型,本章将进行简单的介绍。§3.1时间序列平稳性和单位根检验一、时间序列的平稳性二、单整序列三、单位根检验四、趋势平稳与差分平稳随机过程五、结构变化时间序列的单位根检验一、时间序列的平稳性StationaryTimeSeries⒈问题的提出•经典计量经济模型常用到的数据有:–时间序列数据(time-seriesdata);–截面数据(cross-sectionaldata)–平行/面板数据(paneldata/time-seriescross-sectiondata)•时间序列数据是最常见,也是最常用到的数据。•经典回归分析暗含着一个重要假设:数据是平稳的。•数据非平稳,大样本下的统计推断基础——“一致性”要求——被破怀。•数据非平稳,往往导致出现“虚假回归”(SpuriousRegression)问题。–表现为两个本来没有任何因果关系的变量,却有很高的相关性。–例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。2、平稳性的定义•假定某个时间序列是由某一随机过程(stochasticprocess)生成的,即假定时间序列{Xt}(t=1,2,…)的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:–均值E(Xt)=是与时间t无关的常数;–方差Var(Xt)=2是与时间t无关的常数;–协方差Cov(Xt,Xt+k)=k是只与时期间隔k有关,与时间t无关的常数;•则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationarystochasticprocess)。宽平稳、广义平稳•白噪声(whitenoise)过程是平稳的:Xt=t,t~N(0,2)•随机游走(randomwalk)过程是非平稳的:Xt=Xt-1+t,t~N(0,2)Var(Xt)=t2•随机游走的一阶差分(firstdifference)是平稳的:Xt=Xt-Xt-1=t,t~N(0,2)•如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。二、单整序列IntegratedSeries•如果一个时间序列经过一次差分变成平稳的,就称原序列是一阶单整(integratedof1)序列,记为I(1)。•一般地,如果一个时间序列经过d次差分后变成平稳序列,则称原序列是d阶单整(integratedofd)序列,记为I(d)。•I(0)代表一平稳时间序列。•现实经济生活中只有少数经济指标的时间序列表现为平稳的,如利率等;•大多数指标的时间序列是非平稳的,例如,以当年价表示的消费额、收入等常是2阶单整的,以不变价格表示的消费额、收入等常表现为1阶单整。•大多数非平稳的时间序列一般可通过一次或多次差分的形式变为平稳的。•但也有一些时间序列,无论经过多少次差分,都不能变为平稳的。这种序列被称为非单整的(non-integrated)。三、平稳性的单位根检验(unitroottest)1、DF检验(Dicky-FullerTest)•通过上式判断Xt是否有单位根,就是时间序列平稳性的单位根检验。tttXX1tttXX1tttttXXX11)1(随机游走,非平稳对该式回归,如果确实发现ρ=1,则称随机变量Xt有一个单位根。等价于通过该式判断是否存在δ=0。•一般检验模型tttXX1tttXX1零假设H0:=0备择假设H1:0•可通过OLS法下的t检验完成。但是:–在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏倚),通常的t检验无法使用。–Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布(这时的t统计量称为统计量),即DF分布。–由于t统计量的向下偏倚性,它呈现围绕小于零均值的偏态分布。如果t临界值,则拒绝零假设H0:=0,认为时间序列不存在单位根,是平稳的。样本容量显著性水平2550100500∝t分布临界值(n=∝)0.01-3.75-3.58-3.51-3.44-3.43-2.330.053.00-2.93-2.89-2.87-2.86-1.650.102.63-2.60-2.58-2.57-2.57-1.28单尾检验2、ADF检验(AugmentDickey-Fullertest)•为什么将DF检验扩展为ADF检验?–DF检验假定时间序列是由具有白噪声随机误差项的一阶自回归过程AR(1)生成的。但在实际检验中,时间序列可能由更高阶的自回归过程生成,或者随机误差项并非是白噪声,用OLS法进行估计均会表现出随机误差项出现自相关,导致DF检验无效。–如果时间序列含有明显的随时间变化的某种趋势(如上升或下降),也容易导致DF检验中的自相关随机误差项问题。•ADF检验模型tmiitittXXX11tmiitittXXX11tmiitittXXtX11零假设H0:=0备择假设H1:0模型1模型2模型3•检验过程–实际检验时从模型3开始,然后模型2、模型1。–何时检验拒绝零假设,即原序列不存在单位根,为平稳序列,何时停止检验。–否则,就要继续检验,直到检验完模型1为止。•检验原理与DF检验相同,只是对模型1、2、3进行检验时,有各自相应的临界值表。•检验模型滞后项阶数的确定:以随机项不存在序列相关为准则。模型统计量样本容量0.010.0250.050.1025-2.66-2.26-1.95-1.6050-2.62-2.25-1.95-1.61100-2.60-2.24-1.95-1.61250-2.58-2.23-1.95-1.61500-2.58-2.23-1.95-1.611500-2.58-2.23-1.95-1.6125-3.75-3.33-3.00-2.6250-3.58-3.22-2.93-2.60100-3.51-3.17-2.89-2.58250-3.46-3.14-2.88-2.57500-3.44-3.13-2.87-2.57500-3.43-3.12-2.86-2.57253.412.972.612.20503.282.892.562.181003.222.862.542.172503.192.842.532.165003.182.832.522.1625003.182.832.522.16模型统计量样本容量0.010.0250.050.1025-4.38-3.95-3.60-3.2450-4.15-3.80-3.50-3.18100-4.04-3.73-3.45-3.15250-3.99-3.69-3.43-3.13500-3.98-3.68-3.42-3.13500-3.96-3.66-3.41-3.12254.053.593.202.77503.873.473.142.751003.783.423.112.732503.743.393.092.735003.723.383.082.725003.713.383.082.72253.743.252.852.39503.603.182.812.381003.533.142.792.382503.493.122.792.385003.483.112.782.3835003.463.112.782.38•一个简单的检验过程:–同时估计出上述三个模型的适当形式,然后通过ADF临界值表检验零假设H0:=0。–只要其中有一个模型的检验结果拒绝了零假设,就可以认为时间序列是平稳的;–当三个模型的检验结果都不能拒绝零假设时,则认为时间序列是非平稳的。3、例题演示•检验1978~2006年间中国实际支出法国内生产总值GDPC时间序列的平稳性。年份GDPC年份GDPC年份GDPC年份GDPC19787802.5198616273.7199432056.2200260078.019798694.2198717716.3199534467.5200367282.219809073.7198818698.7199637331.9200476096.319819651.8198917847.4199739988.5200588002.1198210557.3199019347.8199842713.12006101616.3198311510.8199121830.9199945625.8198413272.8199225053.0200049238.0198514966.8199329269.1200153962.5•ADF检验在Eviews中的实现•ADF检验在Eviews中的实现•检验GDPC,模型3•检验GDPC,模型3从GDPC(-1)的参数值看,其t统计量的值大于临界值,不能拒绝存在单位根的零假设。同时,由于时间项T的t统计量也小于ADF分布表中的临界值,因此不能拒绝不存在趋势项的零假设。需进一步检验模型2。•检验GDPC,模型2•检验GDPC,模型2从GDPC(-1)的参数值看,其t统计量的值大于临界值,不能拒绝存在单位根的零假设。同时,由于常数项的t统计量也小于ADF分布表中的临界值,因此不能拒绝不存在趋势项的零假设。需进一步检验模型1。•检验GDPC,模型1•检验GDPC,模型1•从GDPC(-1)的参数值看,其t统计量的值大于临界值,不能拒绝存在单位根的零假设。•至此,可断定中国实际支出法GDP时间序列是非平稳的。如果仅需要检验该时间序列是否是平稳的,检验到此结束。•如果需要检验该时间序列的单整性,即它是多少阶的单整序列,则需要对其一次差分序列、二次差分序列等进行单位根检验。•检验ΔGDPC,模型3•检验ΔGDPC,模型3从△GDPC(-1)的参数值看,其t统计量的值大于临界值,不能拒绝存在单位根的零假设。同时,由于时间项项T的t统计量也小于AFD分布表中的临界值,因此不能拒绝不存在趋势项的零假设。需进一步检验模型2。•检验ΔGDPC,模型2从△GDPC(-1)的参数值看,其统计量的值大于临界值,不能拒绝存在单位根的零假设。同时,由于常数项的t统计量也小于AFD分布表中的临界值,因此不能拒绝不存在趋势项的零假设。需进一步检验模型1。•检验ΔGDPC,模型1•从△GDPC(-1)的参数值看,其统计量的值大于临界值(单尾),不能拒绝存在单位根的零假设。至此,可断定△GDPC时间序列是非平稳的。•检验Δ(ΔGDPC),模型3•检验Δ(ΔGDPC),模型3•检验Δ(ΔGDPC),模型2•检验Δ(ΔGDPC),模型1从△2GDPC(-1)的参数值看,其t统计量的值小于临界值,拒绝存在单位根的零假设。至此,可断定△2GDPC时间序列是平稳的。GDPC是I(2)过程。4、关于ADF检验的几点讨论•关于检验模型中滞后项的确定–模型(1)、(2)、(3)中都含有滞后项,其目的是为了消除模型随机项的序列相关,保证随机项是白噪声。–一般采用LM检验确定滞后阶数,以及其它数据依赖方法。•关于检验模型中滞后项的确定–当采用一些应用软件(例如Eviews)进行ADF检验时,可以自动得到滞后阶数,使得估计过程更加简单。–但是,在软件中一般采用信息准则(例如AIC、BIC等)确定滞后阶数,其明显的缺点是无法判断滞后阶数不连续的情况,例如只存在1阶和3阶而不存在2阶相关的情况。–另外,从理论上讲,信息准则主要是基于预测的均方误差最小,但对于