第九章时间序列计量经济学模型的理论与方法第一节时间序列的平稳性及其检验第二节随机时间序列模型的识别和估计第三节协整分析与误差修正模型§9.1时间序列的平稳性及其检验一、问题的引出:非平稳变量与经典回归模型二、时间序列数据的平稳性三、平稳性的图示判断四、平稳性的单位根检验五、单整、趋势平稳与差分平稳随机过程一、问题的引出:非平稳变量与经典回归模型⒈常见的数据类型到目前为止,经典计量经济模型常用到的数据有:•时间序列数据(time-seriesdata);•截面数据(cross-sectionaldata)•平行/面板数据(paneldata/time-seriescross-sectiondata)★时间序列数据是最常见,也是最常用到的数据。⒉经典回归模型与数据的平稳性•经典回归分析暗含着一个重要假设:数据是平稳的。•数据非平稳,大样本下的统计推断基础——“一致性”要求——被破怀。•经典回归分析的假设之一:解释变量X是非随机变量•放宽该假设:X是随机变量,则需进一步要求:(1)X与随机扰动项不相关∶Cov(X,)=0nXXi/)(2QnXXPin)/)((2lim依概率收敛:(2)第(2)条是为了满足统计推断中大样本下的“一致性”特性:)ˆ(limnPnxnuxxuxiiiiii//ˆ22QnxPnuxPPiiin0/lim/limˆlim2第(1)条是OLS估计的需要▲如果X是非平稳数据(如表现出向上的趋势),则(2)不成立,回归估计量不满足“一致性”,基于大样本的统计推断也就遇到麻烦。因此:注意:在双变量模型中:表现在:两个本来没有任何因果关系的变量,却有很高的相关性(有较高的R2):例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。在现实经济生活中:情况往往是实际的时间序列数据是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。⒊数据非平稳,往往导致出现“虚假回归”问题时间序列分析模型方法就是在这样的情况下,以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论。时间序列分析已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中。二、时间序列数据的平稳性时间序列分析中首先遇到的问题是关于时间序列数据的平稳性问题。假定某个时间序列是由某一随机过程(stochasticprocess)生成的,即假定时间序列{Xt}(t=1,2,…)的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:1)均值E(Xt)=是与时间t无关的常数;2)方差Var(Xt)=2是与时间t无关的常数;3)协方差Cov(Xt,Xt+k)=k是只与时期间隔k有关,与时间t无关的常数;则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationarystochasticprocess)。例9.1.1.一个最简单的随机时间序列是一具有零均值同方差的独立分布序列:Xt=t,t~N(0,2)例9.1.2.另一个简单的随机时间列序被称为随机游走(randomwalk),该序列由如下随机过程生成:Xt=Xt-1+t这里,t是一个白噪声。该序列常被称为是一个白噪声(whitenoise)。由于Xt具有相同的均值与方差,且协方差为零,由定义,一个白噪声序列是平稳的。为了检验该序列是否具有相同的方差,可假设Xt的初值为X0,则易知X1=X0+1X2=X1+2=X0+1+2……Xt=X0+1+2+…+t由于X0为常数,t是一个白噪声,因此Var(Xt)=t2即Xt的方差与时间t有关而非常数,它是一非平稳序列。容易知道该序列有相同的均值:E(Xt)=E(Xt-1)•然而,对X取一阶差分(firstdifference):Xt=Xt-Xt-1=t由于t是一个白噪声,则序列{Xt}是平稳的。后面将会看到:如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。•事实上,随机游走过程是下面我们称之为1阶自回归AR(1)过程的特例Xt=Xt-1+t不难验证:1)||1时,该随机过程生成的时间序列是发散的,表现为持续上升(1)或持续下降(-1),因此是非平稳的;第二节中将证明:只有当-11时,该随机过程才是平稳的。2)=1时,是一个随机游走过程,也是非平稳的。•1阶自回归过程AR(1)又是如下k阶自回归AR(K)过程的特例:Xt=1Xt-1+2Xt-2…+kXt-k该随机过程平稳性条件将在第二节中介绍。三、平稳性检验的图示判断•给出一个随机时间序列,首先可通过该序列的时间路径图来粗略地判断它是否是平稳的。•一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程;•而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。tXtXtt(a)(b)图9.1平稳时间序列与非平稳时间序列图•进一步的判断:检验样本自相关函数及其图形定义随机时间序列的自相关函数(autocorrelationfunction,ACF)如下:k=k/0自相关函数是关于滞后期k的递减函数(Why?)。实际上,对一个随机过程只有一个实现(样本),因此,只能计算样本自相关函数(Sampleautocorrelationfunction)。一个时间序列的样本自相关函数定义为:nttkntkttkXXXXXXr121,3,2,1k易知,随着k的增加,样本自相关函数下降且趋于零。但从下降速度来看,平稳序列要比非平稳序列快得多。krkr110k0k(a)(b)图9.1.2平稳时间序列与非平稳时间序列样本相关图•注意:确定样本自相关函数rk某一数值是否足够接近于0是非常有用的,因为它可检验对应的自相关函数k的真值是否为0的假设。Bartlett曾证明:如果时间序列由白噪声过程生成,则对所有的k0,样本自相关系数近似地服从以0为均值,1/n为方差的正态分布,其中n为样本数。也可检验对所有k0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行:该统计量近似地服从自由度为m的2分布(m为滞后长度)。因此:如果计算的Q值大于显著性水平为的临界值,则有1-的把握拒绝所有k(k0)同时为0的假设。例9.1.3:表9.1.1序列Random1是通过一随机过程(随机函数)生成的有19个样本的随机时间序列。mkkLBknrnnQ12)2(表9.1.1一个纯随机序列与随机游走序列的检验序号Random1自相关系数kr(k=0,1,…17)LBQRandom2自相关系数kr(k=0,1,…17)LBQ1-0.031K=0,1.000-0.0311.00020.188K=1,-0.0510.0590.1570.4805.11630.108K=2,-0.3933.6790.2640.0185.1234-0.455K=3,-0.1474.216-0.191-0.0695.2415-0.426K=4,0.2806.300-0.6160.0285.26160.387K=5,0.1877.297-0.229-0.0165.2697-0.156K=6,-0.36311.332-0.385-0.2196.74580.204K=7,-0.14812.058-0.181-0.0636.8769-0.340K=8,0.31515.646-0.5210.1267.454100.157K=9,0.19417.153-0.3640.0247.477110.228K=10,-0.13918.010-0.136-0.24910.22912-0.315K=11,-0.29722.414-0.451-0.40418.38913-0.377K=12,0.03422.481-0.828-0.28422.99414-0.056K=13,0.16524.288-0.884-0.08823.514150.478K=14,-0.10525.162-0.406-0.06623.866160.244K=15,-0.09426.036-0.1620.03724.00417-0.215K=16,0.03926.240-0.3770.10525.483180.141K=17,0.02726.381-0.2360.09327.198190.2360.000•容易验证:该样本序列的均值为0,方差为0.0789。(a)(b)-0.6-0.4-0.20.00.20.40.624681012141618RANDOM1-0.8-0.40.00.40.81.224681012141618RANDOM1AC从图形看:它在其样本均值0附近上下波动,且样本自相关系数迅速下降到0,随后在0附近波动且逐渐收敛于0。由于该序列由一随机过程生成,可以认为不存在序列相关性,因此该序列为一白噪声。•根据Bartlett的理论:k~N(0,1/19)因此任一rk(k0)的95%的置信区间都将是可以看出:k0时,rk的值确实落在了该区间内,因此可以接受k(k0)为0的假设。同样地,从QLB统计量的计算值看,滞后17期的计算值为26.38,未超过5%显著性水平的临界值27.58,因此,可以接受所有的自相关系数k(k0)都为0的假设。因此,该随机过程是一个平稳过程。]4497.0,4497.0[]19/196.1,19/196.1[],[025.0025.0ZZ•序列Random2是由一随机游走过程Xt=Xt-1+t生成的一随机游走时间序列样本。其中,第0项取值为0,t是由Random1表示的白噪声。(a)(b)-1.0-0.8-0.6-0.4-0.20.00.20.424681012141618RANDOM2-0.8-0.40.00.40.81.224681012141618RANDOM2AC样本自相关系数显示:r1=0.48,落在了区间[-0.4497,0.4497]之外,因此在5%的显著性水平上拒绝1的真值为0的假设。该随机游走序列是非平稳的。图形表示出:该序列具有相同的均值,但从样本自相关图看,虽然自相关系数迅速下降到0,但随着时间的推移,则在0附近波动且呈发散趋势。例9.1.4检验中国支出法GDP时间序列的平稳性。表9.1.21978~2000年中国支出法GDP(单位:亿元)年份GDP年份GDP年份GDP19783605.6198610132.8199446690.719794073.9198711784199558510.519804551.3198814704199668330.419814901.4198916466199774894.219825489.2199018319.5199879003.319836076.3199121280.4199982673.119847164.4199225863.6200089112.519858792.1199334500.6•图形:表现出了一个持续上升的过程,可初步判断是非平稳的。•样本自相关系数:缓慢下降,再次表明它的非平稳性。图9.1.51978~2000年中国GDP时间序列及其样本自相关图-0.4-0.20.00.20.40.60.81.01.2246810121416182022GDPACF020000400006000080000100000788082848688909294969800GDP拒绝:该时间序列的自相关系数在滞后1期之后的值全部为0的假设。结论:1978~2000年间中国GDP时间序列是非平稳序列。•从滞后18期的QLB统计量看:QLB(18)=57.1828.86=20.05•例9.1.5检验§