计量经济学第十章时间序列计量经济模型引子:是真回归还是伪回归?经典回归分析的做法是:首先采用普通最小二乘法(OLS)对回归模型进行估计,然后根据可决系数或F检验统计量值的大小来判定变量之间的相依程度,根据回归系数估计值的t统计量对系数的显著性进行判断,最后在回归系数显著不为零的基础上对回归系数估计值给予经济解释。为了分析某国的个人可支配总收入与个人消费总支出的关系,用OLS法作关于的线性回归,得到如下结果:-174.440.9672ttEI20.9941DW0.532Rt(-7.481)(119.87)EIIE从回归结果来看,非常高,个人可支配总收入的回归系数t统计量也非常大,边际消费倾向符合经济假设。凭借经验判断,这个模型的设定是好的,应是非常满意的结果。准备将这个计量结果用于经济结构分析和经济预测。可是有人提出,这个回归结果可能是虚假的!可能只不过是一种“伪回归”!2RI“要千万小心!”这里用时间序列数据进行的回归,究竟是真回归还是伪回归呢?为什么模型、样本、数据、检验结果都很理想,却可能得到“伪回归”的结果呢?时间序列数据被广泛地运用于计量经济研究。经典时间序列分析和回归分析有许多假定前提,如序列的平稳性、正态性等。直接将经济变量的时间序列数据用于建模分析,实际上隐含了上述假定,在这些假定成立的条件下,据此而进行的t检验、F检验等才具有较高的可靠度。越来越多的经验证据表明,经济分析中所涉及的大多数时间序列是非平稳的。问题:●如果直接将非平稳时间序列当作平稳时间序列来进行分析,会造成什么不良后果;●如何判断一个时间序列是否为平稳序列;●当我们在计量经济分析中涉及到非平稳时间序列时,应作如何处理?第十章时间序列计量经济模型本章主要讨论:时间序列的基本概念时间序列平稳性的单位根检验协整第一节时间序列基本概念本节基本内容:●伪回归问题●随机过程的概念●时间序列的平稳性一、伪回归问题传统计量经济学模型的假定条件:序列的平稳性、正态性。所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。20世纪70年代,Grange、Newbold研究发现,造成“伪回归”的根本原因在于时序序列变量的非平稳性表现在:两个本来没有任何因果关系的变量,却有很高的相关性(有较高的R2)。例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。在现实经济生活中,实际的时间序列数据往往是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。时间序列分析模型方法就是在这样的情况下,以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论。时间序列分析已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中。二、随机过程有些随机现象,要认识它必须研究其发展变化过程,随机现象的动态变化过程就是随机过程。例如,考察一段时间内每一天的电话呼叫次数,需要考察依赖于时间t的随机变量,{}就是一随机过程。又例如,某国某年的GNP总量,是一随机变量,但若考查它随时间变化的情形,则{}就是一随机过程。ttGNPtttT()随机过程的严格定义若对于每一特定的,为一随机变量,则称这一族随机变量{}为一个随机过程。若为一区间,则{}为一连续型随机过程。若为离散集合,如或,则{}为离散型随机过程。离散型时间指标集的随机过程通常称为随机型时间序列,简称为时间序列。tYtYYttYTT(0,1,2,T=)(,-2,-1,0,1,2,T=)连续型的随机变量心电图离散型随机变量GDP,货币供给量时间序列数据:时,此类随机过程是离散时间T的随机函数。我们称之为随机时间序列,简称时间序列。0,1,2....tty把某种现象发展变化的指标数值按一定时间顺序排列起来形成的数列,称为时间序列(数列),有时也称为动态数列。任何一个时间序列都具有两个基本要素:一是现象所属的时间、二是与时间所对应的指标值三、时间序列的平稳性所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。直观上,一个平稳的时间序列可以看作一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一是严格平稳,另一种是弱平稳。严格平稳是指随机过程{}的联合分布函数与时间的位移无关。设{}为一随机过程,为任意实数,若联合分布函数满足:则称{}为严格平稳过程,它的分布结构不随时间推移而变化。tY11211ntttt+ht+hnnnY,Y,...,YY,...,YFy,...,yFy,...,ytYn,htY弱平稳是指随机过程{}的期望、方差和协方差不随时间推移而变化。若{}满足:与时间t无关的常数与时间t无关的常数则称{}为弱平稳随机过程。在一般的分析讨论中,平稳性通常是指弱平稳。Cov(,)Cov(,)(,0)stt-st+hs+hYYYYrt-sr20Var()tYrσtYYttYEYμ()t对于平稳性时间序列而言,任何震荡的影响都是短暂的。随着时间的推移,这些影响将逐渐消失,即时间序列数据将恢复到长期平均水平平稳的时间序列有稳定的趋势(均值)、波动性(方差)和横向联系(协方差),可以用时间序列的样本均值和方差来推断各个时点随机变量的分布特征,计量经济分析的参数估计和统计推断等问题可以得到解决。一般说来,如果一个时间序列的均值和方差在任何时候保持恒定,并且两个时期和的协方差(或自协方差)仅依赖于两个时期之间的距离(间隔或滞后),而与计量这些协方差的实际期无关,则该时间序列是平稳的ttk时间序列的非平稳性是指时间序列的统计规律随着时间的位移而发生变化,即生成变量时间序列数据的随机过程的特征随时间而变化。在实际中遇到的时间序列数据很可能是非平稳序列,而平稳性在计量经济建模中又具有重要地位,因此有必要对观测值的时间序列数据进行平稳性检验。2030405060708090510152025303540455055606570F平稳时间序列观测点在图形上往往表现出一种围绕其均值不断波动的过程20040060080010001958195919601961REF非平稳时间序列观测点在不同的阶段具有不同的均值(持续上升或持续下降)tXtXtt(a)(b)图9.1平稳时间序列与非平稳时间序列图白噪声(whitenoise)2,~(0,)tttXuuNtX另一个简单的随机时间列序被称为随机游走(randomwalk),该序列由如下随机过程生成:Xt=Xt-1+t这里,t是一个白噪声。容易知道该序列有相同的均值:E(Xt)=E(Xt-1)为了检验该序列是否具有相同的方差,可假设Xt的初值为X0,则易知:X1=X0+1X2=X1+2=X0+1+2……Xt=X0+1+2+…+t由于X0为常数,t是一个白噪声,因此:Var(Xt)=t2即Xt的方差与时间t有关而非常数,它是一非平稳序列。然而,对X取一阶差分(firstdifference):Xt=Xt-Xt-1=t由于t是一个白噪声,则序列{Xt}是平稳的。后面将会看到:如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。第二节时间序列平稳性的单位根检验本节基本内容:●单位根检验●Dickey-Fuller检验●AugmentedDickey-Fuller检验一、单位根过程为了说明单位根过程的概念,我们侧重以AR(1)模型进行分析:根据平稳时间序列分析的理论可知,当时,该序列{}是平稳的,此模型是经典的Box-Jenkins时间序列AR(1)模型。Yt11tt-tYφYε不难验证:1)||1时,该随机过程生成的时间序列是发散的,表现为持续上升(1)或持续下降(-1),因此是非平稳的;2)=1时,是一个随机游走过程,也是非平稳的。3)只有当-11时,该随机过程才是平稳的。t当,则序列的生成过程变为如下随机游动过程(RandomWalkProcess):其中{}独立同分布且均值为零、方差恒定为。随机游动过程的方差为:当时,序列的方差趋于无穷大,说明随机游动过程是非平稳的。1-1-2-112-12Var()Var()Var()Var()ttttttttYYεYεεεε...εεtσttY=Yε1tt2随机游走过程是AR(1)的特例单位根过程如果一个序列是随机游动过程,则称这个序列是一个“单位根过程”。为什么称为“单位根过程”?将一阶自回归模型表示成如下形式:其中,是滞后算子,即-1-(1-)tttttYYεLYε或-1ttLYYL根据模型的滞后多项式,可以写出对应的线性方程:(通常称为特征方程)该方程的根为:。当时序列是平稳的,特征方程的根满足条件;当时,序列的生成过程变为随机游动过程,对应特征方程的根,所以通常称序列含有单位根,或者说序列的生成过程为“单位根过程”。1-L1-0ZZ11Z11Z结论:随机游动过程是非平稳的。因此,检验序列的非平稳性就变为检验特征方程是否有单位根,这就是单位根检验方法的由来。从单位根过程的定义可以看出,含一个单位根的过程,其一阶差分:是一平稳过程,像这种经过一次差分后变为平稳的序列称为一阶单整序列(IntegratedProcess),记为。-1-ttttYYYuItY(1)有时,一个序列经一次差分后可能还是非平稳的,如果序列经过二阶差分后才变成平稳过程,则称序列为二阶单整序列,记为。一般地,如果序列经过次差分后平稳,而次差分却不平稳,那么称为阶单整序列,记为,称为整形阶数。特别地,若序列本身是平稳的,则称序列为零阶单整序列,记为。tYI2tY()tYItYd()I0tY()ddd1d二、Dickey-Fuller检验(DF检验)大多数经济变量呈现出强烈的趋势特征。这些具有趋势特征的经济变量,当发生经济振荡或冲击后,一般会出现两种情形:●受到振荡或冲击后,经济变量逐渐又回它们的长期趋势轨迹;●这些经济变量没有回到原有轨迹,而呈现出随机游走的状态。若我们研究的经济变量遵从一个非平稳过程,一个变量对其他变量的回归可能会导致伪回归结果。这是研究单位根检验的重要意义所在。假设数据序列是由下列自回归模型生成的:其中,独立同分布,期望为零,方差为,我们要检验该序列是否含有单位根。检验的原假设为:回归系数的OLS估计为:检验所用的统计量为:tε-1tttYY2σ0H:1-12-1ˆtttyyyˆˆ-ˆtσ在成立的条件下,t统计量为:Dickey、Fuller通过研究发现,在原假设成立的情况下,该统计量不服从t分布。所以传统的t检验法失效。但可以证明,上述统计量的极限分布存在,一般称其为Dickey-Fuller分布。根据这一分布所作的检验称为DF检验,为了区别,t统计量的值有时也称为值。ˆˆ-1ˆt0H:1Dickey、Fuller得到DF检验的临界值,并编制了DF检验临界值表供查。在进行DF检验时,比较t统计量值与DF检验临界值,就可在某个显著性水平上拒绝或接受原假设。在实际应用中,可按如下检验步骤进行:(1)根据观察数据,用OLS法估计一阶自回归模型,得到回归系数的OLS估计:-1tttYYε121ˆtttyyy(2)提出假设检验用统计量为常规t统计量,(3)计算在原假设成立的条件下t统计量值,查DF检验临界值表得临界值,然后将t统计量值与DF检验临界值比较:若t统计量值小于DF检验临界值,则拒绝原假设,说明序列不存在单位根;若t统计量值大于或等于DF检验临界值,则接受原假设,说明序列存在单位根。0H:1ˆˆ-ˆt1H:1Dickey、Fuller研究发现,DF检验的临界值同序列的数据生成过程