1第五章时间序列模型关于标准回归技术及其预测和检验我们已经在前面的章节讨论过了,本章着重于时间序列模型的估计和定义,这些分析均是基于单方程回归方法,第9章我们还会讨论时间序列的向量自回归模型。这一部分属于动态计量经济学的范畴。通常是运用时间序列的过去值、当期值及滞后扰动项的加权和建立模型,来“解释”时间序列的变化规律。2在时间序列模型的发展过程中,一个重要的特征是对统计均衡关系做某种形式的假设,其中一种非常特殊的假设就是平稳性的假设。通常一个平稳时间序列能够有效地用其均值、方差和自相关函数加以描述。本章首先通过讨论回归方程扰动项通常会存在的序列相关性问题,介绍如何应用时间序列数据的建模方法,修正扰动项序列的自相关性。进一步讨论时间序列的自回归移动平均模型(ARMA模型),并且讨论它们的具体形式、估计及识别方法。3由于传统的时间序列模型只能描述平稳时间序列的变化规律,而大多数经济时间序列都是非平稳的,因此,由20世纪80年代初Granger提出的协整概念,引发了非平稳时间序列建模从理论到实践的飞速发展。本章还介绍了非平稳时间序列的单位根检验方法、ARIMA模型的建模方法、协整理论的基本思想及误差修正模型。4§5.1序列相关及其检验第3章在对扰动项ut的一系列假设下,讨论了古典线性回归模型的估计、检验及预测问题。如果线性回归方程的扰动项ut满足古典回归假设,使用OLS所得到的估计量是线性无偏最优的。但是如果扰动项ut不满足古典回归假设,回归方程的估计结果会发生怎样的变化呢?理论与实践均证明,扰动项ut关于任何一条古典回归假设的违背,都将导致回归方程的估计结果不再具有上述的良好性质。因此,必须建立相关的理论,解决扰动项不满足古典回归假设所带来的模型估计问题。5§5.1.1序列相关及其产生的后果对于线性回归模型(5.1.1)随机扰动项之间不相关,即无序列相关的基本假设为(5.1.2)如果扰动项序列ut表现为:(5.1.3)即对于不同的样本点,随机扰动项之间不再是完全相互独立的,而是存在某种相关性,则认为出现了序列相关性(serialcorrelation)。tktktttuxxxy22110Ttsuustt,,2,1,00),cov(Ttsuustt,,2,1,00),cov(6由于通常假设随机扰动项都服从均值为0,同方差的正态分布,则序列相关性也可以表示为:(5.1.4)特别的,如果仅存在(5.1.5)称为一阶序列相关,这是一种最为常见的序列相关问题。TtsuuEstt,,2,1,00)(TtuuEtt,,2,10)(17如果回归方程的扰动项存在序列相关,那么应用最小二乘法得到的参数估计量的方差将被高估或者低估。因此,检验参数显著性水平的t统计量将不再可信。可以将序列相关可能引起的后果归纳为:②使用OLS公式计算出的标准差不正确,相应的显著性水平的检验不再可信;③回归得到的参数估计量的显著性水平的检验不再可信。①在线性估计中OLS估计量不再是有效的;8EViews提供了检测序列相关和估计方法的工具。但首先必须排除虚假序列相关。虚假序列相关是指模型的序列相关是由于省略了显著的解释变量而引起的。例如,在生产函数模型中,如果省略了资本这个重要的解释变量,资本对产出的影响就被归入随机误差项。由于资本在时间上的连续性,以及对产出影响的连续性,必然导致随机误差项的序列相关。所以在这种情况下,要把显著的变量引入到解释变量中。§5.1.2序列相关的检验方法9EViews提供了以下3种检测序列相关的方法。1.D_W统计量检验Durbin-Watson统计量(简称D_W统计量)用于检验一阶序列相关,还可估算回归模型邻近残差的线性联系。对于扰动项ut建立一阶自回归方程:(5.1.6)D_W统计量检验的原假设:=0,备选假设是0。tttuu110如果序列不相关,D.W.值在2附近。如果存在正序列相关,D.W.值将小于2。如果存在负序列相关,D.W.值将在2~4之间。正序列相关最为普遍,根据经验,对于有大于50个观测值和较少解释变量的方程,D.W.值小于1.5的情况,说明残差序列存在强的正一阶序列相关。)ˆ1(2ˆ)ˆˆ(..12221TttTtttuuuWD11Dubin-Waston统计量检验序列相关有三个主要不足:1.D-W统计量的扰动项在原假设下依赖于数据矩阵X。2.回归方程右边如果存在滞后因变量,D-W检验不再有效。3.仅仅检验是否存在一阶序列相关。其他两种检验序列相关方法:Q-统计量和Breush-GodfreyLM检验克服了上述不足,应用于大多数场合。122.相关图和Q-统计量1.自相关系数我们还可以应用所估计回归方程残差序列的自相关系数和偏自相关系数来检验序列相关。时间序列ut滞后k阶的自相关系数由下式估计(5.2.26)其中是序列的样本均值,这是相距k期值的相关系数。称rk为时间序列ut的自相关系数,自相关系数可以部分的刻画一个随机过程的性质。它告诉我们在序列ut的邻近数据之间存在多大程度的相关性。TttTktkttkuuuuuur121u132.偏自相关系数偏自相关系数是指在给定ut-1,ut-2,…,ut-k-1的条件下,ut与ut-k之间的条件相关性。其相关程度用偏自相关系数k,k度量。在k阶滞后下估计偏相关系数的计算公式如下(5.2.27)其中:rk是在k阶滞后时的自相关系数估计值。(5.2.28)这是偏相关系数的一致估计。11111,111,11,krrrkrkjjkjkkjjkjkkkkjkkkkjkjk,1,,1,14要得到k,k的更确切的估计,需要进行回归t=1,2,,T(5.2.29)因此,滞后k阶的偏相关系数是当ut对ut-1,…,ut-k作回归时ut-k的系数。称之为偏相关是因为它度量了k期间距的相关而不考虑k-1期的相关。tktkkktkttuuuu,1111015我们还可以应用所估计回归方程残差序列的自相关和偏自相关系数(在本章5.2.4节给出相应的公式),以及Ljung-BoxQ-统计量来检验序列相关。Q-统计量的表达式为:pjjLBjTrTTQ122(5.1.7)其中:rj是残差序列的j阶自相关系数,T是观测值的个数,p是设定的滞后阶数。16p阶滞后的Q-统计量的原假设是:序列不存在p阶自相关;备选假设为:序列存在p阶自相关。如果Q-统计量在某一滞后阶数显著不为零,则说明序列存在某种程度上的序列相关。在实际的检验中,通常会计算出不同滞后阶数的Q-统计量、自相关系数和偏自相关系数。如果,各阶Q-统计量都没有超过由设定的显著性水平决定的临界值,则接受原假设,即不存在序列相关,并且此时,各阶的自相关和偏自相关系数都接近于0。17反之,如果,在某一滞后阶数p,Q-统计量超过设定的显著性水平的临界值,则拒绝原假设,说明残差序列存在p阶自相关。由于Q-统计量的P值要根据自由度p来估算,因此,一个较大的样本容量是保证Q-统计量有效的重要因素。在EViews软件中的操作方法:在方程工具栏选择View/ResidualTests/correlogram-Q-statistics。EViews将显示残差的自相关和偏自相关函数以及对应于高阶序列相关的Ljung-BoxQ统计量。如果残差不存在序列相关,在各阶滞后的自相关和偏自相关值都接近于零。所有的Q-统计量不显著,并且有大的P值。18例5.1:利用相关图检验残差序列的相关性考虑美国的一个投资方程。美国的GNP和国内私人总投资INV是单位为10亿美元的名义值,价格指数P为GNP的平减指数(1972=100),利息率R为半年期商业票据利息。回归方程所采用的变量都是实际GNP和实际投资;它们是通过将名义变量除以价格指数得到的,分别用小写字母gnp,inv表示。实际利息率的近似值r则是通过贴现率R减去价格指数变化率p得到的。样本区间:1963年~1984年,建立如下线性回归方程:t=1,2,,Tttttugnprinv)ln()ln(21119应用最小二乘法得到的估计方程如下:t=(-1.32)(154.25)R2=0.80D.W.=0.94ttttugnprinvˆ)ln(734.0016.0)ln(120虚线之间的区域是自相关中正负两倍于估计标准差所夹成的。如果自相关值在这个区域内,则在显著水平为5%的情形下与零没有显著区别。本例1阶的自相关系数和偏自相关系数都超出了虚线,说明存在1阶序列相关。1阶滞后的Q-统计量的P值很小,拒绝原假设,残差序列存在一阶序列相关。选择View/Residualtest/Correlogram-Q-statistice会产生如下结果:213.序列相关的LM检验与D.W.统计量仅检验扰动项是否存在一阶自相关不同,Breush-GodfreyLM检验(Lagrangemultiplier,即拉格朗日乘数检验)也可应用于检验回归方程的残差序列是否存在高阶自相关,而且在方程中存在滞后因变量的情况下,LM检验仍然有效。LM检验原假设为:直到p阶滞后不存在序列相关,p为预先定义好的整数;备选假设是:存在p阶自相关。检验统计量由如下辅助回归计算。22(1)估计回归方程,并求出残差et(5.1.8)(2)检验统计量可以基于如下回归得到(5.1.9)这是对原始回归因子Xt和直到p阶的滞后残差的回归。LM检验通常给出两个统计量:F统计量和T×R2统计量。F统计量是对式(5.1.9)所有滞后残差联合显著性的一种检验。T×R2统计量是LM检验统计量,是观测值个数T乘以回归方程(5.1.9)的R2。一般情况下,T×R2统计量服从渐进的2(p)分布。ktkttttxxxyeˆˆˆˆ22110tptptttveee11X23在给定的显著性水平下,如果这两个统计量小于设定显著性水平下的临界值,说明序列在设定的显著性水平下不存在序列相关;反之,如果这两个统计量大于设定显著性水平下的临界值,则说明序列存在序列相关性。在EView软件中的操作方法:选择View/ResidualTests/SerialcorrelationLMTest,一般地对高阶的,含有ARMA误差项的情况执行Breush-GodfreyLM。在滞后定义对话框,输入要检验序列的最高阶数。24LM统计量显示,在5%的显著性水平拒绝原假设,回归方程的残差序列存在序列相关性。因此,回归方程的估计结果不再有效,必须采取相应的方式修正残差的自相关性。例5.1(续)序列相关LM检验25例5.2:含滞后因变量的回归方程扰动项序列相关的检验考虑美国消费CS和GDP及前期消费之间的关系,数据期间:1947年第1季度~1995年第1季度,数据中已消除了季节要素,建立如下线性回归方程:t=1,2,,T应用最小二乘法得到的估计方程如下:t=(1.93)(3.23)(41.24)R2=0.999D.W.=1.605tttuGDPcCSccCS21t10ttttuGDP.CS..CSˆ0509301510126如果单纯从显著性水平、拟合优度及D.W.值来看,这个模型是一个很理想的模型。但是,由于方程的解释变量存在被解释变量的一阶滞后项,那么D.W.值就不能作为判断回归方程的残差是否存在序列相关的标准,如果残差序列存在序列相关,那么,显著性水平、拟合优度和F统计量将不再可信。所以,必须采取本节中介绍的其他检验序列相关的方法检验残差序列的自相关性。这里采用LM统计量进行检验(p=2),得到结果如下:LM统计量显示,回归方程的残差序列存在明显的序列相关性。27下面给出残差序列的自相关系数和偏自相关系数,相关图如下:本例1~3阶的自相关系数都超出了虚线,说明存在3阶序列相关。各阶滞后的Q-统计量的