上海财经大学统计学系1非平稳和季节时间序列模型分析方法•在第四章中,我们介绍了非平稳时间序列模型,但是在前面的讨论中,对于时间序列的特性分析,以及模型的统计分析都集中于平稳时间序列问题上。本章将介绍几个非平稳时间序列的建模方法,并且分析不同的非平稳时间序列模型的动态性质。上海财经大学统计学系2§8.1ARIMA模型的分析方法•8.1.1ARIMA模型的结构•具有如下结构的模型称为求和自回归移动平均(AutoregressiveIntegratedMovingAverage),简记为ARIMA(p,d,q)模型:•(8.1)•式中:2()()()0,(),()0,()0,dtttttsstBXBEVarEstEXst11(1)()1ARMA(p,q)()1ARMA(p,q)ddppqqBBBBBBB,为平稳可逆模型的自回归系数多项式,为平稳可逆模型的移动平滑系数多项式上海财经大学统计学系3•式(8.1)可以简记为:•式中,为零均值白噪声序列。•由式(8.2)显而易见,ARIMA模型的实质就是差分运算与ARMA模型的组合。这一关系意义重大,这说明任何非平稳序列只要通过适当阶数的差分运算实现差分后平稳,就可以对差分后序列进行ARMA模型拟合了。而ARMA模型的分析方法非常成熟,这意味着对差分平稳序列的分析也将是非常简单、非常可靠的了。()()dttBXB(8.2){}t上海财经大学统计学系4•例如,设ARIMA(1,1,1)模型•图8.1是给出的ARIMA(1,1,1)模型一个模拟数据,样本容量为200,可以看出时间趋势是非常明显的。图8.2是经过一阶差分得到的数据。经过一阶差分我们看到下降的时间趋势被去掉,新的序列看起来是平稳的。10.5110.3,~...0,1tttBBXBiidN上海财经大学统计学系5图8.1ARIMA(1,1,1)模型一个模拟数据图8.2模拟数据的一阶差分数据上海财经大学统计学系6•求和自回归移动平均模型这个名字的由来是因为阶差分后序列可以表示为:•式中,,即差分后序列等于原序•列的若干序列值的加权和,而对它又可以拟合自回归移动平均(ARMA)模型,所以称它为求和自回归移动平均模型。11(1)ddditdtiXCX!!()!iddCidi上海财经大学统计学系7•特别地,•当d=0时,ARIMA(p,d,q)模型实际上就是ARMA(p,q)模型;•当p=0时,ARIMA(o,d,q)模型可以简记为IAM(d,q)模型;•当q=0时,ARIMA(p,d,0)模型可以简记为ARI(p,d)模型.•当d=1,p=q=0时,ARIMA(0,1,0)模型为:•••(8.3)•该模型被称为随机游走(RandomWalk)模型,或醉汉模型。12()0,(),()0,()0,ttttttsstXXEVarEstEXst上海财经大学统计学系8•随机游走模型的产生有一个有趣的典故。它最早于1905年7月由卡尔·皮尔逊(KarlPearson)在《自然》杂志上作为一个问题提出:假如有一个醉汉醉得非常严重,完全丧失方向感,把他放在荒郊野外,一段时间之后再去找他,在什么地方找到他的概率最大呢?•考虑到他完全丧失方向感,那么他第步的位置将是他第步的位置再加一个完全随机的位移。用数学模型来描述任意时刻这个醉汉可能的位置,即为一个随即游走模型(8.3)。上海财经大学统计学系9•1905年8月,雷利爵士(LordRayleigh)对卡尔·皮尔逊的这个问题作出了解答。他算出这个醉汉离初始点的距离为至的概率为:•且当n很大时,该醉汉离初始点的距离服从零均值正态分布。这意味着,假如有人想去寻找醉汉的话,最好是去初始点附近找他,该地点是醉汉未来位置的无偏估计值。•作为一个最简单的ARIMA模型,随机游走模型目前广泛应用于计量经济学领域。传统的经济学家普遍认为投机价格的走势类似于随机游走模型,随机游走模型也是有效市场理论(EfficientMarketTheory)的核心。22/22rnlerrnl上海财经大学统计学系108.1.2ARIMA模型的性质•一、平稳性•假如服从ARIMA(p,d,q)模型:•式中:•记,被称为广义自回归系数多项式。显然ARIMA模型的平稳性完全由的根的性质决定。()()dttBXB11(1)()1()1ddppqqBBBBBBB()()dBB()B()0B上海财经大学统计学系11•因为阶差分后平稳,服从ARMA(p,q)模型,所以不妨设•则••(8.4)•由式(8.4)容易判断,ARIMA(p,d,q)模型的广义自回归系数多项式共有p+d个特征根,其中p个在单位圆内,d个在单位圆上。因为有d个特征根在单位圆上而非单位圆内,所以当时,ARIMA(p,d,q)模型不平稳。1()(1),1;1,2,,piiiBBip1()()[(1)](1)pddiiBBBB0d上海财经大学统计学系12•二、方差齐性•对于ARIMA(p,d,q)模型,当时,不仅均值非平稳,序列方差也非平稳。以最简单的随机游走模型ARIMA(0,1,0)为例:•则•这是一个时间的递增函数,随着时间趋向无穷,序列的方差也趋向无穷。•但1阶差分之后,•差分后序列方差齐性0d121011ttttttttXXXX2011()()tttVarXVarXt{}tXttX2()tVarX上海财经大学统计学系138.1.3ARIMA模型建模•在掌握了ARMA模型建模的方法之后,尝试使用ARIMA模型对观察序列建模是一件比较简单的事情。它遵循如下的操作流程,如下图所示:上海财经大学统计学系14图8.3ARIMA模型建模流程上海财经大学统计学系158.1.4ARIMA模型预测•在最小均方误差预测原理下,ARIMA模型的预测和ARMA模型的预测方法非常类似。ARIMA(p,d,q)模型的一般表示方法为:•和ARMA模型一样,也可以用历史观测值的线性函数表示它:•式中,的值由如下等式确定:()(1)()dttBBXB1122()tttttXB12,,()(1)()()dBBBB上海财经大学统计学系16•如果把记为广义自相关函数,有•容易验证的值满足如下递推公式:•式中,•那么,的真实值为:*()B*212()()(1)1dBBBBB12,,1112112211jjpdjpdj0,10,1,0jjjjqj;tlX111111()()tltltlltltltX上海财经大学统计学系17•由于的不可获得性,所以的估计值只能为:•真实值与预报值之间的均方误差为:•要使均方误差最小,当且仅当:11,,,tltlttlX***01122ˆ()ttttxl2222*22110ˆ[()](1)()tlttljjjEXxl*jlj上海财经大学统计学系18•所以,在均方误差最小的原则下,期预报值为:•期预报误差为:•真实值等于预报值加上预报误差:•期预报的方差为:1122ˆ()tltltltxlll11111()tttlltel112211111()()ˆ=()()tlltltltttlltttXxlel22211[()](1)ttVarel上海财经大学统计学系19•例8.1对1950年—2005年我国进出口贸易总额数据(单位:亿元人民币)序列建立ARIMA模型(数据见附录1.15)1.对原序列(NX)的分析(1)做出1950年—2005年我国进出口贸易总额数据(NX)的时序图及自相关图,如图8.4,图8.5。上海财经大学统计学系20图8.4图8.5上海财经大学统计学系21•(2)对该序列做单位根检验,原假设:;备择假设:,检验结果如图8.4。图8.6根据图8.6的检验结果,我们可以认为这一序列非平稳。上海财经大学统计学系22•2.对原序列取对数并分析•由于这一序列有着非常明显的指数趋势,因此我们对它进行取对数的运算,以消除指数趋势的影响,将取对数后的序列命名为,即。•作出序列的时序图与自相关图分别如图8.7,8.8。图8.7图8.8tyln()tyNX{}ty上海财经大学统计学系23•依然对序列做单位根检验,检验结果如图8.9。•图8.9•根据这一检验结果,我们看到这一序列依然没有平稳,结合图8.7和图8.8,我们看到在序列中有着明显的增长趋势,因此我们还需要对其进行差分处理。{}ty{}ty上海财经大学统计学系24•3.对序列进行查分处理•我们将序列进行一阶差分处理,得到一个新序列,即。•画出序列的时序图,并进行相应的单位根检验,如图8.10,图8.11。•图8.10图8.11•根据上述结果,可以认为这一序列已经平稳,接下来,可以针对该序列做进一步的建模拟合。{}tY{}tY{}tX(1)ttXBY{}tX上海财经大学统计学系25•4.针对平稳序列的建立ARMA模型•(1)画出序列的自相关图,如图。根据该图,我们可以初步判断该序列的偏自相关图一阶截尾,而针对自相关图并不能马上做出判断。{}tX{}tX图8.12上海财经大学统计学系26•(2)针对序列我们尝试几种不同的模型拟合,比如ARMA(1,1),ARMA(1,2),ARMA(1,3)等。经过不断的尝试,我们最终选择了ARMA(1,6)模型,并且该模型中移动平均部分的系数只有MA(6)的系数是显著的,这样我们就把1-5阶的系数全部放弃,最终的估计结果如图8.13。••图8.13通过图8.11,我们可以看到最终选择的模型的整体检验效果还是良好的。{}tX上海财经大学统计学系27•(5)对拟合模型后的残差序列做纯随机性检验,检验结果如图8.14。•图8.14•通过这一检验,我们看到残差序列已经可以认为是一个纯白噪声的序列,说明我们的模型已经将有用信息充分提取了。•这一模型的整体拟合效果见图8.15。上海财经大学统计学系28图8.15•综合上述分析过程,实际上我们是针对原序列(NX):1950年—2005年我国进出口贸易总额数据序列,建立了一个ARIMA(1,1,6)模型进行拟合,模型机构如下:162(1)(ln)0.557897(1)(ln)0.475266()0()()00ttttttststBNXBNXEVarEstENXst,,,,上海财经大学统计学系29§8.2季节时间序列模型的分析方法•8.2.1季节时间序列的重要特征•一、季节时间序列表示•许多商业和经济时间序列都包含季节现象,例如,冰淇淋的销量的季度序列在夏季最高,序列在每年都会重复这一现象。相应的周期为4。类似地,在美国汽车的月度销售量和销售额数据在每年的7月和8月也趋于下降,因为每年这时汽车厂家将会推出新的产品;在西方,玩具的销售量在每年12月份会增加,主要是因为圣诞节的缘故;在中国,每年农历5月份糯米的销售量大大地增加,这是因为中国的端午节有吃粽子的习惯。以上三种情况的季节周期都是12个月。由上面的例子可以看到,很多的实际问题中,时间序列会显示出周期变化的规律,这种周期性是由于季节变化或其他物理因素所致,我们称这类序列为季节性序列。单变量的时间序列为了分析方便,可以编制成一个二维的表格,其中一维表示周期,另一维表示某个周期的一个