第1讲季节时间序列(SARIMA)模型张晓峒(2016年8月13日)南开大学数量经济研究所博士生导师、所长中国数量经济学会副理事长zhangnk710@126.comfile:7b2c3file:1211692file:7gener1-1file:dummy01季节时间序列模型1.9季节时间序列(SARIMA)模型1.9.1季节时间序列模型定义1.9.2SARIMA过程的自相关函数和偏自相关函数1.9.3SARIMA模型的识别、拟合与检验1.9.4SARIMA模型建模案例1.10回归与ARMA组合模型(RegARIMA模型)1.11时间序列的干扰分析1.12时间序列的异常值探测季节时间序列模型(SARIMA)在“时间序列分析”中的位置。“时间序列分析”概念:用随机过程理论和数理统计学方法,研究时间序列所遵从的统计规律,其自身的变化,预测等。这种分析方法可以应用于自然科学、社会、人文科学的各个领域。“时间序列分析”内容包括:●回归分析、相关分析:高尔登(FGalton1822~1911)1886年提出回归概念。1888年提出相关系数计算公式。达尔文(CRDarvin1809~1882)对其影响很大。●成分分解分析:在应用统计学中讲授。以美国统计学家密契尔(Mitchell)的“商业周期”(1913)和美国统计学家米尔斯(Mills)的“经济与商业统计方法”(1924)为标志。提出“长期趋势”、“循环变动”、“季节变动”和“意外变动”的概念。●ARIMA模型,RegARIMA模型分析:博克斯与詹金斯(GBox与GMJenkins)1970年出版了具有划时代意义的专著《时间序列分析,预测与控制》。使分析时间序列的水平向前推进了一大步。●时间序列非线性模型分析:近年兴起。双线性模型,广义自回归模型,阈值自回归(TAR)模型,平滑转移自回归(STAR)模型。●单位根检验:Dickey(1976),Dickey与Fuller(1981)提出DF检验。Phillips,Perron(1988)用Wiener过程表述了单位根检验统计量DF的渐近分布。●ARCH、GARCH模型分析:研究序列二阶矩(方差)的变化规律。0.00E+005.00E+101.00E+111.50E+112.00E+112.50E+113.00E+113.50E+114.00E+11808284868890929496980002GDPGDPF经济时间序列分析的目的:(1)对时间序列进行统计分析,如分析各种特征数,观察序列的变化特征,分析相关图、偏相关图和谱图等,为建立模型提供信息。(2)研究时间序列自身的变化规律,如,序列属于何种结构,模型参数是多少,都含有何种成分,有无确定性趋势,有无单位根,有无季节性成分等。(3)用时间序列模型预测。这包括两种情况。第一种情况是对该序列将来的值进行预测。第二种情况是在用时间序列构成的回归模型的预测过程中,可以首先用ARIMA模型对解释变量的值进行预测。而且这种预测的精度常常很高。(4)对序列进行信号提取。在经济领域中主要是指从原序列中提取季节成分,并称此技术为季节调整。如果用带有季节性变化成分的经济序列计算环比增长率,就必须先对经济序列进行季节调整。(5)在非经典计量经济学研究中既以回归分析为基础,也以ARIMA模型分析为基础。不掌握ARIMA模型分析方法就不能继续学习新的计量经济学知识。回顾ARIMA模型表达式及其自相关函数偏自相关函数表现p(L)(dyt)=+q(L)ut或(1-1L-…-pLp)(dyt)=+(1+1L+…+qLq)ut模型分类自相关函数偏自相关函数AR模型拖尾衰减截尾MA模型截尾拖尾衰减ARMA模型峰值后拖尾衰减峰值后拖尾衰减ARIMA模型拖尾不衰减截尾●为什么要学习SARIMA模型。因为当前所面临的季节性周期经济序列越来越多,随着采集经济数据范围的扩大,以后还会更多。要分析这些序列就必须学会SARIMA模型。●季节性时间序列包括所有带周期性变化的序列,包括季度、月度以及周度、天度等序列。不是只指季度和月度序列。EViews可以处理各种周期性序列的SARIMA建模。●SARIMA模型要比回归模型难学。●越是难学的知识掌握后就越有成就感。●在中国经济研究领域普及ARIMA建模知识始于1998年。10,00020,00030,00040,00050,00060,00070,00080,000929394959697989900010203040506070809GDP1.9季节时间序列模型在某些时间序列中,存在明显的周期性变化。这种周期是由于季节性变化(包括季度、月度、周度等变化)或其他一些固有因素引起的。这类序列称为季节性序列。经济领域中,季节性时间序列更是常见。如季度时间序列、月度时间序列、周度时间序列等。这里主要研究的是季度和月度时间序列。中国季度GDP序列(yt,亿元人民币,1992:1~2009:1)见图。序列明显存在以4个季度为周期的变化。在每年的第4季度,由于受接近年终的影响,GDP额比其他季度要增加很多。描述这类序列的模型称作季节时间序列模型(seasonalARIMAmodel),用SARIMA表示。季节时间序列模型也称作乘积季节模型(multiplicativeseasonalmodel)。因为模型的最终形式是用因子相乘的形式表示。●SARIMA方法可以为任何周期的经济时间序列建模。1.9.1季节时间序列模型定义季节性序列的变化周期用s表示。对于月度序列,s=12;对于季度序列,s=4。首先用季节差分(seasonaldeference)的方法消除周期性变化。季节差分算子定义为,s=1-Ls若季节性时间序列用yt表示,则一次季节差分表示为syt=(1-Ls)yt=yt-yt-s●对于非平稳季节性时间序列,进行有限次的季节差分和非季节差分,总可以转换成一个平稳的序列。●若原序列长度用T表示,经过一次季节差分和一次非季节差分,序列将丢失s+1个观测值,序列长度变为T-s-1。周期为s的季节时间序列模型的一般表达式如下:(1-1L-…-pLp)(1-1Ls-…-PLPs)(dsDyt)=(1+1L+…+qLq)(1+1Ls+…+QLQs)ut或p(L)P(Ls)(dsDyt)=q(L)Q(Ls)ut其中p(L)=(1-1L-2L2-…-pLp)(注意:i前的符号用负号表示)P(Ls)=(1-1Ls-2L2s-…-PLPs)(注意:i前的符号用负号表示)q(L)=(1+1L+2L2+…+qLq)(注意:i前的符号用正号表示)Q(Ls)=(1+1Ls+2L2s+…+QLQs)(注意:i前的符号用正号表示),s分别表示非季节和s期季节性差分。d,D分别表示非季节和季节性差分次数,用以保证把yt转换为一个平稳的时间序列。ut~IID(0,2)是白噪声。p(L)和P(Ls)分别称作非季节与季节自回归算子或自回归特征多项式。q(L)和Q(Ls)分别称作非季节与季节移动平均算子或移动平均特征多项式。下标p,P,q,Q,分别表示非季节,季节,自回归,移动平均算子的最大滞后阶数。上述模型用SARIMA(p,d,q)(P,D,Q)s表示。对于季度序列,s=4;对于月度序列,s=12。●因为p(L)和P(Ls),q(L)和Q(Ls)分别是相乘关系,所以此季节时间序列模型也称作乘积季节模型(模型两侧或单侧的特征多项式是相乘关系)。SARIMA模型:p(L)P(Ls)(dsDyt)=q(L)Q(Ls)ut序列(dsDyt)具有平稳性的条件是p(L)P(Ls)=0的根必须在单位圆以外。序列(dsDyt)具有可逆性的条件是q(L)Q(Ls)=0的根都必须在单位圆以外。【例】对于SARIMA(1,1,1)(1,1,1)12模型(1-1L)(1-1L12)12yt=(1+1L)(1+1L12)ut12yt具有平稳性的条件是(1-1L)(1-1L12)=0的根在单位圆外。12yt具有可逆性的条件是(1+1L)(1+1L12)=0的根在单位圆外。●在实际建模过程中,d,D,p,P,q,Q的值都不会很大。●在实际研究中,通常是先对经济序列取对数,以消除可能存在的异方差。非季节和季节性差分次数d和D通常取0和1即可满足要求。熟悉SARIMA模型表达式的写法。【例】对于SARIMA(1,1,1)(1,1,1)12模型,表达式是,(1-1L)(1-1L12)12yt=(1+1L)(1+1L12)ut【例】对于SARIMA(2,1,0)(1,1,1)4模型,表达式是,(1-1L-2L2)(1-1L4)4yt=(1+1L4)ut●1、2、1前的符号用负号表示;1前的符号用正号表示。【例】SARIMA(0,1,1)(0,1,1)12模型表达式为,12Lnyt=(1+1L)(1+1L12)ut●这种模型也称作航线模型(airlinemodel),首次被Box采用。【例】(1-1.20L+0.66L2)(1-0.33L4)4yt=(1-1.16L+0.97L2)(1-0.95L4)vt(14.4)(-8.8)(2.8)(55.9)(86.1)(-32.9)这是一个SARIMA(2,1,2)(1,1,1)4模型。●SARIMA模型p(L)P(Ls)(dsDyt)=q(L)Q(Ls)ut可以展开为(dsDyt)序列的ARMA(p+PS,q+QS)模型。例如,(0,1,1)(0,1,1)12模型,12Lnyt=(1+1L)(1+1L12)ut,可表示为12Lnyt的ARMA(0,13)模型,12Lnyt=ut+1Lut+1L12ut+11L13ut=ut+1ut–1+1ut–12+11ut–13=ut+1ut–1+12ut–12+13ut–13其中13=11。与SARIMA模型惟一不同点是,上式对ut–13的系数13没有约束,而对季节模型来说,相当于增加了两个约束条件,12=1,13=11。●对于SARIMA模型:(1-1L-…-pLp)(1-1Ls-…-PLPs)(dsDyt)=(1+1L+…+qLq)(1+1Ls+…+QLQs)ut当P=D=Q=0时,SARIMA(p,d,q)(P,D,Q)s模型退化为ARIMA模型;从这个意义上说,ARIMA模型是SARIMA模型的特例。当P=D=Q=p=q=d=0时,SARIMA模型退化为白噪声过程。●对乘积季节模型的季节阶数,即周期长度s的识别可以通过对实际问题的分析、时间序列图,时间序列的相关图、偏相关图和谱图分析得到。●以相关图和偏相关图为例,如果相关图和偏相关图不是呈近似线性衰减趋势,而是在变化周期的整倍数时点上出现绝对值相当大的峰值并呈振荡式变化,就可以认为该时间序列可以用SARIMA模型描述。●对SARIMA模型的估计、检验、诊断都与ARIMA模型相同。●SARIMA模型从两个方向讲授●自相关函数和偏自相关函数是分析时间序列,建立SARIMA模型的重要工具。分析其自相关函数、偏自相关函数的表现已知真实的SARIMA过程面对实际季节时间序列通过估计的自相关、偏自相关函数推断其属于何种过程1.9.2SARIMA过程的自相关函数和偏自相关函数先定义季节模型和乘积季节模型。季节模型:只含有季节特征多项式的SARIMA模型。例如,(1-1L4)xt=ut,即xt=1xt–4+ut,1|1,ut~IN(0,u2),乘积季节模型:季节和非季节特征多项式形成乘积项的SARIMA模型。例如,(1-1L)(1-1L4)xt=ut,1|1,1-1L4=0全部根在单位圆之外,ut~IN(0,u2)季节性时间序列的自相关函数和偏自相关函数分析顺序(先易后难):(1)先分析自相关函数,