厦门大学数学科学学院计量经济原理课程报告ARIMA模型建立与应用学院:数学科学学院系别:计算数学系姓名:刘明学号:19020121152488指导教师:黄荣坦2013年1月14日ARIMA模型建立与应用第2页共10页ARIMA模型建立与应用一、相关概念介绍1.1预备知识(一)模型1、AR(p)(p阶自回归模型)tptptttuxxxx2211其中ut白噪声序列,δ是常数(表示序列数据没有0均值化)AR(p)等价于ttppuxLLL)1(221AR(p)的特征方程是:01)(221ppLLLLAR(p)平稳的充要条件是特征根都在单位圆之外。2、MA(q)(q阶移动平均模型)qtqttttuuuux2211ttqqtuLuLLLx)()1(221其中{ut}是白噪声过程。MA(q)平稳性MA(q)是由ut本身和q个ut的滞后项加权平均构造出来的,因此它是平稳的。MA(q)可逆性(用自回归序列表示ut)ttxLu1)]([可逆条件:即1)]([L收敛的条件。即Θ(L)每个特征根绝对值大于1,即全部特征根在单位圆之外。3、ARMA(p,q)(自回归移动平均过程)qtqtttptptttuuuuxxxx22112211ARIMA模型建立与应用第3页共10页ttqqtpptuLuLLLxLLLxL)()1()1()(221221ttuLxL)()(ARMA(p,q)平稳性的条件是方程Φ(L)=0的根都在单位圆外;可逆性条件是方程Θ(L)=0的根全部在单位圆外。4、ARIMA(p,d,q)(单整自回归移动平均模型)差分算子:tdtdttttttttttttxLxxLxLxLxxxxLLxxxxx)1()1()1()1()1(21121对d阶单整序列xt~I(d)tdtdtxLxw)1(则wt是平稳序列,于是可对wt建立ARMA(p,q)模型,所得到的模型称为xt~ARIMA(p,d,q),模型形式是qtqtttptptttuuuu22112211ttduLxL)()(由此可转化为ARMA模型。(二)模型识别要建立模型ARIMA(p,d,q),首先要确定p,d,q,步骤是:一是用单位根检验法,确定xt~I(d)的d;二是确定xt~AR(p)中的p;三是确定xt~MA(q)中的q。平稳序列自相关函数0000)var()var(),cov()var()var(),cov(rrxxxxxxxxkkkttkttkρ0=1,ρ-k=ρk(对称)1、平稳AR(p)的自相关系数和偏自相关系数(1)平稳AR(p)的自相关系数tptptttuxxxx2211|φi|1,i=1,2,…,p,E(ut)=0ARIMA模型建立与应用第4页共10页tktptktptkttkttktuxxxxxxxxx2211,k0pkpkkk2211,k0平稳AR(p)的自相关系数是pkpkkk2211,k0(2)k阶平稳自回归过程AR(k)的偏自相关系数tktkktktktuxxxx2211jttjtktkkjttkjttkjttxuxxxxxxxx2211kjkkjkjkj2211两边同除以γ0kjkkjkjkj2211对任意j0都成立。根据10和对称性jj,得到Yule-Walker方程组kkkkkkkkkkkkkkkkk22112211211211对于给定的k,ρ1,ρ2,…,ρk已知,每个方程组最后一个解就是相应的偏自相关系数:φ11,φ22的,…,φkk。ρ3是k=3的自相关系数,意义:度量平稳序列xt与xt-3的相关系数,至于中间xt-1,xt-2起什么作用无法顾及。φ33的k=3的偏自相关系数。意义:剔除中间变量xt-1,xt-2的影响后,度量xt与xt-3的相关程度。2、平稳MA(q)的自相关系数和偏自相关系数(1)MA(q)自相关系数qtqttttuuuux2211qkqkkxxEqqkkkqkttk,00),(0),1()(112222212ARIMA模型建立与应用第5页共10页qkqkkrrqqqkkkkk,00),1/()(0,122221110当kq时,ρk=0,xt与xt+k不相关,这种现象称为截尾,因此可根据自相关系数是否从某一点开始一直为0来判断MA(q)模型的阶数q。(2)MA(q)偏自相关系数MA(q)模型对应一个AR(∞),通过AR(∞)来解决3、ARMA(p,q)有拖尾特征,p和q的识别通过从低阶逐步试探直到合适的模型为止。1.2关于ARIMA模型ARIMA模型全称为差分自回归移动平均模型。是由博克思和詹金斯于70年代初提出的一著名时间序列预测方法,博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。1.3时间序列的AR、MA和ARIMA建模自回归过程令Yt表示t时期的GDP。如果我们把Yt的模型写成(Yt−δ)=α1(Yt−1−δ)+ut其中δ是Y的均值,而ut是具有零均值和恒定方差σ2的不相关随机误差项(即ut是白噪音),则成Yt遵循一个一阶自回归或AR(1)随机过程。P阶自回归函数形式写成:ARIMA模型建立与应用第6页共10页(Yt−δ)=α1(Yt−1−δ)+α2(Yt−2−δ)+α3(Yt−3−δ)+⋯+αp2(Yt−p−δ)+ut模型中只有Y这一个变量,没有其他变量。可以理解成“让数据自己说话”。移动平均过程上述AR过程并非是产生Y的唯一可能机制。如果Y的模型描述成Yt=μ+β0ut+β1ut−1其中μ是常数,u为白噪音(零均值、恒定方差、非自相关)随机误差项。t时期的Y等于一个常数加上现在和过去误差项的一个移动平均值。则称Y遵循一个一阶移动平均或MA(1)过程。q阶移动平均可以写成:Yt=μ+β0ut+β1ut−1+β2ut−2+⋯+βqut−q自回归于移动平均过程如果Y兼有AR和MA的特性,则是ARMA过程。Y可以写成Yt=θ+α1Yt−1+β0ut+β1ut−1其中有一个自回归项和一个移动平均项,那么他就是一个ARMA(1,1)过程。Θ是常数项。ARMA(p,q)过程中有p个自回归和q个移动平均项。自回归求积移动平均过程上面所做的都是基于数据是平稳的,但是很多时候时间数据是非平稳的,即是单整(单积)的,一般非平稳数据经过差分可以得到平稳数据。因此如果我们讲一个时间序列差分d次,变成平稳的,然后用AEMA(p,q)模型,则我们就说那个原始的时间序列是AEIMA(p,d,q),即自回归求积移动平均时间序列。AEIMA(p,0,q)=AEMA(p,q)。ARIMA模型建立与应用第7页共10页二、基本思路和基本程序2.1基本思路步骤一:识别。找出适当的p、d、和q值。通过相关图和偏相关图可以解决。步骤二:估计。估计模型周所含自回归和移动平均项的参数。有时可以用最小二乘法,有时候需要用非线性估计方法。(软件可以自动完成)步骤三:诊断(检验)。看计算出来的残差是不是白噪音,是,则接受拟合;不是,则重新在做。步骤四:预测。短期更为可靠。2.2基本程序第一步,根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。第二步,对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。第三步,根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。第四步,进行参数估计,检验是否具有统计意义。第五步,进行假设检验,诊断残差序列是否为白噪声。第六步,利用已通过检验的模型进行预测分析。ARIMA模型建立与应用第8页共10页三、举例说明上述步骤3.1识别可以通过观察相关图中自相关函数(ACF)和偏相关函数(PACF)得出数据适用于AR、MA还是ARIMA模型,并通过图形形状来判断P,d,q。首先我们说明一下图形判断的标准。ACF与PACF的理论模式模型种类ACF的典型模式PACF的典型模式AR(p)指数衰减或衰减的正弦波或两者显著的直至滞后q的尖柱MA(q)显著的直至滞后q的尖柱指数下降ARMA(p,q)指数衰减指数衰减注:指数衰减和几何衰减意义相同注意AR(P)过程的ACF和PACF,和MA(q)过程的ACF和PACF相比,有相反的模式;对于AR(p)清醒,AC按几何或者指数规律下降(描述为拖尾者),而PACF则在一定滞后次数滞后突然截尾(断尾者)。对于MA(q)情况相反。我们用1970年第一季度至1991第四季度美国GDP举例说明。(可以在后期改成产业安全方面的,现在暂时没找到典型的的替代数据。)首先将数据处理成平稳数据,d=1即可。ARIMA模型建立与应用第9页共10页从上图可以看到ACF一直到滞后4是指数衰减的。此外,除了在滞后1、8和12两除外,其余自相关都是不显著的(系数不显著不等于0),图中两边的两条虚线是95%置信限。偏自相关在之后1、8和12出现尖柱,其余都不显著。所以得出结论,GDP的一阶差分模型是最多为AR(12),同时由于除了1、8、12外都不显著,一次函数形式,只存在1、8、12的滞后项。3.2模型估计通过上述判断可以运用软件得出一下AR模型。(其实AR模型只是ARIMA的特殊形式,特殊在MA变量的系数都为0,d为1)。Yt∗=δ+α1Yt−1∗+α8Yt−8∗+α12Yt−12∗Y*为Y的一阶差分。ARIMA模型建立与应用第10页共10页3.3诊断检查一种简单的办法就是看求出的残差直至滞后25的ACF和PACF。如图所示。没有任何ACF和PACF是显著地,估计出来的残差是纯随机的,此模型拟合达到标准。