1实验一ARIMA模型建立与应用一、实验项目:ARIMA模型建立与预测。二、实验目的1、准确掌握ARIMA(p,d,q)模型各种形式和基本原理;2、熟练识别ARIMA(p,d,q)模型中的阶数p,d,q的方法;3、学会建立及检验ARIMA(p,d,q)模型的方法;4、熟练掌握运用ARIMA(p,d,q)模型对样本序列进行拟合和预测;三、预备知识(一)模型1、AR(p)(p阶自回归模型)tptptttuxxxx2211其中ut白噪声序列,δ是常数(表示序列数据没有0均值化)AR(p)等价于ttppuxLLL)1(221AR(p)的特征方程是:01)(221ppLLLLAR(p)平稳的充要条件是特征根都在单位圆之外。2、MA(q)(q阶移动平均模型)qtqttttuuuux2211ttqqtuLuLLLx)()1(221其中{ut}是白噪声过程。MA(q)平稳性MA(q)是由ut本身和q个ut的滞后项加权平均构造出来的,因此它是平稳的。MA(q)可逆性(用自回归序列表示ut)ttxLu1)]([可逆条件:即1)]([L收敛的条件。即Θ(L)每个特征根绝对值大于1,即全部特征根在单位圆之外。3、ARMA(p,q)(自回归移动平均过程)qtqtttptptttuuuuxxxx22112211ttqqtpptuLuLLLxLLLxL)()1()1()(221221ttuLxL)()(ARMA(p,q)平稳性的条件是方程Φ(L)=0的根都在单位圆外;可逆性条件是方程Θ(L)=0的根全部在单位圆外。24、ARIMA(p,d,q)(单整自回归移动平均模型)差分算子:tdtdttttttttttttxLxxLxLxLxxxxLLxxxxx)1()1()1()1()1(21121对d阶单整序列xt~I(d)tdtdtxLxw)1(则wt是平稳序列,于是可对wt建立ARMA(p,q)模型,所得到的模型称为xt~ARIMA(p,d,q),模型形式是qtqtttptptttuuuuwwww22112211ttduLxL)()(由此可转化为ARMA模型。(二)模型识别要建立模型ARIMA(p,d,q),首先要确定p,d,q,步骤是:一是用单位根检验法,确定xt~I(d)的d;二是确定xt~AR(p)中的p;三是确定xt~MA(q)中的q。平稳序列自相关函数0000)var()var(),cov()var()var(),cov(rrxxxxxxxxkkkttkttkρ0=1,ρ-k=ρk(对称)1、平稳AR(p)的自相关系数和偏自相关系数(1)平稳AR(p)的自相关系数tptptttuxxxx2211|φi|1,i=1,2,…,p,E(ut)=0tktptktptkttkttktuxxxxxxxxx2211,k0pkpkkk2211,k0平稳AR(p)的自相关系数是pkpkkk2211,k0(2)k阶平稳自回归过程AR(k)的偏自相关系数tktkktktktuxxxx2211jttjtktkkjttkjttkjttxuxxxxxxxx2211kjkkjkjkj2211两边同除以γ03kjkkjkjkj2211对任意j0都成立。根据10和对称性jj,得到Yule-Walker方程组kkkkkkkkkkkkkkkkk22112211211211对于给定的k,ρ1,ρ2,…,ρk已知,每个方程组最后一个解就是相应的偏自相关系数:φ11,φ22的,…,φkk。ρ3是k=3的自相关系数,意义:度量平稳序列xt与xt-3的相关系数,至于中间xt-1,xt-2起什么作用无法顾及。φ33的k=3的偏自相关系数。意义:剔除中间变量xt-1,xt-2的影响后,度量xt与xt-3的相关程度。2、平稳MA(q)的自相关系数和偏自相关系数(1)MA(q)自相关系数qtqttttuuuux2211qkqkkxxEqqkkkqkttk,00),(0),1()(112222212qkqkkrrqqqkkkkk,00),1/()(0,122221110当kq时,ρk=0,xt与xt+k不相关,这种现象称为截尾,因此可根据自相关系数是否从某一点开始一直为0来判断MA(q)模型的阶数q。(2)MA(q)偏自相关系数MA(q)模型对应一个AR(∞),通过AR(∞)来解决3、ARMA(p,q)有拖尾特征,p和q的识别通过从低阶逐步试探直到合适的模型为止。(三)模型估计用Eviews软件进行估计(四)模型检验1、用t统计量检验模型参数显著性;2、为保证ARMA(p,q)的平稳性和可逆性,模型特征根皆应在单位圆以外,或倒数在单位圆内;3、用Q统计量对残差进行白噪声检验。原假设和备择假设0:211KH(序列不存在自相关,是白噪声)4KH,,,:210不全为0(序列存在自相关,不是白噪声)统计量)(~)1(212KKTrTTQKkk其中上述r是样本相关系数,T是样本容量,分布是极限分布。K是自相关系数的个数,即最大滞后期。若样本较大,则K=[T/10]或T的平方根;若样本较小,则K=[T/4]。判别规则是:)(2KQ接受原假设,)(2KQ拒绝原假设。(五)模型外推预测已有ARMA(p,q)模型qtqtttptptttuuuuxxxx22112211和观察值Xt,Xt-1,Xt-2,…,X1。把观察值代入,在t+1时刻有1121111211qtqtttptptttuuuuXXXX上式中,观察值已知,只有误差处理问题。下标大于t的误差项,由于未来的误差未知,因此用期望值0代替未来的误差。下标从1到t的误差项,可用残差估计值(要建模时可找到)代替。于是1步预测公式:112111210)1(qtqttptptttuuuXXXX类似地,2步预测公式和l步预测公式分别是:2132222100)1()2(qtqttptptttuuuXXXXhqtqththtptttuuuphXhXhXhX1121)()2()1()(其中,h-p=0时,phttXphX)(;h-q0时,0hqtu四、实验内容1、ARIMA(p,d,q)模型阶数识别;2、ARIMA(p,d,q)模型估计与检验;3、ARIMA(p,d,q)模型外推预测。五、实验软件环景:Eviews软件。六、实验步骤:按、以美元对欧元汇率1993.1到2007.12的月均价数据为例进行实验。(一)创建Eviews工作文件(Workfile)从Eviews主选单中选“File/New\Workfile”,选择“monthly”选项,输入“Startdate:1993:01Enddate:2007:12”。5(二)录入数据,并对序列进行初步分析1、导入数据Quick/EmptyGroup在Ser01输入数据;改变量名:点击Ser01全选第一列,在命令栏输入EURO。将文件保存命名,注意存放地址。62、序列初步分析选定变量EURO,双击它,View\Graph\Line,输出EURO的曲线7从图形看到美元对欧元汇率在2001年左右处于高位,2002年以后一直处于下跌态势。数据总体上类似于随机游走过程形式,应该是非平稳的。(三)ARIMA(p,d,q)模型阶数识别1、确定单整阶数d(1)用不含时间趋势项、解释变量中不含差分项的模型,即对模型ttteuroeuro1进行单位检验(UnitRootTest)。假设0:0H;备择假设0:1H。在工作文件窗口,选定变量EURO,双击它,在EURO页面上,点击View\UnitRootTest\ADF,表示已经进入扩展的DF检验。选择Level(对水平变量进行单位根检验,检验系数对应的项EUROt-1)\Intercept(不含时间趋势变量)\Automaticselecttion(解释变量不含EUROt-1的差分),并且在maximum中选择0(表示差分滞后项数取0,即不含EUROt-1的差分)8NullHypothesis:EUROhasaunitrootExogenous:ConstantLagLength:0(AutomaticbasedonSIC,MAXLAG=0)t-StatisticProb.*AugmentedDickey-Fullerteststatistic-0.5839080.8699Testcriticalvalues:1%level-3.4669945%level-2.87754410%level-2.575381*MacKinnon(1996)one-sidedp-values.AugmentedDickey-FullerTestEquationDependentVariable:D(EURO)Method:LeastSquaresDate:04/11/11Time:08:24Sample(adjusted):1993M022007M12Includedobservations:179afteradjustmentsVariableCoefficientStd.Errort-StatisticProb.EURO(-1)-0.0074960.012838-0.5839080.5600C0.0058750.0114750.5119900.6093R-squared0.001923Meandependentvar-0.000766AdjustedR-squared-0.003716S.D.dependentvar0.020297S.E.ofregression0.020334Akaikeinfocriterion-4.9419079Sumsquaredresid0.073187Schwarzcriterion-4.906293Loglikelihood444.3006F-statistic0.340948Durbin-Watsonstat1.369377Prob(F-statistic)0.560026得到结果1007496.0005875.0tteuroeurot=(0.511990)(-0.583908)p=(0.6093)(0.5600)要确定差分方程的样本容量T,原有的样本容量是180,差分后样本容量是T=179;取α=5%,查附表2,得临界值τ=-2.88;统计量观察值为t=-0.583908τ=-2.88,所以接受假设(从概率值大于0.05也得到接受的结论),即认为汇率序列(EURO)是非平稳的。(2)对模型ttteuroeuro12,作假设0:0H;备择假设0:1H。在工作文件窗口,选定变量euro,双击,在euro页面上,点击View\Un