上机指导第五章5.8.1拟合ARIMA模型由于ARMA模型是ARIMA模型的一种特例,所以在SAS系统中这两种模型的拟合都放在了ARIMA过程中。我们已经在第3章进行了ARMA模型拟合时介绍了ARIMA过程的基本命令格式。再次以临时数据集example5_1的数据为例介绍ARIMA模型拟合与ARMA模型拟合的不同之处。dataexample5_1;inputx@@;difx=dif(x);t=_n_;cards;1.05-0.84-1.420.202.816.725.404.385.524.462.89-0.43-4.86-8.54-11.54-16.22-19.41-21.61-22.51-23.51-24.49-25.54-24.06-23.44-23.41-24.17-21.58-19.00-14.14-12.69-9.48-10.29-9.88-8.33-4.67-2.97-2.91-1.86-1.91-0.80procgplot;plotx*tdifx*t;symbolv=starc=blacki=join;run;输出时序图显示这是一个典型的非平稳序列。如图5-49所示图5-49序列x时序图考虑对该序列进行1阶差分运算,同时考察查分后序列的平稳性,在原程序基础上添加相关命令,程序修改如下:dataexample5_1;inputx@@;difx=dif(x);t=_n_;cards;1.05-0.84-1.420.202.816.725.404.385.524.462.89-0.43-4.86-8.54-11.54-16.22-19.41-21.61-22.51-23.51-24.49-25.54-24.06-23.44-23.41-24.17-21.58-19.00-14.14-12.69-9.48-10.29-9.88-8.33-4.67-2.97-2.91-1.86-1.91-0.80procgplot;plotx*tdifx*t;symbolv=starc=blacki=join;procarima;identifyvar=x(1);estimatep=1;forecastlead=5id=t;run;语句说明:(1)DATA步中的命令“difx=dif(x);”,这是指令系统对变量x进行1阶差分,差分后的序列值赋值给变量difx。其中dif()是差分函数,假如要差分的变量名为x,常见的几种差分表示为:1阶差分:dif(x)2阶差分:dif(dif(x))k步差分:difk(x)(2)我们在GPLOT过程中添加绘制了一个时序图“difx*t”,这是为了直观考察1阶差分后序列的平稳性。所得时序图如图5-50所示。图5-50序列difx时序图时序图显示差分后序列difx没有明显的非平稳特征。(3)“identifyvar=x(1);”,使用该命令可以识别查分后序列的平稳性、纯随机性和适当的拟合模型阶数。其中x(1)表示识别变量x的1阶差分后序列。SAS支持多种形式的差分序列识别:var=x(1),表示识别变量x的1阶查分后序列Δxt;var=x(1,1),表示识别变量x的2阶查分后序列Δ2xt;var=x(k),表示识别变量x的k步差分后序列Δkxt;var=x(k,s),表示识别变量x的k步差分后,再进行s步查分后序列ΔsΔkxt。识别部分的输出结果显示1阶查分后序列difx为平稳非白噪声序列,且具有显著的自相关系数不截尾、偏自相关系数1截尾的性质。(4)“estimatep=1;”对1阶差分后序列Δxt拟合AR(1)模型。输出拟合结果显示常数项不显著,添加或修改估计命令如下:estimatep=1nonit;这是命令系统不要常数项拟合AR(1)模型,拟合结果显示模型显著且参数显著。如图5-51所示。图5-51序列difx模型拟合结果输出结果显示,序列xt的拟合模型为ARIMA(1,1,0)模型,模型口径为:Δxt=艾普龙t/1-0.66933B或等阶记为:xt=1.66933xt-1-0.66933xt-2+艾普龙t(5)“forecastlead=5id=t;”,利用拟合模型对序列xt作5期预测。一、建立数据集,绘制时序图dataexample5_2;inputx@@;lagx=lag(x);t=_n_;cards;3.038.4610.229.8011.962.838.4313.7716.1816.8419.5713.2614.7824.4828.1628.2732.6218.4425.2538.3643.7044.4650.6633.0139.9760.1768.1268.8478.1549.8462.2391.49103.20104.53118.1877.8894.75138.36155.68157.46177.69117.15;procgplotdata=example5_2;plotx*t=1;symbol1c=blacki=joinv=star;run;输出时序图如5-52所示。图5-52序列x时序图时序图显示,序列X有一个明显的随时间线性递增的趋势,同时又有一定规律性的波动,所以不妨考虑使用误差自回归模型拟合该序列的发展。二、因变量关于时间的回归模型procautoregdata=example5_2;modelx=t/dwprob;run;语句说明:(1)“procautoregdata=example5_2;”指令SAS系统对临时数据集example5_2进行回归程序分析。(2)“modelx=t/dwprob;”指令SAS系统以变量t作为自变量,变量x作为因变量,建立线性模型:tixabtu并给出残差序列DW检验统计量的分为点。本例中,序列x关于变量t的线性回归模型最小二乘估计输出结果如图5-53所示。图5-53序列x关于变量t的线性回归模型最小二乘估计结果本例输出结果显示,DW统计量的值等于0.7628,输出概率显示残差序列显著正相关。所以应该考虑对残差序列拟合自相关模型,修改AUTOREG程序如下:procautoregdata=example5_2;modelx=t/nlag=5backstepmethod=ml;run;Model语句是指令系统对线性回归模型的残差序列显示延迟5阶的自相关图,并拟合延迟5阶自相关模型,特别注意,SAS输出的自回归模型结构为:1155...ttttuuu即输出的自相关回归参数值与我们习惯定义的自回归参数值相差一个负号。由于自相关延迟阶数的确定是由我们尝试选择的,所以nlag得阶数通常会指得大一些。这就导致残差自回归模型中可能有部分参数不显著,因而添加逐步回归选项backstep,指令系统使用逐步回归的方法筛选出显著自相关因子,并使用极大似然的方法进行参数估计。输出如下四方面的结果:1因变量说明如图5-54所示:图5-54因变量说明2普通最小二乘估计结果该部分输出信息包括差平方和(SSE)、自由度(DFE)、均方误差(MSE)、根号均方误差(RootMSE)、SBC信息量。回归部分相关系数平方(regressrsquare)、总的相关系数平方(totelrsquare),DW统计量(durbinwatson)及所有待参数的自由度、估计值、标准差、t值和统计量的P值。如图5-55所示。图5-55普通最小二乘估计结果3回归误差分析该部分共输出四方面的信息:残差序列自相关图、逐步回归消除的不显著项报告、初步均方误差(MSE)、自回归参数估计值。本例该部分输出结果如图5-56所示。图5-56自回归误差分析输出结果本例输出的残差序列自相关图显示残差序列有非常显著的1阶正相关性。逐步回归消除报告显示除了1阶的序列值显著自相关外,延迟其他阶数的序列值均不具有显著的自相关性,因此延迟2阶-5阶的自相关项被剔除。初步均方误差为10.602573tttuu4、最终拟合模型该部分包括三方面的汇总信息:收敛状况、极大似然估计结果和回归系数估计。本例该部分输出结果如图5-57所示。图5-57最终拟合模型输出结果本例得到最终拟合模型为:12.76380.6883tttttxtuuu为了得到直观的拟合效果,我们可以利用OUTPUT命令将拟合结果存入SAS数据集中,并对输出结果作图,相关命令如下:procautoregdata=example5_2;modelx=t/nlag=5backstepmethod=ml;outputout=outp=xppm=trend;procautoregdata=example5_2;modelx=t/nlag=5backstepmethod=mlnoint;outputout=outp=xppm=trend;procgplotdata=out;plotx*t=2xp*t=3trend*t=4/overlay;symbol2v=stari=nonec=black;symbol3v=nonei=joinc=redw=2l=3;symbol4v=nonei=joinc=greenw=2;run;语句说明:“outputout=outp=xppm=trend;”,该命令是指令系统将部分结果输入临时数据集OUT,选择输出的第一个信息为整体模型的拟合值(P值),该拟合变量取名为XP;选择输出的第二个信息为线性趋势拟合值(PM值),还可以选择R选项输出拟合残差项,本例不要求输出此项。输出图像如图5-58所示。图5-58拟合效果图三、延迟因变量回归模型procautoregdata=example5_2;modelx=lagx/lagdep=lagx;run;语句说明:(1)首先在DATA步中添加命令“lagx=lgax(x);”,该语句指令系统使用延迟函数生成序列x的1阶延迟序列,并将该序列赋值给变量lagx,即1,2ttlagxxt(2)“modelx=lagx/lagdep=lagx;”指令系统建立带有延迟变量的回归模型1tttxabxu并通过LAGDEP选项指定被延迟的因变量名。本例输出结果如图5-59所示。图5-59带延迟因变量回归分析结果由于带有延迟因变量,所以这种场合在回归模型估计结果中输出的是durbinh统计量。本例中durbinh统计量的分布函数达到0.3853,这表示残差序列不存在显著的相关性,不需要考虑对残差序列继续拟合自回归模型。在注意参数检验结果,如图5-60所示。图5-60参数估计结果在显著性水平默认为0.05的条件下,截距项不显著(P值大于0.05),所以可以考虑在模型拟合命令中增加NOINT选项。最后输出拟合结果,并绘制拟合时序图相关命令如下:procautoregdata=example5_2;modelx=lagx/lagdep=lagx;modelx=lagx/lagdep=lagxnoint;outputout=outp=xp;procgplotdata=out;plotx*t=2xp*t=3/overlay;symbol2v=stari=nonec=black;symbol3v=nonei=joinc=redw=2l=3;run;模型拟合部分输出的信息表示最终的拟合模型为:..11.004,(0,302.23437)iidttttxxN输出的拟合效果图如图5-61所示。图5-61带有延迟因变量的回归模型拟合效果图本例中由于没有残差自回归项,最终拟合值就是趋势值,所以只需绘制其中之一即可。5.8.3介绍GARCH模型拟合,相关程序如下:Dataexample5_3;Inputx@@;T=_n_;Cards;10.7713.3016.6419.5418,9710.5224.3623.5127.1630.8031.8431.6332.6834.9033.8533.0935.4635.3239.9437.4735.2433.0332.6735.2032.3632.3438.4538.1732.1439.7049.4247.8648.3