第九章ARIMA模型已知1867-1938年英国(英格兰及威尔士)绵羊的数量如表1所示,运用时间序列模型预测未来三年英国的绵羊数量。表11867-1938年英国绵羊数量年份绵羊数年份绵羊数年份绵羊数186722031891211119151752186823601892211919161795186922541893199119171717187021651894185919181648187120241895185619191512187220781896192419201338187322141897189219211383187422921898191619221344187522071899196819231384187621191900192819241484187721191901189819251597187821371902185019261686187921321903184119271707188019551904182419281640188117851905182319291611188217471906184319301632188318181907188019311775188419091908196819321850188519581909202919331809188618921910199619341653188719191911193319351648188818531912180519361665188918681913171319371627189019911914172619381791(一)序列的平稳性检验(1)时序图在workfile的工作区,双击“X”,打开“Series:X”窗口,选择View/Graph,type下选择Basicgraph和Line&Symbol,点确定,得到图1。图1从图1可以看出,绵羊数量的序列X具有向下的趋势,不平稳。(2)对序列进行一阶差分,去除趋势。在命令行输入命令:genrDX=d(X),回车,得到X差分后的序列DX。画DX的时序图,见图2:图2从图2可以看出,差分后的序列已经没有趋势,可以初步判断是平稳的。(3)序列DX平稳的单位根检验在Series:DX窗口,选择View/UnitRootTest,弹出如下窗口(见图3)。图3选择Testtype为AugmentedDickey-Fuller,Testforunitrootin选择Level,Includeintestequation处依此选择Trendandintercept、intercept、None,Laglength处按默认的选项,由SchwarzInfoCriterion自动选择最佳滞后长度。在选择Trendandintercept后,输出了表2.表2根据表2的结果,ADF统计量=-6.403584,相应的P值为0.0000,小于=0.05,因此拒绝原假设(原假设为序列DX有一个单位根,也即序列DX非平稳),DX是平稳的。在表2中给出了单位根检验的辅助回归结果,其中C和@trend(1867)均不显著(相应的t统计量的p值分别为0.4014,0.4606),因此检验模型中不应包括趋势和截距项。在模型选择处(Includeintestequation)重新选择None,得到下表(表3):表3ADF统计量=-6.430649,相应的P值为0.0000,小于=0.05,因此拒绝原假设,即DX是平稳的。(4)DX的白噪声检验在Series:DX窗口,选择View/Correlogram,在CorrelogramSpecification下选择Level,点“OK”确定,得到图5。图4图5从图5的最后一列,Q统计量的伴随概率P均小于=0.05,因此应拒绝原假设(原假设为:序列为白噪声),即DX是非白噪声的。(二)模型的识别根据图5,可知DX序列的自相关系数4阶截尾,偏相关系数3阶截尾,因此可选择MA(4)、AR(3)、ARMA(3,4)模型拟合。相应地,X序列可选择ARIMA(0,1,4)、ARIMA(3,1,0)和ARIMA(3,1,4)。(三)模型的估计及检验1、拟合ARIMA(0,1,4)模型命令:LSD(X)CMA(1)MA(2)MA(3)MA(4)表4写出拟合的方程:ttBBBBXB)5967.04565.02149.03715.01(1019.7)1(432s.e.=67.79307,AIC=11.33862,SC=11.49796模型的显著性检验:(在Equation窗口,选择View/residualtests/Correlogram-Q-Statictic:图6根据图6,残差序列的Q统计量的p值均大于=0.05,因此不拒绝原假设(原假设为:序列为白噪声),即残差序列是白噪声,拟合模型显著有效。模型参数的显著性检验:表5参数估计值标准误差T统计量P值结论C-7.1018572.184440-3.2511110.0018MA(2)的系数在10%的水平下显著,其余参数在5%的水平下显著.MA(1)0.3714970.1067333.4806070.0009MA(2)-0.2149010.110342-1.9475850.0557MA(3)-0.4565220.107424-4.2497250.0001MA(4)-0.5966690.114973-5.1896600.00002、拟合ARIMA(3,1,0)模型命令:LSD(X)CAR(1)AR(2)AR(3)在剔除不显著的C后得到估计结果(表6)表6写出拟合的方程:)2555.02393.04952.1()1(32BBBXBtts.e.=67.85262,AIC=11.31567,SC=11.41359模型的显著性检验:图7根据图7,残差序列的Q统计量的p值均大于=0.05,因此不拒绝原假设(原假设为:序列为白噪声),即残差序列是白噪声,拟合模型显著有效。模型参数的显著性检验:表7参数估计值标准误差T统计量P值结论AR(1)0.4951970.1272773.8907090.0002所有参数在10%的水平下显著AR(2)-0.2393320.135978-1.7600740.0831AR(3)-0.2555350.119253-2.1428000.03593、拟合ARIMA(3,1,4)模型命令:LSD(X)CAR(1)AR(2)AR(3)MA(1)MA(2)MA(3)MA(4)在剔除不显著的项后得到估计结果(表8)表8写出拟合的方程:)6839.02289.01()3419.09965.04655.05428.01()1(32422BBBBBBXBtts.e.=65.21546,AIC=11.27737,SC=11.47321模型的显著性检验:图8根据图8,残差序列滞后7阶的Q统计量的p值为0.035,小于=0.05,因此拒绝原假设(原假设为:序列为白噪声),即残差序列是非白噪声的,拟合模型不显著。(四)模型的优化表9模型AICSCARIMA(0,1,4)11.3386211.49796ARIMA(3,1,0)11.3156711.41359根据AIC和SC准则,模型ARIMA(3,1,0)优于模型ARIMA(0,1,4),我们选择ARIMA(3,1,0)最为预测模型。(五)预测首先扩大样本范围,在命令行输入:expand18671941,然后估计模型ARIMA(3,1,0),在Equation窗口,选择forecast菜单:图9在Forecastsample里输入要预测的时间,在S.E.(optional)处输入“se”,以便保存预测值的标准误差,点“OK”确定。计算95%的预测区间如下:表10年份预测值标准误差95%的置信下界95%的置信上界19391876.96372.400721735.0582018.86819401889.991129.411636.3472143.63519411833.962167.13721506.3732161.551其中预测值来自workfile里的xf序列,标准误差来自se序列,95%的置信下界=预测值xf-1.96*标准误差se;95%的置信下界=预测值xf+1.96*标准误差se;1.96为=0.05时,标准正态分布N(0,1)的临界值。