1第三章平稳时间序列分析选择合适的模型拟合1950-2008年我国邮路及农村投递线路每年新增里程数序列,见表1:表11950-2008年我国邮路及农村投递线路每年新增里程数序列单位:万公里年份新增里程年份新增里程年份新增里程195015.71197026.3919906.76195124.43197131.091991-0.83195218.23197219.7819924.67195322.5019732.56199311.68195412.53197412.9519940.8219559.94197515.5419958.5419567.1919763.97199624.51195741.1319772.42199728.91195879.0319780.31199844.941959119.321979-5.10199911.161960-12.101980-7.52200011.081961-89.711981-7.69200115.751962-52.2619821.612002-0.31196320.0119834.46200320.99196419.92198410.9720046.50196542.81198515.15200510.45196618.7819866.002006-3.511967-0.751987-0.90200723.421968-1.081988-3.22200817.9919695.091989-8.54一、时间序列预处理(一)时间序列平稳性检验1.时序图检验(1)工作文件的创建。打开EViews6.0软件,在主菜单中选择File/New/Workfile,在弹出的对话框中,在Workfilestructuretype中选择Dated-regularfrequency(时间序列数据),在Datespecification下的Frequency中选择Annual(年度数),在Startdate中输入“1950”(表示起始年2份为1950年),在Enddate中输入“2008”(表示样本数据的结束年份为2008年),然后单击“OK”,完成工作文件的创建。(2)样本数据的录入。选择菜单中的Quick/Emptygroup(EditSeries)命令,在弹出的Group对话框中,直接将数据录入,并分别命名为year(表示年份),X(表示新增里程数)。(3)时序图。选择菜单中的Quick/graph…,在弹出的SeriesList中输入“yearx”,然后单击“确定”,在GraphOptions中的Specifi中选择“XYLine”,然后按“确定”,出现时序图,如图1所示:图1我国邮路及农村投递线路每年新增里程数序列时序图从图1中可以看出,该序列始终在一个常数值附近随机波动,而且波动的范围有界,因而可以初步认定序列是平稳的。为了进一步确认序列的平稳性,还需要分析其自相关图。2.自相关图检验选择菜单中的Quick/SeriesStatistics/Correlogram...,在SeriesName中输入x(表示作x序列的自相关图),点击OK,在CorrelogramSpecification中的Correlogramof中选择Level,在Lagstoinclude中输入24,点击OK,得到图2:-120-80-40040801201601,9401,9501,9601,9701,9801,9902,0002,010YEARX3图2我国邮路及农村投递线路每年新增里程数序列自相关图和偏自相关图从图2可以看出,序列的自相关系数一直都比较小,除滞后1阶和3阶的自相关系数落在2倍标准差范围以外,其他始终控制在2倍的标准差范围以内,可以认为该序列自始至终都在零轴附近波动,因而认定序列是平稳的。(二)时间序列纯随机性检验由于平稳序列通常具有短期相关性,这里构造延迟6期和12期的Q统计量,如表2:表2序列白噪声检验结果表延迟阶数Q统计量的值P值637.7540.0001244.6200.000由表2可知,在各延迟阶数下Q检验统计量的P值都非常小(0.0001),所以可以以很大的把握(置信水平99.999%)断定我国邮路及农村投递线路每年新增里程数序列属于非白噪声序列。从而可以对这个平稳非白噪声序列进行进一步分析建模及预测。二、模型识别从图2可以看出,序列的自相关图显示除了1-3阶的自相关系数在2倍标准差4范围之外,其他阶数的自相关系数都在2倍标准差范围内波动,既可以将其看成是拖尾也可以将其看成是3阶截尾;偏自相关系图显示除了2阶的偏自相关系数在2倍标准差范围之外,其他阶数的偏自相关系数都在2倍标准差范围内波动,既可将其看成是拖尾也可将其看成是2阶截尾。从而将模型初步认定为:AR(2),MA(3)三、参数估计(一)AR(2)模型在Eviews6.0主菜单中选择Quick/EstimateEquation…,在弹出的对话框中,在Equationspecification中输入“ycar(1)ar(2)”在Method中选择LS-LeastSquares(NLSandARMA);在Sample中输入“19502008”,然后按“确定”,即出现回归结果(如表3所示):表3AR(2)模型回归结果DependentVariable:XMethod:LeastSquaresSample(adjusted):19522008Includedobservations:57afteradjustmentsConvergenceachievedafter3iterationsVariableCoefficientStd.Errort-StatisticProb.C10.837413.2340533.3510290.0015AR(1)0.7285900.1138856.3975920.0000AR(2)-0.5445830.114077-4.7738380.0000R-squared0.453915Meandependentvar10.95316AdjustedR-squared0.433689S.D.dependentvar26.47445S.E.ofregression19.92298Akaikeinfocriterion8.872821Sumsquaredresid21433.96Schwarzcriterion8.980350Loglikelihood-249.8754Hannan-Quinncriter.8.914610F-statistic22.44281Durbin-Watsonstat2.104218Prob(F-statistic)0.000000InvertedARRoots.36-.64i.36+.64i从表3中可以看出,AR(2)模型为:xt=10.83741+tBB2*544583*728590.0115(二)MA(3)模型在Eviews6.0主菜单中选择Quick/EstimateEquation…,在弹出的对话框中,在Equationspecification中输入“ycma(1)ma(2)ma(3)”在Method中选择LS-LeastSquares(NLSandARMA);在Sample中输入“19502008”,然后按“确定”,即出现回归结果,但由于ma(2)的参数不显著,所以剔除掉,结果如下(如表4所示):表4MA(3)模型回归结果DependentVariable:XMethod:LeastSquaresSample:19502008Includedobservations:59Convergenceachievedafter13iterationsMABackcast:19471949VariableCoefficientStd.Errort-StatisticProb.C11.071773.0924963.5802070.0007MA(1)0.6477840.1257145.1528410.0000MA(3)-0.3726780.127716-2.9180150.0051R-squared0.430334Meandependentvar11.26220AdjustedR-squared0.399262S.D.dependentvar26.07973S.E.ofregression20.21369Akaikeinfocriterion8.915987Sumsquaredresid22472.64Schwarzcriterion9.056837Loglikelihood-259.0216Hannan-Quinncriter.8.970969F-statistic13.84929Durbin-Watsonstat1.862847Prob(F-statistic)0.000001InvertedMARoots.60-.62+.49i-.62-.49i从表4中可以看出,MA(3)模型为:xt=11.07177+(1-0.647784*B+0.372678*B3)t四、模型检验(一)AR(2)模型的显著性检验在Eviews6.0主菜单中选择Quick/GenerateSeries…,在弹出的对话框中,在Enterequation中输入“e=resid”,表示将resid存入e中,在Sample中输入“19502008”,然后按“ok”。选择菜单中的Quick/Series6Statistics/Correlogram...,在SeriesName中输入e(表示作e序列的自相关图),点击OK,在CorrelogramSpecification中的Correlogramof中选择Level,在Lagstoinclude中输入24,点击OK,得到图3:图3AR(2)模型的残差自相关和偏自相关图从图3可以看出,AR(2)模型的AC和PAC都没有显著异于0,Q统计量的P值都远远大于0.05,因此可以认为残差序列为白噪声序列,模型信息提取比较充分。此外从表3可以看出,滞后一阶和二阶参数的P值都很小,参数显著,因此整个模型比较精简,模型较优。(二)MA(3)模型的显著性检验在Eviews6.0主菜单中选择Quick/GenerateSeries…,在弹出的对话框中,在Enterequation中输入“e1=resid”,表示将resid存入e1中,在Sample中输入“19782012”,然后按“ok”。选择菜单中的Quick/SeriesStatistics/Correlogram...,在SeriesName中输入e1(表示作e1序列的自相关图),点击OK,在CorrelogramSpecification中的Correlogramof中选择Level,在Lagstoinclude中输入24,点击OK,得到图4:7图4MA(3)模型的残差自相关和偏自相关图从图4可以看出,MA(3)模型的AC和PAC都没有显著异于0,Q统计量的P值都远远大于0.05,因此可以认为残差序列为白噪声序列,模型信息提取比较充分。此外从表4可以看出,滞后一阶和三阶参数的P值都很小,参数显著,因此整个模型比较精简,模型较优。五、模型优化从上面的分析可知,AR(2),MA(3)模型均显著,此时需要选择一个更好的模型,即选择相对最优模型。根据优化准则得到表5:AIC=n*ln(^2)+2(未知参数个数)SBC=n*ln(^2)+ln(n)(未知参数个数)表5检验结果表模型AICSBCAR(2)8.8728218.980350MA(3)8.9159879.056837由表5可知,无论是使用AIC准则还是使用SBC准则,AR(2)模型都要优于MA(3)模型,所以此次实验中AR(2)模型是相对最优模型。8六、模型预测在Workfile窗口点击Range,出现ChangeWorkfileRange窗口,将Enddata由2008改为2009,点击OK,将Workfile中的Range扩展为1950-2009,以同样