1第三章平稳时间序列建模实验报告下表为1980-2012年全国第三产业增加值指数(上年=100)的数据。表3-11980-2012年全国第三产业增加值指数(上年=100)年份第三产业增加值年份第三产业增加值19801061997110.71981110.41998108.419821131999109.31983115.22000109.71984119.32001110.31985118.22002110.419861122003109.51987114.42004110.11988113.22005112.21989105.42006114.11990102.320071161991108.92008110.41992112.42009109.61993112.22010109.81994111.12011109.41995109.82012108.11996109.4资料来源:国家统计局网站根据以上数据,下面用Eviewis6.0对1980-2012年我国第三产业增加值指数的年度数据建立ARMA(p,q)模型,并利用此模型进行数据预测。以下将分为时间序列预处理、模型识别、参数估计、模型检验、模型优化和模型预测六个部分进行具体分析。一、时间序列预处理(一)平稳性检验根据序列时序图和散点图以及序列相关图,判断序列是否为平稳序列,最后用单位根检验图像判断是否准确。若为平稳序列则可对其进一步进行分析处理,进而建立模型。1.时序图检验在数据窗口中,按路径“View\Graph”选择Line@Sybol,做序列时序图,看序列是否随时间随机波动没有明显的趋势和周期性波动,如果没有,则可以认为序列平稳。2图3-1时序图2.散点图在数据窗口,按路径“View\Graph”选择DotPlot,做序列散点图如下:图3-2散点图通过观察时序图和散点图发现序列没有明显的趋势变动和周期变动,数值在110上下小范围波动,可初步确定其为平稳序列。33.自相关图检验图3-3序列相关图自相关图中显示,自相关系数和偏自相关系数一阶之后都基本控制在两倍标准差之内,基本可以看做接近于0,得出序列应为平稳序列。4.单位根检验通过以上的直观判断后,得出序列为平稳序列。优于直观图判断受主观因素影响,很容易产生偏差。下面通过统计检验来进一步对其是否为统计上显著的平稳序列进行证实。在数据窗口,按路径“View\UnitRootTest”,在Automaticselection中选择AkaikeInfoCriterion,检验结果如下表3-2所示。从以上单位根检验结果看,P值小于0.05,拒绝原假设,认为序列为平稳的。4表3-2单位根检验结果NullHypothesis:YhasaunitrootExogenous:ConstantLagLength:4(AutomaticbasedonAIC,MAXLAG=8)t-StatisticProb.*AugmentedDickey-Fullerteststatistic-3.5001370.0156Testcriticalvalues:1%level-3.6891945%level-2.97185310%level-2.625121*MacKinnon(1996)one-sidedp-values.AugmentedDickey-FullerTestEquationDependentVariable:D(Y)Method:LeastSquaresDate:05/12/14Time:19:25Sample(adjusted):19852012Includedobservations:28afteradjustmentsVariableCoefficientStd.Errort-StatisticProb.Y(-1)-0.7645920.218446-3.5001370.0020D(Y(-1))0.5569630.1940902.8696080.0089D(Y(-2))-0.0163500.216951-0.0753650.9406D(Y(-3))0.2848100.1697361.6779570.1075D(Y(-4))0.2204220.1786391.2338950.2303C84.5704024.281233.4829540.0021R-squared0.533775Meandependentvar-0.400000AdjustedR-squared0.427815S.D.dependentvar2.897892S.E.ofregression2.192050Akaikeinfocriterion4.594961Sumsquaredresid105.7119Schwarzcriterion4.880434Loglikelihood-58.32946Hannan-Quinncriter.4.682233F-statistic5.037502Durbin-Watsonstat2.157749Prob(F-statistic)0.003165(二)纯随机性检验1.自相关图检验样本自相关图虽然显示序列没有一个自相关系数严格等于零,但是这些自相关系数确实比较小,而且在零值附近以小幅度随机波动,粗略可看做是纯随机序列。5图3-3序列相关图2.统计量检验表3-2Q统计量检验结果延迟Q统计量检验Q统计量值P值延迟6期23.5210.001延迟12期27.9580.006在序列相关图中,Q统计量大于相应分位点,或者该统计量的P值小于0.05时可以以0.95的置信水平拒绝原假设,认为该序列为非白噪声序列;否则,接受原假设,认为该序列为纯随机序列。在图3中结果显示,Q统计量足够大而且P统计量足够小,满足拒绝原假设的条件,则该序列为非白噪声序列。二、模型识别由图3可以看出,偏自相关系数在K=2后全部接近为0落入2倍标准差范围以内,可以判断其偏自相关系数明显2阶截尾,可尝试用AR(2)进行拟合。6自相关系数在K=1之后基本都落在2倍标准差范围内,可判断其为自相关系数1阶截尾,可尝试用MA(1)进行拟合。而自相关系数开始逐渐变化,且后边还有接近甚至稍大于两倍标准差的,故也可以判断其拖尾。同时偏自相关系数相对于0而言也还有一定的差距,故后面对AR(2)、MA(1)以及(2,1)分别进行考虑。三、参数估计对同一个平稳序列常常可以建立多个适合的模型如AR(p)、MA(q)以及ARMA(p,q)。多模型均通过检验时,考虑模型的简约原则,选择AIC和SC值比较小的即信息提取量大未知量少的,作为最佳的拟合模型。以下分别用AR(2)、MA(1)和ARMA(2,1)对序列进行拟合,并对结果进行分析比较,得出最佳的拟合模型。(一)尝试AR模型在主窗口中输入LSYAR(1)AR(2),其中AR(i)表示自回归系数,得到如下结果,即得模型估计结果和相关统计量。表3-3AR(2)模型结果DependentVariable:YMethod:LeastSquaresDate:05/18/14Time:11:22Sample(adjusted):19822012Includedobservations:31afteradjustmentsConvergenceachievedafter3iterationsVariableCoefficientStd.Errort-StatisticProb.C110.97140.851824130.27500.0000AR(1)0.8801980.1706305.1585310.0000AR(2)-0.4078720.164972-2.4723630.0198R-squared0.493065Meandependentvar111.1226AdjustedR-squared0.456856S.D.dependentvar3.387694S.E.ofregression2.496674Akaikeinfocriterion4.759561Sumsquaredresid174.5346Schwarzcriterion4.898334Loglikelihood-70.77320Hannan-Quinncriter.4.804798F-statistic13.61698Durbin-Watsonstat1.881436Prob(F-statistic)0.000074InvertedARRoots.44-.46i.44+.46i7由以上结果P值均小于0.05,可得AR(1)、AR(2)均高度显著,得出模型如下:teBBY2*)407872.0(*880198.0119714.110(二)尝试MA模型在主窗口中输入LSYCMA(1),得到如下结果,即得到模型估计结果和相关统计量。表3-4MA(1)模型结果DependentVariable:YMethod:LeastSquaresDate:05/18/14Time:12:23Sample:19802012Includedobservations:33Convergenceachievedafter35iterationsMABackcast:1979VariableCoefficientStd.Errort-StatisticProb.C110.91260.758292146.26630.0000MA(1)0.7451710.1154276.4557460.0000R-squared0.473381Meandependentvar110.9455AdjustedR-squared0.456393S.D.dependentvar3.400468S.E.ofregression2.507154Akaikeinfocriterion4.734865Sumsquaredresid194.8605Schwarzcriterion4.825563Loglikelihood-76.12528Hannan-Quinncriter.4.765382F-statistic27.86610Durbin-Watsonstat1.559567Prob(F-statistic)0.000010InvertedMARoots-.75由以上结果P值小于0.05可得,MA(1)系数高度显著,得到的自回归模型如下:Y=110.9126+(1-0.745171B)etMA(1)模型与AR(2)模型相比,AICA和SC的值相差无几,MA(1)模型略小。可决系数和修正的可决系数也十分相似。故将其综合考虑进行ARMA(2,1)模型拟合。(三)尝试ARMA(2,1)模型8在主窗口中输入LSYCAR(1)AR(2)MA(1),得到如下结果,即得模型估计结果和相关统计量。表3-5ARMA(2,1)模型结果DependentVariable:YMethod:LeastSquaresDate:05/18/14Time:11:46Sample(adjusted):19822012Includedobservations:31afteradjustmentsConvergenceachievedafter23iterationsMABackcast:1981VariableCoefficientStd.Errort-StatisticProb.C111.01430.964788115.06600.0000AR(1)0.5082320.3378141.5044720.1441AR(2)-0.1913750.276312-0.6926050.4945MA(1)0.4929890.3182011.5492990.1330R-squared0.520764Meandependentvar111.1226AdjustedR-squared0.467515S.D.dependentvar3.387694S.E.ofregression2.472054Akaikeinfocriterion4.767890Sumsquaredresid164.9983