基于ARIMA模型的城镇居民人均收入的预测摘要:城镇居民可支配收入是反映人民生活水平以及国内经济发展状况的重要指标,因此深入了解城镇居民可支配收入的情况就显得尤为重要。本文在对1978—2013年我国城镇居民人均可支配收入的数据进行训练集和检验集的划分处理后,运用SAS9.3统计软件建立了ARIMA(1,1,0)城镇居民人均可支配收入的拟合模型:ttBxB75705.0111。并预测2014年城镇居民人均的可支配收入为29284.77元,为政府部门提供了制定相关惠民政策的参考。中图分类号N32文献标识码:A一、引言城镇居民可支配收入是指反映居民家庭全部现金收入能用于安排家庭日常生活的那部分收入。随着国家将经济政策的重点放到保证和改善民生上面,城镇居民的可支配收入就成为了一个非常重要的参考指标,可以用来衡量城镇居民的生活水平,从而是政府制定相关政策的重要依据。目前国内针对城镇居民可支配收入的预测研究的文献主要采用两种预测方法平稳时间序列预测法和灰色预测法。一种是由著名学者邓聚龙教授提出的灰色预测系统理论,目前已经广泛应用到了经济、科教、工农业、气象、军事等领域,并取得了较好的预测效果。其中游中胜以重庆城镇居民家庭为例构造了GM(1,1)的家庭人均可支配收入模型,并分别预测了2013—2015年的人均可支配收入]2[。另一种则是通过建立ARIMA模型进行预测,通过对数据的处理分析最终得到较好的预测结果。文献有蒋琴莉利用ARIMA模型预测了我国城镇居民家庭人均可支配收入并提出建设性的政策意见]3[。本文运用软件SAS9.3对《中国统计年鉴2014》1978—2013年我国城镇居民人均可支配收入的数据进行分析,此外,为了更好地检验数据的拟合效果,我们将数据分为训练集和检验集,并运用ARIMA模型对城镇居民可支配收入进行了预测。二、ARlMA模型原理ARIMA模型全称为自回归移动平均模型(AutoregressiveIntegratedMovingAverageModel,简记ARIMA),具有如下结构:tsExtsEVarEBxBtsstttttd,0,0)(,)(,0)()()(2(1)式中,ddB)1(;ppBBB11)(,为平稳可逆ARMA(P,q)模型的自回归系数多项式;qqBBB11)(,为平稳可逆ARMA(p,q)模型的移动平滑系数多项式。求和自回归移动模型这个名字的由来是因为d阶差分后序列可以表示为:itiddiitdxCx0)1(式中,)!(!!ididCid,即差分后序列等于原序列的若干序列值的加权和,而对它又可以拟合自回归移动平均模型,所以称它为求和自回归移动平均模型。式(5.1)可以简记为:ttdBBx)()((2)式中,t为零均值白噪声序列。由式2容易看出,ARIMA模型的实质就是差分运算与ARMA模型的组合。这一关系意义重大。这说明任何非平稳序列如果能通过适当阶数的差分实现差分后平稳,就可以对差分后序列进行ARMA模型拟合了。而ARMA模型的分析方法非常成熟,这意味着对差分序列的分析也将是非常简单、非常可靠的。特别的,当d=0时,ARIMA(p,d,q)模型实际就是ARMA(p,q)模型。当p=0时,ARIMA(0,d,q)模型可以简记IMA(d,q)模型。当d=1,p=q=0时,ARIMA(0,1,0)模型为:tsExtsEVarExxtsstttttt,0,0)(,)(,0)(21(3)该模型又称为随机游走模型]4[。三、数据的介绍以及描述本文选取《中国统计年鉴2014》1978—2013年我国城镇居民人均可支配收入作为研究数据。通过利用SAS9.3软件对城镇居民人均可支配收入绘制时序图(如图1),可以清晰的了解到城镇居民人均可支配收入序列蕴含着曲线递增的长期趋势,是非平稳时间序列。图11978—2010年城镇居民人均可支配收入的时序图3.1数据预处理为了更好地检验数据的拟合效果,我们将数据分为训练集和检验集。1978—2010年的数据作为训练集用于建模,余下3年数据作为检验集作为检验模型预测能力好坏的标准。由于初步了解数据发现该序列呈现明显的上升趋势,为非平稳序列。且通过观察图形我们可以看出时序图呈指数函数上升的趋势,于是我们对该序列做对数变换,变换后的时序图(如图2)所示。图21978—2010年城镇居民人均可支配收入对数变换时序图图2显示,取对数后的时序图仍然蕴含着线性递增的趋势,还需要对该城镇居民人均可支配收入进行1阶差分运算来实现趋势平稳。结果如图3所示。图31978—2010年城镇居民人均可支配收入的1阶差分时序图1阶差分后的序列不再呈现明显的趋势性,可以直观的初步确认该序列已经平稳。四、ARIMA模型的建立4.1序列的平稳性检验与白噪声检验时序图显示该序列的信息基本被差分运算充分提取,为了进一步验证其平稳性,我们考察差分后序列的自相关图(如图4)。图41978—2010年城镇居民人均可支配收入的1阶差分后自相关图自相关图显示,延迟1阶之后,自相关系数具有明显的短期相关性,可以认为该差分后序列平稳。表1白噪声检验而对于白噪声的检验,我们由表1显示,在各阶延迟下LB检验统计量的P值在(a=0.1)的水平下,拒绝序列纯随机的原假设,我们可以断定城镇居民人均可支配收入的1阶差分后的序列属于非白噪声序列。结合前面平稳性的检验结果,可以说明该序列为平稳非白噪声序列。4.2模型的定阶与拟合为了确定模型的阶数,我们还需要考虑偏自相关图(图5)。图5偏自相关图偏自相关图显示,除了延迟1阶的偏西相关系数显著大于2倍标准差之外,其他阶数的偏自相关系数都比较小。根据自相关图和偏相关图的特点,我们来进行模型的定阶。由于偏相关图中只有延迟1阶的偏相关系数显著大于2倍标准差,所以拟合定阶模型AR(1),并剔除了常数项,(见表2)。表2未知参数估计表由上表可知,t统计量的P值小于非常小(0.001),所以AR(1)非常显著。综合考虑前面的差分运算,实际上对该数列拟合的模型ARIMA(1,1,0)。由此结合表3可知,表3拟合模型的具体形式由此结合表3可知,我们得到城镇居民人均可支配收入的拟合模型:ttBxB75705.0111(4)4.3模型的检验表4残差白噪声检验残差检验结果表示,在显著性检验a=0.05的水平下,检验统计量P均大于0.05.这表明残差序列可以视为白噪声序列。该ARIMA(1,1,0)模型对该序列建模成功。4.5模型的预测于是我们运用SAS程序利用上述ARIMA模型预测了城镇居民人均未来4年的可支配收入(如表5)所示。并将其中2011—2013的预测数据与检验集这三年的实际数据相比较,(如表6)所示。表52011—2013年城镇居民人均可支配收入预测值表6经过转换后2011—2013年的预测值:表7预测结果与实际结果比较表:年份真实值预测值201121809.7820964.96201224564.7223118.93201326955.095525825.84通过表7我们发现真实值与预测值十分接近,这表明我们所建模型有较好的效果,可以用来预测。于是我们得到了2014年城镇居民人均的可支配收入为29284.77元。五、结论预测城镇居民的人均可支配收入,不仅能够清楚掌握我国经济发展情况而且还有助于了解居民的生活水平和质量,据此为政府部门提供制定相关惠民政策的参考]1[。本文通过对1978—2013年我国城镇居民人均可支配收入的数据进行分析,采用ARIMA(1,1,0)模型对城镇居民可支配收入进行了预测。通过对检验数据的拟合,ARIMA(1,1,0)模型能够提供较好预测,并最终预测2014年城镇居民人均的可支配收入为29284.77元。此外,我们发现城镇居民的人均可支配收入呈现稳健的递增趋势,这表明国内经济发展良好,居民生活质量高,国家出台的相关促进经济增长的政策得到了一定成果。参考文献[1]蒋琴莉.我国城镇居民家庭人均可支配收入的分析及预测—基于ARIMA模型[J].中国经贸,2014,(3):102-104.[2]游中胜,张珣.基于GM(1,1)模型的城镇居民人均可支配收入预测—以重庆市城镇居民家庭为例[J].重庆师范大学学报,2013(30):60-63[3]王振寰,杨堰琨,张峰.ARIMA模型在城镇居民家庭收入的应用[J].内蒙古农业大学学报,2014(35):166-169[4]王燕.应用时间序列[M].北京:中国人民大学出版社,2014,141-147附录dataa;inputx@@;date=intnx('year','1jan1978'd,_n_-1);formatdateyear;cards;343.4477.6739.11510.21700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.67702.88472.29421.610493.011759.513785.815780.817174.719109.4;procgplotdata=a;symbol1v=starc=redi=join;plotx*date=1;run;datab;seta;lx=log(x);dif1=dif(lx);run;procgplotdata=b;symbol2v=starc=redi=join;plotlx*date=2dif;run;procgplotdata=b;symbol3v=starc=redi=join;plotdif1*date=3;run;procarimadata=b;identifyvar=lxnlag=6;run;identifyvar=lx(1)nlag=6;run;estimatep=5noint;run;forecastlead=4id=dateout=c;datac;setc;y=exp(lx);l95=exp(l95);u95=exp(u95);forecast=exp(forecast+std*std/2);run;procprintdata=c;vardateforecast;wheredate='1jan1978'd;run;