基于ARMA模型和灰色预测模型的邮政业务总量预测上传日期:2009年10月16日编辑:现代经济编辑部点击:318次胡芳芳(首都经济贸易大学统计学院,北京100070)摘要:邮政业务是个复杂的社会经济系统,本文分别采取ARMA模型以及灰色预测模型GM(1,1)对邮政业务总量进行预测,并比较了两种模型的预测精度,并对2009-2011年全国邮政业务总量进行了预测。关键词:ARMA模型;灰色预测模型;邮政业务;预测精度中图分类号:F618文献标识码:A文章编号:1671-8089(2009)08-0032-04一、基于ARMA模型的邮电业务总量预测ARMA模型是一类常用的随机时序模型,由博克斯(Box)、詹金斯(Jenkins)创立,亦称B-J方法。它是一种精度较高的时序短期预测方法,其基本思想是:某些时间序列是依赖于时间t的一族随机变量,构成该时序的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以有相应的数学模型近似描述。通过对该数学模型的分析研究,能够更本质地认识时间序列的结构与特征,达到最小方差意义下的最优预测。本文利用1949-2005年全国邮电业务总量历史数据,建立ARMA模型进行拟合,并对2006-2008年数据进行预测,最后对2006-2008年邮电业务总量真实值与预测值进行比较分析。(一)序列的平稳性检验。建立ARMA模型之前需检验序列的平稳性,只有平稳序列才能建立ARMA模型。原序列yz非平稳,为减小序列的波动,对yz取对数形成新的序列lyz,经检验,lyz仍非平稳,须对lyz序列进行逐期差分以消除趋势,差分后序列为ilyz。再检验ilyz的平稳性,进行单位根检验,检验结果如图1所示:图1单位根检验结果可以看出,检验统计量值为-3.578351,小于给定置信水平下的临界值,则认为序列ilyz不存在单位根,为平稳序列。(二)模型的识别与建立。自相关函数和偏自相关函数是识别ARMA模型最主要的工具,在Eviews中,通常利用样本的自相关和偏自相关分析图进行模型识别与定阶。平稳序列ilyz的自相关-偏自相关分析图如图2:图2平稳序列ilyz的自相关-偏自相关分析图由图可以看出,偏自相关系数在后很快地趋于0,所以取;自相关系数在后很快趋于0,所以。于是建立ARMA(1,6)模型。ARMA(1,6)模型的参数估计结果为:(三)模型检验。参数估计后,应该对ARMA模型的适合性进行检验,即对模型的残差序列进行白噪声检验。对残差序列进行检验,检验结果以及残差序列的自相关-偏自相关分析图如图3所示:图3残差序列的自相关-偏自相关分析图从图中可以看出,残差序列的自相关系数均落入随机区间,表明残差序列是纯随机的。(四)模型的预测。本文使用1997-2005年的邮政业务总量真实值与模型拟合值进行拟合精度分析,以及利用2006-2008年邮政业务总量真实值逾模型预测值进行预测精度分析。表1模型预测结果年份真实值(亿元)拟合值(亿元)19971773.2901827.57919982431.2102429.43519993330.8203310.48420004792.7004470.03720014556.2606532.86120025695.8005041.88820037019.7906919.28520049712.2909167.722200512028.5412192.48200615325.8713759.59200719805.0616957.58200823841.320634.95模型拟合平均相对误差为0.0819,模型预测平均相对误差为0.1268。二、基于GM(1,1)模型的邮政业务总量预测灰色预测法式一种对含有不确定因素的系统进行预测的方法,是对既含有已知信息又含有不确定信息的系统进行预测,就是对在一定范围内变化的、与时间有关的灰色过程进行预测。灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成又较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来的发展趋势状况。(一)模型的建立。设时间序列有个观察值,,通过累加生成新序列,则模型相应的微分方程为:(1)式中,,为发展灰数,为内生控制灰数。设为待估参数向量,则,利用最小二乘法求解,得:,其中,,解方程则有:(2)求解预测值:将代入(2)式可得模型的计算值,通过将预测值还原,得到相应的预测值。(二)模型的检验。对模型的预测精度进行检验是建构预测分析必不可少的步骤。常用的检验方法有残差检验法、后残差检验法及关联度分析法。1、残差检验法:根据预测模型可知,第年预测值与原始值的误差表示为:若相对误差记为,称为平均相对误差,给定,当成立时,称模型为残差合格模型。2、后残差检验:记时刻残差,则残差均值,残差的方程,设原始方差为,则可得:(1)后残差比值:,对于给定的,当时,称模型为均方差比合格模型;(2)小误差概率:,对于给定的当时,称模型为小误差概率合格模型。表2模型的精度标准好合格勉强合格不合格(3)关联度检验:绝对误差为:关联系数:在最大差百分比取50%时,关联度大于0.6便满意了。(三)邮政业务总量预测。以1997-2005年邮政业务总量来构建灰色预测GM(1,1)模型,并对模型精度进行检验。记1997-2005年全国邮政业务总量的时间序列为:根据(1),(2)式得到预测模型:表3模型预测结果年份真实值(亿元)拟合值(亿元)19971773.2901773.2919982431.2102479.9819993330.8203089.5820004792.7003849.01920014556.2604795.1420025695.8005973.8320037019.7907442.2320049712.2909271.59200512028.5411550.62表4模型的精度检验结果表平均相对误差关联度后验差比值小误差概率0.05950.93930.12991从模型的精度检验结果来看,除了平均相对误差以外,其他几项指标均达到了理想状态,下面建立改进残差模型。对残差项建立GM(1,1)模型,将预测模型加上残差预测模型变得修正预测模型:表5模型预测结果年份真实值(亿元)拟合值(亿元)19971773.2901773.2919982431.2102479.9819993330.8203295.45120004792.7004030.35520014556.2604954.8720025695.8006114.5220037019.7907566.1620049712.2909380.76200512028.5411646.77表6模型的精度检验结果表平均相对误差关联度后验差比值小误差概率0.05490.94210.129671从模型的精度检验结果来看,平均相对误差有所提高。,即GM(1,1)可以适合中长期预测。以下为2006-2008年邮政业务总量预测结果:表7预测结果年份真实值(亿元)拟合值(亿元)200615325.8714474.54200719805.0618001.59200823841.322399.26模型拟合平均相对误差为0.0549,模型预测平均相对误差为0.0605。下表为ARMA(1,6)模型和GM(1,1)模型1997-2005年拟合平均相对误差以及2006-2008年的预测平均相对误差之间的比较。表8模型预测精度对比模型拟合平均相对误差模型预测平均相对误差ARMA模型0.08190.1268GM(1,1)模型0.05490.0605可见,不管是在拟合历史数据方面,还是在预测未来数据方面,GM(1,1)灰色预测模型效果均好于ARMA模型。三、2009-2011年邮政业务总量预测由于GM(1,1)在预测未来数据方面精度好于ARMA模型,下面利用1997-2008年邮政业务总量数据建立GM(1,1)模型,并对2009-2011年的邮政业务总量进行预测分析。预测结果如下:表9预测结果真实值(亿元)预测值(亿元)19971773.291773.2919982431.212371.95619993330.822980.70620004792.73745.68820014556.264706.9920025695.85915.0220037019.797433.0620049712.299340.73200512028.5411737.96200615325.8714750.44200719805.0618536.06200823841.323293.2200929271.3201036783.6201146223.9图4预测结果四、总结由预测结果可知,2009年我国邮政业务总量将比2008年增长22.8%,之后每年将以超过25%的速度增长。参考文献:[1]易丹辉.数据分析与Eviews应用.中国统计出版社,2002[2]徐国祥.统计预测和决策.第二版.上海财经大学出版社,2005作者简介;胡芳芳(1985年-),女,籍贯:江西南昌,学位:在读硕士二年级,首都经济贸易大学统计学院,研究方向:精算与风险分析。