灰色预测模型理论及其应用灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测.尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测.灰色预测模型只需要较少的观测数据即可,这和时间序列分析,多元回归分析等需要较多数据的统计模型不一样.因此,对于只有少量观测数据的项目来说,灰色预测是一种有用的工具.本文主要围绕灰色预测GM(1,1)模型及其应用进行展开。一、灰色系统及灰色预测的概念1.1灰色系统灰色系统产生于控制理论的研究中。若一个系统的内部特征是完全已知的,即系统的信息是充足完全的,我们称之为白色系统。若一个系统的内部信息是一无所知,一团漆黑,只能从它同外部的联系来观测研究,这种系统便是黑色系统。灰色系统介于二者之间,灰色系统的一部分信息是已知的,一部分是未知的。区别白色和灰色系统的重要标志是系统各因素间是否有确定的关系。特点:灰色系统理论以“部分信息已知、部分信息未知”的“小样本”、“贫信息”不确定型系统的研究对象。1.2灰色预测灰色系统分析方法是通过鉴别系统因素之间发展趋势的相似或相异程度,即进行关联度分析,并通过对原始数据的生成处理来寻求系统变动的规律。生成数据序列有较强的规律性,可以用它来建立相应的微分方程模型,从而预测事物未来的发展趋势和未来状态。灰色预测是用灰色模型GM(1,1)来进行定量分析的,通常分为以下几类:(1)灰色时间序列预测。用等时距观测到的反映预测对象特征的一系列数量(如产量、销量、人口数量、存款数量、利率等)构造灰色预测模型,预测未来某一时刻的特征量,或者达到某特征量的时间。(2)畸变预测(灾变预测)。通过模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。(3)波形预测,或称为拓扑预测,它是通过灰色模型预测事物未来变动的轨迹。(4)系统预测,是对系统行为特征指标建立一族相互关联的灰色预测理论模型,在预测系统整体变化的同时,预测系统各个环节的变化。上述灰预测方法的共同特点是:(1)允许少数据预测;(2)允许对灰因果律事件进行预测,比如灰因白果律事件:在粮食生产预测中,影响粮食生产的因子很多,多到无法枚举,故为灰因,然而粮食产量却是具体的,故为白果。粮食预测即为灰因白果律事件预测。白因灰果律事件:在开发项目前景预测时,开发项目的投入是具体的,为白因,而项目的效益暂时不很清楚,为灰果。项目前景预测即为灰因白果律事件预测。(3)具有可检验性,包括:建模可行性的级比检验(事前检验),建模精度检验(模型检验),预测的滚动检验(预测检验)。二、GM(1,1)模型2.1GM(1,1)模型GM(1,1)模型是基于灰色系统的理论思想,将离散变量连续化,用微分方程代替差分方程,按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近,用生成数序列代替原始时间序列,弱化原始时间序列的随机性,这样可以对变化过程作较长时间的描述,进而建立微分方程形式的模型.其建模的实质是建立微分方程的系数,将时间序列转化为微分方程,通过灰色微分方程可以建立抽象系统的发展模型.经证明,经一阶线性微分方程的解逼近所揭示的原始时间数列呈指数变化规律时,灰色预测GM(1,1)模型的预测将是非常成功的.2.2GM(1,1)模型的建立GM(1,1)模型是指一阶,一个变量的微分方案预测模型,是一阶单序列的线性动态模型,用于时间序列预测的离散形式的微分方程模型.模型符号含义为GM(1,1)GreyModel1阶方程1个变量设时间序列0X有n个观察值,00001,2,,Xxxxn,为了使其成为有规律的时间序列数据,对其作一次累加生成运算,即令101tnxtxn从而得到新的生成数列1X,11111,2,,Xxxxn,称(0)(1)()()xkaxkb为GM(1,1)模型的原始形式。新的生成数列1X一般近似地服从指数规律.则生成的离散形式的微分方程具体的形式为dxaxudt即表示变量对于时间的一阶微分方程是连续的.求解上述微分方程,解为(1)()atuxtcea当t=1时,()(1)xtx,即(1)ucxa,则可根据上述公式得到离散形式微分方程的具体形式为11atuuxtxeaa其中,ax项中的x为dxdt的背景值,也称初始值;a,u是待识别的灰色参数,a为发展系数,反映x的发展趋势;u为灰色作用量,反映数据间的变化关系.按白化导数定义有0()()limtdxxttxtdtt显然,当时间密化值定义为1时,当1t时,则上式可记为1lim(()())tdxxttxtdt这表明dxdt是一次累减生成的,因此该式可以改写为(1)(1)(1)()dxxtxtdt当t足够小时,变量x从()xt到()xtt是不会出现突变的,所以取()xt与()xtt的平均值作为当t足够小时的背景值,即(1)(1)(1)1()(1)2xxtxt(紧邻均值(MEAN)生成序列)将其值带入式子,整理得(0)(1)(1)1(1)()(1)2xtaxtxtu(GM(1,1)模型的均值形式)由其离散形式可得到如下矩阵:(1)(1)(0)(1)(1)(0)(0)(1)(1)1(1)(2)2(2)1(2)(3)(3)2()1(1)()2xxxxxxauxnxnxn令(0)(0)(0)(2),(3),,()TYxxxn(1)(1)(1)(1)(1)(1)11(1)(2)211(2)(3)21(1)()12xxxxBxnxnTau称Y为数据向量,B为数据矩阵,为参数向量.则上式可简化为线性模型:YB由最小二乘估计方法得1TTaBBBYu上式即为GM(1,1)参数,au的矩阵辨识算式,式中1TTBBBY事实上是数据矩阵B的广义逆矩阵.将求得的a,u值代入微分方程的解式,则(1)(1)(1)ˆ()(1)atuuxtxeaa其中,上式是GM(1,1)模型的时间响应函数形式,将它离散化得(1)(0)(1)ˆ()(1)atuuxtxeaa对序列1ˆxt再作累减生成可进行预测.即(0)(1)(1)(0)(1)ˆˆˆ()()(1)(1)1aatxtxtxtuxeea上式便是GM(1,1)模型的预测的具体计算式.2.3GM(1,1)模型的检验GM(1,1)模型的检验包括残差检验、关联度检验、后验差检验三种形式.每种检验对应不同功能:残差检验属于算术检验,对模型值和实际值的误差进行逐点检验;关联度检验属于几何检验范围,通过考察模型曲线与建模序列曲线的几何相似程度进行检验,关联度越大模型越好;后验差检验属于统计检验,对残差分布的统计特性进行检验,衡量灰色模型的精度.残差检验残差大小检验,即对模型值和实际值的残差进行逐点检验.设模拟值的残差序列为(0)()et,则(0)(0)(0)ˆ()()()etxtxt令()t为残差相对值,即残差百分比为(0)(0)(0)ˆ()()()%()xtxttxt令为平均残差,11()nttn.一般要求20%t,最好是10%t,符合要求.关联度检验关联度是用来定量描述各变化过程之间的差别.关联系数越大,说明预测值和实际值越接近.设(0)(0)(0)(0)ˆˆˆˆ()(1),(2),,()Xtxxxn(0)(0)(0)(0)()(1),(2),,()Xtxxxn序列关联系数定义为式中,(0)(0)ˆ()()xtxt为第t个点(0)x和(0)ˆx的绝对误差,()t为第t个数据的关联系数,称为分辨率,即取定的最大差百分比,0,一般取0.5.(0)()xt和(0)ˆ()xt的关联度为11ntrtn关联度大于60%便满意了,原始数据与预测数据关联度越大,模型越好.后验差检验后验差检验,即对残差分布的统计特性进行检验.检验步骤如下:1、计算原始时间数列0(0)(0)(0)(1),(2),,()Xxxxn的均值和方差2(0)(0)2(0)11111(),()nnttxxtSxtxnn(0)(0)(0)(0)(0)(0)(0)(0)ˆˆmin()()max()(),0ˆˆ()()max()()1,0xtxtxtxtttxtxtxtxtt2、计算残差数列(0)(0)(0)(0)(1),(2),,()eeeen的均值e和方差22s2(0)2(0)21111(),()nntteetSetenn其中(0)(0)(0)ˆ()()(),1,2,,etxtxttn为残差数列.3、计算后验差比值21CSS4、计算小误差频率(0)1()0.6745PPeteS令0S=0.67451S,(0)()|()|tete,即0()PPtS.若对给定的00C,当0CC时,称模型为方差比合格模型;若对给定的00P,当0PP时,称模型为小残差概率合格模型.PC模型精度0.950.35优0.800.5合格0.700.65勉强合格0.700.65不合格表3后验差检验判别参照表2.3GM(1,1)模型修正(残差GM(1,1)模型)当原始数据序列(0)X建立的GM(1,1)模型检验不合格时,可以用GM(1,1)残差模型来修正.如果原始序列建立的GM(1,1)模型不够精确,也可以用GM(1,1)残差模型来提高精度.若用原始序列(0)X建立的GM(1,1)模型(1)(0)ˆ(1)[(1)]atuuxtxeaa可获得生成序列(1)X的预测值,定义残差序列(0)(1)(1)ˆ()()()ekxkxk.若取k=t,t+1,…,n,则对应的残差序列为(0)(0)(0)(0)()(1),(2),,()ekeeen计算其生成序列(1)()ek,并据此建立相应的GM(1,1)模型(1)(0)ˆ(1)[(1)]eakeeeeuueteeaa得修正模型(1)(0)(0)(1)(1)()()(1)eakakeeeuuuxtxektaeeaaa其中1()0ktktkt为修正参数.三、GM(1,1)模型的应用表1南昌市民用汽车保有量年份2004200520062007200820092010201120122013南昌市民用汽车保有量(万辆)24.410926.730730.387836.380741.016143.7348.41615763.1第一步:构造累加生成序列X(1);(1)(1)(1)(1)(1)(1)(1)(1)(1)(1)(1)(1),(2),(3),(4)(5),(6),(7),(8)(9),(10),51.1416,81.5294,117.9101,158.9262,202.6562,251.0662,312.0662,369.06624.12409Xxxxxxxxxxx,,,432.166第二步:计算系数值;对(1)X做紧邻均值生成.令(1)(1)(1)()0.5()0.5(1)Zkxkxk,得(1)(1)(1)(1)(1)(1)(1)(1)(1)(1)(2),(3),(4)(5),(6),(7)(8)(9)(,10)37.77625,66