灰色预测模型灰色预测是就灰色系统所做的预测.所谓灰色系统是介于白色系统和黑箱系统之间的过渡系统,其具体的含义是:如果某一系统的全部信息已知为白色系统,全部信息未知为黑箱系统,部分信息已知,部分信息未知,那么这一系统就是灰箱系统.一般地说,社会系统、经济系统、生态系统都是灰色系统.灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测.尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测.灰色预测模型只需要较少的观测数据即可,这和时间序列分析,多元回归分析等需要较多数据的统计模型不一样.因此,对于只有少量观测数据的项目来说,灰色预测是一种有用的工具.一、GM(1,1)模型灰色系统理论是邓聚龙教授在1981年提出来的,是一种对含有不确定因素系统进行预测的方法.通过鉴别系统因素之间发展趋势的相异程度,进行关联分析,并通过对原始数据进行生成处理来寻找系统的变化规律,生成较强规律性数据序列,然后建立相应微分方程模型,从而预测事物未来的发展趋势和未来状态.目前使用最广泛的灰色预测模型是关于数列预测的一个变量、一阶微分的GM(1,1)模型.GM(1,1)模型是基于灰色系统的理论思想,将离散变量连续化,用微分方程代替差分方程,按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近,用生成数序列代替原始时间序列,弱化原始时间序列的随机性,这样可以对变化过程作较长时间的描述,进而建立微分方程形式的模型.其建模的实质是建立微分方程的系数,将时间序列转化为微分方程,通过灰色微分方程可以建立抽象系统的发展模型.经证明,经一阶线性微分方程的解逼近所揭示的原始时间数列呈指数变化规律时,灰色预测GM(1,1)模型的预测将是非常成功的.1.1GM(1,1)模型的建立灰色理论认为一切随机量都是在一定范围内、一定时间段上变化的灰色量及灰色过程.数据处理不去寻找其统计规律和概率分布,而是对原始数据作一定处理后,使其成为有规律的时间序列数据,在此基础上建立数学模型.GM(1,1)模型是指一阶,一个变量的微分方案预测模型,是一阶单序列的线性动态模型,用于时间序列预测的离散形式的微分方程模型.设时间序列0X有n个观察值,00001,2,,Xxxxn,为了使其成为有规律的时间序列数据,对其作一次累加生成运算,即令101tnxtxn从而得到新的生成数列1X,11111,2,,Xxxxn,新的生成数列1X一般近似地服从指数规律.则生成的离散形式的微分方程具体的形式为dxaxudt即表示变量对于时间的一阶微分方程是连续的.求解上述微分方程,解为(1)()atuxtcea当t=1时,()(1)xtx,即(1)ucxa,则可根据上述公式得到离散形式微分方程的具体形式为11atuuxtxeaa其中,ax项中的x为dxdt的背景值,也称初始值;a,u是待识别的灰色参数,a为发展系数,反映x的发展趋势;u为灰色作用量,反映数据间的变化关系.按白化导数定义有0()()limtdxxttxtdtt显然,当时间密化值定义为1时,当1t时,则上式可记为1lim(()())tdxxttxtdt这表明dxdt是一次累减生成的,因此该式可以改写为(1)(1)(1)()dxxtxtdt当t足够小时,变量x从()xt到()xtt是不会出现突变的,所以取()xt与()xtt的平均值作为当t足够小时的背景值,即(1)(1)(1)1()(1)2xxtxt将其值带入式子,整理得(0)(1)(1)1(1)()(1)2xtaxtxtu由其离散形式可得到如下矩阵:(1)(1)(0)(1)(1)(0)(0)(1)(1)1(1)(2)2(2)1(2)(3)(3)2()1(1)()2xxxxxxauxnxnxn令(0)(0)(0)(2),(3),,()TYxxxn(1)(1)(1)(1)(1)(1)11(1)(2)211(2)(3)21(1)()12xxxxBxnxnTau称Y为数据向量,B为数据矩阵,为参数向量.则上式可简化为线性模型:YB由最小二乘估计方法得1TTaBBBYu上式即为GM(1,1)参数,au的矩阵辨识算式,式中1TTBBBY事实上是数据矩阵B的广义逆矩阵.将求得的a,u值代入微分方程的解式,则1(1)()((1))atuuxtxeaa其中,上式是GM(1,1)模型的时间响应函数形式,将它离散化得(1)(0)(1)ˆ()(1)atuuxtxeaa对序列1ˆxt再作累减生成可进行预测.即(0)(1)(1)(0)(1)ˆˆˆ()()(1)(1)1aatxtxtxtuxeea上式便是GM(1,1)模型的预测的具体计算式.或对()atuxtcea求导还原得(0)(0)(1)ˆ()((1))atuxtaxea1.2GM(1,1)模型的检验GM(1,1)模型的检验包括残差检验、关联度检验、后验差检验三种形式.每种检验对应不同功能:残差检验属于算术检验,对模型值和实际值的误差进行逐点检验;关联度检验属于几何检验范围,通过考察模型曲线与建模序列曲线的几何相似程度进行检验,关联度越大模型越好;后验差检验属于统计检验,对残差分布的统计特性进行检验,衡量灰色模型的精度.残差检验残差大小检验,即对模型值和实际值的残差进行逐点检验.设模拟值的残差序列为(0)()et,则(0)(0)(0)ˆ()()()etxtxt令()t为残差相对值,即残差百分比为(0)(0)(0)ˆ()()()%()xtxttxt令为平均残差,11()nttn.设残差的方差为22S,则22211()ntSeten.故后验差比例C为21/CSS,误差频率P为1()0.6745PPeteS.对于,CP检验指标如下表:检验指标好合格勉强不合格P0.950.800.700.70C0.350.500.650.65表1灰色预测精确度检验等级标准一般要求20%t,最好是10%t,符合要求.关联度检验关联度是用来定量描述各变化过程之间的差别.关联系数越大,说明预测值和实际值越接近.设(0)(0)(0)(0)ˆˆˆˆ()(1),(2),,()Xtxxxn(0)(0)(0)(0)()(1),(2),,()Xtxxxn序列关联系数定义为(0)(0)(0)(0)(0)(0)(0)(0)ˆˆmin()()max()(),0ˆˆ()()max()()1,0xtxtxtxtttxtxtxtxtt式中,(0)(0)ˆ()()xtxt为第t个点(0)x和(0)ˆx的绝对误差,()t为第t个数据的关联系数,称为分辨率,即取定的最大差百分比,0,一般取0.5.(0)()xt和(0)ˆ()xt的关联度为11ntrtn精度等级关联度均方差比值小误差概率好(1级)0.900.350.95合格(2级)0.800.500.80勉强(3级)0.700.650.70不合格(4级)0.700.650.70表2精度检验等级关联度大于60%便满意了,原始数据与预测数据关联度越大,模型越好.后验差检验后验差检验,即对残差分布的统计特性进行检验.检验步骤如下:1、计算原始时间数列0(0)(0)(0)(1),(2),,()Xxxxn的均值和方差2(0)(0)2(0)11111(),()nnttxxtSxtxnn2、计算残差数列(0)(0)(0)(0)(1),(2),,()eeeen的均值e和方差22s2(0)2(0)21111(),()nntteetSetenn其中(0)(0)(0)ˆ()()(),1,2,,etxtxttn为残差数列.3、计算后验差比值21CSS4、计算小误差频率(0)1()0.6745PPeteS令0S=0.67451S,(0)()|()|tete,即0()PPtS.若对给定的00C,当0CC时,称模型为方差比合格模型;若对给定的00P,当0PP时,称模型为小残差概率合格模型.PC模型精度0.950.35优0.800.5合格0.700.65勉强合格0.700.65不合格表3后验差检验判别参照表1.3残差GM(1,1)模型当原始数据序列(0)X建立的GM(1,1)模型检验不合格时,可以用GM(1,1)残差模型来修正.如果原始序列建立的GM(1,1)模型不够精确,也可以用GM(1,1)残差模型来提高精度.若用原始序列(0)X建立的GM(1,1)模型(1)(0)ˆ(1)[(1)]atuuxtxeaa可获得生成序列(1)X的预测值,定义残差序列(0)(1)(1)ˆ()()()ekxkxk.若取k=t,t+1,…,n,则对应的残差序列为(0)(0)(0)(0)()(1),(2),,()ekeeen计算其生成序列(1)()ek,并据此建立相应的GM(1,1)模型(1)(0)ˆ(1)[(1)]eakeeeeuueteeaa得修正模型(1)(0)(0)(1)(1)()()(1)eakakeeeuuuxtxektaeeaaa其中1()0ktktkt为修正参数.应用此模型时要考虑:1、一般不是使用全部残差数据来建立模型,而只是利用了部分残差.2、修正模型所代表的是差分微分方程,其修正作用与()kt中的t的取值有关.1.4GM(1,1)模型的适用范围定理:当GM(1,1)发展系数||2a时,GM(1,1)模型没有意义.我们通过原始序列0iX与模拟序列0ˆiX进行误差分析,随着发展系数的增大,模拟误差迅速增加.当发展系数0.3a时,模拟精度可以达到98%以上;发展系数0.5a时,模拟精度可以达到95%以上;发展系数1a时,模拟精度低于70%;发展系数1.5a时,模拟精度低于50%.进一步对预测误差进行考虑,当发展系数0.3a时,1步预测精度在98%以上,2步和5步预测精度都在90%以上,10步预测精度亦高于80%;当发展系数0.8a时,1步预测精度已低于70%.通过以上分析,可得下述结论:1、当0.3a时,GM(1,1)可用于中长期预测;2、当0.30.5a时,GM(1,1)可用于短期预测,中长期预测慎用;3、当0.50.8a时,GM(1,1)作短期预测应十分谨慎;4、当0.81a时,应采用残差修正GM(1,1)模型;5、当1a时,不宜采用GM(1,1)模型.1.5GM(1,1)模型实例分析例:预测学生后两个学期的成绩.学期1成绩学期2成绩学期3成绩学期4成绩某学生7974.82574.2976.98则该学生成绩时间序列如下:(0)(0)(0)(0)(0)(1),(2),(3),(4)79,74.825,74.29,76.98Xxxxx对(0)X作一次累加后的数列为(1)(1)(1)(1)(1)(1),(2),(3),(4)79,153.825,228.115,305.095Xxxxx对