灰色预测法王玉雷河南工业大学理学院在预测分析中,最基本的预测模型为线性回归方程,针对一些规律性较强的数据,该模型能作出精确的预测,但在实际中,我们得到的常是一些离散的,规律性不强的数据,为解决此类问题,线性的方法就不适用了,此时,就需要采用灰色预测的方法。1灰色预测理论2GM(1,1)模型3GM(1,1)残差模型及GM(n,h)模型灰色预测法回总目录1.灰色预测理论一、灰色预测的概念(1)灰色系统、白色系统和黑色系统•白色系统是指一个系统的内部特征是完全已知的,即系统的信息是完全明确的。回总目录回本章目录•黑色系统是指一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。•灰色系统内的一部分信息是已知的,另一部分信息是未知的,系统内各因素间有不确定的关系。回总目录回本章目录灰色预测是对既含有已知信息又含有不确定信息的系统进行预则,就是对在一定范围内变化的、与时间有关的灰色过程进行预测。(2)灰色预测法回总目录回本章目录灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。(3)灰色系统的应用范畴•灰色系统的应用范畴大致分为以下几方面:•(1)灰色关联分析。•(2)灰色预测:人口预测;初霜预测;灾变预测….等等。•(3)灰色决策。•(4)灰色预测控制。(4)灰色预测的四种常见类型•灰色时间序列预测即用观察到的反映预测对象特征的时间序列来构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。•畸变预测即通过灰色模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。回总目录回本章目录•系统预测通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化。•拓扑预测将原始数据做曲线,在曲线上按定值寻找该定值发生的所有时点,并以该定值为框架构成时点数列,然后建立模型预测该定值所发生的时点。回总目录回本章目录二、生成列设已知数据变量组成序列X(0),则我们可得到数据序列为了弱化原始时间序列的随机性,在建立灰色预测模型之前,需先对原始时间序列进行数据处理,经过数据处理后的时间序列即称为生成列。回总目录回本章目录nXXXXX00000,...3,2,1累加累加是将原始序列通过累加得到生成列。灰色系统常用的数据处理方式有累加和累减两种。(1)数据处理方式回总目录回本章目录累加的规则:将原始序列的第一个数据作为生成列的第一个数据,将原始序列的第二个数据加到原始序列的第一个数据上,其和作为生成列的第二个数据,将原始序列的第三个数据加到生成列的第二个数据上,其和作为生成列的第三个数据,按此规则进行下去,便可得到生成列。回总目录回本章目录记原始时间序列为:nXXXXX00000,...3,2,1生成列为:nXXXXX11111,...3,2,1上标1表示一次累加,同理,可作m次累加:kimmiXkX11回总目录回本章目录•对非负数据,累加次数越多则随机性弱化越多,累加次数足够大后,可认为时间序列已由随机序列变为非随机序列。•一般随机序列的多次累加序列,大多可用指数曲线逼近。回总目录回本章目录累减将原始序列前后两个数据相减得到累减生成列•累减是累加的逆运算,累减可将累加生成列还原为非生成列,在建模中获得增量信息。一次累减的公式为:1001kXkXkX回总目录回本章目录三、关联度关联度分析是分析系统中各因素关联程度的方法,在计算关联度之前需先计算关联系数。(1)关联系数设nXXXkX0000ˆ,...,2ˆ,1ˆˆnXXXkX0000,...,2,1则关联系数定义为:00000000ˆˆminminmaxmax()ˆˆmaxmaxXkXkXkXkkXkXkXkXk回总目录回本章目录式中:kXkX00ˆkXkX00ˆminminkXkX00ˆmaxmax为第k个点ρ称为分辨率,0ρ1,对单位不一,初值不同的序列,在计算相关系数前应首先进行初始化,即将该序列所有数据分别除以第一个数据。0X0ˆX的绝对误差;和为两级最小差;为两级最大差;回总目录回本章目录若越小,关联系数间差异越大,区分能力越强。一般取ρ=0.5;(2)关联度kX0kX0ˆ11nkrkn和的关联度为:回总目录回本章目录一个计算关联度的例子工业、农业、运输业、商业各部门的行为数据如下:9.41,3.42,4.43,8.451X)9.44,9.43,6.41,1.39(2X5.3,5.3,3.3,4.33X7.4,4.5,8.6,7.64X工业农业运输业商业参考序列分别为21,XX,被比较序列为43,XX试求关联度。回总目录回本章目录解答:以1X为参考序列求关联度。第一步:初始化,即将该序列所有数据分别除以第一个数据。得到:9138.0,9235.0,9475.0,11X1483.1,1227.1,063.1,12X31,0.97,1.0294,1.0294X7.0,805.0,0149.1,14X回总目录回本章目录第二步:求序列差2335.0,1992.0,1155.0,021146.0,1059.0,0225.0,032148.0,1185.0,0674.0,04第三步:求两极差2335.0maxmaxkMi0minminkmi回总目录回本章目录X’2-X’1X’3-X’1X’4-X’1第四步:计算关联系数取ρ=0.5,有:4,3,2,11675.011675.01ikkii从而:1112503.02123695.03123333.041211138384.02135244.0313504.04131114634.02144963.0314352.0414回总目录回本章目录第五步:求关联度551.041411212kk717.041411313kk621.041411414kk计算结果表明,运输业和工业的关联程度大于农业、商业和工业的关联程度。为参考序列时,计算类似,这里略去。2X回总目录回本章目录2GM(1,1)模型一、GM(1,1)模型的建立nXXXX0000,...,2,1nXXXX1111,...,2,111ddaXtX设时间序列有n个观察值,通过累加生成新序列则GM(1,1)模型相应的微分方程(白化方程)为:其中:α称为发展灰数;μ称为内生控制灰数。回总目录回本章目录构造矩阵B与向量Y1)),1()((21......1)),2()3((211)),1()2((21)1()1()1()1()1()1(nXnXXXXXBY=(X(0)(2),X(0)(3),……,X(0)(n))’ˆˆaYBBBTT1ˆaeaXkXak11ˆ01nk...,2,1,0设为待估参数向量,利用最小二乘法可得:求解微分方程,即可得预测模型(时间相应式):,则微分方程回总目录回本章目录可表示为ˆBY对其做累减还原,即可得到原始数列的灰色预测模型为:(0)(1)(1)ˆˆˆ()()(1)XkXkXk由灰色预测方法原理,-a主要控制系统发展态势的大小,即反映预测的发展态势,被称为发展系数;μ的大小反映了数据变化的关系,被称为灰色作用量,其中:①当-a0.3时,GM(1,1)模型可用于中长期预测;②当0.3-a0.5时,GM(1,1)模型可用于短期预测,中长期预测慎用;③当0.5-a1时,应采用GM(1,1)改进模型,包括GM(1,1)残差修正模型;④当-a1时,不宜采用GM(1,1)模型,可考虑其他预测方法。灰色预测检验一般有残差检验、关联度检二、模型检验(1)残差检验按预测模型计算,ˆ1iX并将iX1ˆ累减生成,ˆ0iX然后计算原始序列iX0与iX0ˆ的绝对误差序列及相对误差序列。iXiXi000ˆ%10000iXiini,...,2,1ni,...,2,1验和后验差检验。回总目录回本章目录在建立模型后,还必须对模型进行精度检验,其检验标准见表1。表1精度检验等级参照表精度等级相对误差Δ一级(优)0.01二级(良)0.05三级(合格)0.1四级(不适用)0.2iX0ˆiX0(2)关联度检验根据前面所述关联度的计算方法算出与原始序列的关联系数,然后计算出关联度,根据经验,当ρ=0.5时,关联度大于0.6便满意了。回总目录回本章目录(3)后验差检验a.计算原始序列标准差:2001XiXSn回总目录回本章目录b.计算绝对误差序列的标准差:12002niSc.计算后验差比值:12SSCd.计算小误差概率:0010.6745PPiS00iei令:106745.0SS,则:0SePPiP0.950.800.70≤0.70C0.350.500.65≥0.65好合格勉强合格不合格回总目录回本章目录例某矿某年3-7月份的轻伤事故情况如表所示月份34567轻伤人次2629313334试建立GM(1,1)模型的白化方程及时间响应式,并对M(1,1)模型进行检验,预测该矿8月份轻伤人数.1)153119(211)11986(211)8655(211)5526(21B1038.270532.0)(ˆ1YBBBaTT所以705.509,1038.27,0532.0aa原始数据列:}34,33,31,29,26{)(0iX累加生成数列:}153,119,86,55,26{)(1iX}34,33,31,29{)}5(),4(),3(),2({0000xxxxY求解过程从而得到预测公式(时间响应式)为:aeaXkXak)1()1(ˆ)1()1(75.509705.5350532.0ke为了得到原始数列的预测值,需要将生成数列的预测值作累减还原为原始值,(0)(1)(1)ˆˆˆ()()(1)XkXkXk从而得到白化方程:(1)(1)0.053227.1038dXXdt生成数列的预测值,原始数列的还原值分别如下表所示k0262615555.2728686.143119118.704153153.03(1)ˆ()Xk(1)()Xk带入预测公式算(0)()Xk生成数列的预测值,原始数列的还原值分别如下表所示k026262615555.2729.2728686.143119118.704153153.03(1)ˆ()Xk(1)()Xk55.27-26(0)()Xk生成数列的预测值,原始数列的还原值分别如下表所示k026262615555.2729.2728686.1430.873119118.7032.564153153.0334