灰色系统理论一、灰色预测法数据要求:等时距观测到的反映预测对象特征的一系列数量模型预测:未来某一时刻的特征量,或达到某一特征量的时间。构造模型:1)通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析;2)对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列;3)然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。灰色预测法是一种对含有不确定因素的系统进行预测的方法。三、关联度关联度分析是分析系统中各因素关联程度的方法,在计算关联度之前需先计算关联系数。(1)关联系数设minXXXkXiiii,......,1,,...,2,10000nXXXkX0000,...,2,1则关联系数定义为:kXkXkXkXkXkXkXkXkiiiii00000000maxmaxmaxmaxminmin)(回总目录回本章目录式中:kXkX00ˆkXkX00ˆminminkXkX00ˆmaxmax为第k个点ρ称为分辨率,0ρ1,一般取ρ=0.5;对单位不一,初值不同的序列,在计算相关系数前应首先进行初始化,即将该序列所有数据分别除以第一个数据。0X0ˆX的绝对误差;和为两级最小差;为两级最大差;回总目录回本章目录(2)关联度kX0kXi0miknXXrrnkiii,......,11),(10和的关联度为:回总目录回本章目录例子工业、农业、运输业、商业各部门的行为数据如下:9.41,3.42,4.43,8.451X)9.44,9.43,6.41,1.39(2X5.3,5.3,3.3,4.33X7.4,4.5,8.6,7.64X工业农业运输业商业参考序列分别为21,XX,被比较序列为,43,XX试求关联度。回总目录回本章目录解答:以1X为参考序列求关联度。第一步:初始化,即将该序列所有数据分别除以第一个数据。得到:9138.0,9235.0,9475.0,11X1483.1,1227.1,063.1,12X0294.1,0294.1,097,.13X7.0,805.0,0149.1,14X回总目录回本章目录第二步:求序列差2335.0,1992.0,1155.0,021146.0,1059.0,0225.0,032148.0,1185.0,0674.0,04第三步:求两极差2335.0maxmaxkMi0minminkmi回总目录回本章目录第四步:计算关联系数取ρ=0.5,有:4,3,2,11675.011675.01ikkii从而:1112503.02123695.03123333.041211138384.02135244.0313504.04131114634.02144963.0314352.0414回总目录回本章目录第五步:求关联度551.041411212kk717.041411313kk621.041411414kk计算结果表明,运输业和工业的关联程度大于农业、商业和工业的关联程度。为参考序列时,计算类似,这里略去。2X回总目录回本章目录因素间相互关系的评价iX数据预处理灰色系统常用的数据处理方式有累加和累减两种。记原始时间序列为:nXXXXX00000,...3,2,1生成列为:nXXXXX11111,...3,2,1上标1表示一次累加,同理,可作m次累加:,......,1,11miXkXkimm数据预处理对非负数据,累加次数越多则随机性弱化越多,累加次数足够大后,可认为时间序列已由随机序列变为非随机序列。一般随机序列的多次累加序列,大多可用指数曲线逼近。将原始序列前后两个数据相减得到累减生成列累减是累加的逆运算,累减可将累加生成列还原为非生成列,在建模中获得增量信息。一次累减的公式为:1001kXkXkXGM(1,1)模型的建立nXXXX0000,...,2,1nXXXX1111,...,2,1uaXtX11dd设非负时间序列有n个观察值,通过一次累加(1-AGO)生成新序列即为GM(1,1)模型。对可建立下述形式的白化方程1X其中a称为发展灰数;u称为内生控制灰数(未知参数)。kiiXkX101这里其相应的微分方程为参数估计则nkukXkXakX,.....,2,1(2110参数的确定该式称为时间响应函数,其中a,u可根据最小二乘法得出NTTTYBBBua1)(),(ˆ其中1)()1(211)3()2(211)2()1(21)1()1()1()1()1()1(nXnXXXXXBTNnXXXY)(,),3(),2()0()0()0(^110,.....,2,1(2aBYnkukXkXakXN•由微分方程求得:aeaXkXak11ˆ01nk...,2,1,0预测值的还原由于GM模型得到的是一次累加量,必须将GM模型所得数据经过逆生成,即累减还原为才能使用。)(ˆ)1(kX)(ˆ)0(kX有公式nkkXkXkX,......,2),1(ˆ)(ˆ)(ˆ)1()1()0(得到估计值检验一:后验差检验为检验按灰色模型预测的可信性,需要进行后验差检验。原始数据列的实际数据的平均值与方差分别为:X21SnknkXkXnSkXnX12)0(211)0()(1)(1把第k项数据的原始数据值与计算的估计值之差称作第k项残差:)()0(kX)(ˆ)0(kX)(ˆ)()()0()0(kXkXkq则整个数据列所有数据项的残差的平均值和方差分别为:q22SnknkqkqnSkqnq12221)(1)(1后验差检验通过计算后验差比值C和小误差频率P来进行后验差检验定义:后验差比值为12SSC后验差比值C越小越好,C越小按灰色模型计算的估计值与实际值越接近定义:小误差频率为残差与残差平均值之差小于给定值0.6745S1的频率。检验二:小误差频率16745.0)(SqkqPP小误差频率越大越好。根据后验差比值和小误差频率可以综合评价模型的精度,见下表后验差及小误差频率精度等级表精度等级小误差频率后验差比值好合格勉强不合格95.035.08.05.07.065.07.065.0检验三:关联度检验iX0ˆiX0关联度检验根据后面所述关联度的计算方法算出与原始序列的关联系数,然后计算出关联度,根据经验,当ρ=0.5时,关联度大于0.6便满意了。残差模型如果经过后验差检验根据原始数据列建立的灰色模型不合格,可以建立残差模型对原模型修正。对累加生成的数据列的数据项计算残差:)(ˆ)()()1()1()1(kXkXkq组成残差数据列)1(q111111,...,3,2,1nqqqqq一般只用部分残差而不是全部残差建立残差模型,即nn1残差模型将残差数据列进行累加生成得到残差累加生成数据列,建立一阶微分方程:1111uqadtdq该方程的解为:kakaeeauqkq111111111ˆ11ˆ11qq残差模型把残差估计值加到生成数据列的对应项上,得到修正后的模型。一般地,从保证预测精度考虑,只对生成数据列的最后几个数据项进行修正。设对生成数据列的第项以后的数据项修正,则修正后的第K+1项的估计值为:1ˆkXkamkaeeaumqauauXkX111111011ˆ)(mkmqauauXkX1011ˆ灰色预测理论应用实例例1:某矿某年3-7月份的轻伤事故情况如下表所示月份34567轻伤人次2629313334试建立Gm(1,1)模型的白化方程及时间响应式,并对Gm(1,1)模型进行检验,预测该矿8月份轻伤人数。灰色预测理论应用实例该例中,原始数据列为:34,33,31,29,26)()0(iX累加生成数列为:153,119,86,55,26)()1(iXTnXXX34,33,31,29,...,3,2YT000N113615.10215.7015.401153119211119862118655211552621B灰色预测理论应用实例34333129113615.10215.7015.4011111365.1025.705.40113615.10215.7015.40YBBBˆ1NT1T51038016914.2790531754295.0灰色预测理论应用实例所以0532.090531754295.0a1038.2751038016914.27u705.509auuaXtX11dd所以白化方程1038.270532.0dd11XtX具体形式为灰色预测理论应用实例本例的事故预测公式(时间响应式)为:75.509705.5351ˆ0532.01kekX为了得到原始数列的预测值,需要将生成数列的预测值作累减还原为原始值,即根据下式求得:)1(ˆ)(ˆ)(ˆ)1()1()0(kXkXkX生成数列的预测值、原始数列的还原值分别如下表所示灰色预测理论应用实例k02626015555.27-0.2728686.14-0.143119118.700.304153153.03-0.03生成数列的预测值与误差检验1)1(kX1ˆ)1(kX1kq灰色预测理论应用实例原始数列的还原值与误差检验kX0kX0ˆkqK12626022929.27-0.2733130.870.1343332.560.4453434.33-0.33平均值30.630.606-0.006灰色预测理论应用实例数据方差和残差方差分别为:24.8]6.30346.30336.30316.30296.3026[512222221S078424.0]006.033.0006.044.0006.013.0006.027.0006.00[512222222S后验差比值为:0976.024.8078424.012SSC灰色预测理论应用实例小误差频率9362.1006.06745.01kqPSqkqPP9362.1006.0006.00006.01q9362.1264.0006.027.0006.02q9362.1136.0006.013.0