§12.5灰色预测我们通常所说的系统是指:由客观世界中相同或相似的事物和因素按一定的秩序相互关联、相互制约而构成的一个整体.例如:工程技术系统、社会系统、经济系统等.如果一个系统中具有充足的信息量,其发展变化的规律明显、定量描述方便、结构与参数具体,则这种系统通常称为白色系统.如果一个系统的内部特征全部是未知的,则称此系统为黑色系统.如果系统内部信息和特征是部分已知的,另一部分是未知的,这种系统称为灰色系统.例如:社会系统、农业系统、经济系统、气象系统、生物系统等.对于这类系统,内部因素难以辨识,相互之间的关系较为隐蔽,人们难以准确了解这类系统的行为特征.因此,对于这类问题进行定量描述,即建立模型难度较大.区别白色系统与灰色系统的重要标志是系统内各因素之间是否具有确定的关系.灰色系统分析方法主要是根据具体灰色系统的行为特征数据,充分利用数量不多的数据和信息寻求相关因素自身与各因素之间的数学关系,建立相应的数学模型.目前,灰色系统理论在实际中已得到了广泛的应用,例如:在工程技术、经济管理、气象预报以及政治、社会、工业、农业等领域都取得了一定的应用成果.我们往往要对农业问题、商业问题等做未来的预测工作,另外,进行军事战争以及治理生态环境也需对未来的发展情形做一可靠的分析,这就产生了灰色预测.灰色预测是对灰色系统问题进行未来的预测,实际问题中,应用最多的灰色预测模型是以GM(1,1)(即GM(1,N)当N=1时的特例)模型为基础的.12.5.1GM(1,1)模型的建立设X(0)=(X(0)(1),X(0)(2),…,X(0)(n)),做1-AGO,得(1)(1)(1)(1)((1),(2),,())XXXXn(1)(1)(0)(1)(0)((1),(1)(2),,(1)())XXXXnXn则GM(1,1)模型相应的微分方程为:(1)(1)dXaXudt(1)式中:a称为发展灰数;μ称为内生控制灰数.设ˆ=(a,μ)T,按最小二乘法得到11ˆ()TTBBBY(2)其中(1)(1)(1)(1)(1)(1)1((1)(2))121((2)(3))121((1)())12XXXXBXnXn(0)(0)1(0)(2)(3)()XXYXn易求得,方程(1)的解为(1)(0)ˆ(1)((1))akuuXkXeaa(3)例4100m成绩预测1983~1990年世界男子和中国女子100m最好成绩如表6.表6各年度最好成绩年份19831984198519861987198819891990男子9.939.969.989.959.939.929.949.93女子11.9511.6611.6311.6511.3511.3211.5811.32记世界男子100m成绩的原始数列为(0)(9.93,9.96,9.98,9.95,9.93,9.92,9.94,9.93)X建立GM(1,1)模型,即按式(1)、(2)、(3)得到预测模型为(1)0.0007185266ˆ(1)(9.9313884.61)13884.61kXke由预测模型得预测值为年份模型预测值/s19919.9219929.9120009.85记中国女子的原始数列为(0)(11.95,11.66,11.63,11.65,11.35,11.32,11.58,11.32)X同样建立GM(1,1)模型,得到预测模型为(1)0.00451067ˆ(1)(11.952602.187)2602.187kXke从而得到中国女子100m成绩的预测值年份模型预测值/s199111.30199211.24200010.8512.5.2模型检验灰色预测检验一般有残差检验、关联度检验和后验差检验.(1)残差检验按预测模型计算(1)ˆ()Xi,并将(1)ˆ()Xi累减生成(0)ˆ()Xi,然后计算原始序列X(0)(i)与(0)ˆ()Xi的绝对误差序列及相对误差序列.(0)(0)(0)ˆ()|()()|1,2,,iXiXiin(0)(0)()()100%1,2,,()iiinXi(2)关联度检验定义1选取参考数列00000{()|1,2,,}((1),(2),,())XXkknXXXn其中k表示时刻.假设有m个比较数列{()|1,2,,}((1),(2),,())1,2,,iiiiiXXkknXXXnim则称0000minmin|()()|maxmax|()()|()|()()|maxmax|()()|iiikikiiiikXkXkXkXkkXkXkXkXk(1)为比较数列Xi对参考数列X0在k时刻的关联系数,其中ρ∈[0,1]为分辨系数,一般取ρ=0.5.称式(1)中minminik|X0(k)-Xi(k)|、maxmaxik|X0(k)-Xi(k)|分别为两级最小差和两级最大差.由(1)式易看出,ρ越大,分辨率越大;ρ越小,分辨率越小.式(1)定义的关联系数是描述比较数列与参考数列在某时刻关联程度的一种指标,由于各个时刻都有一个关联数,因此信息显得过于分散,不便于比较,为此我们给出以下定义定义2称11()niikrkn(2)为数列Xi对参考数列X0的关联度.由式(2)易看出,关联度是把各个时刻的关联系数集中为一个平均值,也就是把过于分散的信息集中处理.根据前面所述关联度计算方法计算出(0)ˆ()Xi与原始序列X(0)(i)的关联系数,然后计算出关联度,根据经验,当ρ=0.5时,关联度大于0.6便满意了.(3)后验差检验1.计算原始序列标准差:(0)(0)21[()]1XiXSn2.计算绝对误差序列的标准差:(0)(0)22[()]1iSn3.计算方差比:21SCS4.计算小误差概率:(0)(0)1{|()|0.6745}PpiS令(0)(0)01|()|,0.6745,ieiSS则0{}iPpeS.表7检验标准PC0.950.35好0.800.50合格0.700.65勉强合格0.700.65不合格若残差检验、关联度检验和后验差检验都能通过,则可以用所建模型进行预测;若用原始时间序列X(0)建立的GM(1,1)模型检验不合格或精度不理想时,这时要对建立的GM(1,1)模型进行修正或提高模型的预测精度.其修正方法如下:设原始时间序列X(0)建立的GM(1,1)模型为(1)(0)ˆ(1)((1))aiuuXiXeaa可获得生成序列X(1)的预测值(1)ˆX,即对于(1)(1)(1)(1){(1),(2),,()}XXXXn,有预测序列(1)(1)(1)(1)ˆˆˆˆ{(1),(2),,()}XXXXn,定义残差为(0)(1)(1)ˆ()()()ejXjXj若取j=i,i+1,…,n,则与X(1)及(1)ˆX对应的残差序列为(0)(0)(0)(0){(),(1),,()}eeieien为便于计算上式改写为(0)(0)(0)(0){(1),(2),,()}eeeene(0)的累加生成序列为(1)(1)(1)(1){(1),(2),,()}eeeennnie(1)可建立相应的GM(1,1)模型:(1)(0)ˆ(1)((1))eakeeeeuuekeeaa(1)ˆ(1)ek的导数(1)(0)ˆ(1)()((1))eakeeeuekaeea加上(1)ˆ(1)ek修正(1)ˆ(1)Xk,得修正模型:(1)(1)(0)(0)ˆ(1)((1))(1)()((1))eakakeeeuuuXkXekaeeaaa其中1,2(1)0,2kkk为修正系数.最后给出经过残差修正的原始序列预测模型:(0)(1)(1)ˆˆˆ(1)(1)()(1,2,)XkXkXkk§12.6灰色预测模型案例一、问题描述表8给出了上海市1991年-1996年国内生产总值总消费资料.生产决定消费,国内生产总值总消费决定了居民的消费水平,为此很有必要对国内生产总值总消费进行科学预测,分析国内生产总值总消费发展趋势,为宏观经济政策的制定提供重要的参考.表8国内生产总值总消费单位:亿元年份199119921993199419951996国内生产总值总消费386.06476.57679.35873.891085.331252.33试根据表8的资料,建立上海市国内生产总值总消费的灰色预测模型GM(1,1),并预测上海市1998年国内生产总值总消费.二、模型的建立及求解1.令X(0)(1),X(0)(2),…,X(0)(6)对应于原始序列数据.第一步,构造累加生成序列:(1)(0)(1)(1)(0)(1)(1)(0)(1)(1)(0)(1)(1)(0)(1)(1)(0)(1)(1)386.06(2)(1)(2)862.63(3)(2)(3)1541.98(4)(3)(4)2415.87(5)(4)(5)3501.2(6)(5)(6)4753.53XXXXXXXXXXXXXXXXX第二步,构造数据矩阵B和数据向量Y1:(1)(1)(1)(1)(1)(1)(1)(1)(1)(1)1[(1)(2)]121624.3451[(2)(3)]121202.305111978.9251[(3)(4)]122958.53511[(4)(5)]14127.365121[(5)(6)]12XXXXBXXXXXX1476.57679.35873.891085.331252.33Y第三步,计算BTB,(BTB)-1,BTY1:31539559.341081.4751081.4755TBB,10.000000120.000278742()0.0002787420.808183989TBB111223502.574367.47TBY,110.207987503ˆ()396.8903031TTBBBY即0.207987503396.8903031a第四步,得出预测模型:(1)(1)0.207987503396.8903031dXXdt(0)(1)386.061908.241108Xa(0)(1)2294.301108Xa(1)0.207988(1)2294.3011081908.241108kXke三、模型检验第五步,进行关联度检验:(1)计算:(1)0,(2)53.87,(3)26.28,(4)69.82,(5)95.37,(6)33.48,min{()}0,max{()}95.37kk(2)计算关联系数:(1)1,(2)0.47,(3)0.64,(4)0.41,(5)0.33,(6)0.590000minmin|()()|maxmax|()()|()|()()|maxmax|()()|iiikikiiiikXkXkXkXkkXkXkXkXk1(10.470.640.410.330.59)0.5736r,0.573r是基本满足0.5时,r0.57的.所以关联度检验通过.第六步,后验差检验:(1)计算:(0)1(386.06476.57679.35873.891085.331252.33)792.2556X(0)(0)21[()]341.0651XkXSn(2)计算残差的均值:1(053.8726.2869.8295.3733.48)46.476残差的标准差:22[()]33.84381kSn