方法陈团结,钱振东(教育部智能运输工程系统工程中心,江苏南京,210096)Email:demo555@126.com摘要:1-AGO方法是灰色系统理论中常用的方法,常用来处理灰色信息量较大的问题。公路交通量调查采用的是定时、定点方法对过往车辆进行统计,因此这种数据采集方法本身不能真正反映交通量大小的具体情况,只能给出一定的宏观规律。而利用这种采集方法得到的交通量调查数据就是一组灰色的带有噪音扰动的序列。所以要利用这些数据进行交通量预测,首要任务是如何消除噪音并使数据白化。本文通过分析认为1-AGO方法能有效地消除交通量调查数据中的噪音,通过累加可以使数据序列白化。并且与其它建模技术结合得到的预测结果精度优于采用神经网络和直接非线性回归等建模方法的精度。关键词:1-AGO;交通量预测;灰色信息;神经网络;非线性回归TrafficVolumePredictionUsing1-AGOMethodChinTuan-jie,Qianzhen-dong(IntelligentTransportationSystemInstitute,SoutheastUniversity,JiangsuNanjing,210096)Abstract:1-AGOisthebasismethodinGraySystemTheory,whichisalwaysusedtodealwiththeproblemswithtoomuchgrayinformation.Whilethewaynowusedtocollectthetrafficvolumedatacannotresultinthetruefigurebutgeneralnumber.Thatistosay,thedatagainedthiswaycontainmuchuncertaintyanddisturbance.Therefore,beforeusingthesedatatopredictthevolume,somemeasuresmustbetakentoeliminatetheerrorsinthedatacollected.Inthearticle,theauthortriestoprovethat1-AGOcangetridofthenoisesfromthedatathroughanalysisandcalculation.Andbycomparingwithothermethodsofprediction,suchasANNanddirectnonlinearregressionmethod,thearticlereachesaconclusionthat1-AGOmethodcombinedwithsomeregressionmethodsshowsmanybettercharactersintrafficvolumepredictionandnoiseeliminationfromdata.Keywords:1-AGO;trafficvolumeprediction;grayinformation;ANN;directnonlinearregression0前言交通量预测是道路设计和规划等非常重要的参数。对交通量预测的方法很多,其中包括经验回归、神经网络、弹性系数、灰色模型GM(1,1)等方法。国内对于交通量预测最常用的方法当属弹性系数法,此法是根据交通量增长与经济发展之间存在一定的关联性原理,以经济的宏观规划来预测交通量在不同阶段的增长速度,从而可以得到不同时刻路段的交通量。但是,采用弹性系数法进行预测时,首先需要根据往年弹性系数的发展规律对未来弹性系数进行预估(一般认为经济发展初期弹性系数大于1,中期等于1,末期小于1),这使得交通量预测转化为弹性系数预测。由于经济指标及交通量指标在采集过程中总会存在些许人为误差,所以弹性系数值误差会因此有很大的增加。由此导致的交通量预测结果同样会出现更大的误差。为了避免这种缺陷,此处将采用灰色系统理论中的1-AGO方法对交通量1进行预测。11-AGO方法的概念定义:X(0)=(x(0)(1),x(0)(2),…,x(0)(n))为系统真实行为序列,而观测到的系统行为数据序列为X=(x(1),x(2),…,x(n))=(x(0)(1)+ε1,x(0)(2)+ε2,…,x(0)(n)+ε3)=X(0)+ε其中ε=(ε1,ε2,…,εn)为冲击扰动项,则称X为冲击扰动序列。要从冲击扰动序列X出发,实现对真实行为序列X(0)的系统的变化规律正确的把握和认识,必须首先跨越障碍ε。如果不事先排除干扰,而用失真的数据直接建模、预测,则会因模型所描述的并非由X(0)所反映的系统真实变化规律而导致预测失败。累加生成(1-AGO)是使灰色过程由灰变白的一种方法,它在灰色系统理论中占有极其重要的地位。通过累加可以看出灰量积累过程的发展态势,使离乱的原始数据中蕴含的积分特性或规律充分展露出来。比如一个生产重型机械设备的厂家,由于产品周期长、其产量、产值如果按天计算,就没有规律,若按年计算,则规律明显。同样道理,在交通量预测中也可以采用此方法。累加生成算子的数学表达为:∑==kiixdkx1)0()0()()(;k=1,2,…,n其中d称为X(0)的一次累加生成算子。利用一次或者r次累加生成序列进行之后,利用一次或者r次累减算子对系统序列进行还原,就可以得到需要的预测值。21-AGO方法应用实例表1为陕西省某两条高等级公路几年的交通量值。表1A、B两条公路历年交通量V1年路段199019911992199319941995A3651B262833753474.561747282.5110312两条高等级公路历年交通量趋势图可以看出,交通量的原始序列虽然有随时间总体上有上升的趋势,但是并不光滑,且发展过程中存在多次减小的趋势,这使得直接采用回归统计的方法进行预测的精度大打折扣。对A、B两个序列进行1-AGO运算,得到结果见表2及图2。表2A、B两序列1-AGO值年份路段199019911992199319941995A3651B262860039478156522293433965年份路段19961997199819992000A821713459190262560331515B4429655954674597804890542020000400006000080000100000199019921994199619982000Y1-AGOValueAB图2A、B序列1-AGO值的发展趋势通过1-AGO变换之后,不难发现A、B两个变换后的序列随时间的发展趋势很明显而且曲线光滑。不但蕴含在原始序列中的规律被充分的体现出来,而且对于这种光滑曲线很容3易构造预测模型。本例中根据变换后时间序列的特性,构造了多项式模型:A路:32*912.71*51.1862*5.429189.7586YYYVA−+−=12=RB路:2*54.215*61.196515998YYVB++−=9996.02=R其中:VA、VB分别代表变换后的A、B两个序列的计算值,Y代表时间相对于基年步长(此处A路的基年为1990年,B路的基年为1995年)。B对1-AGO序列进行预测后,利用1-IAGO算法对序列进行还原,得到交通量的计算值V2,结果见表3。表3A、B两条公路交通量的计算值V2年份路段199019911992199319941995A-----3651B262832513651608580849652年份路段199619971998199920002003A467251995630606164927185B107881149311766119081220812833比较表1及表3,得出计算相对误差:Delta=abs(V2-V1)/V1*100。计算结果见表4。表4计算相对误差Delta(%)年份路段199019911992199319941995A-----0B03.685.191.4411.0112.49年份路段199619971998199920002003A2.310.821.127.849.814.15B4.431.422.279.6211.811.70可见,利用1-AGO方法计算得出的交通量值中,最大相对误差为12.49%,最小相对误差为0.82%;预测2003年交通量值的相对误差分别为4.15%和1.7%。为了清楚反映V1与V2之间的差异,将表1与表3的数据绘制成图3、图4。4计算值与实测值的比较可以看出,实测值与计算值之间存在较好的相关性。计算值较好的消除了实测数据中存在的由于众多因素造成的干扰或者噪音值,很好地反映系统指标的发展趋势。另外值得一提的是,虽然A序列中2000年的实测数据虽然已经偏离了整体趋势,但是通过1-AGO运算这一偏离被成功修正,并且最后的预测值没有偏离系统数列发展的趋势,相对误差也很小。这一点足以反映1-AGO方法的优越性。3与其它预测模型的比较为了说明1-AGO模型的优越性,分别采用神经网络和直接回归方法对上面的工程实例进行计算。(1)与人工神经网络计算模型的比较采用3层神经网络的计算和预测结果见图5、图6。01000200030004000500060007000800019951997199920012003年TrafficVolumeA-计算A-实测020004000600080001000012000140001991199319951997199920012003年TrafficVolumeB-计算B-实测图5A的交通量神经网络计算值图6B的神经网络交通量计算值该神经网络的训练样本采用1990~2000年对应的数据,2003年的数据作为预测结果的检验值。从图5及图6中可以看出,在训练样本的值域范围内,神经网络可以给出很好的计算结果,而对训练样本值域范围以外的预测值却不能给出很好的结果,误差通常会很大(与神经网络隐含层的层数以及结点数目有关)。此处预测值的相对误差最大值达到43%,而且路A与B的预测值都偏离了系统时间序列的发展趋势。5(2)与直接非线性预测模型的比较采用直接非线性回归方法分析该问题时,可以建立很多种模型,但是多项式模型的相关性是最好的。得出的多项式模型如下:A路:2*458.93*7.217818.542YYVA−+−=924.02=RB路:2*21.117*1.13252.2392YYVB−+=933.02=R计算和预测结果见图7、图8。3000400050006000700019951997199920012003年TrafficVolumeA实测A计算1000300050007000900011000130001500019891991199319951997199920012003年TrafficVolumeB实测B计算图7A的直接回归模