1引入支路流量的非参数回归交通流短时预测杨珍,王慧(浙江大学系统工程研究所智能交通研究中心杭州310027)摘要:先进的交通信息系统和先进交通管理系统对交通流短时预测提出了越来越高的要求,针对目前交通流短时预测存在的问题,提出了一种引入支路流量的非参数回归城市交通流短时预测方法。在传统非参数回归方法中构建一个支路流量突变因子,在发生由支路流量引起并且历史样本库中不存在的突发事件时,结合非参数回归预测和支路流量突变因子准确预测干路的未来交通流量,并利用最小二乘法确定历史数据和当前支路流量数据的权值。经仿真验证,该方法在历史样本库不足的情况下有很好的预测效果。关键字:交通流短时预测;非参数回归;支路流量Short-termTrafficFlowForecastingBasedonNon-ParametricRegressionwithBranchFlowYangZhen,WangHui(ResearchCenterofIntelligentTransportationSystem,InstituteofSystemEngineering,ZhejiangUniversity,Hangzhou310027,China)Abstract:AdvancedTrafficInformationSystemandAdvancedTrafficManagementSystemrequirepreciseshort-termtrafficflowforecastingmethods.Thisarticleconcludedtheproblemsthatexistedinthefieldofshort-termtrafficflowforecastingandproposedanewmethodbasedonnon-parametricregressionwithbranchflow.Ajumpingfactorwasintroducedtotheconventionalnon-parametricmethodsothatwhensuddeneventcausedbybranchflowhappened,whoseneighborhoodscannotbefoundinthehistoricaldatabase,preciseforecastingcanstillbereached.LeastSquaremethodwasusedtoestimatetheweightvaluesforhistoricaldataandthejumpingfactor.Itwasvalidatedthatthemethodbasedonnon-parametricregressionwithbranchflowhadmorepreciseforecastingabilitythentheconventionalnon-parametricmethodwhenthehistoricaldatabasewasdeficient.Keywords:Short-termTrafficFlowForecasting;Non-ParametricRegression;BranchFlow1概述交通诱导是智能交通系统(IntelligentTransportationSystem,ITS)中一个非常重要的环节,其核心工作是通过实时检测的交通信息数据传送到先进的交通信息系统和先进交通管理系统提供出行者合理的路线指导,实现诱导以缩短行驶时间和减少拥挤。这对城市交通流量短时预测提出了越来越高的要求,而全球和个人通讯技术的发展为实现交通短时预测提供了技术基础。短时交通预测就是指预测某一道路或路段在未来短时间(通常在5~15min)内交通流状态的变化情况。从20世纪60年代以来,人们就开始把各种其它领域的预测模型用于短时交通流预测,经过不断的发展,形成了一系列成熟的预测算法。大致分成两类:一类是以经典数理统计传统理论为基础的预测模型,包括时间序列模型[1]、卡尔曼滤波法[2]、指数平滑模型[3]等,这些方法是用数学建模求解,存在着精确建模和求解两方面的困难,已经越来越不能满足实际应用的需要;另一类是基于交通流演变特性的方法,包括非参数回归模型[4]、支持向量机方法[5]以及神经网络预测方法[6]等,其特点是所采用的模型和方法不追求严格意义的数学推导和明确的物理意义,而重视对真实交通流现象的拟合效果。其中非参数回归方法不需要建立模型,不需要先验知识,直接从历史数据中挖掘信息,具有良好的可移植性,在参数估计、算法效率等方面都有较好的性能,体现了该算法的潜力。非参数回归方法不同于传统的回归模型通过确定模型的参数拟合系统输入输出的唯一函数关系,而是把系统的输入状态定位在历史状态的特定的区域内。非参数回归的方法源自“模式识别”的思想(KarlssonandYakowitz,1987):将待识别的向量与n维欧式空间的向量集进行比对,根据与之距离接近的向量群体确定它的所属类型模式。非参数回归模型的本质是从历史数据中寻找当前的系统状态的“近邻”(neighborhood),然后结合所有近邻的系统输出确定预测的流量值。历史数据库的数量和质量对模型的效果有非常大的影响,它必须能够反应未来所有可能发生的情形[7]。随着交基金项目:国家高技术研究发展计划(863)计划专题(2006AA11Z204)作者简介:杨珍(1985-),女,浙江丽水人,硕士研究生,研究方向:智能交通系统浙江大学玉泉校区工控新楼109,310027,0571-87952519,zyang@iipc.zju.edu.cn2通系统复杂性的不断上升,用仅基于历史数据的预测方法在突发事件发生时预测精度会严重降低,引起突发事件的因素有吸纳点、交通事故和支路流量的变化等。本文主要考虑支路流量变化这一影响因素,提出了引入支路流量的基于非参数回归交通流预测方法,在利用历史数据进行预测的同时,考虑当前支路流量的影响,并通过最小二乘法确定历史数据和支路流量所占的权值。2引入支路流量的非参数回归预测方法:非参数回归问题具有四大要素:历史数据的准备、状态向量的选取、相似机制及预测方式的选取[8]。引入支路流量的非参数回归预测方法与传统非参数回归方法的区别主要在预测方式上做了一定改进。传统非参数回归方法根据当前状态向量在历史样本库中选择与之匹配的邻近向量,通过邻近向量中后一时刻的流量来预测未来时刻的流量。非参数回归的本质是从历史向量集中搜索邻近点,该方法对历史数据具有绝对的依赖性,历史数据集必须充分大以覆盖所有突发事件,非参数回归才能准确预测出未来的趋势,而充分大的历史数据集往往是难以实现的。影响预测精度的主要因素有吸纳点、交通事故和支路流量的变化,在这些干扰下,无法在历史数据中找到与当前状态邻近的向量,非参数回归有较大的局限性。本文考虑支路流量变化这一影响因素,下面将从四大要素分别对引入支路流量的非参数回归交通流短时预测方法进行介绍。2.1预测方式:非参数回归采用K邻近法,即用搜索的算法寻找K个与当前所需预测的状态向量xc(t)最近的向量xhist,i(t),i=1,2,3……k,这K个邻近向量分别对应K个下一时刻的流量值Vhist,i(t+1),根据(1)式计算得到当前向量下一时刻的流量值,,11(1)(1)1khistiiifkiiVtDistVtDist==++=∑∑(1)其中Disti是邻近向量与当前向量之间的欧式距离。需要说明的是,流量值的预测方法并不只有(1)式一种,如在计算量非常大的时候,可以考虑直接平均法,以简化计算和节省存储Disti所占用的空间,在这里考虑使用(1)式距离倒数加权平均法这种最常用的方法。Vf(t+1)是在仅考虑了历史数据时所得到的预测流量,上文已经提到,在历史样本数据不足的情况下,Vf(t+1)可能与实际未来流量偏差较大。考虑支路流量变化引起突发事件的情况,引入支路流量突变因子,即当前支路流量与历史支路流量的差值,如(2)式,11()()()1histibbkibikiiVtVtDistVtDist==−=∑∑+(2)其中,Vb(t)为当前状态支路流量,Vbhist,i(t)为邻近向量中的支路流量,同样采用距离倒数加权平均的方法计算流量突变因子。这个因子直接反应了当前支路流量与邻近向量支路流量的差值,这个差值越大,代表Vf(t+1)与实际未来数据的差距越大,传统非参数回归方法预测效果越差。支路流量将在未来时刻汇入干路,因此在由支路引起的突发事件中,支路当前流量的突变将影响未来干路流量的变化,把Vb△(t)作为一个影响因子,与(1)式结合,得到引入支路流量的非参数回归预测方法,如式(3)所示*(1)(1)()bfVtVtVtαβ+=×++×+(3)其中,α、β分别是传统非参数预测和支路流量的权值。α、β作为预测模型中的两个参数,分别代表了历史数据和支路流量突变因子对于预测流量的影响系数。显然,影响α、β的因素有很多,不同的交通状态下α、β的取值会不同,检测器埋设的位置、数据传输速度等外界因素也会影响α、β的取值,因此需要用参数估计方法利用实时数据对α、β进行在线估计。成熟的参数估计算法已经较多,比如最小二乘法、Kalman滤波方法、最大似然法以及遗传算法等,本文采用最小二乘法对α、β进行估计。3图1、图2分别为传统非参数回归算法流程图和引入支路流量的非参数回归算法流程图,传统的非参数回归算法(见图1)在历史样本数据不足的情况下,无法进行未来流量的预测,因为该算法本质上对历史样本数据存在着根本的依赖,如果当前交通状态超出了历史数据样本所涵盖的范围,所得的预测数值存在着较大的误差,无法用于交通诱导。而引入支路流量突变因子进行改进后(见图2),综合考虑了历史样本数据和当前支路流量数据两方面的因素,如果当前状态在样本数据范围内,图1传统非参数回归算法图2引入支路流量非参数回归算法(3)式中的α影响较大,预测结果与传统非参数回归方法相近,如果当前状态不在样本数据范围内,(3)式中的β影响增强,支路流量突变因子起到一定的校正作用,使得预测结果比传统非参数回归算法更准确。2.2状态定义:为了确定合适的状态向量,采用相关性分析法分析历史数据与预测数据的相关性。分析当前预测的流量Vn(t)和之前若干个时刻(Vn(t-1),Vn(t-2),Vn(t-3),Vn(t-4),Vn(t-5))的相关性。表1预测流量变量与历史流量变量相关性分析变量Vn(t-1)Vn(t-2)Vn(t-3)Vn(t-4)Vn(t-5)相关系数0.8150.7980.6210.3270.275相关性分析的结果显示Vn(t)与前三个时刻的流量Vn(t-1),Vn(t-2),Vn(t-3)相关系数较大,所以,采用历史数据Vn(t-1),Vn(t-2),Vn(t-3)作为输入变量预测当前流量Vn(t)。定义输入状态向量如(4)式所示。()[(),(1),(2)]xtVtVtVt=−−(4)2.3距离定义:采用欧式距离的方法定义向量的距离。根据距离的大小判断临近的向量集。向量A(a,b,c)和B(a’,b’,c’)的距离定义为:222(')(')(')ABaabbcc=−+−+−&&(5)利用(5)式计算(1)(2)式中的Disti。2.4历史数据:浙江大学智能交通研究中心开发的交通路口仿真系统软件(TrafficIntersectionSimulationSystem,4TISS),基于交通流的宏观仿真、车辆行为的微观仿真模型以及信号灯配时理论,是适用于城市道路规划设计、模拟城市交通车流通行状况和信号灯相位的设置等领域的交通系统设计和分析的仿真软件。本文基于TISS软件仿真数据对引入支路流量的非参数回归交通流预测算法在方法上进行研究和验证。短时预测周期一般在5-15min,而短周期的精确预测是短时预测的发展趋势,所以本文采用5min作为预测周期。3仿真验证本文以带有一个支路的路段为例子进行仿真,验证引入支路流量的非参数回归短时交通流预测方法,支路可根据实际情况进行