第5卷第10期2010年10月743高速公路交通运行状态分类方法研究徐婷,陈志建,程琳(东南大学交通学院,南京210096)摘要:为了更加细致地了解高速公路交通运行状态,为突发事件的应急处理提供高效、可靠的决策支持,利用高速公路交通流参数的变化规律建立基于支持向量机的高速公路交通运行状态分类模型。以道路服务水平为依据将交通运行状态划分为第Ⅰ类交通状态、第Ⅱ类交通状态、第Ⅲ类交通状态、第Ⅳ类交通状态和第Ⅴ类交通状态,设计分类模型的工作步骤,以I-880数据库为例,采用Matlab软件对所设计的方法进行仿真实验。结果表明,所设计的方法通用性强、有较好的分类效果。关键词:支持向量机;事件检测;交通状态分类中图分类号:U491文献标志码:A文章编号:1673-7180(2010)10-0743-6ResearchonmethodsofhighwaytrafficstateclassificationXuTing,ChenZhijian,ChengLin(SchoolofTransportation,SoutheastUniversity,Nanjing210096,China)Abstract:Tohaveagoodcommandofthetrafficrunningstateonhighwaysandprovidereliableefficientdecisionsupportindisposinganemergency,amodelabouttrafficstateclassificationonhighwaysisproposedbasedonsupportvectormachine,consideringthevariationofthetrafficparameters.Accordingtothehighwayservicelevel,thetrafficstateisdividedintofiveclasses:thetrafficstateⅠ,thetrafficstateⅡ,thetrafficstateⅢ,thetrafficstateⅣandthetrafficstateⅤ.DesigntheworkstepsoftheclassificationmodelandtakedatafromI-880databankasanexample.ThesimulationresultsfromMatlabshowthatthenewmethodisadaptableandefficient.Keywords:SVM;incidentdetection;trafficstateclassification高速公路是世界经济发展的重要推动力,为人们提供了快捷、高效、舒适的运输环境。但高速公路在快速发展的同时,汽车保有量也在不断增加,高速公路不可避免地出现了交通拥堵、交通事故等问题,严重阻碍了其高速发展的步伐。为了提高高速公路运行的安全和畅通,许多学者致力于包括交通事故、货物散落、车辆抛锚等交通事件的检测方法研究,如加州算法、神经网络方法等。其中,基于支持向量机(supportvectormachine,SVM)的交通事件检测方法是目前事件检测研究的一个热点。支持向量机是基于统计学习理论发展起来的一种新型的机器学习算法,有效解决了困扰以往机器学习算法的许多问题,如神经网络中的模型选择问题、过学习与欠学习问题、非线性和维数灾难问题等,而且,支持向量机能较好地解决小样本问题,当训练样本有限时使用该方法得到的决策规则对独立的测试集仍然能够得到较小的误差。目前对支持向量机算法的研究主要集中在SVM与其他算法的结合、SVM模型的优化、SVM与粗糙集、模糊集的结合等方面[1-4]。最早将支持向量机技术应用到交通事件检测中的收稿日期:2010-09-20基金项目:国家高技术研究发展计划(863计划)项目(2009AA11Z219)作者简介:徐婷(1987-),女,硕士研究生,主要研究方向:交通规划、交通管理通信联系人:程琳,教授,主要研究方向:交通规划、交通管理,gist@seu.edu.cn中国科技论文在线SCIENCEPAPERONLINE第5卷第10期2010年10月744中国科技论文在线SCIENCEPAPERONLINE是新加坡国立大学的FangYuan和RueyLongCheu,在建立了SVM模型之后,分别通过模拟数据和实测数据进行测试,并与多层前反馈神经网络测试结果进行比较,发现支持向量机算法的检测结果具有明显优势[5]。梁新荣等[6]等根据交通事件对交通流参数的影响规律,提出了一种基于支持向量机分类的建模方法,研究高速公路交通事件检测问题。陈斌[7]建立了基于支持向量机的高速公路意外交通事件检测模型,利用自主开发的EAD2Simulations仿真平台生成的交通流数据库进行仿真试验,研究了单侧输入与双侧输入、不同输入特征因素组合、不同核函数等情况下支持向量机的检测性能指标。裴瑞平等[8]提出了一种基于小波变换和最小二乘支持向量机的交通事件自动检测算法,利用小波变换提取特征数据,使用最小二乘支持向量机进行分类。但是,目前对于支持向量机方法在交通事件检测中应用的研究,都集中在对交通流2种状态,即事件状态与非事件状态的划分,把交通事件的检测转化成一个简单的二分类问题,这样就不可避免地存在以下几个问题:1)对分类要求定的过高,会导致影响较小的交通事件不能被检测出来,从而使检测率大打折扣。2)对分类要求定的过低,会导致一些本来不是事件的情况也被误认为是事件,使得误分率增加,为交通管理带来不必要的麻烦。3)检测得到结果仅为简单的有事件或无事件2种状态,并不能确定事件的严重程度,因此不能为交通事件紧急预案的制定提供很好的决策支持。笔者以支持向量机理论为基础,设计一种高速公路事件状态分类方法,并以美国I-880数据为例,通过Matlab软件对所设计的方法进行仿真实验,证明该方法的可行性与有效性。1支持向量机及高速公路运行状态分析1.1统计学习理论与支持向量机统计学习理论是目前针对小样本统计估计和预测学习的最佳理论。它主要研究经验风险最小化原则下统计学习一致性的条件及其在这些条件下关于统计学习方法推广性的界的结论,并在这些界的基础上建立小样本归纳推理准则,从而设计实现这些新的原则的实际方法。其中,最有指导性的理论结果是推广性的界的结论,与此相关的一个核心概念是VC维,它是指在一个函数集P(x,w),wΩ∈中,能够被集合中的函数以所有可能的2h种方式分成2类的向量x1,x2,…,xh的最大数目h,亦即能够被这个函数集打散的向量的最大数目。VC维反映了函数集的学习能力,VC维越大则学习机器越复杂。支持向量机是建立在统计学习理论和结构风险最小化原理之上的一种新型的机器学习方法。在解决分类问题时,不但要求经验风险最小,同时还要使VC维尽量小,从而缩小置信范围,使期望风险最小,最终使得所建立的算法尽可能地贴近输入输出值之间真实的依赖关系,尽可能地提高预测输出的可信度。首先,支持向量机算法的本质是一种机器学习方法。机器学习目的是根据给定的训练样本,求出对系统S输入输出之间依赖关系的估计,使它能够对未知输出尽可能准确的预测。其基本问题模型如图1所示,其中,系统S是研究对象,它在给定一定输入x下得到一定的输出y,LM是我们所求的学习机器,预测输出为ˆy。图1机器学习的基本模型图Fig.1Basicmodelofmachinelearning其次,支持向量机应用了结构风险最小化原则,拥有更优良的泛化能力。结构风险最小化原理的基本思想是:如果要求风险最小,就要使得经验风险与置信范围相互平衡,共同趋于极小;并且,在获得学习模型风险最小的同时,希望模型的泛化能力尽可能的大,如图2所示。图2结构风险最小化示意图Fig.2Structuralriskminimizationscheme支持向量机的线性分类原理如图3所示。图中,“●”和“○”分别代表2类样本,H为分类线。H1、H2分别为各类中离分类线最近的样本且平行于分类线的直线。所谓最优分类线就是要求分类线不但能将2类正确分开(训练错误率为0),而且使它们之间的分类间隔(margin)最大。第5卷第10期2010年10月7451HH2Hmargin=2/w图3最优分类线与支持向量Fig.3Theoptimalclassificationlineandsupportvectors对于支持向量机的非线性分类,则引入了核空间理论,将低维的输入空间数据通过非线性映射函数映射到高维属性空间,将分类问题转化到属性空间进行。可以证明,如果选用适当的映射函数,输入空间线性不可分问题在属性空间将转化为线性可分问题,这种非线性映射函数被称为核函数,目前常用的核函数有线性核函数、多项式核函数、径向基核函数和Sigmoid核函数。另外,在非线性分类时还引入了松弛变量和惩罚因子,以减小误差。1.2高速公路交通运行状态分析高速公路交通运行状态可分为事件状态和非事件状态2种。当交通流处于正常运行状态,即非事件状态时,各交通流参数(交通量、车速、交通密度和占有率等)的关系相对稳定,变化过程平缓。当某一地点由于交通事件而发生拥挤,即处于事件状态时,事发地点上游会产生一个导致拥挤的压缩波,使车辆聚集,上游检测站的流量会有所减少,同时占有率明显增加、速度显著降低;事发地点下游则会产生一个扩张波,使车辆稀疏,占有率降低,速度会恢复到甚至高于事件发生之前的水平,流量通常会低于道路的正常通行能力。事件状态与非事件状态下交通流特性变化图如图4所示。图4事件与非事件状态交通流特性图Fig.4Featuresoftrafficflowunderincidentandincident-freestatus2基于支持向量机的高速公路交通状态分类方法2.1基于支持向量机的高速公路交通事件检测事件检测是交通状态分类的基础,根据事件状态与非事件状态下高速公路交通流变化的不同特性,利用交通流参数设计输入向量,通过建立支持向量机模型来进行交通事件的检测。目前常用的支持向量机核函数主要有线性核函数、多项式核函数、径向基核函数和Sigmoid核函数,各种核函数性能的优劣视样本的具体情况而定,通过实验对比,发现径向基核函数支持向量机的分类效果较好且较稳定,推广性也好,因此选择径向基核函数构建SVM模型,对其他核函数情况暂时不做深入分析。径向基核函数的基本形式如下:()()2,'exp'/Kxxxxh=−−。(1)该模型中包含c和g2个参数,分别为模型的惩罚参数和核函数的调节参数,参数寻优采用网格搜索算法,在1010(2,2)c−∈和1010(2,2)g−∈中寻求c、g的最优搭配值,步长都设为1。基于支持向量机的高速公路交通事件检测结构如图5所示。高速公路交通运行状态分类方法研究第5卷第10期2010年10月746中国科技论文在线SCIENCEPAPERONLINE输出(决策规则()⎟⎠⎞⎜⎝⎛+=∑=SiiiibxxKyy1,·sgnα权值wi=αiyi基于S个支持向量X1,X2,…,XS的非线性变换(内积)输入向量x=(x1,x2,…,xS)图5支持向量机检测结构图Fig.5Detectingstructureofsupportvectormachine2.2基于支持向量机的高速公路交通运行状态分类根据交通事件发生后对交通流产生影响和不同交通事件对交通流影响程度的不同,将高速公路交通运行状态划分为5类:第Ⅰ类交通状态,事件状态,事件对交通流的影响程度很大,事件地点上游路段的服务水平为F级,交通处于强制流状态,车辆经常排成队,跟着前面的车辆走走停停,极不稳定。第Ⅱ类交通状态,事件状态,事件对交通流的影响程度较大,事件地点上游路段的服务水平为E级,交通流处于不稳定流状态。第Ⅲ类交通状态,事件状态,事件对交通流的影响程度一般,事件地点上游路段的服务水平为D级,交通流处于稳定交通流的较差部分,速度和驾驶自由度受到严格约束,驾驶的舒适度低下。第Ⅳ类交通状态,事件状态,事件对交通流