第29卷第3期209年6月桂林电子科技大学学报JournalofGuilinUniversityofElectronicTechnologyVoI.29。NO.3Jun.2009SVM模式识别技术及在机械故障诊断中的应用进展王长林,陈鸿宝,林玮,秦启茂,宋宜梅(1.桂林电子科技大学机电工程学院,广西桂林541004;2.广西右江矿务局,广西田东531501)摘要:支持向量机(SuportVectorMachines,SVM)是一种基于统计学习理论的新型机器学习方法,对小样本决策具有较好的学习推广性。为在机械故障诊断中更好地运用该方法,从基于支持向量机理论的模式识别技术和机械故障诊断中应用两方面,综述了近年来支持向量机国内外研究应用现状,分析了技术特点、存在问题、解决方案及其在机械工程领域应用前景。关键词:支持向量机;机器学习;模式识别;故障诊断中图分类号:TH17文献标识码:A文章编号:1673808X(2009)03—0256—04PatternRecognitionBasedonSupportVectorMachineandItsApplicationinFaultDiagnosisWANGChang—Iin,CHENHong—bao,LINWei。,QINGQi—mao,SONGYi—mei(1.SchoolofMechanicalandElectricalEngineering·GuilinUniversityofElectronicTechnology,Guilin541004,ChinaI2.GuangxiYouiangBureauofMines,Tiandong531501,China)Abstract:Supportvectormachine(SVM)isanewgeneralmachinelearningmethodbasedontheStatisticalLearn—ingTheory.Itexhibitsgoodgeneralizationcharacteristicswhenfaultsamplesarefew.Therecentdevelopmentsofsupportvectormachinearereviewedandsomenewprogresesinfaultdiagnosisareintroduced.Somekeytech—niques,unsolvedproblems,andtheprospectofengineeringapplicationsarediscussedindetail.Keywords:supportvectormachine;machinelearning;paternrecognition;faultdiagnosis1机械设备的故障诊断技术机械设备故障诊断技术是现代化生产发展的产物,已成为保证生产系统安全稳定运行和提高产品质量的重要手段和关键技术。故障诊断技术研究的关键问题在于信号获取、模式分类及判别决策,而故障的模式分类则是故障诊断过程的核心所在。从本质上而言,机械设备故障诊断的过程也是个故障模式识别的过程,模式识别系统主要包括4个部分[1],如图1所示。目前,人工神经网络智能诊断技术是比较常用的故障模式分类方法之一,在故障诊断领域得到了较多的研究和应用。然而,人工神经网络的算法基础为传统统计学理论,具有一些不可克服的缺点和不足,最图1模式识别系统的基本构成框图直接的问题就是推广泛化能力不足,需要大量的训练样本,并且存在学习问题。工程实际中的机械故障诊断问题,尤其是大型机械设备,获取大量的典型故障样本非常困难。因此,在机械故障诊断中处理的一般是小样本问题,在样本的数量上和质量上都不能满足收稿日期:2008—12—01基金项目;国家自然科学基金(50805028);广西自然科学青年基金(0832082)作者简介:王长林(1983一),男,江苏盐城人,硕士研究生,主要研究方向为机械设备故障智能诊断技术。E—mail:xiaowang6509@163.corn第3期王长林等:SVM模式识别技术及在机械故障诊断中的应用进展257像神经网络等现有的故障诊断方法对学习样本的要求,从而限制了这些理论上很优秀的算法的实际应用效果。因此选择一种具有良好的推广泛化能力,适合小样本情况的学习机器进行机械故障诊断非常关键。支持向量机突出优点是推广泛化能力强、适合于小样本问题求解,目前已经成为机械故障诊断的前沿研究方向。本文系统地阐述了支持向量机的模式识别技术及在机械故障诊断中的应用现状。2基于SVM理论的模式识别技术研究进展早在1963年Vapnik博士在解决模式识别问题上提出的支持向量机方法,是指从训练集中选择一组特征子集,使得对特征子集的划分等价于对整个数据集的划分,这组特征子集被称为支持向量(SupportVector—SV)[。≈]。1971年,Kimeldorf博士提出了支持向量机的一个重要理论基础一VC维理论。1982年,Grace,Boser和Vapnik博士等人进一步提出了具有划时代意义的结构风险最小化原理。其后,支持向量机理论研究停滞不前,直到1995年,Vapnik博士正式提出统计学习理论,用完整的支持向量机分类器,较好地解决了线性不可分问题,为有限样本情况下的统计学习问题提供了一种有效的解决途径,祢补了传统统计学理论的不足,奠定了支持向量机的理论基础,近十几年来国内外许多学者对支持向量机结构、算法进行了一系列的理论研究。在传统的模式识别技术中,模式分类的基本方法是利用判别函数来划分每一个类别,如何选择有效的判别函数形式,以及如何在识别过程中对判别函数的有关参数进行修正,有很多不同的解决方法,其中支持向量机方法是一种较新的分类算法。标准的支持向量机一般解决的是二分类问题,而实际需要解决的一般是多类问题。目前,利用支持向量机处理模式识别中的多类分类问题是当前研究的热点之一。研究者们已提出的一些卓有成效的多类支持向量机方法,可大致归纳为两大类:第一大类是以Weston博士[4]在1998年提出的多类算法为代表,该算法是在经典支持向量机理论的基础上,重新构造多值分类模型,通过改写Vapnik博士的支持向量机二值分类中的优化目标函数实现多类分类。这类算法选择的目标函数十分复杂,实现困难,计算复杂度也非常高。第二大类引入了组合的思想,通过组合多个两类分类器实现多值分类器的分类,目前此类方法主要有以下几类算法:(1)一对多算法(One—against—Rest,简称1-a—r)。一对多算法[5]由Vapnik博士提出,其基本思想是针对k类问题构造k个两类分类器,用一个两类支持向量机分类器将每类与其他所有类区分开来,得到k个分类函数。在对测试样本进行分类时,采用“比较法”,将未知样本分类为具有最大分类函数值的那类。(2)一对一算法(One—against—One,简称1-a一1)。一对一算法由S.KnerrE]提出,该方法基本思想是在每两类间训练一个分类器,因此对于一个愚类问题,将有k(五一1)/2个分类函数。在对测试样本进行分类时,采用“投票法”,最后得票最多的类别既作为该未知样本的类别。(3)决策导向无环图算法(DecisionDirectedA—cyclicGraph—DDAG)。对于1-a—l算法,JohnPlatL7J引入了图论的思想提出DDAG算法,在训练阶段DDAG和1-a一1算法投票一样,也要构造出每两类间的分类面,即有k(足一1)/2个分类器。但是在分类阶段,该方法将所用分类器构造成一种两向无环图形状如图2所示,包括k(惫一1)/2个节点和k个“叶”。当对一个未知样本进行分类时,首先从顶层的二值分类器开始,根据顶部的二值分类器分类结果,确定采用下一层的左节点还是右节点的二值分类器继续分类,直到底层的某个“叶”为止,该“叶”所表示的类别即为未知样本的类别。图2DDAGSVM分类示意图以上多类分类算法,相比较而言一对多算法易于实现,但它的推广误差无界,任何一个分类器的错误分类都将会带来分类的二义性。一对一算法的速度在一般情况下均优于一对多算法,在增量学习中,这一差别尤为明显。因此,现有的应用在模式识别中的多值分类算法一般采用一对一算法,或在一对一算法和一对多算法的基础上进行改进的一些算法,如上所阐述的JohnPlat提出的决策导向无环图算法[6],虽然这种算法的训练阶段和一对一算法一样,但在分类阶段只用了曼一1个分类器,速度优于一对一算法。支持向量机方法由于其出色的学习性能和分类性能,在很多领域都得到了很成功的应用。特别是在模式识别领域,这是支持向量机一个最重要也是最成功的应用之一,也是支持向量机二分类和多分类算法258桂林电子科技大学学报209年6月的直接应用,涵盖了文本自动分类[7]、人脸检测[8]、遥感图象分析[9]等各个方面。其中最突出的应用研究是贝尔实验室对美国邮政手写体字库的实验[10],结果表明,用支持向量机方法得到的识别结果均优于专家系统和多层神经网络。除了在模式识别领域外,在数据挖掘En-n]、金融时间序列预测E13]、非线性系统建摸与控制[1.]等领域,支持向量机都显示出了良好的性能,这些研究表明其应用范围是非常广泛的,是一项很有发展前途的机器学习算法。3SVM在机械故障诊断中的应用进展机械故障诊断的过程是一个故障模式识别的过程,因此研究适合于开展机械设备故障状态识别的识别理论是解决问题的关键之一。鉴于机械设备在整个国民经济中所处的重要地位以及支持向量机针对小样本情况所表现出来的优良分类性能,已引起了众多机械故障诊断领域研究人员的广泛关注,目前国内外研究人员都试图在这一领域有所突破。Jack等将支持向量机应用于滚动轴承的状态检测[1引,并用遗传算法优化支持向量机的参数,取得比较好的推广能力[1;彭问季提出了一种利用小波包分析提取水电组的振动故障特征和基于支持向量机的水电组振动的故障诊断方法[1];王凯等提出了一种基于支持向量机的齿轮故障诊断方法,采用小波变换对齿轮的振动信号进行处理来构造特征量,在小样本情况下比神经网络获得更高的诊断精度[】。;饶泓、虞国全[19]采用了几种基于支持向量机的径向基网络故障诊断方法,结合了支持向量机和径向网络两者各自的优点,解决了故障样本数据不足问题,缩短了训练时间,并取得更高的准确率;齐保林、李凌均将支持向量机分类算法用于滚动轴承的多类故障模式分类中并与人工神经网络进行了对比研究,实验表明在有限样本条件下,支持向量机算法比人工神经网络具有更好的分类性能[2叼;孙刚等在利用支持向量机进行模式分类时,提出了根据分类权值来进行特征的选择,提高支持向量机分类器的分类性能r;官理等在处理多分类问题上提出了结合导向无环图方法和简化支持向量机方法的一种快速支持向量机多类分类方法,减少了支持向量的数量并加快了分类的速度[2。;余辉等针对支持向量机多类分类方法中的分解重构法进行了深入分析,讨论了影响分类性能的两个关键因素,并通过实验验证其观点[2。;张龙等针对旋转机械振动信号存在非平稳性,提出一种基于时变参数自回归模型和支持向量机相结合的旋转机械故障诊断方法[2;何学文等提出了一种基于小波分析和支持向量机相结合的旋转机械故障诊断方法,实验表明该方法可以获得更高的旋转机械故障诊断准确率[2;牛慧峰等针对在液压泵故障诊断中故障样本难以获得的问题,融合人工免疫系统中的实值否定选择算法和支持向量机算法提出了一种混合的故障诊断方法[2;吴峰崎等针对转子在升降速运行时的故障特征数据样本有限而制约有效智能诊断的问题,提出了基于支持向量机的加速度信号故障诊断方法[2;毛荣富等将后验概率引入到故障诊断中,提出了一种基于后验概率的支持向量机方法,实验表明,该方法无论对测试样本还是对训练样本都有更高的诊断准确率[2引。这些针对不同机械故障对象的诊断研究表明,将支持向量机应用在机械故障诊断模式分类方面,其性能优于许多已有的方法。对于小样本,诊断精度高于神经网络方法;对于高维样本,其诊断速度比神经网络快。研究表明,机械故障诊断技术发展的的瓶