1055第二十八届(2012)全国直升机年会论文基于聚类结合动态剪枝二叉树SVM方法的涡轴发动机故障诊断系统研究及实现侯云涛1关瑞杰2赵晓博3(1、3中航工业哈飞飞机设计研究所航电设计室,2陆航驻哈尔滨地区军事代表室,哈尔滨150066)摘要:现代航空发动机结构复杂,工作状态恶劣,属于故障多发系统。如何保障发动机健康稳定的工作,提高飞行安全性,一直是困扰国内外学者和研究人员的问题。本文针对某型涡轴发动机的常见故障,提出了一种聚类结合动态剪枝二叉树SVM的故障诊断方法,并且基于MatlabR2008a平台,开发了故障诊断系统。仿真实验结果表明,本文提出的多类分类算法是可行的,并且有效地提高了故障诊断的准确率和速度。关键词:发动机故障;动态剪枝二叉树SVM;故障诊断;仿真实验0引言发动机故障在飞行故障占有相当大的比例,是影响飞行安全的主要因素。直升机工作环境复杂,大多工作在近海面上空、沙漠地带、南极、山地等潮湿、尘埃多、气流复杂的空域。作为直升机动力装置的涡轴发动机,有其独特的结构特点:燃气发生器涡轮与动力涡轮是气动关系,燃气发生器涡轮转速高,体积小,通道窄,布局密。这些都会影响发动机的关键零部件寿命,也使发动机更容易发生诸如腐蚀、疲劳损伤或某些组合损伤等故障。这些故障发生时,轻则会引起发动机性能恶化,输出功率不足;重则引起发动机损坏,直接危及飞行安全。如何早期发现和预防这些故障,是直升机发动机日常维护的主要任务,也是涡轴发动机实现单体视情维修的关键。计算机技术的发展,促进了人工智能技术在故障诊断领域中的应用。支持向量机(SVM)是由Vapnik领导的AT&TBell实验室研究小组在1963年提出的一种新的非常有潜力的分类技术,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。本文采用了一种基于聚类结合动态剪枝二叉树SVM的涡轴发动机故障诊断方法,有效地提高了故障诊断准确率和速度。1基本原理1.1支持向量机对样本集,,1,,iiyinx,,dRx设类别号为1,1y。通过非线性映射nmRRΦ:,将输入向量映射到高维空间,当数据在高维空间可分时,支持向量机便在高维空间nR构造最大间隔分类超平面(如图1所示):bwxΦ,w可以写成的线性组合:1ΦNiijiwyx,其中i是Lagrange乘数,可由求解下面的二次规划问题得到:NjijijijiNiiyyQ1,121)(maxxΦxΦ(1)约束条件:10560,01iNiiiy(2)supportvectormatginoptimalhyperplane图1最优分类超平面高维空间的内积总可以在输入空间找到一个满足Mercer条件的核函数使得jijiΚxΦxΦxx,,因此并不需要知道非线性映射的具体形式,避免求非线性映射而求内积。即求解:1,11max,2NNiijijijiijQyyKxx(3)约束条件:0,01iNiiiy(4)常见的核函数有:多项式核:diirΚxxxx,(5)径向基核:2,exp()iiKxxxx(6)Sigmoid核:cΚiixxxxtanh,(7)线性核:iiΚxxxx,(8)1057分类边界上0*ii的点,称为支持向量,利用KKT条件可以得到域值b*。从而可以得到分类决策函数为:*1(,)iN*iiiifsignyKbxxx(9)当数据在高维空间不能进行无误差分离时,引入松弛变量0i,并通过求解下述二次规划使得错分误差最小:NiiCwL1221min(10)其中i反映了实际指示值iy与支持向量机输出之间的距离,C是平衡因子,反映第一项与第二项之间的权衡。求解可转化为:1,11max,2NNiijijijiijQyyKxx(11)约束条件:CyiNiii001(12)利用KKT条件求解上式,可以获取域值并确定决策函数。1.2多类分类算法由于基本的支持向量机只能解决两类分类的问题,而实际应用中往往却是多类分类问题,所以需要重新构造支持向量机分类器模型。目前流行采用的方法有:一对一(OAA)、一对多(OAO)、二叉树等。一对多分类算法(OAA):一对多分类算法基本思想是构造一系列两类分类机,其中的每一个分类机都把其中的一类同余下的各类划分开。最后输出两类分类器输出最大的那一类,缺点是每次训练都要训练全部样本,构造的两类问题很不对称,决策结果也可能属于多类或不属于任何类以及推广误差无界。一对一分类算法(OAO):该算法基本思想是对n类问题,构造(1)/2nn个二值分类器,每两类之间训练一个SVM将彼此分开。设区分第i类和第j类数据,则相应的分类问题转化为求解下式:,,1min2ijijijTijijijtbtC(13)约束条件:,1))()((ijtijtTijbx(14),1))()((ijtijtTijbx(15)0ijt(16)1058其中,为核函数,C为惩罚因子,为松弛变量,和b分别为超平面参数。预测新样本时,它每次并不拿出全部的n类样本来构造每个二分类SVM,每次只选取其中的两类样本,对所有可能的两类组合构造SVM,总共需要构造n(n-1)/2个SVM。在确定样本x所属类别时,采用的是“投票法”,样本每经过一个二分类SVM都会获得一个可能的类别号,即获得一票,当样本经过所有二分类SVM后,对获得票数进行统计,得票数最高的类别即为该样本最可能属于的类别。当某几类获得相同票数时,再将样本输入与这几类相关的二分类SVM,如此循环,直至最终出现票数胜出的类别。该方法的缺点是可能出现过学习,投票结果可能属于多类。该算法运行时间随n增大而增长,且推广误差无界。1.3本文算法针对n类多类分类问题,一对多方法需要构造n个支持向量分类器,且每个分类器都需要对所有的样本进行训练;一对一方法则需要构造n(n-1)/2个支持向量子分类器,每类样本都要与其余的n-1类进行训练。但是无论一对一还是一对多算法,都会存在大量的不可分区域本算法中。本文算法中,最顶端的SVM分类器将按这样的法则构建,即将有更大相似度的类聚成一类,直至最终聚为两类,并将此两类作为根节点,据此构造二叉树,在每一个二叉树节点,用两类SVM进行分类。即先聚类,后分类。该方法不仅有效解决“误差累积”问题,并且大大加快了分类速度。为了尽量使分类误差在远离根结点的分类器中出现,解决的方法就是把最容易分离的类首先分离出来。根据训练数据估计各类间的易分性,通常的做法是用类中间的Euclidean距离或马氏距离作为分离性测度,但这种方法的缺点在于:如果不考虑待分类的分布,那么类中心间的距离远近并不能总是代表类间的分离度。图2给出了不同的类间可分离性比较,(a)(b)两图中所代表的类中间的距离均相等,但是很明显(b)中的两类要比(a)中的两类容易分。(a)(b)图2类间可分离性比较示意图因此,类空间分布是影响类间分离性测度的重要因素。根据上述分析,在本文算法中,在考虑类之间相似度定义的时候,不仅了考虑类之间的欧式距离,并且考虑了类的类空间分布,给出一种新的相似度定义。第i类中心点定义如下:(17)其中sx表示将输入空间样本用非线性映射:mnRR映射到高维空间中。i类与j类的距离定义如下:22111111121,,,jjjiiillllllijijssstttssstttiijjDmmKxxKxxKxxllll(18)1isimxl1059其中ΦststKxxxx,。类之间的相似度定义如下:22similar,ijijRRijmm(19)其中maxitiRxm。聚类与SVM动态剪枝二叉树结合的算法如下:第一步,根据公式(19)计算各类样本间的相似度;第二步,将两个具有最大相似度的类聚成一个新的类,并重新训练新类的SVM,按照公式(17)、(18)、(19)计算新类的类中心以及新类与其余各类的距离,进而计算新类与其余各类的相似度;第三步,重复进行以上两步,直到所有的类被聚成两类,将此两类作为根节点,依次构造二叉树的子分类器;第四步,识别第一个输入样本,记录样本状态;第五步,根据上一样本类别,重新构造剪枝二叉树,去除与该类别相似度相对较低的支持向量,剩余样本集合作为根结点用来识别该类别,从大到小排列各样本与该预测样本的相似度,依次构造子分类树,每个分类树都是一个一对余的二类分类器,若相似度相同,则任取其中一类作为子树要区分的类别,直至全部区分样本类。第六步,识别新样本,记录样本当前状态,若仍是前一类别,则维持现有二叉树结构,重复第五步;第七步,若样本类别发生变化,需要重新调整二叉树结构,转第四步;结束。以五类分类为例,如图3所示,若故障4发生,排除不可能的信息1,2;将剩余的样本作为根结点样本来识别当前故障4。图3基于聚类的动态剪枝二叉树拓扑结构2性能测量参数的选取对发动机而言,故障成因是多种多样的,如表面的腐蚀、磨损、外来物损伤、喷嘴堵塞,密封件损坏、叶片断裂、烧毁或变形等。这些都表现在发动机机件的尺寸变化上。根据发动机原理,可以建立性能测量参数X与监控参数Y的关系:Y=f(X),进行故障诊断时,1060利用性能测量参数的实际数据,即可确定核心部件衰竭程度及具体单元体故障。根据模拟计算和分析,选取的性能测量参数为燃气涡轮转速、自由涡轮转速、排气温度、飞行高度、飞行速度、燃油油量、滑油压力、滑油温度。实验数据来自飞行参数记录系统所记录的飞行参数。3实验结果与分析针对发动机的五种故障:压气机密闭性不好、自动加速器故障、燃气涡轮叶片烧蚀、燃气发生器后轴承损坏故障和管路渗油故障进行仿真实验,5种故障的训练样本数各为50组,测试样本分别为25组和50组。分别运用OAA,OAO和本文算法进行故障诊断实验,结果如下表:表1多类算法比较结果多类分类算法准确率(25组)准确率(50组)平均测试时间(s)OAA0.95160.94863.12OAO0.95820.95371.41本文算法0.94580.96121.13从表1可以看出,用不同的多类算法预测同一样本,在准确率上相差不多,然而随着测试样本的增多,本文算法的准确率也相应提高。在测试时间上,本文算法明显优于其他两类方法,且本文算法可以进行更进一步地缩短预测时间,确保了出现异常时实时预测的可行性。图4~图6所示为一组燃气发生器涡轮叶片发生器烧蚀的试车数据的诊断验证结果:图4OAA分类方法界面1061图5OAO分类方法界面图6聚类结合动态剪枝二叉树分类方法界面4结论经过实验结果的比较,最终得出结论:核函数的选择上,径向基核函数优于其他两种核函数(sigmoid、多项式);分类方法上,本文所提出的方法无论在诊断时间还是诊断精度上都远优于其他两种SVM多类分类方法(OAA、OAO),并且非常适合对故障进行实时诊断。参考文献[1]AnnaWang,JunfangLiu,QinwanWang,WenjingYuan.ANovelMulti-ClassifierforFaultDiagnosisofAnalogCircuit1062BasedontheUnsupervisedBinarytreeandSupportVectorMachines[C],InternationalMultiConferenceofEngineersandComputerScientists,Hongkong,2007,59-64.[2]AnnaWang,JunfangLiu,JieWu,XinhuaZhang.ResearchesonSoftFaultDiagnosisAlgorithmofAnalogyCircuitsBasedonDD