第三章BP神经网络在变压器故障诊断中的应用3.4.5网络参数选择及运行结果在选定训练样本以及神经元个数后,对本网络进行训练运行。对于单隐层的神经网络来说参数的设定相对较简洁:隐层的传递函数设置为tansig,输出层的传递函数设置purelin,训练函数选用收敛性最好的LM函数,收敛误差设置为0.001。为了便于观察网络内权值阈值的变化和回想结果与理想结果的比较,这里给出网络训练后的权值阈值数据以及回想结果:输入层与隐层的连接权值InputWeights=0519.48352.11909.26424.14410.27909.60865.27934.46217.35631.77439.13141.62215.23243.15988.3185.57614.173055.20155.105744.112021.05316.15486.00332.18529.18543.27905.00828.25529.06611.06651.11494.11484.1-----------------隐层与输入层的连接权值LayerWeights=8022.10028.01102.00037.003.00006.00347.00865.00865.01502.13082.18847.10186.09174.00142.01152.10056.03025.07255.07255.01058.01262.00077.00327.06508.2009.0291.10034.04619.34822.04822.01251.01149.0218.00525.019.07239.11099.00666.00226.03325.03325.014.00467.00644.00767.04199.05709.1028.00428.11088.04255.14205.03989.02441.0108.04632.14238.01579.00984.21248.14906.06003.00958.10479.00783.00193.0404.13747.2002.02923.20124.00348.31206.05929.10607.00749.0------------------------------------隐层阈值Bias1=3610.30871.79779.0175.20377.1667.11251.18617.03013.01663.38239.3-----输出层阈值Bias2=6275.06502.19669.08158.04564.02212.24716.0-----回想结果=第三章BP神经网络在变压器故障诊断中的应用0015.0122.10004.0441.0112.0331.0115.00012.01454.0612.0002.0005.00022.00121.0512.0001.0354.07115.00014.00041.0142.00031.0122.07041.00021.0155.00012.0511.00041.0514.01123.11142.00041.0112.00031.0456.00041.01544.00031.01125.0003.0003.1997.0688.01525.0741.0311.04121.03112.00031.00051.00012.00013.0006.0344.1112.1641.01154.0412.01123.00012.00001.00012.00025.00012.0125.01241.0974.0422.1112.1------------------003.1311.10021.00001.00041.00074.00061.0114.0221.01454.001.01224.0879.0784.0997.0112.0001.0611.0003.02212.0005.01541.00041.00021.00031.0112.1224.17789.01402.00014.00004.0612.0412.00036.00041.03115.012.10031.08991.01102.1112.00001.0031.0004.00001.01171.01158.00112.0003.03112.00041.00046.00025.05011.0661.00094.03112.00331.01148.00014.02121.00031.00041.00041.00031.00112.00012.00012.0212.1415.0--------------可以发现回想结果大体与理想输出是相符合的,但是其中也不乏部分样本的输出值远偏离了相应二进制数值的范围,说明BP在收敛过程部分区域精度并没有达到要求,这会造成的了预测的严重误差并与理想输出相去甚远。训练效果如图3.4所示,运行294步之后达到了规定的收敛误差。将预测结果转换为数字编码后通过图3.5可以发现此时BP的预测准确性不高只有68%(训练样本以及测试样本参见4.6.1及4.6.2节),因此本节设计的BP模型由于本身固有的问题以及预测概率性问题根据目前的准确性是仍然难以独立胜任变压器的实际故障诊断的。图3.4BP训练误差结果图3.5预测值与实际值对比3.5本章小结本节针对传统变压器故障诊断方法的缺点,利用神经网络自我学习的特性第三章BP神经网络在变压器故障诊断中的应用和分组归类的功能为油色谱的故障诊断带来了新思路。通过参数的反复仿真对比,本文最终确定的BP神经网络为单隐层结构,输入量为3组特征气体的比值,隐含层的神经元节点数为11,输出量为变压器7种状态的7个二进制数。本章介绍了BP网络的基本原理并着重讲解了设计基于BP网络的变压器有色谱故障诊断模型的仿真过程,但是最终的预测准确性不是很理想只达到了68%,因此还需要对此模型进行一系列的优化才可以将此诊断方法应用到实际当中去。第四章基于改进遗传算法优化BP神经网络的变压器故障诊断第四章基于改进遗传算法优化BP神经网络的变压器故障诊断遗传算法(GeneticAlgorithm,简称GA)是根据达尔文生物进化论中的自然选择和遗传学的原理来模拟生物进化过程的数学计算模型。这是一种具有随机性的搜索方法并具有并行计算、高效率、全局搜索的特点,且不会像其他算法一样受到可微、连续等条件的约束。和自然界的遗传进化类似特定问题可以比喻为自然环境,遗传算法的每一代就好比与生活在这个环境中的自然个体,对于不同的具体问题可以规定一个描述个体适应度的函数来对个体做出评价(也称为个体的环境适应度),能适应环境生存的个体繁殖到下一代,不适应环境的则面临死亡最终被淘汰。经过多少代的遗传筛选后,剩下的个体就成为了最适应这个环境生存的个体,相对于已经淘汰的旧个体具有巨大的优越性,对于该问题的处理也是最佳的求解。4.1算法基本思想遗传算法起源于利用基因编码组成的种群,且该种群拥有一定数量类似于染色体的个体,而这个种群则相当于包含问题的解的解集。在生物学中,基因对个体的本质起决定性的作用,多个基因则组成一个染色体。因此,需要先对对象进行编码,将对象变形为基因型,所以可以用一组特定的数列来表示基因构成。在第一代种群产生之后,个体之间逐代繁衍并进化组成出对环境适应性更高的种群。所以对于特定的问题,需要设置一个有针对性的适应度函数,对每代个体进行适应度的评价并进行基因的交叉和变异操作得到新的基因个体,这些新个体便组成了新的种群。当具体问题中的遗传进化完成的时候,将最终种群中的最优个体进行解码,译码后的个体便是此问题的最优解了。遗传算法有两个已证明的理论依据:模式定理、积木块假设。遗传算法的数学基础是Holland的模式定理[60],定理表明遗传算法最优解的样本曲线可以呈指数增长趋势,这说明GA可以实现对于最优解的全局搜索而很难陷入局部最小值。相比而言,积木块假设则点名了GA可以根据适应度函数在经过各种第四章基于改进遗传算法优化BP神经网络的变压器故障诊断遗传算子操作后,产生最优解。4.2遗传算法的实现依据上述遗传算法的原理,得出GA是一种不断重复迭代以求得最优个体的搜索算法,迭代流程如图4.1所示。群体P(t)反向计算交叉操作变异操作群体P(t+1)解码解集合个体评价(适应度函数)图4.1遗传算法运算过程由图4.1可以看出,遗传算法极少对个体进行单独操作,而主要是对种群进行整体操作,加快了遗传的效率。从图中可知选择、交叉和变异三个算子构成了所有的遗传操作,这些操作算法使得遗传算法区别于其他算法又优越于其他算法。遗传算法中包含以下五个基本要素并且要素构成了GA的核心:(1)参数编码:(2)初始群体设定;(3)适应度函数的设计;(4)遗传操作设计;(5)控制参数设定(主要是指群体大小和使用遗传操作的概率等)[61]。4.2.1参数编码使用遗传算法解决特定问题时,首先需要进行的就是编码,作为GA算法的基础,编码的地位将会逐渐体现出来。编码方法除了决定个体染色体的排列第四章基于改进遗传算法优化BP神经网络的变压器故障诊断顺序之外还对搜索空间的个体基因型与解空间表现型的转换模式有极大的影响。同时,遗传算法中的交叉、变异操作也都是需要以编码为基础进行操作的。所以说参数编码是遗传算法的开端,编码方式直接会影响到算法的速率以及后续运算的精确性。如果编码方式选择的不恰当,就会导致后面进行的交叉、变异等运算产生较大误差,或者产生无解的现象。随着GA的广泛运用,学者们已提出过很多不同的编码方法,下面介绍其中两个比较常用的方法。(1)二进制编码方法对于一般的GA来说,通常采用的编码方式是基于0、1的二进制编码,编码长度并没有确定的数值而是根据解决问题的需要而进行不同的取值。二进制形式编码具有如下的优点:只需要简单离散化处理就可以将问题中的数值进行编码,解码时只需进行逆向操作;二进制的编码中的数字比较少,只有0和1。这样对于交叉及变异操作实现起来就很方便;编码原则是使字符集尽量的小,并使二进制编码的字符在规定的范围内;二进制编码以模式定理为理论基础,便于对算法的理论层面分析。(2)浮点数编码方法与二进制编码类似,个体的基因通过某取值范围的随机浮点数来表示,这种方法即为浮点数编码方法。其中每个个体编码长度就相当于具体问题中的决策参数数量。4.2.2适应度函数设计依据遗传学的原理及“物竞天择,适者生存”的自然法则,在遗传进化的过程中需要用一个标准来考察种群对环境的适应程度,称这个适应的程度为种群的适应度。对于具体的环境,适应能力较强的种群相比于其他种群来说能够繁衍进化的几率更大。这同样也适用于遗传算法,通过设定适应度这个标准来评价优化过程中每个解的适应程度,并使得适应度高的解有更多的生存机会。在解决具体问题应用中通常采用一个函数来评价个体适应能力,称这个函数为适应度函数。适应度评价的一般流程如下所示[62]:(1)首先对具体的样本个体进行编码串的解码,随后便可知道此个体编码前第四章基于改进遗传算法优化BP神经网络的变压器故障诊断的表现形式,即表现型;(2)根据步骤(1)中得到的表现型,利用数学公式进行理论计算得出一个与该个体对应的目标值(3)对于不同类型的优化问题,将步骤(2)中得到的目标值作为参考依据,经过一定程度的函数转换后求解出个体的适应度(例如误差)。4.2.3遗传算法的基本操作4.2.3.1选择算子从上一代个体中选择遗传到下一代群体的优质个体的操作就是选择算子。上一代的种群通过某种手段决胜出最优个体后该个体遗传到下一代的几率就会更大,其他的适应度较差的个体则被淘汰掉,这样下一代种群的质量得到了大幅度提升,进而提高了种群整体的适应度。选择算子的步骤为:一、求出种群所包含个体的适应度的代数和;二、计算单一个体的相对适应度并作为该个体被选择进化到下一代种群中的依据;三、采用轮盘选择操作,根据每个个体的选择概率确定出该个体被选择操作选中的次数。假设群体大小为M,个体i的适应度值为if,那么个体i即将被选上的几率ip:∑MiiiiffP1=/=(4