第三章PID神经网络结构及控制器的设计在控制系统中,PID控制是历史最悠久,生命力最强的控制方式,具有直观、实现简单和鲁棒性能好等一系列优点。但近年来随着计算机的广泛应用,智能控制被越来越广泛的应用到各种控制系统中。智能控制方法以神经元网络为代表,由于神经网络可实现以任意精度逼近任意函数,并具有自学习功能,因此适用于时变、非线性等特性未知的对象,容易弥补常规PID控制的不足。将常规PID控制同神经网络相结合是现代控制理论的一个发展趋势。3.1常规PID控制算法和理论基础3.1.1模拟PID控制系统PID(Proportional、IntegralandDifferential)控制是最早发展起来的控制策略之一,它以算法简单、鲁捧性好、可靠性高等优点而梭广泛应用于工业过程控制中。PID控制系统结构如图3.1所示:积分比例微分被控对象—e(t)u(t)c(t)r(t)图3.1模拟PID控制系统结构图它主要由PID控制器和被控对象所组成。而PID控制器则由比例、积分、微分三个环节组成。它的数学描述为:01()()[()()]tpDidetutKetedTTdt(3.1)式中,pK为比例系数;iK为积分时间常数:dK为微分时间常数。简单说来,PID控制器各校正环节的主要控制作用如下:1.比例环节即时成比例地反映控制系统的偏差信号()et,偏差一旦产生,控制器立即产生控制作用,以减少偏差。2.积分环节主要用于消除静差,提高系统的无差度。积分作用的强弱取决于积分时间常数iT,iT越大,积分作用越弱,反之则越强。3.微分环节能反映偏差信号的变化趋势(变化速率),并能在偏差信号值变得太大之前,在系统中引入一个有效的早期修正信号,从而加快系统的动作速度,减少调节时间。具体说来,PID控制器有如下特点:(1)原理简单,实现方便,是一种能够满足大多数实际需要的基本控制器;(2)控制器能适用于多种截然不同的对象,算法在结构上具有较强的鲁棒性,在很多情况下,其控制品质对被控对象的结构和参数摄动不敏感。3.1.2数字PID控制算法在计算机控制系统中,使用的是数字PID控制器,数字PID控制算法通常又分为位置式PID控制算法和增量式PID控制算法。1.位置式PID控制算法由于计算机控制是一种采样控制,它只能根据采样时刻的偏差值计算控制量,故对式(3.1)中的积分和微分项不能直接使用,需要进行离散化处理。按模拟PID控制算法的算式(3.1),现以一系列的采样时刻点kT代表连续时间t,以和式代替积分,以增量代替微分,则可以作如下的近似变换:tkT(0,1,2,3...)k000()()()kktjjetdtTejTTej()()[(1)]()(1)detekTekTekekdtTT(3.2)式中,T表示采样周期。显然,上述离散化过程中,采样周期T必须足够短,才能保证有足够的精度。为了书写方便,将()ekT简化表示()ek成等,即省去T。将式(3.2)代入到(3.1)中可以得到离散的PID表达式为:0(){()()[()(1)]}kDpjITTukKekejekekTT(3.3)或0()()()[()(1)]}kpIDjukKekKejKekek(3.4)式中,k——采样序号,0,1,2...k;()uk——第k次采样时刻的计算机输出值;()ek——第k次采样时刻输入的偏差值;(1)ek——第k次采样时刻输入的偏差值;IK——积分系数,;IpITKKTDK——微分系数,;DDpTKKT对于位置式PID控制算法来说,由于全量输出,所以每次输出均与过去的状态有关,计算时要对误差进行累加,所以运算工作量大。而且如果执行器——计算机出现故障,则会引起执行机构位置的大幅度变化,而这种情况是生产场合不允许的,因而产生了增量式PID控制算法。2.增量式PID控制算法所谓增量式PID是指数字控制器的输出只是控制量的增量。当执行机构需要的是控制量的增量时,可以由式(3.4)导出提供增量的PID控制算式。根据递推原理可得:0(1)(1)()[(1)(2)]}kpIDjukKekKejKekek(3.5)用式(3.4)减去式(3.5),可得()uk[()(1)]pkekek()ikek[()2(1)(2)]dkekekek()pKek()[()(1)]IDKekKekek(3.6)式中,()ek=()(1)]ekek式(3.6)称为增量式PID控制算法。增量式控制算法的优点是误动作小,便于实现无扰动切换。当计算机出现故障时,可以保持原值,比较容易通过加权处理获得比较好的控制效果。但是由于其积分截断效应大,有静态误差;溢出影响大。所以在选择时不可一概而论。为此,可以将PID控制器与其他的算法相结合,对PID控制器进行改进,得到改进型PID控制器。3.2神经网络PID控制器神经网络应用于控制统设计的主要原因是针对系统的非线性、不确定性和复杂性。出于神经网络的适应能力、并行处理能力和鲁棒性,使得采用神经网络的控制系统具有更强的适应性和鲁棒性。这点在神经网络PID控制器中显露无遗。传统的PID调节器则具有结构简单、调整方便和参数整定与工程指标联系密切的优点。但是对于传统PID控制器来说,它也具有一定的局限性:当控制对象不同时,控制器的参数难咀自动调整以适应外界环境的变化,且难于对一些复杂的过程和参数馒时变系统进行有效控制。而将神经网络技术与传统PID控制相结合,则可以在一定程度上解决传统PID控制器不易进行在线实时参数整定等方面的缺陷,充分发挥PID控制的优点。3.2.1神经元PID控制器神经网络PID控制是神经网络应用于PID控制并与传统PID控制器相结合而产生的一种改进型控制方法,是对传统的PID控制的一种改进和优化。传统的PID控制器算式如下:01()()[()()]tpDidetutKetedTTdt(3.1)相应的离散算式为:0()()()[()(1)]}kpIDjukKekKejKekek(3.4)其中,,pIDKKK分别为比例、积分、微分系数,()ek为第k次采样的输入偏差值,()uk为第k次采样时刻的输出值。而它的增量式PID控制算法为:()uk()pKek()[()(1)]IDKekKekek(3.6)根据(3.1)(3.2)式,用一个单神经元构造PID控制器,如图3.2所示:X1(k)X2(k)X3(k)W1W2W3u(k)图3.2神经网络PID控制器其网络的输入为:1()Xk=()ek20()()kjXkj3()()()(1)Xkekekek(3.7)网络的输出为:()uk11223()()()WXkWXkWXk式中,{iW}为控制器的加权系数,相当于PID控制器中的比例、积分、微分系数——,,pIDKKK,但与传统的PID控制器不同的是参数{iW}可以进行在线修正。通过不断调整{iW}从而使之达到最优值{W},从而可以达到改善控制系统的控制性能的目的。3.2.2单神经元自适应PID控制器神经元作为构成神经网络的基本单元,具有自学习和自适应的能力,而且结构简单易于计算。传统的PID调节器也具有结构简单、调整方便和参数整定与工程指标联系密切等特点。将两者结合,便可以在一定程度上解决传统PID调节器不易在线实时整定参数和难于对一些复杂过程和参数慢时变系统进行有效控的不足。用神经元实现的自适应PID控制器结构框图如图3.3所示转换器K过程f1Zu()ukzry()yk1x2x3x1w2w3w图3.2单神经元laid控制器结构框图图中状态转换器的输入反映被控对象及控制设定的状态。转换器的输出为神经面学习控制所需的状态量,控制信号()uk由神经元通过关联搜索和自学习产生。设定输入ry为给定值,y为输出值,经状态变换器转换后成为神经元学习控制所需的状态量123,,xxx。这里:1()()xkek反映了系统误差变化的积累(相当于积分项)2()()xkek反映了误差的变化(相当于比例项)23()()xkek反映了误差变化的一阶差分(相当于微分项)()()()rZkykyk为性能指标或递进信号,为一个教师信号;()iwk为对应于()ixk的加权系数;K为神经元的比例系数,K为大于0的数。那么有:()(1)ukuk31()()iiiKwkxk(3.8)即有:()uk=123[()()()()()()]Kwkekwkekwkek(3.9)试比较(3.4)与(3.9)可以看出PID参数分别为1()PITKwkKT(积分系数),2()pKwkK(比例系数),2()DPTKwkKT(微分系数)。故该神经元控制器具有PID控制器的特性,它通过对加权系数的调整来实现自适应,自组织功能。所以该神经元PID控制器是一类在线自适应PID控制器。这种自适应能力是通过一定的学习规则进行的,而学习规则可以通过计算算法实现,因此神经元PID控制器的性能取决于学习算法的收敛性和自学习能力。如何获得更完善的自学习能力、联想能力的算法是关键。解决好学习算法的快速性和收敛性,便可以大大推进神经网络控制在工业生产过程中的实用化进程。本文中采用Delta学习规则。即(1)()()iiiwkwkrk(3.10)()()iirekxk(3.11)式中,ir——学习(或强化)信号,它随着过程的进行缓慢地衰减。——学习速率,0。该学习规则表示对一个动态特性未知的环境,自适应神经元在教师信号()ek作用下进行强制学习,从而对外界作用作出反映和作用。神经元权系数的学习确保系统的跟踪误差收敛于零。只要跟踪误差存在,学习过程就会使权值变化,从而使误差以最快的速度趋于零。这样就通过关联搜索保证了系统的无静差。只要保证学习算法的收敛性,调节系统就可以实现无静差和快速响应的控制效果。通常学习速率对保证学习的收敛性有很大的关系,要由仿真分析来选择适当的学习速率。为了加快神经元PID控制器的学习速率,通常希望学习速率的取值大一些。在,值选择较大时,为保证上述单神经元P1D控制学习算法的收敛性与鲁棒性,对学习算法进行规范化处理:31()(1)()()iiiukukkwkxk()iwk=31()|()|iiiwkwk111(1)()()()Iwkwkekxk222(1)()()()Pwkwkekxk333(1)()()()Dwkwkekxk式中,,,IpD为积分、比例、微分的学习速率;1()xk=()ek2()xk=()ek3()xk=2()ek=()2(1)(2)ekekek这里对积分(I)、比例(P)、微分(D)分别采用不同的学习速率,,IpD,以便对它们各自的权系数能根据需要分别进行调整。采用不同的学习速率进行学习,可以防止某些项因为相差太大而被淹没,其取值可先由现场实验或仿真来确定。这里选取的一般规则如下:①对于阶跃响应,若输出有大的超调,且多次出现正弦衰减现象,应减少,K维持,,IpD不变;若上升时间长,无超调,应增大K,保持,,IpD不变。②对于阶跃输入,若被控对象产生多次正弦衰减现象,应减少p,其他参数不变。③若被控对象响应特件出现上升时间短、超调过大现象,应减少I,,其他参数不变。④若被控对象上升时间长,增大I又导致超调过大,可适当增加P,,其他参数不变。⑤在开始调整时,D选择较小值,当调整I,P和K,使被控对象具有良好特性时,再逐渐增大D,而其他参数不变,使系统输出基本无波纹。⑥K是系统最敏感的参数。K值的变化,相当于,,PID三项同时变化,应在第一步先调整K,然后根据“②~⑤”项调整规则调整,,IpD。3.3基于BP神经网络参数自学习的PID控制器PID控制要取得好的控制效果,就必须对比例、积分和微分三种控制作用进行调整以形成相互配合又相互制约的关系,这种