神经网络控制神经网络控制的优越性神经网络可以处理那些难以用模型或规则描述的过程或系统。神经网络采用并行分布式信息处理,具有很强的容错性。神经网络是本质非线性系统,可实现任意非线性映射。神经网络具有很强的信息综合能力,能同时处理大量不同类型的输入,并能很好解决输入信息之间的互补性和冗余性问题。神经网络的硬件实现愈趋方便。神经网络控制的研究领域基于神经网络的系统辨识①将神经网络作为被辨识系统的模型,可在已知常规模型结构的情况下,估计模型的参数。②利用神经网络的线性、非线性特性,可建立线性、非线性系统的静态、动态、逆动态及预测模型,实现非线性系统的建模和辨识。神经网络控制器神经网络作为实时控制系统的控制器,对不确定、不确知系统及扰动进行有效的控制,使控制系统达到所要求的动态、静态特性。神经网络与其他算法相结合将神经网络与专家系统、模糊逻辑、遗传算法等相结合,可设计新型智能控制系统。3.5.3神经网络控制的研究重点神经网络的稳定性与收敛性问题;神经网络控制系统的稳定性与收敛性问题;神经网络学习算法的实时性;神经网络控制器和辨识器的模型和结构。神经网络控制系统的结构类型神经网络在控制系统中的作用:充当对象的模型、控制器、优化计算环节等。神经网络的结构形式较多,分类标准不统一;对于不同结构的神经网络控制系统,神经网络本身在系统中的位置和功能各不相同,学习方法也不尽相同。几种实际的神经网络控制系统:神经网络监督控制;神经网络直接逆控制;神经网络自适应控制;神经网络内模控制;神经网络预测控制;神经网络自适应评判控制;神经网络混合控制。(1)神经网络监督控制神经网络控制器是前馈控制器,建立被控对象的逆模型;神经网络控制器基于传统控制器的输出,在线学习调整网络的权值,使反馈控制输入趋近于零,从而使神经网络控制器逐渐在控制作用中占据主导地位,最终取消反馈控制器的作用;一旦系统出现干扰,反馈控制器重新起作用。可确保控制系统的稳定性和鲁棒性,有效提高系统的精度和自适应能力。传统控制器对象神经网络控制器+++-期望输出(2)神经网络直接逆控制将对象的神经网络逆模型直接与被控对象串联起来,使期望输出与对象实际输出之间的传递函数为1。缺点:无反馈,用作控制器的神经网络逆模型不准确时,抗干扰能力差,缺乏鲁棒性。两种改进结构方案:对象神经网络控制器神经网络控制器1对象神经网络辨识器2+-神经网络控制器对象评价函数常规控制器对象神经网络估计器+-期望输出神经网络控制器对象稳定的参考模型+-+-期望输出参考模型输入神经网络间接模型参考自适应控制神经网络辨识器向神经网络控制器提供对象的Jacobian信息。神经网络控制器对象参考模型+-+-期望输出神经网络辨识器+-(4)神经网络内模控制正向模型作为被控对象的近似模型,与实际对象并联;控制器与对象的逆有关,可以是对象的逆;滤波器通常为线性的,可提高系统的鲁棒性。蓝色实线为基本原理图,加上绿色虚线后可构成内模控制的一种具体实现。神经网络控制器对象神经网络内模(辨识)+-滤波器+-+-非线性系统的神经网络辨识神经网络辨识基础概念辨识:是在输入和输出数据的基础上,从一组给定的模型中,确定一个与所测系统等价的模型。辨识的三要素:数据:能量测到的被辨识系统的输入/输出数据,是辨识的基础。模型类:要寻找的模型的范围,即所考虑系统的结构。等价准则:辨识的优化目标,用来衡量模型接近实际系统的标准,也称误差准则或损失函数。神经网络辨识用神经网络作为被辨识对象的正模型、逆模型、预测模型等,也称为神经网络建模。说明:①本质上,神经网络辨识的目的是建立所考查对象的模型,因此最简单的情况下,辨识只需利用对象本身的输入输出数据即可。②神经网络建模本身不涉及诸如某一具体控制任务之类的其它目的,因此与作为神经网络控制系统的结构框图相比,辨识的原理结构图要简单得多,只要能完成建模的任务即可;一般地,辨识结构图只涉及对象系统本身和所用的神经网络两大主体。建模的两种基本情况前向建模:建立系统本身的模型,也称正向建模;逆向建模:建立系统的逆模型。正向建模指利用神经网络逼近对象本身的动力学特性。简化结构图:网络与系统并联;输出之差用作训练信号;对网络而言,系统的实际输出构成了期望的导师信号,故为有导师学习;可用多层前馈神经网络实现;可进行离线辨识,也可进行在线辨识。对象神经网络辨识模型+-逆向建模一般而言,建立逆模型对神经网络控制意义重大。直接逆建模简化结构图:可用于离线辨识,也可用于在线辨识。缺点:不是目标导向的,系统输入也不可能预先定义。实际常采用正-逆建模结构。对象神经网络逆模型+-对象神经网络正向模型+-神经网络逆模型+-离线辨识与在线辨识①在线辨识是在对象系统实际运行的过程中进行的,辨识过程要求实时性,即必须在一个采样周期的时间间隔内至少进行一次网络权值的调整;离线辨识则是在取得对象系统的一批输入输出数据后再进行辨识,故辨识过程与实际系统是分离的,无实时性要求。②离线辨识在系统工作前预先完成网络的学习或训练,但输入输出训练集很难覆盖对象所有可能的工作范围、且难以适应系统在工作过程中的参数变化,故最好的辨识方式是:先进行离线训练、再进行在线学习,将离线训练得到的权值作为在线学习的初始权,以加快在线学习的速度。(由于网络具有学习能力,故当被辨识对象的特性变化时,神经网络也能通过不断地调整权值和阈值自适应地跟踪对象系统的变化。)③对于神经网络控制系统,其中的辨识是以系统在闭环控制下所得到的观测数据进行的,因此一般属在线辨识。对于时变系统,则只能使用在线辨识。神经网络建模的考虑因素模型的选择精确性和复杂性的权衡;对神经网络辨识而言,权衡表现为网络隐含层数的选择和隐含层内节点的选择。权衡的有效途径:进行多次仿真实验。输入信号的选择时域上,要求输入信号持续加在系统对象上,以便在辨识时间内充分激励系统的所有模态、反映系统对象的完整动态过程。(这里的输入信号是加在系统上的信号,也将构成神经网络的输入或输出信号)频域上,要求输入信号的频谱覆盖系统的频谱。等价准则的选择等价意味着按照某种误差评价准则,使确定的神经网络模型最好地拟合所关心的被辨识系统的静态或动态特性。系统P+-系统P+-系统P+-用什么类型的神经网络建模?对于静态系统,其输入输出间只是某种非线性映射关系,因此可以直接利用前向神经网络进行建模。对于动态系统,可利用动态神经网络建模,也可利用静态前向神经网络进行建模。一般而言,后者更便于分析,但需要将动态系统的神经网络建模转化为静态系统的神经网络的建模。神经网络辨识的特点(与传统辨识方法相比)神经网络本身作为一种辨识模型,其可调参数反映在网络内部的极值上,无需建立实际系统的辨识格式。借助网络外部的输入/输出数据拟合系统的输入/输出关系,可对本质非线性系统进行辨识。(网络内部隐含着系统的特性)辨识的收敛速度不依赖于被辨识系统的维数,只与神经网络本身所采用的学习算法有关。神经网络具有大量的连接,连接权值构成神经网络模型的参数,通过调节这些权值使网络输出逼近系统输出。神经网络作为实际系统的辨识模型,构成系统的一个物理实现,可用于在线控制。3.6.2非线性静态系统的神经网络辨识非线性动态系统的神经网络辨识动态系统神经网络辨识的两类网络导致两种辨识模型:神经网络辨识模型神经网络辨识模型模型③的动态系统+-++TDLTDL…选取具体结构为1-6-2-1型,则利用上面的学习算法可得到仿真结果为若使用一个神经网络,结构为2-20-10-1型,仿真结果为150次迭代,误差达0.0133300次迭代,误差达23.06神经网络控制的学习机制神经网络控制器的特殊性:控制器的样本信息通常无法预先知道(如:控制器的期望输出通常是系统的最佳控制量,一般无法通过测量获得)。解决控制器的学习问题是关键。神经网络控制器的学习:就是寻找一种有效的途径进行网络连接权阵或网络结构的修改,从而使得网络控制器输出的控制信号能够保证系统输出跟随系统的期望输出。神经网络控制器的学习类别(1)监督式学习(有导师指导下的控制网络学习)外界提供适当形式的导师信号,学习系统根据导师信号与相对应的实际输出量之差调节网络参数。离线学习法在线学习法反馈误差学习法多网络学习法(2)增强式学习(通过某一评价函数指定下的学习)无导师信号,按照环境所提供数据的某些规则或适当的评价函数调节网络参数。(2)再励学习(强化学习)介于上述两种情况之间,外部环境只对输出结果给出评价,而不给出具体答案,学习系统通过强化那些受奖励的动作来改善自身的性能。离线学习对一批实现给定的系统输入输出样本数据进行离线学习,建立系统的一个逆模型,然后用此逆模型进行在线控制。非线性系统神经网络控制器离线学习(建模)在线控制适合静态环境非线性系统神经网络逆模型+-非线性系统+-固定增益控制器非线性系统+++-前向建模多神经网络学习非线性系统+-+-非线性系统+-逆向建模多神经网络学习3.8神经网络控制器的设计直接逆模型神经网络控制器的设计直接神经网络控制器的设计多神经网络自学习控制器的设计3.8.1直接逆模型神经网络控制器的设计神经网络逆模型辨识……对象建立逆模型时神经网络的训练示意图神经网络……对象神经网络控制器直接逆模型网络控制器的控制系统结构示意图(运行于静态参数环境)3.8.2直接神经网络控制器的设计解:构造神经网络结构为5-25-12-1型;直接神经网络控制器的系统结构图为:输出单元线性激励,其余层单元Sigmoid型激励;非线性系统100个周期的学习后,均方误差小于0.005仿真结果:3.8.3多神经网络自学习控制器的设计……对象……根据前面的工作原理和学习算法,可以得到仿真结果为100个周期的学习效果,误差1%思考与习题1.神经元的种类有哪些?其输入输出间的函数关系如何?2.神经网络按连接的拓扑结构和信息流向分别应该如何分类?简述每一类型的特征。3.如何理解有导师学习与无导师学习?4.如何理解神经网络的泛化能力?5.基本BP算法的思想是什么?训练样本的流程如何?主要优点和缺点是什么?6.动态Hopfield网络处理问题的重点是什么?简述DHNN网络用于联想记忆时的两个阶段及其任务?7.神经网络控制的研究领域包括哪些?8.神经网络辨识的两种基本情况是什么?对于一个给定的未知系统,如何选择神经网络进行建模?9.神经网络控制器有导师学习的重点是什么?10.结合神经网络控制在线学习方法的结构图,论述在线学习的思想和系统应满足的条件。11.结合多神经网络自学习控制器的结构图,说明多神经网络自学习控制系统的基本思想、原理和特点。