第3章人工神经元网络控制论-控制基础智能控制基础引言3.2前向神经网络模型3.6神经网络控制基础3.7非线性动态系统的神经网络辨识3.8神经网络控制的学习机制3.9神经网络控制器的设计3.3动态神经网络模型3.10单一神经元控制法目录引言神经网络控制的优越性神经网络控制器的分类神经网络的逼近能力神经网络是一种具有高度非线性的连续时间动力系统,它有着很强的自学习功能和对非线性系统的强大映射能力,已广泛应用于复杂对象的控制中。神经网络所具有的大规模并行性、冗余性、容错性、本质的非线性及自组织、自学习、自适应能力,给不断面临挑战的控制理论带来生机。神经网络控制的优越性1神经网络可以处理那些难以用模型或规则描述的过程或系统2神经网络采用并行分布式信息处理,具有很强的容错性。3神经网络是本质的非线性系统,可以实现任意非线性映射。4很强的信息综合能力,能够同时处理大量不同类型的输入,能够很好地解决输入信息之间的互补性和冗余性问题;5神经网络的硬件实现愈趋方便,大规模集成电路技术的发展为神经网络的硬件实现提供了技术手段神经网络的稳定性与收敛性问题;神经网络控制系统的稳定性与收敛性问题;神经网络学习算法的实时性;神经网络控制器和辨识器的模型和结构;根据神经网络在控制器中的作用不同,神经网络控制器可分为两类,一类为神经控制,它是以神经网络为基础而形成的独立智能控制系统;另一类为混合神经网络控制,它是指利用神经网络学习和优化能力来改善传统控制的智能控制方法,如自适应神经网络控制等。综合目前的各种分类方法,可将神经网络控制的结构归结为以下六类。神经网络控制器的分类神经网络控制器的分类逆控制器自适应网络控制器前馈控制结构自适应评价网络混合控制系统神经网络控制器(1)导师指导下的控制器XUY专家经验控制器动力学系统动力学系统神经网络UYX利用专家经验图3-2-1导师指导下的神经控制结构图动力学系统神经网络YYUd动力学系统UYYdF-1Y=FU图3-2-2逆控制器的结构图网络控制器N神经网络N参考模型非线性系统ryecipmceecpyyiu++--图3-2-3自适应网络控制结构图学习样本取自于专家经验输入来自传感器,输出为控制信号缺点是静态过程缺乏在线学习机制系统为根据视觉信息对机械手臂进行控制,使其能够准确地对不规则形状物体进行抓举。系统组成:(1)神经网络控制器NC为一块嵌入式DSP处理器,神经网络算法根据上述原理由程序实现。(2)对象P为被控对象机械臂,其各关节驱动电机的信号线与NC输出端相连,作为神经网络的输出。(1)导师指导下的控制器(3)系统的输入为机器视觉信息经转化后的数字信号(多维),其中包含了物体的位置和形状信息;输出为机械臂各部分的位置电信号及传感器信号(多维)。(4)NC包含训练引脚,其与有人手控制的机械臂的驱动信号相连。该信号作为以人为导师的导师值训练信号。(1)导师指导下的控制器(1)导师指导下的控制器(2)逆控制器XUY专家经验控制器动力学系统动力学系统神经网络UYX利用专家经验图3-2-1导师指导下的神经控制结构图动力学系统神经网络YYUd动力学系统UYYdF-1Y=FU图3-2-2逆控制器的结构图网络控制器N神经网络N参考模型非线性系统ryecipmceecpyyiu++--图3-2-3自适应网络控制结构图神经网络的训练目的是逼近系统的逆动力学模型,Yd期望输出作为神经网络输入以便使期望输出与对象实际输出之间的传递函数为1,则被控对象的输出为期望输出。(3)自适应网络控制器模型参考自适应网络控制器XUY专家经验控制器动力学系统动力学系统神经网络UYX利用专家经验图3-2-1导师指导下的神经控制结构图动力学系统神经网络YYUd动力学系统UYYdF-1Y=FU图3-2-2逆控制器的结构图网络控制器N神经网络N参考模型非线性系统ryecipmceecpyyiu++--图3-2-3自适应网络控制结构图利用神经网络代替线性系统中的线性处理单元控制误差反馈到控制器进行修改使误差最小(4)前馈控制结构基于鲁棒性问题提出反馈的目的在于提高抗随机扰动的能力非线性成分由网络控制器完成难点是如何在系统模型未知条件下找到有效的学习方法(4)前馈控制结构(4)前馈控制结构(4)前馈控制结构(4)前馈控制结构(4)前馈控制结构(4)前馈控制结构(5)神经网络自适应评价控制通常由两个单元组成:搜索单元和自适应评价单元。自适应评判网络通过不断的奖励、惩罚等再励学习,使自己逐渐成为一个合格的“教师”,学习完成后,根据系统目前的状态和外部激励反馈信号产生一个内部再励信号,以对目前的控制效果作出评价。(6)神经网络混合控制该控制方法是集成人工智能各分支的优点,由神经网络技术与模糊控制、专家系统等相结合而形成的一种具有很强学习能力的智能控制系统。由神经网络和模糊控制相结合构成模糊神经网络,由神经网络和专家系统相结合构成神经网络专家系统。神经网络混合控制可使控制系统同时具有学习、推理和决策能力。神经网络的逼近能力相关结论:含一个隐层以上的多层前向传播神经网络不仅可以以任意精度逼近连续函数本身,还可以逼近函数的导数项。引言3.2前向神经网络模型3.6神经网络控制基础3.7非线性动态系统的神经网络辨识3.8神经网络控制的学习机制3.9神经网络控制器的设计3.3动态神经网络模型3.10单一神经元控制法目录辨识基础3.7.2神经网络辨识模型的结构3.7.3非线性动态系统的神经网络辨识3.7非线性动态系统的神经网络辨识L.A.Zadeh曾经下过这样的定义:“辨识是在输入和输出数据的基础上,从一组给定的模型中,确定一个与所测系统等价的模型”。使用非线性系统的输入输出数据来训练神经网络可认为是非线性函数的逼近问题。多层前向传播网络能够逼近任意L2非线性函数。(双隐层比单隐层具有更高的逼近精度)3.7.1辨识基础输入输出数据——能够测量到的输入输出模型类——系统的结构等价准则——辨识的优化目标27/68辨识的基本要素模型的选择隐含层数和节点数的选择——多次仿真实验得到(兼顾精确性和复杂性)输入信号的选择时域:激励系统的所有模态频域:足以覆盖系统的频谱(白噪声或伪随机信号)误差准则的选择28/68k))k(e(f)W(E)k(e)]k(e[f2神经网络辨识的特点不要求建立实际系统的辨识格式可以对本质非线性系统进行辨识,非算法式收敛速度不依赖于待辨识系统的维数,只与神经网络本身即其学习算法有关权值在辨识中对应于的模型参数可以用于在线控制29/68辨识基础3.7.2神经网络辨识模型的结构3.7.3非线性动态系统的神经网络辨识3.7非线性动态系统的神经网络辨识神经网络辨识模型的结构逆模型法前向建模法前向建模法所谓前向建模法是利用神经网络来逼近非线性系统的前向动力学模型。动态系统的建模:一个办法是对神经网络本身引入动态环节,如动态回归网络和动态神经元模型。另一个办法是将输入输出的滞后信号加到多层前向网络中形成动态关系。))m-u(ku(k),...,1),n-y(k(y(k),...,f1)(ky~N非线性系统TDITDI神经网络学习规则TDIydyNu+-逆模型法直接法:TDI神经网络学习规则yyNu+-非线性系统TDI待辨识系统的输出作为神经网络的输入,神经网络的输出与动态系统的输入进行比较,相应的输入误差用来训练神经网络存在的问题存在的问题学习过程不一定是目标最优的。(学习样本)一旦非线性系统对应关系不是一对一的,那么不准确的逆模型可能会被建立。克服方法——增加使用已建模的神经网络正向模型TDI逆模型网络N学习规则yyNu+-非线性系统TDI逆模型网络N学习规则yu-+非线性系统前向神经网络辨识基础3.7.2神经网络辨识模型的结构3.7.3非线性动态系统的神经网络辨识3.7非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识前向神经网络具有良好的学习性能利用静态神经网络描述动态系统误差反向传播是一般BP学习算法的精髓动态反向传播的关键是找到反映该动态过程的关系式带时滞的多层感知器网络+动态误差反向回归学习算法37/68并行结构)]1(),...,1(),(),1(ˆ),...,1(ˆ),(ˆ[)1(ˆmkukukunkykykyNky串行结构)]1(),...,1(),(),1(),...,1(),([)1(ˆmkukukunkykykyNky串行结构更稳定根据可分离性和线性性,有4种结构。辨识的两种结构含线性部分的辨识问题(模型1、2)模型1)]1mk(u),...,1k(u),k(u[g)ik(y)1k(y1n0ii模型2)ik(u)]1nk(y),...,1k(y),k(y[f)1k(y1m0ii线性部分的参数已知TDI逆模型网络N学习规则yyNu+-非线性系统TDI神经网络101niiz模型①TDI-+y(k+1)y(k+1)uTDI逆模型网络N学习规则yyNu+-非线性系统TDI神经网络模型②TDI-+y(k+1)u101miiz++线性部分的参数未知神经网络模型②TDI-+y(k+1)u101miiz++-+模型①y(k+1)u(k)TDI神经网络W线性部分TDIy(k)y1(k+1)y2(k+1)++c(k+1)线性部分学习方法最小二乘法其中初始条件完全未知时,可取))(ˆ)1()1()(1()(ˆ)1(ˆ2lll