智能控制 第3章 人工神经元网络控制论-控制基础

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第3章人工神经元网络控制论-控制基础智能控制基础2/683.1引言3.2前向神经网络模型3.6神经网络控制基础3.7非线性动态系统的神经网络辨识3.8神经网络控制的学习机制3.9神经网络控制器的设计3.3动态神经网络模型3.10单一神经元控制法目录3/683.6.1引言神经网络控制的优越性神经网络控制器的分类神经网络的逼近能力4/68神经网络控制的优越性1神经网络可以处理那些难以用模型或规则描述的过程或系统2神经网络采用并行分布式信息处理,具有很强的容错性。3神经网络神经网络具有是本质的非线性系统4很强的信息综合能力5神经网络的硬件实现愈趋方便5/68神经网络控制器的分类逆控制器自适应网络控制器前馈控制结构自适应评价网络混合控制系统神经网络控制器6/68(1)导师指导下的控制器XUY专家经验控制器动力学系统动力学系统神经网络UYX利用专家经验图3-2-1导师指导下的神经控制结构图动力学系统神经网络YYUd动力学系统UYYdF-1Y=FU图3-2-2逆控制器的结构图网络控制器N神经网络N参考模型非线性系统ryecipmceecpyyiu++--图3-2-3自适应网络控制结构图7/68(2)逆控制器XUY专家经验控制器动力学系统动力学系统神经网络UYX利用专家经验图3-2-1导师指导下的神经控制结构图动力学系统神经网络YYUd动力学系统UYYdF-1Y=FU图3-2-2逆控制器的结构图网络控制器N神经网络N参考模型非线性系统ryecipmceecpyyiu++--图3-2-3自适应网络控制结构图8/68(3)自适应网络控制器模型参考自适应网络控制器XUY专家经验控制器动力学系统动力学系统神经网络UYX利用专家经验图3-2-1导师指导下的神经控制结构图动力学系统神经网络YYUd动力学系统UYYdF-1Y=FU图3-2-2逆控制器的结构图网络控制器N神经网络N参考模型非线性系统ryecipmceecpyyiu++--图3-2-3自适应网络控制结构图9/68(4)前馈控制结构10/683.6.2神经网络的逼近能力相关结论:含一个隐层以上的多层前向传播神经网络不仅可以以任意精度逼近连续函数本身,还可以逼近函数的导数项。11/683.1引言3.2前向神经网络模型3.6神经网络控制基础3.7非线性动态系统的神经网络辨识3.8神经网络控制的学习机制3.9神经网络控制器的设计3.3动态神经网络模型3.10单一神经元控制法目录12/683.7.1辨识基础3.7.2神经网络辨识模型的结构3.7.3非线性动态系统的神经网络辨识3.7非线性动态系统的神经网络辨识13/68L.A.Zadeh曾经下过这样的定义:“辨识是在输入和输出数据的基础上,从一组给定的模型中,确定一个与所测系统等价的模型”。使用非线性系统的输入输出数据来训练神经网络可认为是非线性函数的逼近问题。多层前向传播网络能够逼近任意L2非线性函数。3.7.1辨识基础14/68模型的选择输入信号的选择误差准则的选择k))k(e(f)W(E)k(e)]k(e[f215/683.7.1辨识基础3.7.2神经网络辨识模型的结构3.7.3非线性动态系统的神经网络辨识3.7非线性动态系统的神经网络辨识16/683.7.2神经网络辨识模型的结构逆模型法前向建模法17/68前向建模法所谓前向建模法是利用神经网络来逼近非线性系统的前向动力学模型。1))m-u(ku(k),...,1),n-y(k(y(k),...,f1)(ky~N非线性系统TDITDI神经网络学习规则TDIydyNu+-18/68逆模型法直接法:TDI神经网络学习规则yyNu+-非线性系统TDI19/68存在的问题存在的问题学习过程不一定是目标最优的。一旦非线性系统对应关系不是一对一的,那么不准确的逆模型可能会被建立。克服方法TDI逆模型网络N学习规则yyNu+-非线性系统TDI逆模型网络N学习规则yu-+非线性系统前向神经网络20/683.7.1辨识基础3.7.2神经网络辨识模型的结构3.7.3非线性动态系统的神经网络辨识3.7非线性动态系统的神经网络辨识21/68并行结构)]1(),...,1(),(),1(ˆ),...,1(ˆ),(ˆ[)1(ˆmkukukunkykykyNky串行结构)]1(),...,1(),(),1(),...,1(),([)1(ˆmkukukunkykykyNky根据可分离性和线性性,有4种结构。辨识的两种结构22/68含线性部分的辨识问题(模型1、2)模型1)]1mk(u),...,1k(u),k(u[g)ik(y)1k(y1n0ii模型2)ik(u)]1nk(y),...,1k(y),k(y[f)1k(y1m0ii23/68线性部分的参数已知TDI逆模型网络N学习规则yyNu+-非线性系统TDI神经网络101niiz模型①TDI-+y(k+1)y(k+1)uTDI逆模型网络N学习规则yyNu+-非线性系统TDI神经网络模型②TDI-+y(k+1)u101miiz++24/68线性部分的参数未知神经网络模型②TDI-+y(k+1)u101miiz++-+模型①y(k+1)u(k)TDI神经网络W线性部分TDIy(k)y1(k+1)y2(k+1)++c(k+1)25/68线性部分学习方法最小二乘法其中初始条件完全未知时,可取))(ˆ)1()1()(1()(ˆ)1(ˆ2lllylKllT)()]1()1([)1(lPllKIlPT1)]1()()1()1()[1()()1(llPllllPlKTIP)0(;0)0(ˆ)]1(),...,1(),([)1(222nlylylyl26/68非线性部分学习方法BP学习)l(wo)l(w)1l(wjipipjjijiLayerHidden)Net()w(LayerOutput)Net()ot(pjssjpspjpjpjpj27/68例3-8考虑以下模型:y(k+1)=a·y(k)+b·y(k-1)+g(u)其中a=0.3,b=0.6g(u)=u3+0.3u2-0.4u试辨识该系统28/68解线性部分,采用递推最小二乘学习法非线性部分采用前向传播多层神经网络来逼近。选择神经网络结构为))l(ˆ)1l()1l(y)(1l(K)l(ˆ)1l(ˆT21T)]1l()l(P)1l()1l()[1l()l(P)1l(K)l(P)]1l()1l(KI[)1l(PT00ba)0(ˆ100010)0(ρ,1,8,4,10,0.229/68辨识效果校验输入信号:100...2,1,01002sin)(kkku30/68非线性可分离系统(模型3))]1(),...,1(),([)]1(),...,1(),([)1(mkukukugnkykykyfky31/68BP学习pjLpjpjLpjLpjLpjLpjpjLpjLpjLtoooNettoofNet112111211()()()()()()()()(())(())()pjLpjpjLpjLpjLtoofNet21222()()()()(())()pjrpjrpkrkkjrfNetw1111111()()()()()pjrpjrpkrkkjrfNetw2222121()()()()()32/68例3-9考虑如下非线性离散系统:求:采用双模型法解决该系统的辨识问题。)()(1)()1(32kukykyky33/68两种方法的学习曲线单一模型网络:两模型网络:2,20,10,12,2,6,134/68两模型法的辨识效果35/683.1引言3.2前向神经网络模型3.6神经网络控制基础3.7非线性动态系统的神经网络辨识3.8神经网络控制的学习机制3.9神经网络控制器的设计3.3动态神经网络模型3.10单一神经元控制法目录36/683.8神经网络控制的学习机制神经元控制器的目的在于如何设计一个有效的神经元网络去完成代替传统控制器的作用,使得系统的输出跟随系统的期望输出。为了达到这个目的,神经网络的学习方法就是寻找一种有效的途径进行网络连接权阵或网络结构的修改,从而使得网络控制器输出的控制信号能够保证系统输出跟随系统的期望输出。37/68分类3.8.1监督式学习离线学习法在线学习法反馈误差学习法多网络学习法3.8.2增强式学习38/681.离线学习法适合静态环境39/682.在线学习法适合模型已知的动态环境40/68学习方法采用最速下降法wkwkEwwkykykykwkwkykykykukukwkjijipjijidjijidji()()()(()())()()()(()())()()()()1假设系统的Jacobian矩阵已知41/683.反馈误差学习法适用于非线性系统线性绝对占优条件下的网络学习42/684.多神经网络学习法1前向建模多网络控制43/68多神经网络学习法2逆模型建模的多网络控制结构图非线性系统神線网络控制器Nc+-yyu图3-2-23前向建模多网络控制结构图神经网络控制器Nc非线性系统++-yyu图3-2-24逆模型建模的多网络控制结构图神经网络辨识器NiyM神经网络逆模型辨识器Nyu-idddd44/683.8.2增强式学习利用当前控制是否成功来决定下一次控制该如何走的学习方式。修正的办法是对某一成功的行为进行鼓励,而对不成功的行为进行惩罚。用神经网络来实现时,则可在权值空间进行调整。45/683.1引言3.2前向神经网络模型3.6神经网络控制基础3.7非线性动态系统的神经网络辨识3.8神经网络控制的学习机制3.9神经网络控制器的设计3.3动态神经网络模型3.10单一神经元控制法目录46/683.9.1直接逆模型控制法3.9.2直接网络控制法3.9.3多网络自学习控制法3.9神经网络控制器的设计47/683.9.1直接逆模型控制法训练结构示意图神经网络模型②TDI-+y(k+1)u101miiz++-+模型①y(k+1)u(k)TDI神经网络W线性部分TDIy(k)y1(k+1)y2(k+1)++c(k+1)Z-1Z-n+1Z-1Z-m神经网络对象y(k+1)u(k)uN(k)48/68直接逆模型控制的结构示意图运行于静态参数环境49/683.9.1直接逆模型控制法3.9.2直接网络控制法3.9.3多网络自学习控制法3.9神经网络控制器的设计50/683.9.2直接网络控制法51/68例3-10考虑被控系统假设动力学逆模型成立,为试用直接网络控制法控制。ykykykykukykukykyk()()()()()(())()()()112111112221)]-u(k1),-y(k1),-y(ky(k),1),g[y(ku(k)52/68解构造神经网络结构为Π5,25,12,1。输出单元层的神经元的激励函数为激励函数为非线性被控系统、其余层的神经元为Sigmoid激励元。取η=0.05期望输出为:ykkkd()sin.sin210002610053/68学习公式wkwkoijijpjpi()()1pjddykykdykdukykykykyk(()())()()(()())()()112322pjpjpjpllljoow()1输出层隐含层54/68学习结果100次55/681摄动法2符号函数法3前向神经网络方针模型法4多网络自学习控制法Jacobian矩阵的替代5

1 / 68
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功