神经网络理论与应用课件第7章神经网络控制论7.1神经网络控制的优越性何谓神经网络控制在控制系统中,采用神经网络技术,对难以描述的复杂非线性对象,进行建模或充当控制器或优化计算或进行推理或故障诊断等,以及同时兼有上述某些功能的适当组合,这样的系统称为基于神经网络的控制系统,称这种方式为神经网络控制。神经网络控制的优越性:神经网络理论与应用课件a)神经网络可以处理难以用模型或规则描述的过程或系统;b)神经网络是本质的非线性系统可实现任何非线性映射;c)神经网络采用并行分布式信息处理方式使其具有很强的容错性;d)神经网络具有很强的信息综合能力;e)神经网络的硬件实现,愈趋方便。神经网络理论与应用课件7.2几种典型的神经网络控制系统a)导师指导下的控制系统F控制器检测、变换器被控对象执行器xguezy-神经网络理论与应用课件F神经网络控制器被控对象执行器guxy在线数据检测器控制器检测、变换器被控对象执行器xguezyF-神经网络理论与应用课件b)逆控制控制器的作用是使对象的输出与期望输出能够保持一致u=f´ydy=fuy=ff´yd若f´=f-1则有ff´=ff-1=1故y=ydf—非线性被控对象的原函数f-1—控制器特性控制器非线性被控对象uydy神经网络理论与应用课件c)神经网络内模控制内模控制系统于1982由E.Cahos等人提出。其中:W0(S)—被控对象传函Wm(S)—内部模型传函Wc(S)—调节器传函X(s)-Wc(s)W0(s)Y(s)Wm(s)-神经网络理论与应用课件当Wm(S)=W0(S)系统为开环控制。当Wm(S)=W0(S)且Wc(S)=W0-1(S)系统为逆控制系统1991年J.Hunt等人把神经网络技术用于非线性对象的内模系统结构中,系统结构为:X(s)-NN控制器非线性对象Y(s)NN估计器-滤波器神经网络理论与应用课件NN估计器—神经网络辨识器,用于辨识非线性对象的逆动态特性d)自适应神经网络控制系统神经网络模型参考自适应控制是由Narendra等人于1990年提出的。直接神经网络模型参考自适应控制系统结构为:y(k)+NN控制器非线性对象yd(k)参考模型-ym(k)ec(k)u(k)神经网络理论与应用课件系统控制的任务是,在确定的序列{yd(k)}作用下使limIy(k)-ym(k)I≤≻0的正小数间接神经网络模型参考自适应控制系统结构为:y(k)+NN控制器非线性对象yd(k)NN辨识器-ym(k)ec(k)u(k)K∞神经网络理论与应用课件神经网络离线辨识结构yN(k)-非线性对象NN辨识器ep(k)u(k)d(k)yp(k)神经网络理论与应用课件e)神经网络前馈控制传统的前馈控制系统结构:X(s)Wc(s)W0(s)Y(s)Wff(s)-Wd(s)E(s)U(s)D(s)神经网络理论与应用课件神经网络前馈补偿系统结构图有负反馈控制的逆控制系统。f)混合控制系统反馈控制器非线性被控对象ueyydNN控制器-神经网络理论与应用课件神经网络技术与其它的智能控制技术相结合构成的混合型控制方式。如模糊神经网络控制系统,神经网络专家控制系统等。神经网络理论与应用课件7.3神经网络控制器的学习方式7.3.1离线学习法对象处于静态离线的状态,神经网络根据被控对象的输入输出数据建立被控对象的逆模型。框架结构图为:y—神经网络的输入uc—神经网络的实际输出u—神经网络的期望输出目标函数为:E=(uc(k)–u(k))2-非线性对象NN控制器ucuy21神经网络理论与应用课件神经网络逆控制系统结构图:存在的问题:a)离线学习结束,神经网络控制器的学习能力就停止,当系统出现随机干扰时逆控制无能为力;b)离线学习训练时,采用的是uc与u的误差平方极小当yd与y不一致时,不能保证的误差平方极小。7.3.2在线学习法非线性对象NN控制器ucydy神经网络理论与应用课件在线学习框架结构图:学习算法:设非线性对象的数学模型为:y=f(u)指标函数为:Ep=[yd(k)—y(k)]2则有:wij(k+1)=wij(k)—=wij(k)—=wij(k)+[yd(k)—y(k)]=21∂wij∂Ep∂y(k)∂Ep∂wij(k)∂y(k)∂wij(k)∂y(k)非线性对象NN控制器uyd-y神经网络理论与应用课件=wij(k)+[yd(k)—y(k)]优点:系统出现随机干扰时,神经网络能够从新修改网络参数使得系统的输出,再次与期望输出靠近。缺点:要求非线性对象的Jacodian矩阵存在7.3.3反馈误差学习法反馈误差学习法的结构框架图:∂u(k)∂y(k)∂wij(k)∂u(k)神经网络理论与应用课件指标函数:EP=[yd(k)—y(k)]2优点:缺点:固定增益控制器(k0)非线性被控对象ueyyd神经网络-2k0神经网络理论与应用课件7.3.4多网络学习法前向模型的多网络学习法框架结构图:y-NN控制器非线性对象ydNN辨识器ymu-神经网络理论与应用课件逆模型的多网络学习法框架结构图:ydy-NN控制器非线性对象NN辨识器uud神经网络理论与应用课件NN辨识器用于辨识出非线性对象的逆模型。目标函数为:Ep=[ud(k)—uk(k)]2ud为参考输入,u=ud时y=yd神经网络理论与应用课件7.4神经网络控制器的设计7.4.1带时滞的BP网络网络结构图:BP网络抽头时滞环节X(k)x(k)x(k-n)x(k-1)y(k)神经网络理论与应用课件7.4.1神经网络直接逆模型控制BP网络控制器的设计直接逆控制时系统的结构图:采用离线学习法实现对非线性对象逆模型逼近的框架结构图:非线性对象NN控制器ucyd神经网络理论与应用课件离线时间动态关系:y(k+1)=f[y(k),…,y(k-n+1),u(k),…,u(k-m)]其中:f—任意非线性函数-非线性对象NN控制器uNuy神经网络理论与应用课件y—输出变量,u—输入变量,n—对象阶数,m—输入信号滞后阶数。表达式可逆有:U(k)=g[y(k+1),…,y(k-n+1),u(k-1),…,u(k-m)]BP网络完成的映射为:uN=∏(X)其中:uN—BP网络的输出,∏—BP网络逼近的逆模型函数g,X—BP网络的输入矢量。X=[y(k+1),…,y(k-n+1),u(k-1),…,u(k-m)]T通过抽头时滞环节,X可转化为:神经网络理论与应用课件X(k,k)=[y(k+1),…,y(k-n+1),u(k-1),…,u(k-m)]TX(k,k-1)=[y(k),…,y(k-n),u(k-2),…,u(k-m-1)]TX(k,k-p)=[y(k-p+1),…,y(k-n-p+1),u(k-p-1),…,u(k-m-1)]T离线训练结构框架图为:神经网络理论与应用课件-非线性对象uN(k)U(k)Y(k+1)Z-1Z-mZ-1Z-n+1BP网络神经网络理论与应用课件BP网络一般采用四层,输入层、输出层节点均采用恒等函数,隐层节点采用S状函数。目标函数为:E(k,p)=Σλp[u(k-p)-uN(k-p)]20≤λp-1≤λp-2≤……..≤λ1≤λ0≤1λp—遗忘因子输出层节点训练误差:j=Σλp[u(k-p)-uN(k-p)]2P=0P-11P=0P-1神经网络理论与应用课件隐层节点的训练误差:j=f´(netj)qwqj权值和阈值的调整量:wij=jojj=j逆控制系统结构图:U(k)非线性对象uN(k)y(k+1)Z-1Z-mZ-1Z-n+1BP网络yd(k+1)神经网络理论与应用课件例7.1在线学习神经网络控制器的设计框架图为:设非线性对象输入、输出的离散时间动态关系为:y(k+1)=故n=3m=1非线性对象NN控制器uyd-yy(k)y(k-1)y(k-2)u(k-1)[y(k-1)-1]+u(k)1+y2(k-1)+y2(k-2)神经网络理论与应用课件输入节点数为:n+1+m=5分别为:yd(k+1),y(k),yd(k-1),y(k-2),u(k-1)选5—25—12—1四层BP网络,输入输出节点特性为恒等函数,隐层节点特性为:f(x)=(1+e-x)-1目标函数为:E=ΣEp=Σλp[yd(k)-y(k)]2学习规则为:wij(k+1)=wil(k)+ηδpjopi其中:δpj=[yd(k)-y(k)]=2P=0P-11dy(k)du(k-1)神经网络理论与应用课件=[yd(k)-y(k)]——输出层训练误差。δpj=opj(1-opj)Σδpkwkj——隐层训练误差选η=0.05yd(k)=Sin2k/100+0.2Sin6k/100仿真实验经过100次在线学习训练后,可使E≤0.005。11+y2(k-2)+y2(k-3)