6.1概述6.2研究最优控制的前提条件6.13线性二次型次优控制问题6.12线性二次型最优控制问题6.3静态最优化问题的解6.10双积分系统的时间最优控制6.11动态规划法6.9Bang-Bang控制6.8极小值原理6.4离散时间系统的最优控6.5离散时间系统最优控制的离散化处理6.7用变分法求解连续系统最优控制问题-有约束条件的泛函极值6.6泛函及其极值-变分法6.1概述所谓最优化,原非新鲜概念,人们在从事某项工作时,总是想着采取最合理的方案或措施,以期收到最好的效果,这里就包含着最优化问题。求解动态最优化问题的方法主要有古典变分法,极小(大)值原理及动态规划法等。动态最优化问题可以分为确定性和随机性两大类。在确定性问题中,没有随机变量,系统的参数都是确定的。本书只讨论确定性最优控制问题。对连续时问系统对离散时间系统(6)6.2研究最优控制的前提条件在研究确定性系统的最优控制时,前提条件是:1.给出受控系统的动态描述,即状态方程2.明确控制作用域在工程实际问题中,控制矢量往往不能在空间中任意取值,而必须受到某些物理限制,例如,系统中的控制电压,控制功率不能取得任意大。即要满足某些约束条件,这时,在空间中,把所有满足上式的点的集合,记作:(7)这时,在空间中,把所有满足上式的点的集合,记作:(8)U称为控制集。把满足(9)的称为容许控制。3.明确初始条件通常,最优控制系统的初始时刻是给定的。如果初始状态称固定始端。如果是任意的,则称自由始端。如果必须满足某些约束条件:相应的始端集为:此时,则称为可变始端。4.明确终端条件类似于始端条件,固定终端是指终端时刻和终端状态都是给定的。自由端则是在给定情况下,可以任意取值不受限制。可变终端则是指的情况。其中是由约束条件所形成的一个目标集。5.给出目标泛函,即性能指标对连续时间系统,一般表示为:对离散时间系统,一般表示为:上述形式的性能指标,称为综合型或鲍尔扎型。它由两部分组成,等式右边第一项反映对终端性能的要求,例如对目标的允许偏差、脱靶情况等,称为终端指标函数;第二项中L为状态控制过程中对动态品质及能量或燃料消耗的要求等,称为动态指标函数。若不考虑终端指标函数项则有:这种形式的性能指标称为积分型或拉格朗日型。若不考虑动态指标函数项,则形如:称为终端型或梅耶型。6.3静态最优化问题的解静态最优化问题的目标函数是一个多元普通函数,其最优解可以通过古典微分法对普通函数求极值的途径解决。动态最优化问题的目标函数是一个泛函数,确定其最优解要涉及古典变分法求泛函极值的问题。6.3.1一元函数的极值设为定义在闭区间上的实值连续可做函数,则存在极值点的必要条件是:(21)为极小值点充要条件是:为极大值点充要条件是:因为的极小值和的极大值等效,所以今后所有推导和结论,均以圾小化为准。6.3.2多元函数的极值设元函数这里为维列向量。它取极值的必要条件是:至于取极小值的充要条件,尚需满足:或函数的梯度为零矢量。即下列海赛矩阵为正定矩阵。6.3.3具有等式约束条件的极值上面讲的是无约束条件极值问题的求解方法。对于具有等式约束条件的极值问题,则要通过等效变换,化为无约束条件的极值问题来求解。设罐头桶的几何尺寸:高为半径为则容积为:(29)给定铁皮面积A=常量。要使罐头桶容积为最大,必然要受条件:(30)的约束:解此类问题的方法有多种,如嵌入法(消元法)和拉格朗日乘子法(增元法)等。1.嵌入法先从约束条件式(30)解出一个变量,例如等,然后代入目标函数式(29)得:(31)这样就变成一个没有约束条件的函数式。显然,式(31)取极值的条件为:可解出极值点:又因为故上述极值点为极大值点。罐头桶的最大容积为:2.拉格朗日乘子法6.4离散时间系统的最优控6.4.1基本形式6.4.2具有二次型性能指标的线性系统6.5离散时间系统最优控制的离散化处理式中,为终端代价函数,假定是自由终端。最优控制问题是在式(73)约束条件下,寻求使式(74)为最小。设系统状态方程为:(73)目标函数为:(74)6.6泛函及其极值——变分法6.6.1变分法的基本概念1.泛函变分法是研究泛函极值问题的数学工具。什么叫泛函呢?通俗地说,泛函就是函数的函数。它是普通函数概念的一种扩充。2.泛函的极值3.泛函的变分4.泛函极值定理6.6.2泛函极值的必要条件——欧拉方程求泛函6.6.3多元泛函的极值条件6.6.4可变端点问题6.6.5具有综合型性能泛函的情况6.7用变分法求解连续系统最优控制问题——有约束条件的泛函极值6.7.1拉格朗日问题6.7.2波尔札问题6.8极小值原理定理6.8.1设系统状态方程为:始端条件为:(1)控制约束为:(2)终端约束为:(3)性能泛函为:(4)取哈密顿函数为:(5)则实现最优控制的必要条件是,最优控制、最优轨线和最优协态矢量满足下列关系式:1)沿最优轨线满足正则方程(6)(7)若则为:(8)2)在最优轨线上,与最优控制相应的H函数取绝对极小值,即或(9)3)H函数在最优轨线终点处的值决定于:沿最优轨线,有(10)(11)这就是著名的极小值原理。4)协态终值满足横截条件:(12)5)满足边界条件:(13)6.9Bang-Bang控制定理6·9·l线性定常系统∑=(A,B,C),若存在时间最优控制,则该控制是惟一的。,但都能以证明用反证法。设存在两个控制相同的最小时间广使系统完成从初值到零状态的转移,因此有:令作用下,系统在时刻也将初值转移到原点。即所以w也是最小时间控制,根据前面的结论,都是Bang.Bang控制,又不相等的时刻上,有不是Bang—Bang控制,与w(·)是最优控制矛盾,因此有:这表明控制是惟一的。6.10双积分系统的时间最优控制设双积分系统的状态方程为:求最优控制,把系统从仞态转移到终态,使为极小。6.10.l根据极小值原理确定最优控制列出哈尔密顿函数为使H全局最小.呵得最优控制:由协态方程得:在是一直线,其四种可能形状以及与之相应的,如下图所示。解得:故即显而易见,可供选择的最优控制序列有下列四种:切换次数至多一次。切换时刻为:6.10.2状态轨线及开关曲线6.10.3最优控制律为了使系统的状态能以最小时间从初态转移到终态(0,0)。当初态所划位置不同时,应当采取的控制规律不同。但是,凡不在开关曲线上的点,至少要经过一次切换,转到开关曲线后才能沿着γ+或γ-到达原点(0,0)。因此,按照初态所处的位置可得到下列最优控制规律:若将开关曲线写成:则最优控制律可表示成:6.10.4最优控制律的工程实现6.10.5最优时间计算基本方法是把状态转移轨线按控制序列分成若f段,逐段汁算所需时问然后求和。下面给出的是从初态沿最优轨线到轨线与开关曲线交点的时问,以及从交点沿开关曲线到达原点时间的计算公式在日前情况下,只要把这两段时间加起来,即为状态转移的最小时间。6.11动态规划法动态规划是贝尔曼(Bellman)在20世纪~50年代作为多段(步)决策过程研究出来的,现已在许多技术领域中获得广泛应用。动态规划的核心是最优性原理。6.11.1多段决策问题6.11.2离散系统的动态规划6.11.3连续系统的动态规划利用动态规划最优性原理,可以推导出能泛函为极小应满足的条件—哈密尔顿—雅可比方程。即综上所述,可将连续型动态规划求解最优控制问题的步骤归纳如下:1)构造哈密尔顿函数:2)由上述条件解出的的函数。3)将代入哈密尔顿一贝尔曼方程,并根据边界条件,解出4)将代回,即得最优控制它是状态变量的函数,据此可实现闭环最优控制。5)将代入状态方程,可进一步解出最优轨线6)再将代人求得最优性能泛函。6.12线性二次型最优控制问题6.12.1二次型性能泛函二次型性能泛函的一般形式如下:6.12.2有限时间状态调节器问题状态调节器的任务在于,当系统状态由于任何原因偏离了平衡状态时,能在不消耗过多能量的情况下,保持系统状态各分量仍接近于平衡状态。在研究这类问题时,通常是把初始状态矢量看作扰动,而把零状态取作平衡状态。于是调节器问题就变为寻求最优控制规律u,在有限的时间区间内,将系统从初始状态转移到零点附近,并使给定的性能泛函取极值。6.12.3无限时间状态调节器问题对于无限时间状态调节器,这里要强调以下几点:1)适用于线性定常系统,且要求系统完全能控,而在有限时间状态调节器中则不强调这一点。2)在性能泛函中,由于,而使终端泛函失去了意义,即3)与有限时间状态调节器一样,最优控制也是全状态的线性反馈,结构图也与前面的相同。但是,这里的P是n×n维的实对称常矩阵,是黎卡捉矩阵代数方程的解。因此,构成的是一个线性定常闭环系统。4)闭环系统是渐近稳定的,即系统矩阵的特征值均具负实部,而不论原受控系统A的特征值如何。6.12.4输出调节器问题1.输出调节器的任务是当系统受到外扰时,在不消耗过多能量的前提下,维持系统的输出矢量接近其平衡状态。1.线性时变系统输出调节器问题给定一个能观的线性时变系统:性能泛函为:于是可以用状态调节器上式来确定最优控制:式中,为下列黎卡提距阵微分方程的解:边界条件:给定一个完全能控、能观的线性定常系统:2.线性定常系统输出调节器问题性能泛函为:式中,任意取值;为正定对称矩阵;为正定或半正定矩阵。要求在系统方程约束下,寻求最优控制为:而是下列黎卡提代数微分方程的解:6.12.5跟踪器问题1.线性时变系统跟踪器问题2.线性定常系统6.13线性二次型次优控制问题没完全能控、能观系统的动态方程为:性能指标为二次型:式中,为正定(或半正定)对称阵;为正定对称阵。如上所述,设控制变量是由输出变量的线性负反馈所构成,即闭环系统结构图示如下图所示:从图可得闭环系统的状态方程:(1)式中,为闭环系统的状态矩阵。式中此时,性能指标演化为:(2)在规定了系统结构的情况下,设计任务就是确定输出反馈矩阵K,使性能指标式(2)取极值。对渐近稳定系统式(1),构造一个李雅普诺夫函数:对于渐近稳定的系统,当必须为负定。将上式两边求导数,得:(3)为此,令:(4)式中Q为正定的实对称阵。因此(5)是负定的。比较式(5)和式(3)可得:(6)将式(6)代入式(2),得性能指标:(7)由于A所有特征值均具负实部,故有,从而下式成立:此外,反馈矩阵K亦不能从李雅普诺夫方程:(8)直接求解。因为式(8)中的P和K阵都未知。一个简单的处理方法是用梯度速降法,由式(5)解出用K表示的P,即P【K】,然后代入性能指标式(7),再令:解出使的K。本章完