第三章极大值原理(MaximumPrinciple)前面介绍的变分法属于经典变分学的内容。经典变分学只能解决容许控制属于开集的一类最优控制问题,而且对轨线x(t)、函数L、f均有连续可微要求。实际工程应用问题中,这些要求一般无法得到满足。为解决容许控制属于闭集的一类最优控制问题,前苏联数学家庞特里亚金(俄文ЛОНТЛЯТИН,英文Pontryagin)受力学中Hamilton原理启发,于1958年提出极大值原理并加以证明。极大值原理将经典变分学推进到现代变分学,成为现代控制理论的重要基石。极大值原理(MaximumPrinciple),或称最大值原理,也有称为极小值原理或最小值原理(MinimumPrinciple)。极大值原理的证明在数学上非常严格,本课程只从工程应用需要的理解程度出发对其进行简单推导。3.1泛函极值的充分条件几个有关定义正常场定义3-1:若(t,x)平面某一区域D上每一点都有曲线族中一条且仅有一条通过,则称曲线族在区域D上形成一个正常场。曲线族上点(t,x)处的切线的角系数称为场在点(t,x)的斜率。中心场定义3-2:若区域D上曲线族的全部曲线都通过一点(t0,x0),即它们形成曲线束,且束心也属于D,同时除束心外,曲线在D内不再相交,曲线布满区域D,则该场为中心场。极值曲线场定义3-3:若正常场或中心场是由某一变分问题的极值曲线族所形成,则称之为极值曲线场。设有泛函若用p(x,t)表示其极值曲线场中极值曲线斜率,则可以证明泛函增量可表示为fttdtttxtxLxJ0]),(),([)(fttdtttxptxtxExJ0]),,(),(),([)(],,[][],,[],,[],,,[tpxLppxtpxLtxxLtpxxE其中称为维尔斯特拉斯E函数。维尔斯特拉斯E函数(WeierstrassErdmannFunction)泛函J在曲线上达到极值的充分条件设泛函J在曲线c上达到极值,可分为弱极值和强极值两种情况,其充分条件分别为:对于弱极值,①曲线c应是满足极值条件的极值曲线;②极值曲线c能够被包含在极值曲线场中;③对于c近旁所有点(x,t)以及近于p(x,t)的值,函数不变号,极小值时E≥0,极大值时E≤0。对于强极值,①曲线c应是满足极值条件的极值曲线;②极值曲线c能够被包含在极值曲线场中;③对于c近旁所有点(x,t)以及任意的值,函数不变号,极小值时E≥0,极大值时E≤0。x),,,(tpxxEx),,,(tpxxE3.2连续系统极大值原理考虑系统状态方程(3-2-1)其中,,m≤n]),(),([)(ttutxftxmnRtuRtx)(,)(初始状态(3-2-2)00)(xtx终态满足(3-2-3)其中,,r≤n。0]),([ffttxrRu(t)属于有界闭集Ω,受不等式≥0(3-2-4)约束,g为p维连续可微函数,p≤m。]),(),([ttutxg求最优控制,满足上列条件,并使性能指标(3-2-5)达到极小值。)(*tufttffdtttutxLttxuJ0)]),(),([]),([)(u(t)有界并受不等式约束,与前面讨论的问题不同。•取可以保证g非负;而由u(t)的分段连续性,有的分段连续性,则进一步有w(t)分段光滑连续。因此,可以采用Lagrange乘子法进行求解。u(t)有界一般可以考虑为是分段连续函数,对不等式约束则要设法转化为等式约束处理。引进新变量Z(t)和w(t),取(3-2-6)(3-2-7)0)(],),(),([)]([02tZttutxgtZ0)(),()(0twtutwgZ2)(tw•分别取Lagrange乘子,,,构造广义性能指标(3-2-8)nRrRpRfttffffadtZtwxgxtwxftwxLttxtttxuJ0]}),,([]),,([),,({]),([)(]),([)(2TTT求其一阶变分有(3-2-12)定义(3-2-9)(3-2-10)则有(3-2-11)其中(3-2-13)),,(),,(),,,(twxftwxLtwxHT]),,([),,,(),,,,,,(2ZtwxgxtwxHtZwxxFTTfttffffadttZwxxFttxtttxuJ0),,,,,,(]),([)(]),([)(TZwxtaJJJJJfftfftttftfttFtttFdttJffffff}{}{TT式(3-2-14)中,由于,则有(3-2-14’)(3-2-15)(3-2-16)ffftxtxx)(fffttfttfxdtxFdtdxFxtxFxxFxxxJ0][)(}{TTTTfftttwdtwFdtdwwFwJ0])(TTfftttZdtZFdtdZZFZJ0])(TT(3-2-14)}][){(}{}{}{00fffffttttftttfxdtxFdtdxFxxFxxxxdtxFxxFxxxJTTTTTTTT由泛函极值必要条件及的任意性,得此泛函极值的必要条件为:欧拉方程:(3-2-17)(3-2-18)(3-2-19)横截条件:(3-2-20)(3-2-21)(3-2-22)(3-2-23)0xFdtdxF0wFdtd0ZFdtd0}{ftffxFxFttTT0}{ftxFxxT0ftwF0ftZF0aJZwxxtff,,,,将代入以上各式,可得泛函极值必要条件为:欧拉方程:(3-2-24)(3-2-25)(3-2-26)横截条件:(3-2-27)(3-2-28)(3-2-29)(3-2-30)xgxHT0}{wgwHdtdT0)(ZdtdT0}{ftffHttT0}{ftxxT0}{ftwgwHT0)(ftZT]),,([),,,(),,,,,,(2ZtwxgxtwxHtZwxxFTT将F函数定义式(3-2-10)代入上式,并考虑由和,有;由和,有,以及在最优轨线上有,所以有再由3.1节中泛函达到极值的充分条件,维尔斯特拉斯E函数在泛函极小值时沿最优轨线非负,即有(3-2-31)0)()()(),,,,,(),,,,,(************ZFZZwFwwxFxxZwxZwxFZwxZwxFETTT0wFdtd0ftwF0wF0ZFdtd0ftZF0ZF),,(2tuxgZ0),,,(),,,(*****twxHtwxHE(3-2-32)0),,,(),,,(*****twxHtwxHE(3-2-32)考虑,上式即(3-2-33)uw),,,(),,,(*****tuxHtuxH或(3-2-33’)),,,(min),,,(*****tuxHtuxHu以上即为极大值原理的简单推导。至此可以将庞特里亚金极大值原理表示为:控制变量u(t)是有第一类间断点的分段连续函数,属于m维空间中的有界闭集Ω,满足不等式约束条件≥0(3-2-4)定理3-1:设系统的状态方程为(3-2-1)]),(),([)(ttutxftx]),(),([ttutxg则为把状态x(t)自初始状态(3-2-2)转移到满足边界条件(3-2-3)的终态,其中tf未知,并使性能指标(泛函)(3-2-5)达到最小值,实现最优控制的条件是:00)(xtx0]),([ffttxfttffdtttutxLttxuJ0)]),(),([]),([)((1)设u*(t)是最优控制,x*(t)为由此最优控制产生的最优轨线,则存在与其相对应的协态向量λ*(t),使x*(t)和λ*(t)满足规范方程组(3-2-34)(2)在最优轨线上与最优控制u*(t)对应的Hamilton函数取最小值(3-2-35)]),(),(),([)(]),(),(),([)(********ttuttxHxtttuttxHtx]),(),(),([min]),(),(),([*****ttuttxHttuttxHu(3)Hamilton函数在最优轨线终点处的值由下式决定(3-2-36)(4)协态向量λ*(t)的终值满足横截条件(3-2-37)0}{ftffttHT(5)状态向量x*(t)满足边界条件(3-2-38)ftfxxt}{)(*T0]),([)(00ffttxxtx3.3极大值原理边界条件的几种典型情况以下几种典型情况的分析将有助于解决实际问题,特别是如何确定解规范方程组的边界条件。(1),固定,tf自由0]),([ffttxffxtx)(由于和不显含tf,由(3-2-36)式有,这为确定tf提供了一个条件;又由(3-2-37)式有,即在终点处对λ无约束。0]),([ffttx0)(]),([ffffxtxttx0ftH)(ft这时,因和已经为规范方程组提供了2n个边界条件,无需λ(t)的任何约束。00)(xtxffxtx)(此时有,h为n-k维连续可微向量函数。因为不显含tf,由(3-2-36)式有。由(3-2-37)式有,即各λi*(t)是的线性组合。(2),受n-k个方程约束,tf自由0]),([ffttx)(ftx)]([]),([ffftxhttx0)]([]),([ffftxhttx0ftHknfknfffftxhtxhtxhtxht2121*])(,;)(,)([)()(T)(fitxh考虑特殊情况,则有knixtxtxhiffifi,,2,1,)()]([knitifi,,2,1,)(*nknitfi,,1,0)(*即状态终值为规范方程组提供n-k个边界条件,其余k个边界条件由协态终值提供。(3),不受约束,tf自由这时,有,,即协态终值为规范方程组提供所需的n个边界条件。0]),([ffttx)(ftx0]),([ffttx0ftH0)(*ft(4),属于动点h(tf),tf自由0]),([ffttx)(ftx这时,x(tf)=h(tf),有,因而,0)()(]),([ffffthtxttx)(*ft)(*fffttttHfTT(5)情况同(4),但tf固定此时不存在,因而横截条件(3-2-36)不存在,即tf不用确定。ft(6)情况同(1)~(4),但0]),([ffttx此时,只需在相应的横截条件方程中增加和项即可。ft)(ftx以上边界条件处理情况同样也适用于经典变分法求解最优控制问题。3.4极大值原理的典型应用之一——最短时间控制最短时间控制又称为快速控制或时间最优控制,其基本特征是在满足一定约束条件前提下,取一控制作用(最优控制),使系统以最短的时间从初始状态转移到给定的终态。的某个终态,并使性能指标(3-4-4)最小。其中,对x,t连续可微,tf未知。(1)最短时间控制问题提法已知系统状态方程(3-4-1