第4章最优控制原理与应用最优控制的基本概念最优控制研究的主要问题:根据已建立的被控对象的数学模型,选择一个容许的控制率,使得被控对象按照预定的要求运行,并使给定的某一性能指标达到极小值(或极大值)。从数学观点来看,最优控制研究的问题是:求解一类带有约束条件的泛函极值问题。最优控制问题最优控制问题的一般提法:在满足系统方程的约束条件下,在容许控制域中确定一个最优控制律,使得系统状态从已知初态转移到要求的目标集,并使性能指标达到极值。最优控制的应用类型I.积分型性能指标1.最小时间控制;2.最少能量控制;3.最少燃料控制;II.末值型性能指标III.复合型性能指标0(),(),fttJFxtxttdt0fttJdt01()fmtjtjJutdt0()()ftTtJututdt[(),]ffJxtt0[(),](),(),ftfftJxttFxtxttdt4.1用变分法解最优控制4.1.1泛函与变分4.1.2欧拉方程4.1.3横截条件4.1.4变分法解最优控制问题返回主目录在动态系统最优控制问题中,性能指标是一个泛函,性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面就来列出变分法中的一些主要结果,大部分不加证明,但读者可对照微分学中的结果来理解。4.1.1泛函与变分如果对某一类函数中的每一个函数,有一个实数值与之相对应,则称为依赖于函数的泛函,记为)(tXJ)(tXJ)(tX)(tXJJ粗略来说,泛函是以函数为自变量的函数。(函数的函数)1、泛函:先来给出下面的一些定义。0(),nnnxxnxxR2、泛函的连续性:则lim()()nnJxJx则线性泛函是连续的,称J[x]为线性连续泛函。()JxnR若对于收敛于点x0点列xn,其中x0,xn,均有则称泛函J在x0处连续。对于线性泛函J[x],若0lim()()nnJxJx满足下面条件的泛函称为线性泛函这里是实数,和是函数空间中的函数。XJXJ)()()(YJXJYXJXY3、线性泛函:4、自变量函数的变分:自变量函数的变分是指同属于函数类中两个函数、之差)(tXX)(tX)(1tX)(2tX)()(21tXtXX这里,t看作为参数。当为一维函数时,可用图4-1来表示。)(tXX图4-1自变量函数的变分这里,是的线性泛函,是关于的高阶无穷小,则称为泛函J[x]的变分。可知泛函变分就是泛函增量的线性主部。X当自变量函数有变分时,泛函的增量为)(tXX,,LXXrXXXJXXJJ5、泛函的变分:,LXX,rXXX,JLXX当一个泛函具有变分时,也称该泛函可微。和函数的微分一样,泛函的变分可以利用求导的方法来确定。定理设J[x]是线性赋范空间Rn上的连续泛函,若在x=x0处J[x]可微,则J[x]的变分为000[,][],01JxxJxx证明:由于是的线性连续泛函,又因为是的高阶无穷小,000000000[][][]lim1=lim{[,][,]}=[,]JxxJxJxxLxxrxxJxx泛函变分的规则1212122112(1)()(2)()(3)[,,][,,](4)bbaaLLLLLLLLLLLxxtdtLxxtdtdxdxdtdt举例:可见,计算泛函的变分如同计算函数的微分一样。6、泛函的极值:若存在,对满足的一切X,具有同一符号,则称在处有极值(极大值或极小值)。0*XX)()(*XJXJ)(XJ*XX定理(变分预备定理):设是时间区间[t0,t1]上连续的n维向量函数,是任意的连续n维向量函数,且有,若10()()0tTtttdt则必有()t()t01()()0tt01()0,[,]tttt4.1.2欧拉方程假定t0与tf给定,且初态与末态两端固定。(1)无约束泛函极值的必要条件定理设有如下泛函极值问题:*()xt0()min(),(),fttxtJFxtxttdt(1)已知x(t0)=x0x(tf)=xf,则极值曲线应满足如下欧拉方程0)(xFdtdxF(2)00()()()()0fttfttFFxtxtxx(3)及横截条件)()()(*txtxtx)()()(*txtxtx于是泛函J的增量可计算如下(以下将*号省去)JdttxxFtxxxxFJftt,,,,0022(),()fttFFxxoxxdtxx上式中是高阶项。22[(),()]oxx证明:与之间有如下关系)(tx)(tx根据定义,泛函的变分是的线性主部,即JJfttdtxxFxxFJ0fffttttttvduuvudv000对上式第二项作分部积分,按公式可得ffttttxxFxdtxFdtdxFJ00)((4)J取极值的必要条件是等于零。因是任意的,要使(3-2)中第一项(积分项)为零,必有Jx0)(xFdtdxF(5)(4)式中第二项即为结论中的式(3).举例:利用上面的结论求得(2)有等式约束泛函极值的必要条件定理设有如下泛函极值问题:*()xt0()min((),(),)..((),(),)0fttxtJgxtxttdtstfxtxtt(6)已知x(t0)=x0,x(tf)=xf,则极值曲线应满足如下欧拉方程和横截条件0)(xFdtdxF00()()()()0fttfttFFxtxtxx其中,为拉格朗日函数,是待定拉格朗日乘子。(((),(),,))((),(),)((),(),)TLxtxttgxtxttfxtxtt()ntR4.1.3横截条件(1)末端时刻固定时的横截条件当tf固定时,在x(t0)=x0固定时,横截条件为如果末端状态也固定x(tf)=xf时,边界条件退化为x(t0)=x0,x(tf)=xf;当末端状态自由时,横截条件为0)()(ftttxxFfx(t0)=x0()0fttFxx(t0)=x0(2)末端时刻自由时的横截条件末端受约束时,存在如下近似关系:如果末端自由,则曲线c(t)不存在。设性能指标为容许轨线x(t)与极值曲线x*(t)之间有如下关系(7)当末端由(xf,tf)移动到时,产生如下的泛函增量(,)ffffxxtt(8)将(8)右端的第二项在极值曲线泰勒展开对上式右端的第二项分部积分将以上结果代入(8),取增量的线性主部,得泛函的变分令,得欧拉方程和横截条件:0J(9)(10)(3)末端时刻自由、末端状态变动时的横截条件1)末端状态自由时的横截条件当x(tf)自由时,由(7)可知代入(10)可得到因为任意,所以tf自由、x(tf)自由的横截条件和边界条件为:,ffxt(11)2)末端状态受约束时的横截条件设受约束方程为x(tf)=c(tf),由(7)可知代入(11),并考虑任意,得到tf自由、x(tf)受约束的横截条件和边界条件为ft(11.1)如果t0也自由、x(t0)受约束,即沿着曲线g(t)则应满足以下横截条件000****()()()()(,,)()0(,,)()0fffTtTtxtgtxtctLLxxtgxxLLxxtcxx(11.2)例子:(1)求平面上给定两点A(0,1),B(1,3)间的最短弧长。(2)若B点可沿曲线c(t)=2-t移动,求一连接A、B两点且弧长最短的曲线。对于最短弧长问题,它是泛函在两端固定条件下的变分问题,欧拉方程的解为x=at+b带入边界条件可得解x=2t+1。02[()]1fttJxtxdt201dxdtx(2)属于末端受约束的变分问题,其最短弧长满足与(1)相同的欧拉方程,因此x=at+b,因为初始点没有变化,所以由x(0)=1可得b=1.为了确定参数a,运用横截条件(11.1)可得解得a=1,因此可知极值曲线为.由末端约束条件,可知tf=0.5,带入弧长公式得到最短弧长221(1)01aaaax=t+1()2ffxtt0.50.52002[()]1112Jxtxdtdt不同边界情况下的横截条件4.1.4变分法解最优控制问题系统方程为性能指标为末端状态x(tf)受约束,要求的目标集为最优控制问题是:确定最优控制u*(t)和最优曲线x*(t),使得系统(12)由已知初态x0转移到要求的目标集(14),并使性能指标(13)达到极值。(14)(13)(12)可以利用拉格朗日乘子法将上述有约束条件的泛函极值问题化为无约束条件的泛函极值问题。(,,,)(,,)()(,,)THxutLxuttfxut(15)再引入一个标量函数它称为哈密顿(Hamilton)函数,在最优控制中起着重要的作用。(1)末端时刻固定时的最优解对于如下最优控制问题:无约束且在[t0,tf]上连续,.在[t0,tf]上,f(.),和L(.)连续可微,tf固定。最优解的必要条件为:1)x(t)和满足正则方程,nmxRuR,rRrn(.),(.)()t2)边界条件和横截条件3)极值条件证明:构造广义泛函分部积分则对上式取一次变分,考虑到根据泛函极值的必要条件,可得到结论。当末端时间tf固定,末端状态x(tf)自由时,不存在目标集因此,该下的泛函极值只需将上述结论中的去掉即可。当末端时间tf固定,末端状态x(tf)固定时,正则方程不变,边界条件退化为x(t0)=x0,x(tf)=xf,系统在可控的条件下,极值条件也不变。本例属于末端时刻固定,末端状态受约束的泛函极值问题。Hamilton函数协态方程极值条件状态方程根据初始条件和目标条件可求出c3=c4=0,4c1-9c2=6再根据横截条件可求出c1=(1/2)c2,可求出c1与c2的值。进而获得最优解(2)末端时刻自由时的最优解对于如下最优控制问题:最优解的必要条件为:1)x(t)和满足正则方程()t2)边界条件和横截条件3)极值条件4)在最优曲线末端的Hamilton函数满足证明:构造广义泛函当末端由(xf,tf)移动到时,产生如下的泛函增量将上式在最优轨线展成泰勒级数并取主部,应用中值定理并考虑,可得到(,)ffffxxtt()()TTTaffffffffJxtxtxttxtt将代入上式可得到令得到定理的结论。Page562,表10-2用变分法求最优解的必要条件例子:解:本例属于tf自由,末端状态固定、控制无约束的泛函极值问题。=常数,再由极值条件得由状态方程和初始条件得到利用末态条件得到最后根据末端时刻H的变化率可以求得这样,求得的最优解为2a4.2极小值原理及其应用4.2.1连续系统的极小值原理4.2.2离散系统的极小值原理4.2.3最小时间控制4.2.4最小能量控制返回主目录为解决控制有约束的变分问题,庞特里亚金提出并证明了极小值原理,其结论与经典的变分理论有许多相似之处,而且不要求哈密尔顿函数对控制量连续可微。4.2.1连续系统的极小值原理(1)末端自由时的极小值原理定理对于如下定常系统、末值型性能指标、末端自由、控制受约束的最优控制问题式中为任意分段连续函数;末端状态自由;末端时刻固定或自由。假设f(x,u)和都是自变量的连续可微函数,且在有界集上f(x,u)对变量x满足,nmxRuR()x1212(,)(,),0fxufxuaxxa则对于最优解