最优控制中的变分法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第1章最优控制中的变分法第1章最优控制中的变分法本章主要内容:1.1变分的基本概念1.2无约束条件的最优化问题1.3具有等式约束条件的最优化问题1.4应用变分法求解最优控制问题第1章最优控制中的变分法1.1变分的基本概念例1-1最速降线问题最速降线问题对变分学的创立产生过重大影响。确立一条连结定点A(0,0)和定点B(xf,yf)的曲线。使质点在重力作用下从点A滑动到点B所需的时间最短(忽略摩擦和阻力的影响)。解:最速降线问题的示意图如下ftdtxyJ0)11()]([)21(2212gydtdsvmgymv)31(212)()(2222dxgyygydydxgydsdt)41(21)]([02dxgyyxyJfx第1章最优控制中的变分法(1)泛函的概念函数:对于变量x的某一变域中的每一个值,y都有一个值与之相对应,那么变量y称作变量x的函数。记为:y=f(x)x称为函数的自变量自变量的微分:dx=x-x0(增量足够小时)泛函:对于某一类函数y(·)中的每一个函数y(x),变量J都有一个值与之相对应,那么变量J称作依赖于函数y(x)的泛函。记为:J=J[y(x)]y(x)称为泛函的宗量宗量的变分:)()(0xyxyy例1-1问题的本质:泛函极值第1章最优控制中的变分法泛函的连续性:对任意给定的正数ε,总存在另一个正数δ,当则称泛函J[y(x)]在点y0(x)处是连续的。两个函数接近度的概念:k阶接近度时,...)()(,...,)()(,)()()(0)(00xyxyxyxyxyxykk)]([)]([0xyJxyJ零阶接近度一阶接近度第1章最优控制中的变分法线性泛函:泛函J[y(x)]如果满足下列两个条件:)]([)]([)]()([)12121xyJxyJxyxyJ)]([)]([)2xycJxcyJ则称为线性泛函。第1章最优控制中的变分法(2)泛函的变分设泛函J[y(x)]为连续泛函,则泛函增量的线性主部称为泛函的变分:记为:δJ。可以证明,泛函的变分是唯一的。如何求解泛函的变分?借鉴函数f(x)微分的求解:)51()()()()(00xdfdxxfdxdxxfdxxfx与(1-5)类似,可得出泛函J[y(x)]的求解:)61()]()([)]([0xyxyJxyJ第1章最优控制中的变分法例:求下列泛函的变分fttdttxJ0)(2dttxtxdttxtxtxdttxtxtxtxJJffftttttt)()(2|)()]()([2|)]()([|)]()([0000020第1章最优控制中的变分法(3)泛函的极值泛函极值的定义:对于与y0(x)接近的曲线y(x),泛函J[y(x)]的增量则泛函J[y(x)]在曲线y0(x)上达到极值。0)]([)]([0)]([)]([00xyJxyJJxyJxyJJ或泛函极值定理:若可微泛函J[y(x)]在y0(x)上达到极值,则在y=y0(x)上的变分为零。即)71(0J第1章最优控制中的变分法证明如下:根据函数极值的条件,函数φ(ε)在ε=0时达到极值的必要条件为:)91()()]()([)]([0000ddxyεxyJxyJ)81()]()([)(00xyεxyJ)101(0)(0dd比较(1-9)和(1-10),可见:)111(0)]([0xyJ第1章最优控制中的变分法1.2无约束条件的最优化问题1.端点固定的情况了解泛函极值的概念后,再来研究最速降线问题。其目标函数为:不失一般性,可写为:)121()](),(,[0fxdxxyxyxLJ)131()](),(,[0fttdttxtxtLJ问题为:确定一个函数x(t),使J[x(t)]达到极小(大)值。这条能使泛函J[x(t)]达到极值的曲线称为极值曲线(轨线),记作:x*(t)对于端点固定的情况,容许轨线x(t)应满足下列边界条件:)141()()(00ffxtxxtx对(1-13)求取泛函极值的思路:求取泛函的变分(通过泰勒展开,求取泛函增量的线性主部,)第1章最优控制中的变分法容许轨线是由极值曲线微小摄动而成,即)151()()()(*ttxtx)161(0)()(0ftt将(1-15)式代入(1-13))191(]),()(),()([)(0**fttdttttxttxLJ)201(])()()()([)()(00*******ffttttdtLdtRttxLttxLLJJJ)181(]),(),([0***fttdtttxtxLJ)171()()(ttx)211(][0fttdtxxLxxLJ第1章最优控制中的变分法)211(][0fttdtxxLxxLJ对式(1-21)中被积函数第二项分部积分(消去))221()]([)(][0000ffffttttttttxdtxLdtdxLdtxLdtdxxxLdtxxLJ根据泛函极值的必要条件,可得欧拉方程)231(00)]([xxLdtdLxLdtdxL或欧拉方程的展开形式:)241(002222xLxLLLxxLxxxLxtLxLxxxxxtx或x第1章最优控制中的变分法欧拉方程的特殊形式(L不显含t时))261(0)]([)()]([22dtdxxLdtdxLtxtLxLdtdxLdtdx)251(],[xxLL)271(0][xLxLdtd)281(cxLxL第1章最优控制中的变分法再来回顾最速降线问题,其指标函数为:gyyxyxyLLdxgyyxyJfx21)](),([21)]([202代入(1-28)式:)291()1(22122cygyyygyyLyLy整理、简化后可得若用参数法求解,令,可得这是圆滚线的参数方程。.21,12121gccycyctgy)cos1(2)sin(211cycx第1章最优控制中的变分法关于欧拉方程的几点说明:欧拉方程是泛函极值的必要条件,是否充分还需进一步判断。(参见p56“泛函极值的充分条件——勒盖特条件)欧拉方程是二阶微分方程,只有在个别情况下才能得到封闭形式的解。(如最速降线问题)2.端点变动的情况(例如,拦截问题)始点x0在曲线x=φ(x)上变动终点xf在曲线x=ψ(x)上变动第1章最优控制中的变分法端点变动时泛函极值的必要条件:(推导过程略)(1)欧拉方程)301(0)(xLdtdxL(2)横截条件)311(0])([ftxLxL)321(0])([0txLxL)()()(00ffttxxtxftfxtxttx)()()(00第1章最优控制中的变分法x21012t例:确定点A(0,1)至给定直线的最短的曲线方程。tt2)(解:由A至的弧长性能指标为由欧拉方程:积分得,再积分,得通解dtxdxdtds2221)()(dtxtxjft021)]([0)1(2xxdtd,1,122accxcxxbattx)(根据始端条件:根据终端横截条件,得最优轨线方程:1,1)0(bx101)1(1])([22axxxaxLxLftx1)(*ttx第1章最优控制中的变分法1.3具有等式约束条件的最优化问题在最优控制问题中,泛函J[x(t)]所依赖的函数往往会受到—定约束条件的限制。在动态最优化问题中,由于受控系统的数学模型往往用微分方程来描述,所以等式约束就是系统的状态方程。解决具有等式约束条件的最优化问题的基本思路,就是应用拉格朗日乘子法,将有约束条件的泛函极值问题转化为无约束条件的泛函极值问题。1.微分约束ftffxtxxtxtttttutxfx)()(],[)331(]),(),([000问题:已知受控系统状态方程为目标泛函为:)341(]),(),([0fttdtttutxLJ求最优控制u*(t),使系统从初始状态x(t0)转移到终端状态x(tf),其目标函数J取极值。(两点边值问题)第1章最优控制中的变分法这里,为了将有约束条件的泛函极值问题转化为无约束条件的泛函极值问题,可应用拉格朗日乘子法。为此,引入待定的n维拉格朗日乘子向量λ(t),即)351()]()()([)(21Tntttt构造一个新的辅助泛函:)361()]}(]),(),([)[(]),(),([{0'fttTdttxttutxftttutxLJ定义哈密尔顿(Hamilton)函数H:(将分离出去))371(]),(),([)(]),(),([]),(),(),([ttutxftttutxLtttutxHT代入(1-36)式ffttttTdttttutxtxFdtxHJ00]),(),(),(),([)381(}{')(tx第1章最优控制中的变分法多元辅助泛函J’的欧拉方程为:ffttttTdttttutxtxFdtxHJ00]),(),(),(),([)381(}{')391(00xHxFdtdxF)401(0fxHFdtdF)411(00uHuFdtduF协态方程状态方程控制方程正则方程组根据上述三个方程,加上边界条件,可得最优控制问题的唯一确定解思考:,给定,自由时的情况。00)(xtx)(ftxft第1章最优控制中的变分法2.端点等式约束(等式约束的更一般形式)0]),([)()421(],[]),(),([000fffttxxtxtttttutxfx问题:已知受控系统状态方程为目标泛函为:)431(]),(),([]),([0fttffdtttutxLttxJ求最优控制u*(t),使系统从初始状态x(t0)转移到终端状态x(tf),其目标函数J取极值。根据一个微分约束,一个端点约束,共需引入2个拉格朗日乘子向量,构成新的辅助目标泛函:第1章最优控制中的变分法)441()]([]),([]),([~0fttTffTffdtxfLttxvttxJ用分部积分法消去极值的必要条件是一阶变分为零)(txfffttTttTttTdttxtxdttx000)()()()451()}()(]),(),(),([{)()()()(]),([]),([~000fttTTffTffTffdttxtttuttxHtxttxtttxvttxJ0}]ˆ[{]ˆ)[(]ˆˆˆ[)461(~~])(~)([]~[~ˆˆˆˆˆ0dtuHuxHxxvxtdxxHxttvtdtuJuxJxtxJtdxtJdtJTTttttTfttfTfTffTTttffttfffffff第1章最优控制中的变分法)481(xH)471(],,[tuxfHx)491(0uH(2)协态方程(1)状态方程(3)控制方程(极值条件)(4)端

1 / 29
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功