2020/3/8中南大学信息科学与工程学院自动化系1最优控制中南大学信息科学与工程学院韩华2008.03第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系2第二章变分法及其在最优控制中的应用2.1变分法简介2.2泛函的变分2.3欧拉方程2.4横截条件2.5泛函局部极值的充分条件2.6等式约束条件下的变分问题2.7利用变分法求解最优控制问题小结第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系32.1变分法简介作为数学的一个分支,变分法(calculusofvariations)的诞生,是现实世界许多现象不断探索的结果:约翰·伯努利(JohannBernoulli,1667-1748)1696年向全欧洲数学家挑战,提出一个难题:“设在垂直平面内有任意两点,一个质点受地心引力的作用,自较高点下滑至较低点,不计摩擦,问沿着什么曲线下滑,时间最短?”这就是著名的“最速降线”问题(TheBrachistochroneProblem)。第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系4它的难处在于和普通的极大极小值求法不同,它要求出一个未知函数(曲线),来满足所给的条件。这问题的新颖和别出心裁引起了很大兴趣.罗比塔(1661-1704)、雅可比·伯努利(1654-1705)、莱布尼茨(1646-1716)和牛顿(1642—1727)都得到了解答。约翰的解法比较漂亮,而雅可布的解法虽然麻烦与费劲,却更为一般化.欧拉(EulerLonhard,1707~1783)和拉格朗日(Lagrange,JosephLouis,1736-1813)发明了这一类问题的普遍解法,从而确立了数学的一个新分支——变分学。第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系5有趣的是,在1690年约翰·伯努利的哥哥雅可比·伯努利曾提出著名的悬链线问题(TheHangingChainProblem),向数学界征求答案,即,固定项链的两端,在重力场中让它自然垂下,问项链的曲线方程是什么。在大自然中,除了悬垂的项链外,我們还可以观察到吊桥上方的悬垂钢索,挂着水珠的蜘蛛网,以及两根电线杆之间所架设的电线,这些都是悬链线(catenary)。第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系6伽利略(Galileo,1564~1643)比贝努利更早注意到悬链线,他猜测悬链线是抛物线,从外表看的确象,但实际上不是。惠更斯(Huygens,1629~1695)在1646年(当时17岁),经由物理的论证,得知伽利略的猜测不对,但那时,他也求不出答案。到1691年,也就是雅可比·伯努利提出悬链线问题的第二年,莱布尼兹、惠更斯(62岁)与约翰·伯努利各自得到了正确答案,所用方法是诞生不久的微积分,具体说是把问题转化为求解一个二阶常微分方程22201()(0)(0)0dydyadxdxyyy第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系7解此方程并适当选取参数,得1()2axaxyeea即为悬链线。悬链线问题本身和变分法并没有关系,雅可比·贝努利随后所证明的“悬挂于两个固定点之间的同一条项链,在所有可能的形状中,以悬链线的重心最低,具有最小势能”,有关悬链线的得几个结论,可以用变分法来证明!第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系8现实生活中的许多现象可以表达为泛函求极值问题,称为变分问题。变分法是处理函数的函数的数学领域,和处理数的函数的普通微积分相对。什么叫泛函?2020/3/8中南大学信息科学与工程学院自动化系92.1泛函的变分一、泛函的定义如果变量J对于某一函数类中的每一个函数x(t),都有一个确定的值与之对应,那么就称变量J为依赖于函数x(t)的泛函,记为:J=J[x(t)]。说明:由于函数的值是由自变量的选取而确定的,而泛函的值是由自变量的函数的选取而确定的,所以将泛函理解为“函数的函数”。又称为泛函的宗量泛函函数)(;)()()(,)(txJtxtxJxttxRJRtxn第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系10例2.1.1函数的定积分10()Jxtdt都是泛函。因为变量J的值是由函数的选取而确定的。2.离散系统1.连续时间系统:221()2()qiJxiui是泛函吗?第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系11例2.1.2在平面上连接给定两点A(ta,xa)和B(tb,xb)的曲线的弧长J是一个泛函,如图2-1所示。当曲线方程x=x(t)(满足x(ta)=xa,x(tb)=xb)给定后,可算出它在A、B两点间的弧长为:221()niiiJtxtA(ta,xa)x(t)B(tb,xb)xot图2-1ΔtiΔxi221()1niiiixttt21battdxdtdt第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系12例2.1.3函数的不定积分dxyt0)(泛函的上述概念,可以推广到含有几个函数的泛函的情况:10)]()([dttytxJ不是泛函。例如第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系13几点说明:1、泛函是映射,是从函数空间到数域的映射。2、泛函的自变量是函数,泛函的自变量称为泛函的宗量。3、容许函数空间:满足泛函的规定条件的宗量的全体所构成的函数空间。4、求函数的极值时,微分或导数起着重要的作用。求泛函的极值时,变分起着类似的作用。我们将求泛函的极值问题称为变分问题,其相应的方法称为变分法。第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系14从例2.1.2可以知道,连接A、B两点的曲线之弧长的泛函,其被积函数是未知函数导数的函数。在一般情况下,被积函数是自变量t,未知函数x(t)及其导数的函数。所以最简单的一类泛函可表示为:21x()xt0[()][(),(),]fttJxtLxtxttdt第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系15二、泛函宗量的变分0()()()xtxtxt(2.1.1)泛函J[x(t)]的宗量x(t)的变分是指在同一函数类中的两个函数间的差:图2-2x(t)x0x0(t)t1t2t第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系16三、泛函的连续性函数相近零阶相近当函数x(t)与x0(t)之差的绝对值,即:∣x(t)-x0(t)∣,t1tt2(2.1.2)对于x(t)的定义域中的一切t(t1tt2)都很小时,称函数x(t)与函数x0(t)是相近的,也称为零阶相近。如图2-3所示。x(t)xot图2-3x0(t)t1t2第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系17一阶相近当函数x(t)与x0(t)之差的绝对值以及它们的一阶导数和之差的绝对值,即(2.1.3)都很小,称函数x(t)与函数x0(t)是一阶相近的,如图2-4所示。()xt0()xt0012()(),()()tttxtxtxtxtx(t)xot图2-4x0(t)t1t2注意:一阶相近的两个函数,必然是零阶相近,反之不成立。第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系18都很小时,称函数x(t)与函数x0(t)是k阶相近的。()()00120()(),()(),()()kkxtxtxtxtxtxttttk阶接近:当(2.1.4)第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系19在不同的函数空间,函数间的距离也不同。•在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:••(2.1.5)00[(),()]max()()atbdxtxtxtxt函数间距离在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:()()0000[(),()]max()(),()(),,()()kkatbdxtxtxtxtxtxtxtxt(2.1.6)显然,式(2.1.5)定量地表示两个函数之间的零阶相近度,而式(2.1.6)定量地表示两个函数之间的k阶相近度。第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系20如果对于任意给定的正数,可以找到这样一个0,当d[x(t),x0(t)](2.1.7)时,存在∣J[x(t)]-J[x0(t)]∣(2.1.8)那么,就说泛函J在点x0(t)处是连续的。根据所采用的函数之间距离定义的不同,是按式(2.1.5)还是式(2.1.6),其对应的泛函分别称为零阶连续泛函或k阶连续泛函。泛函的连续性第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系21四、泛函的常见形式1、线性泛函连续泛函如果满足下列条件:(1)J[x1(t)+x2(t)]=J[x1(t)]+J[x2(t)](2)J[cx(t)]=cJ[x(t)]其中,c是任意常数,就称为线性泛函。例如21[()][()(sin)()]ttJxttxttxtdt21[()][()()()()]ttJxtptxtqtxtdt2[()]()tJxtxt都满足上述两个条件,故均为线性泛函。第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系22连续泛函如果满足下列条件:(1)J[x1(t)]+J[x2(t)]=1/2[J[x1(t)+x2(t)]+J[x1(t)-x2(t)]](2)J[cx(t)]=c2J[x(t)]就称为*****二次型泛函*****。例如011()()()()22ftTTfftJxtFxtxtQxtdt是关于x(t)的二次型泛函,其中F、Q均为对称矩阵。2、二次型泛函第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系23五、泛函的变分变分法(calculusofvariations)是处理函数的函数的数学领域,和处理数的函数的普通微积分相对。譬如,这样的泛函可以通过未知函数的积分和它的导数来构造。变分法最终寻求的是极值函数:它们使得泛函取得极大或极小值。第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系24泛函的变分的定义如果连续泛函J[x(t)]的增量可以表示为:[()][()()][()]JxtJxtxtJxt其中,L[x(t),x(t)]是关于x(t)的线性连续泛函,而r[x(t),x(t)]是关于x(t)的高阶无穷小。L[x(t),x(t)]称为泛函的变分,记为(2.1.9)[(),()]JLxtxt(2.1.10)[(),()][(),()]Lxtxtrxtxt也就是说,泛函的变分是泛函增量的线性主部。当一个泛函具有变分时,即泛函的增量可以用式(2.1.9)来表示时,称该泛函是可微的。第二章变分法及其在最优控制中的应用2020/3/8中南大学信息科学与工程学院自动化系25例如,泛函的增量为:120[()]()Jxtxtdt于是,其变分为:102()()JxtxtdtJxtxtdtxtdt112200[()()]()