第二讲变分法与最优控制主要内容2.1变分法概述2.2无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件2.3等式约束最优化问题2.4变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型(波尔扎)问题2.1变分法概述1、泛函定义2、泛函的连续性3、泛函的极值4、线性泛函5、泛函的变分6、泛函变分的求法7、泛函变分的规则8、泛函极值的条件2.1变分法概述1、泛函定义定义:如果变量y对于某一函数类中的每一个函数x(t),都有一个确定的值与之对应,那么就称变量y为依赖于函数x(t)的泛函,记为:y=J[x(t)]。说明:由于函数的值是由自变量的选取而确定的,而泛函的值是由自变量的函数的选取而确定的,所以将泛函理解为“函数的函数”。【例2.1】是一个泛函。变量J的值是由函数x(t)的选取而确定。当时,有。当时,有。【例2.2】曲线的弧长求:平面上连接给定两点A(x0,y0)和B(x1,y1)的曲线的弧长J。A、B两点间的曲线方程为:y=f(x)A、B两点间的弧长为:A(x0,y0)y=f(x)B(x1,y1)xotdxdxdyJxx1021泛函的上述概念,可以推广到含有几个函数的泛函的情况,例如:10)]()([dttytxJdtttxtxLtxJftt0]),(),([)]([求一般函数极值微分法求泛函极值变分法2、泛函的连续性函数相近(零阶相近)当函数x(t)与x0(t)之差的绝对值,即∣x(t)-x0(t)∣,t1tt2对于x(t)的定义域中的一切t(t1tt2)都很小时,称函数x(t)与函数x0(t)是相近的,也称为零阶相近。x(t)xotx0(t)t1t2一阶相近当函数x(t)与x0(t)之差的绝对值以及它们的一阶导数和之差的绝对值,即t1tt2都很小,称函数x(t)与函数x0(t)是一阶相近的。)(tx)(0tx)()()()(00txtxtxtx和x(t)xotx0(t)t1t2注意:一阶相近的两个函数,必然是零阶相近,反之不成立。K阶相近当t1tt2都很小时,称函数x(t)与函数x0(t)是k阶相近的。)()(,)()(,)()()(0)(00txtxtxtxtxtxkk函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:)()(max)](),([00txtxtxtxdbta)()(,,)()(,)()(max)](),([)(0)(000txtxtxtxtxtxtxtxdkkbta显然,式(2.1)定量地表示两个函数之间的零阶相近度,而式(2.1)定量地表示两个函数之间的k阶相近度。(2.1)(2.2)零阶距离零阶距离函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:)()(max)](),([00txtxtxtxdbta(2.1)零阶距离零阶距离)()(,,)()(,)()(max)](),([)(0)(000txtxtxtxtxtxtxtxdkkbta函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:)()(,,)()(,)()(max)](),([)(0)(000txtxtxtxtxtxtxtxdkkbta函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:)()(,,)()(,)()(max)](),([)(0)(000txtxtxtxtxtxtxtxdkkbta函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:)()(,,)()(,)()(max)](),([)(0)(000txtxtxtxtxtxtxtxdkkbta函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:)()(,,)()(,)()(max)](),([)(0)(000txtxtxtxtxtxtxtxdkkbta函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:)()(,,)()(,)()(max)](),([)(0)(000txtxtxtxtxtxtxtxdkkbta函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:零阶距离零阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离k阶距离函数间距离在不同的函数空间,函数间的距离定义也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:泛函的连续性如果对于任意给定的正数,可以找到这样一个0,当d[x(t),x0(t)]时,存在∣J[x(t)]-J[x0(t)]∣那么,就说泛函J在点x0(t)处是连续的。根据所采用的函数之间距离定义的不同,对应的泛函分别称为零阶连续泛函(2.1)或k阶连续泛函(2.2)。3、泛函的极值如果是在与仅仅具有零阶接近度的曲线的泛函中比较得出的极值,称为强极值。如果是在与具有一阶或一阶以上接近度的曲线的泛函中比较得出的极值,则称为弱极值。)]([0txJ)(0tx)(tx)]([0txJ)(0tx)(tx4、线性泛函连续泛函如果满足下列条件:(1)叠加原理:J[x1(t)+x2(t)]=J[x1(t)]+J[x2(t)](2)齐次性:J[cx(t)]=cJ[x(t)]其中,c是任意常数,就称为线性泛函。例如:21)]()(sin)([)]([ttdttxtttxtxJ21)]()()()([)]([ttdttxtqtxtptxJ2)()]([ttxtxJ都满足上述两个条件,故均为线性泛函。5、泛函的变分宗量的变分若函数x(t)是变量J的自变量函数,则称x(t)为泛函J[x(t)]的宗量函数。宗量的变分是指在同一函数类中的两个宗量函数间的差:)](),([txtxLJ也就是说,泛函的变分是泛函增量的线性主部。当一个泛函具有变分时,称该泛函是可微的。泛函的变分当宗量x(t)有变分时,泛函的增量可以表示为)]([)]()([)]([txJtxtxJtxJ)](),([)](),([txtxrtxtxL其中,L[x(t),x(t)]是关于x(t)的线性连续泛函;r[x(t),x(t)]是关于x(t)的高阶无穷小;L[x(t),x(t)]称为泛函的变分,记为线性主部6、泛函变分的求法定理2-1连续泛函J(x)的变分,等于泛函对α的导数在α=0时的值.即定理2-2连续泛函J(x)的二次变分定义为(证明略)(证明略)7、泛函变分的规则求泛函的变分。【例2.3】8、泛函极值的条件泛函极值的必要条件:定理2-3连续可微泛函J(x)在x0(t)上达到极值的必要条件为:J(x)在x=x0处必有泛函极值的充要条件:定理2-4设可微泛函J(x)存在二次变分,则在x=x0处达到极小值的充要条件为:同理,设可微泛函J(x)存在二次变分,则在x=x0处达到极大值的充要条件为:主要内容2.1变分法概述2.2无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件2.3等式约束最优化问题2.4变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型(波尔扎)问题2.2无约束最优化问题1、无约束固定端点泛函极值必要条件]),(),([ttxtxL问题2-1无约束固定终端泛函极值问题为:其中,及x(t)在[t0,tf]上连续可微,t0及tf固定,nRtx)(求满足上式的极值轨线x*(t)。x(t0)=x0,x(tf)=xf,fttdtttxtxLtxJ0]),(),([)]([]),(),([ttxtxL定理2-5若给定曲线x(t)的始端x(t0)=x0和终端x(tf)=xf,则泛函达到极值的必要条件是,曲线x(t)满足欧拉方程其中x(t)应有连续的二阶导数,则至少应是二次连续可微的。欧拉(Euler)方程(证明略)边界条件0xxLdtdL或欧拉方程的全导数形式在中,第二项为全导数)(txLdtd令),,(txxgxLdtdzxLdtddtdtxLtdtdxxLxdtxdxLxxtLdtdxxxLdtxdxL222202222xLxxxLxxtLxL0xxxxtxxLxLxLL得欧拉方程的全导数形式或【例2.4】求泛函在边界条件下的极值曲线及极值.几种特殊的欧拉方程(可以得到封闭形式的解)•被积函数L不依赖于,即•被积函数L不依赖于x,即•被积函数L不依赖于t,即在这种情况下,欧拉方程的首次积分为其中c是待定的积分常数。实际上,将上式左边对t求全导数,有x),(txLL),(txLL),(xxLLcLxLxxxxxxxxxLxxLxLxLxLxLxLdtd2)(0)(x