1caetcy第七章第七章动态系统的最优控制方法动态系统的最优控制方法§1最优控制的一般概念§2最优控制中的变分法§3极小值原理及其应用§4线性二次型问题的最优控制caetcy本节主要内容:泛函与变分欧拉方程、横截条件应用变分法求解最优控制问题2caetcy函数:对于变量t的某一变域中的每一个值,x都有一个值与之相对应,那么变量x称为变量t的函数,t称为函数的自变量。记为:自变量的微分:(增量足够小时)自变量是变数!自变量是变数!0ttdt−=()txx=一、泛函与变分一、泛函与变分函数的微分:dx返回前页caetcy泛函:对于某一类函数x(·)中的每一个函数x(t),变量J都有一个值与之相对应,那么变量J称为依赖于函数x(t)的泛函,x(t)称为泛函的宗量。记为:宗量的变分:自变量是函数!自变量是函数!函数的函数!函数的函数!()()tt0xxx−=δ标称函数()[]tJJx=()[]RRtJn→:x()()nRtt∈∀0,xx泛函的变分:Jδ返回前页3caetcy函数自变量的微分下页泛函宗量的变分自变量宗量函数的微分泛函的变分()tx0ttdt−=dxt()[]tJx()tx()()tt0xxx−=δ返回前页JδRRn→比较caetcy一个变速运动物体的动能:()tmvE221=()[]()∫=10dttxtxJ()ttx=()[]21=⇒txJ()ttxcos=()[]1sin=⇒txJ()[]=tvJ()()[]∫=fttdttttLJ0,,ux00ttdtJfttf−==∫最优控制问题的数学模型中,泛函举例泛函举例()[]ffttJ,xϕ=()[]()()[]∫+=fttffdttttLttJ0,,,uxxϕ返回前页4caetcy则称J[x(t)]为线性泛函。如果泛函J[x(t)]:Rn→R满足下列两个条件:()()[]()[]()[]tJtJttJ2121)1(xxxx+=+()[]()[]tJtJxxαα=)2(()()nRtt∈∀21,xx()RRtn∈∈∀α,x线性泛函线性泛函caetcy设J[x(t)]:Rn→R是线性赋范空间Rn中子集D到实数集R上的泛函,D为泛函的定义域。若对于收敛于x0的xn,其中x0、xn∊D,均有()[]()[]tJtJnn0limxx=∞→则称泛函J[x(t)]在x0处连续。若J[x(t)]在子集D上的每一点都连续,则称泛函J[x(t)]在D中连续。范数泛函的连续性泛函的连续性返回5caetcy线性赋范空间线性赋范空间设||·||是定义在Rn上的非负实函数,如果满足:(1)||x||≥0,且||x||=0↔x=0,其中x∈Rn;(2)||k·x||=||k||·||x||,其中k∈R;(3)||x+y||≤||x||+||y||,其中x、y∈Rn;则称||·||为Rn上的向量范数;定义了范数的线性空间称为线性赋范空间。[)∞+=→+,0RRn||·||非负性齐次性三角不等式补充……返回前页caetcy由于泛函J[x(t)]是定义在线性赋范空间上的,对于线性泛函J[x(t)],若()[]()[]tJtJnnxx=∞→lim则线性泛函J[x(t)]是连续的,称为线性连续泛函。范数()nnnRn∈∀∞→→−xxxx,,0必有泛函的连续性泛函的连续性定义1返回前页6caetcyttΔ+泛函的变分泛函的变分函数回忆……2tx=tttΔtΔ()()22ttttx-Δ+=Δ2tx=22tttΔ+Δ=ttΔttΔ2tΔ函数的增量函数x在点t相应于△t的微分ttdxΔ=2关于Δt的高阶无穷小Δt的线性连续函数002→Δ⇒→Δttcaetcy()()()txttxtx-=Δ+Δ()trtAΔ+Δ=关于Δt的高阶无穷小Δt的线性连续函数tAdxΔ=函数的微分函数的增量函数增量的线性主部()00→Δ⇒→Δtrt()txx=()ttxttΔ+⇒Δ+泛函的变分泛函的变分函数回忆……返回前页7caetcy()[]xxxxδδ+⇒+Jt[][][]xxxxJJJ-=δ+Δ[][]xxxxδδ,,rL+=关于δx的高阶无穷小δx的线性连续函数[]xxδδ,LJ=泛函J[x(t)]的变分泛函的增量泛函增量的线性主部[]0,0→⇒→xxxδδr()[]tJJx=泛函的变分泛函的变分泛函返回前页caetcy()[]()∫=102dttxtxJ例如:泛函()[]()[]∫+=+102dtxtxxtxJδδ()[]()[]()[]txJxtxJtxJ−+=Δδ()[]()∫∫−+=102102dttxdtxtxδ()()∫∫+=102102dtxxdttxδδ泛函的增量()∫=102xdttxJδδ泛函的变分返回前页8caetcy定理10-1定理10-1[][]000|,=+∂∂=εεδεδδxxxxJJ泛函变分的求法设J[x(t)]:Rn→R是线性赋范空间Rn上的连续泛函,若在x=x0处J[x(t)]可微,其中x、x0∊Rn,则泛函J[x(t)]的变分为:10≤≤εcaetcy[][]000|,=+∂∂=εεδεδδxxxxJJ10≤≤ε证明:[]00|=+∂∂εεδεxxJ[][][]000xxxxJJJ-=δ+Δ[][]xxxxδδ,,00rL+=[][]xxxxδδδ,,00LJ=[][]εεδε000limxxxJJ-+=→[][]εεδεδεxxxx,,lim000rL+=→关于εδx的高阶无穷小εδx的线性连续函数定理10-1定理10-1泛函的增量泛函的变分变分定义返回9caetcy[][]εεδεδεεεxxxx,lim,lim0000rL→→+=[]00|=+∂∂εεδεxxJ[][]xxxxδδδ,,00LJ=[][]εεδδεεxxxx,,lim000rL+=→泛函的变分[][]000|,=+∂∂=εεδεδδxxxxJJ10≤≤ε证明:定理10-1定理10-1关于εδx的高阶无穷小0=[]xxδ,0L=前页证毕!caetcy例1:求下列泛函的变分()[]()∫=fttdttxtJ02x[]0|=+∂∂=εεδεδxxJJ[]∫=+∂∂=fttdtxxJ002|εεδεδ[]∫=+∂∂=fttdtxx002|εεδε[]∫=+=fttxdtxx00|2εδεδ∫=fttxdtx02δ解:定理10-110caetcy()2121LLLLδδδ+=+的函数,则、、是函数、设21tLLxx&()122121LLLLLLδδδ+=[][]∫∫=babadttLdttL,,,,xxxx&&δδxxδδdtddtd=泛函变分的规则返回caetcy例2:求泛函的变分()[]txLJ=[]0|=+∂∂=εεδεδxxJJ解:[]0|=+∂∂=εεδεδxxLJxdxdLδ=()()[]ttxtxLJ,,&=解:()[]0|,,=++∂∂=εεδεδεδtxtxxxLJ&&xxLδ∂∂=xxL&&δ∂∂+返回11caetcy例2:求泛函的变分[]0|=+∂∂=εεδεδxxJJ()()[]∫=fttdtttxtxLJ0,,&解:()[]0|,,0=∫++∂∂=εεδεδεδfttdttxtxxxLJ&&()[]0|,,0=∫++∂∂=εεδεδεfttdttxtxxxL&&∫⎥⎦⎤⎢⎣⎡∂∂+∂∂=fttdtxxLxxL0&&δδ前页返回caetcy设J[x(t)]:Rn→R是线性赋范空间Rn上的连续泛函,对于与x0(t)接近的宗量x(t),泛函J[x(t)]的增量:()[]()[]00≥−=ΔtJtJJxx或者()[]()[]00≤−=ΔtJtJJxx则称泛函J[x(t)]在x0(t)处达到极小值(或极大值)泛函的极值泛函的极值12caetcy泛函极值的必要条件定理10-2定理10-2设J[x(t)]:Rn→R是线性赋范空间Rn上的连续可微泛函,且在x0(t)处达到极值,则泛函J[x(t)]在x0(t)处的变分为零:[]0,0=xxδδJ返回返回caetcy变分预备定理设g(t)是[t0,tf]上连续的n维向量函数,h(t)是任意的n维连续向量函数,且h(t0)=h(tf)=0。若满足:()()00=∫fttTdttthg则必有:()0g≡t[]fttt,0∈∀13caetcy二、欧拉方程、横截条件二、欧拉方程、横截条件1,无等式约束泛函极值的必要条件返回2,有等式约束泛函极值的必要条件返回caetcy()tx0t考虑泛函极值问题:()[]()∫=ftttdttLJ0,,minxxxx&求x(t),使J[x(t)]=min/max。极值轨线x*(t)1,无等式约束泛函极值的必要条件给定两端时刻t0、tf和状态x(t0)=x0、x(tf)=xf,返回返回()tx*0t()0txft()ftx降线14caetcy()∫⎥⎥⎦⎤⎢⎢⎣⎡+⎟⎠⎞⎜⎝⎛∂∂+⎟⎠⎞⎜⎝⎛∂∂+=fttTTdtLLtL0HOT,,**xxxxxx&&&δδ容许轨线x(t)是由极值轨线x*(t)微小变化而成:解:()()()tttxxxδ+=*()()()tttxxx&&&δ+=*()()00*0xxx==tt()()fffttxxx==*[]()∫=fttdttLJ0,,***xxx&best[][][]**xxxxJJJ−+=Δδ()()∫∫−++=ffttttdttLdttL00,,,,****xxxxxx&&&δδ泰勒展开始端末端()∫−fttdttL0,,**xx&返回前页下页()tx0t()tx*()()()txtxtxδ+=*0t()0txft()ftxcaetcy0HOTfTTttLLJdtδδ⎡⎤∂∂⎛⎞⎛⎞Δ=++⎢⎥⎜⎟⎜⎟∂∂⎝⎠⎝⎠⎢⎥⎣⎦∫xxxx&&泛函变分是泛函增量的线性主部分部积分0fTttLJdtδδ∂⎛⎞=⎜⎟∂⎝⎠∫xxfttTL0|xxδ⎟⎠⎞⎜⎝⎛∂∂+&∫⎟⎠⎞⎜⎝⎛∂∂−fttTdtLdtd0xxδ&∫⎟⎠⎞⎜⎝⎛∂∂−∂∂=fttTdtLdtdL0xxxδ&x&δ消去泛函极值必要条件fttTL0|xxδ⎟⎠⎞⎜⎝⎛∂∂+&0=∂∂−∂∂xx&LdtdL0|0=⎟⎠⎞⎜⎝⎛∂∂fttTLxxδ&欧拉方程横截条件0=Jδ前页必要()任意不受约束xxδt15caetcy0=∂∂−∂∂xx&LdtdL0|0=⎟⎠⎞⎜⎝⎛∂∂fttTLxxδ&欧拉方程横截条件()()0||00=⎟⎠⎞⎜⎝⎛∂∂−⎟⎠⎞⎜⎝⎛∂∂tLtLtTftTfxxxxδδ&&0|00=⎟⎠⎞⎜⎝⎛∂∂+⎟⎠⎞⎜⎝⎛∂∂−∂∂∫ffttTttTLdtLdtdLJxxxxxδδδ&&=()()000==fttxxδδ即横截条件转化为已知边界条件。端点固定时,容许轨线x(t)应满足边界条件:()()ffttxxxx==00返回caetcy关于欧拉方程的几点说明:欧拉方程是泛函极值的必要条件,是否充分还需进一步判断。欧拉方程是时变二阶非线性微分方程,求解所需的两点边界值由横截条件提供。0=∂∂−∂∂xx&LdtdL欧拉方程16caetcy例3:设有泛函[]()()[]∫−=2022πdttxtxJ&x已知边界条件x(0)=0,x(π/2)=2。求使J[x]达到极值的极值轨线x*(t)。()()()txtxxxL22,−=&&解:xxL2−∂∂=xxL&&2=∂∂xxLdtd&&&2=∂∂⇒0=∂∂−∂∂xx&LdtdL欧拉方程0=+xx&&()tCtCtxsincos21*+=x(0)=0,x(π/2)=2x(0)=0,x(π/2)=2()ttxsin2*=012=+r特征方程:βαir±=2,1()()tCtCetxtββαsincos21+=提醒:横截条件?*=J返回caetcy()()[]∫−=2022*πdttxtxJ&()()[]∫−=2022sin2cos2πdttt[]∫−=2022sincos4πdttt()ttxsin2*=[]∫−=2021cos24πdtt∫∫+=2020222cos1cosππdtttdt⎟⎠⎞⎜⎝⎛+=∫∫20202cos21ππtdtdt()20011cos2224dtt