第四章最优控制第一节最大值原理第二节其他终结条件第三节变分法与最优控制的比较第四节政治商业周期导入例子•最大化TtdteEU0)(满足)(tEdtdS和0)0(SS)(TS自由S表示资源的储量)(tE表示时间时这种资源的抽取速度t)(SU表示使用资源带来的总效用•状态变量是用来描述某一状态范围内所给定的变量,在状态不变的情况下,状态变量的值也就是一定的。控制变量是引起状态变量变动的变量。变分法是寻求状态变量的最优时间路径,最优控制理论把决定控制变量的最优时间路径作为首要任务。yu自由端点问题(垂直终结线):•最大化TdtuytFV0),,(满足),,(uytfy和)(tu,对于所有的Ay)0()(Ty自由(A、T给定)],0[Tt汉密尔顿函数:),,()(),,(),,,(uytftuytFuytH解决最优控制问题的工具是汉密尔顿函数。包含被积函数加上共积变量与函数的乘积。HFf第一节最大值原理(一)最大值原理),,,(uytHMaxu对于所有的],0[TtHy的运动方程yyH的运动方程0)(T横截条件关于最大化的这种要求称为最大值原理。HuHuac0b1曲线2曲线3曲线曲线1有内部解;曲线2和3有边界解。•最大化TdtuytFV0),,(满足),,(uytfy和0)0(yy(给定)0),,(yuytf根据运动方程:0),,()(yuytft0),,()(0dtyuytftTdtyuytftuytFT0),,()(),,(dtyuytftVT0),,()(所以步骤1推导新的目标泛函证明思路:由原泛涵推导出新泛涵,根据新泛涵推导得到最大值原理的三个条件和一般横截条件。V(二)最大值原理的证明把汉密尔顿函数定义为:),,()(),,(),,,(uytftuytFuytH则新泛函为:dtytdtuytHTT00)(),,,(根据分部积分公式dvuvuvdubtatbtatbtatdttyytdtytTTttT000)()()(dttyyyTTT00)()0()(dtyuytftVT0),,()(dtyuytftuytFT0),,()(),,(00)0()()(),,,(yyTdttyuytHTT新泛函为:123上页推导得到:根据汉密尔顿函数,得:),,()(),,(),,,(uytftuytFuytH),,(uytfH状态变量的运动方程),,(uytfy最大化TdtuytFV0),,(满足),,(uytfy和0)0(yy(给定)推导得到最大值原理的条件之一步骤2推导状态变量的运动方程yHy以上两个方程右边相同,因此左边相等:以上推导得到:)(*tu的邻近路径:)()()(*tptutu)(*ty的邻近路径:)()()(*tqtyty更进一步,如果与都是可变的,则有:TTyTTT*TTyyty*)()(0***)(),(),(,TdttqytputqytH0)0()(yyTT新目标泛函的新形式:TddTTTyddy步骤3推导新目标泛函的另一种形式00)0()()(),,,(yyTdttyuytHTT00)0()()(),,,(yyTdttyuytHTT上页推导得到)(0***)(),(),(,TdttqytputqytH0)0()(yyTT的第一项对求导,得:ddTyHdttqtpuHtqyHTtT)(0)()()(的后两项对求导,得:ddTdTTdyddyTTT)()(TTyyTTT)()(0)()()(0TTtTyTTHdttpuHtqyH令,即(7.28)与(7.29)的和设为零得:0dd(7.28)(7.29)(7.30)步骤4令推导另外两个条件和横截条件0dtd0)()()(0TTtTyTTHdttpuHtqyH(7.30)由于是任意的,因此:)(tq0yHyH推导得到最大值原理的条件之二由于是任意的,因此:)(tp0uH推导得到最大值原理的条件之三由于积分项(即第一项)为零,因此:推导得到最大值原理的一般横截条件0)(TTtyTTH上页推导得到:第二节其他终结条件•固定终结点的横截条件:TyTy)((和给定)TTy水平终结线的横截条件:0][TtH0)(TTtyTTH一般横截条件:(7.30)yt1T2T3TZy0TTyT)(终结曲线的横截条件:终结曲线)(TyT0)()(TTTTHTt0THTt0TtH0)(TTtyTTH一般横截条件:(7.30)一般横截条件:0)(TTtyTTH(7.30)截断垂直终结线:0)(T对于min*yyT情况一情况二对于min*yyT)(minTqyyT0)(Tq令,minyyT0根据库恩塔克条件0)()()(0TTtTyTTHdttpuHtqyHdd0)(TyT0)(T对于min*yyT综合情况一和二:0)(Tmin*yyT0)()(min*TyyTminyyTt情况一情况二0t一般横截条件:0)(TTtyTTH0TtH对于max*TT(7.30)截断水平终结线:情况一情况二综合情况一和二:0TtH对于max*TT0])[(max*TtHTT0TtHmax*TT情况一情况二•例1最大化120Vudt满足yyu和(0)1y(1)0y步骤12()Huyu汉密尔顿函数:20Huu2220Hu()ut的解是最大化H12u(7.39)Hy步骤2()ttke可以得到通解:2()Huyu汉密尔顿函数:(任意)k(7.40)例1最大化120Vudt满足yyu和(0)1y(1)0y步骤31122tyyuyyke12tyyke解方程:该方程属于这种类型。)()(/twytudtdy这里的1)(tutketw21)(和根据标准公式,它的解如下:dtetwcetyudtudt)()(dtekecedttdt1121dtekecettt21ttkece241ttkece41(7.41)把(7.39)和(7.40)代入状态变量的运动方程,得:12u(7.39)()ttke(7.40)以上推导得到:步骤4根据边界条件1)0(y0)1(y和代入,得:ttkecety41)(211ec2214eek把这些代入(7.41)、(7.40)和(7.39)得:tteeeeety222*111)(teeet22*14)(teeetu22*12)(以上推导得到:12u(7.39)()ttke(7.40)ttkecey41(7.41)第三节变分法与最优控制的比较一、最简单的问题TdtuytFV0),,(最大化),,(uytfy满足Ay)0(),()(给定自由TATy和,)(tu],0[Tt对于所有运动方程具有如下简单形式,并且的选择是无约束的。uyu一个特例TdtuytFV0),,(最大化uy满足Ay)0(),()(给定自由TATy把运动方程代入被积函数,我们可以消去,以上最优控制问题可以重新写成变分法问题:uyuTdtyytFV0),,(最大化满足Ay)0(),()(给定自由TATy最优控制问题:二、变分法与最优控制的比较TdtuytFV0),,(最大化uy满足Ay)0(),()(给定自由TATy(7.2)最优控制问题:汉密尔顿函数是:uuytFH),,(最大值原理可列出下列条件:,0uFuH,uHy,yFyH0)(T(7.56)第一个方程可重写为,考虑到第二个方程,它进一步可写为:uFyF(7.57)(7.57)关于求导,得:tyFdtd第三个方程给出了的另一个表达式,因此得:0yyFdtdF欧拉方程上页推导得到:0uFuH当关于最大化汉密尔顿函数时,除了满足一阶条件之外,还要满足二阶必要条件。u022uH)(022uyFFuHyyuu因为上页推导得到这就是勒让德必要条件。最优控制垂直终结线的横截条件:0)(TyF以上推导得到:(7.57)把(7.57)式代入该横截条件,得:0][TtyF这就是变分法垂直终结线的横截条件。最优控制水平终结线的横截条件:0][TtH根据以上例子的汉密尔顿函数,最优控制水平终结线的横截条件可变为:uuytFH),,(0][TtyyFF0][TtuFuy(7.56)把(7.56)和(7.57)式代入该横截条件,得:这就是变分法水平终结线的横截条件。第四节政治商业周期一、选举函数与菲利普斯曲线选举函数:),(pUvv)0,0(pUvv为失业率,为通货膨胀率。Up菲利普斯曲线:aUp)()10,0(a其中,表示预期通货膨胀率。其中,度量执政党的得票能力。v预期通货膨胀率按照适应性预期理论生成:)0()(bpbTrtdtepUv0),(最大化aUp)(满足0)0(),()(0给定自由TT(7.61)最优控制问题:为了定量求解,诺德豪斯假设如下函数形式:二、最优控制问题)(pb和TrtdtehahkUhjU02)(最大化满足0)0(),()(0给定自由TT(7.64)最优控制问题:))1((akUjb和)0(),(2hhpUpUv)10,0,()(akjakUjp(7.62)(7.63)三、最大化汉密尔顿函数TrtdtehahkUhjU02)(最大化满足0)0(),()(0给定自由TT(7.64)最优控制问题:))1((akUjb和))1(()(2akUjbehahkUhjUHrt汉密尔顿函数为:关于控制变量U最大化H,我们有一阶条件:0)2(bkehkUUHrt)(21)(rtbehktU二阶条件:0222rteUH(7.66)因此,(7.66)式的控制路径最大化了汉密尔顿函数。))1(()(2akUjbehahkUhjUHrt汉密尔顿函数:的运动方程:)1(abhaeHrtrthaeab)1(这是一阶非齐次线性微分方程,该方程的特解为:)(abbrBeBhart对应的一阶齐次线性微分