最优控制理论最优控制------绪论数学准备---古典变分法第四章用变分法求解最优控制问题第五章极小值原理及其应用第六章线性二次型问题的最优控制第七章动态规划法最优控制----绪论1.1最优控制发展简史最优控制是系统设计的一种方法。它所研究的中心问题是如何选择控制信号才能保证控制系统的性能在某种意义下最优。一:最优控制的发展第二次世界大战以后发展起来的自动调节原理,对设计与分析单输入单输出的线性定常系统是有效的;然而近代航空及空间技术的发展对控制精度提出了很高的耍求,并且被控制的对象是多输入多输出的,参数是时变的。面临这些新的情况.建立在传递函数基础上的自动调节原理就日益显出它的局限性来。这种局限性首先表现在对于时变系统,传递函数根本无法定义,对多输入多输出系统从传递函数概念得出的工程结论往往难于应用。由于工程技术的需要,以状态空间概念为基础的最优控制理论渐渐发展起来。最优控制理论是现代控制理论的核心,20世纪50年代发展起来的,已形成系统的理论。最优控制理论所要解决的问题是:按照控制对象的动态特性,选择一个容许控制,使得被控对象按照技术要求运转,同时使性能指标达到最优值。二:研究最优控制的方法从数学方面看,最优控制问题就是求解一类带有约束条件的泛函极值问题,因此这是一个变分学的问题:然而变分理论只是解决容许控制属于开集的一类最优控制问题,而在工程实践中还常遇到容许控制属于闭集的一类最优控制问题,这就要求人们研究新方法。在研究最优控制的方法中,有两种方法最富成效:一种是苏联学者庞特里雅金提出的“极大值原理”;另一种是美国学者贝尔曼提出的“动态规划”。极大值原理是庞特里雅金等人在1956至1958年间逐步创立的,先是推测出极大值原理的结论,随后又提供了一种证明方法。动态规划是贝尔曼在1953年至1958年间逐步创立的,他依据最优性原理发展了变分学中的哈密顿-雅可比理论,构成了动态规划。由于电子计算机技术的发展,使得设计计算和实时控制有了实际可用的计算工具,为实际应用—些更完善的数学方法提供了工程实现的物质条件,高速度、大容量计算机的应用,一方面使控制理论的工程实现有了可能,另一方面又提出了许多需要解决的理论课题,因此这门学科目前是正在发展的,极其活跃的科学领域之一。最优控制理论在一些大型的或复杂的控制系统设计中,已经取得了富有成效的实际应用。目前很多大学在自动控制理论课程中已经开始适当增加这方面的内容,而对于自动控制方面的研究生则普遍作为必修课程。求解最优控制问题,可以采用解析法或数值计算法1.2最优控制问题的实例例1.1月球上的软着陆问题飞船靠其发动机产生一与月球重力方向相反的推力u(t),以使飞船在月球表面实现软着陆,要寻求发动机推力的最优控制规律,以便使燃料的消耗为最少。设飞船质量为m(t),高度为h(t),垂直速度为v(t),发动机推力为u(t),月球表面的重力加速度为常数g。设不带燃料的飞船质量为M,初始燃料的总质量为F.初始高度为h0,初始的垂直速度为v0,那么飞船的运动方程式可以表示为:)()()()()()()(tkutmtmtugtvtvth初始条件FMmvvhh)0()0()0(00终端条件0)(0)(fftvth性能指标是使燃料消耗为最小,即约束条件)(0tu)(ftmJ达到最大值我们的任务是寻求发动机推力的最优控制规律u(t),它应满足约束条件,使飞船由初始状态转移到终端状态,并且使性能指标为极值(极大值)。例1—2拦截问题在某一惯性坐标系内,设拦截器质心的位置矢量和速度矢量为:LxLx目标质心的位置矢量和速度矢量为:F(t)为拦截器的推力MxMxMLMLxxvxxx则拦截器与目标的相对运动方程为:ctFmtmtFtavvx)()()()(其中a(t)是除控制加速度外的固有相对加速度,是已知的。初始条件为:000000)()()(mtmvtvxtx终端条件为:任意)(0)(fftvtxefmtm)(从工程实际考虑,约束条件为)(max)(0tFtF如果我们既要求拦截过程的时间尽量短,又要求燃料消耗尽量少,则可取性能指标:fttdttFcJ0)]([1为最小综上所述,所谓最优防天拦截问题,即选择满足约束条件的控制F(t),驱使系统从初始状态出发的解,在某个时刻满足终端条件,且使性能指标为极值(极小值)。1.3最优控制问题的提法在叙述最优控制问题的提法之前,先讨论一些基本概念。1:受控系统的数学模型一个集中参数的受控系统总可以用一组一阶微分方程来描述,即状态方程,其一般形式为:)),(),(()(ttutXftXTnxxxX],,,[21是n维状态向量Tpuuuu],,,[21为p维控制向量)),(),((ttutXf为n维函数向量)),()(),(),()(),(()),()(),(),()(),(()),()(),(),()(),(()),(),(()),(),(()),(),(()),(),(()(2121212122121121ttutututxtxtxfttutututxtxtxfttutututxtxtxfttutXfttutXfttutXfttutXftXpnnpnpnn2:目标集如果把状态视为n维欧氏空间中的一个点,在最优控制问题中,起始状态(初态)通常是已知的,即)0()(0XtX而所达到的状态(末态)可以是状态空间中的一个点,或事先规定的范围内,对末态的要求可以用末态约束条件来表示:0)),((0)),((11ffffttxgttxg满足末态约束的状态集合称为目标集,记为M,即:}0)),((,0)),((,)();({21ffffnffttxgttxgRtxtxM至于末态时刻,可以事先规定,也可以是未知的。有时初态也没有完全给定,这时,初态集合可以类似地用初态约束来表示。3:容许控制在实际控制问题中,大多数控制量受客观条件的限制,只能在一定范围内取值,这种限制通常可以用如下不等式约束来表示:piuutui2,1)(0max或上述由控制约束所规定的点集称为控制域U,凡在t0-tf上有定义,且在控制域U内取值的每一个控制函数u(t)均称为容许控制。4:性能指标通常情况下,最优控制问题的性能指标形如:fttffdtttutxttxJ0)),(),((),()(其中第一项是接近目标集程度,即末态控制精度的度量,称为末值型性能指标。第二项称为积分型性能指标,它能反映控制过程偏差在某种意义下的平均或控制过程的快速性,同时能反映燃料或能量的消耗。5:最优控制的提法已知受控系统的状态方程及给定的初态)),(),(()(ttutXftX)0()(0XtX规定的目标集为M,求一容许控制u(t)∈U,t∈[t0,tf],使系统从给定的初态出发,在tft0时刻转移到目标集M,并使性能指标fttffdtttutxttxJ0)),(),(),(()(为最小。这就是最优控制问题。如果问题有解,记为u*(t),t∈[t0,tf],则u*(t)叫做最优控制(极值控制),相应的轨线X*(t)称为最优轨线(极值轨线),而性能指标J*=J(u*(·))则称为最优性能指标。1.4最优控制的应用类型设计最优控制系统时,很重要的一个问题是选择性能指标,性能指标按其数学形式可分为如下三类:1)积分型性能指标fttdtttutXJ0]),(),([这样的最优控制问题为拉格朗日问题。2)终值型性能指标]),([ffttXJ这种性能指标只是对于系统在动态过程结束时的终端状态提出了要求,而对于整个动态过程中系统的状态和控制的演变未作要求。这样的最优控制问题为迈耶尔问题。3)复合型性能指标fttffdtttutXttXJ0]),(),([]),([这样的最优控制问题为波尔扎问题。通过适当变换,拉格朗日问题和迈耶尔问题可以相互转换。按控制系统的用途不同,所选择的性能指标不同,常见的有:1:最小时间控制fttfdtttJ0102:最小燃料消耗控制粗略地说,控制量u(t)与燃料消耗量成正比,最小燃料消耗问题的性能指标为:fttdttuJ0|)(|3:最小能量控制设标量控制函数u2(t)与所消耗的功率成正比,则最小能量控制问题的性能指标为:fttdttuJ0)(24:线性调节器给定一个线性系统,其平衡状态X(0)=0,设计的目的是保持系统处于平衡状态,即这个系统应能从任何初始状态返回平衡状态。这种系统称为线性调节器。线性调节器的性能指标为:fttniidttxJ012)(加权后的性能指标为:fttniiidttxqJ012)(对u(t)有约束的性能指标为:fttTTdttRututQXtXJ0)]()()()([21式中Q和R都是正定加权矩阵。一般形式,有限时间线性调节器性能指标:fttTTffTdttRututQXtXtFXtXJ0)]()()()([21)()(21无限时间线性调节器性能指标:0)]()()()([21tTTdttRututQXtXJF≥0,Q≥0,R0,均为对称加权矩阵。5:线性跟踪器若要求状态X(t)跟踪或尽可能接近目标轨迹Xd(t),则这种系统称为状态跟踪器,其相应的性能指标为:fttTdTddttRututXtXQtXtXJ0)]()()]()([)]()([21Q≥0,R0,均为对称加权矩阵。若要求系统输出y(t)跟踪或尽可能接近目标轨迹yd(t),则这种系统称为输出跟踪器,其相应的性能指标为:fttTdTddttRututytyQtytyJ0)]()()]()([)]()([21Q≥0,R0,均为对称加权矩阵。除了上述几种应用类型外,根据具体工程实际的需要,还可以选取其他不同形式的性能指标,在选取性能指标时需注意:1)应能反映对系统的主要技术条件要求2)便于对最优控制进行求解3)所导出的最优控制易于工程实现数学准备--古典变分2.1函数极值问题变分法是研究泛函极值的一种经典法。一、变分法的基本概念1.泛函:对于某一类函数集合中的每一个函数x(t),均有一个确定的数J与之对应,那么就称J为依赖于函数x(t)的泛函,记为J=J(x(t))。2.泛函的极值如果泛函在任何一条与接近的曲线上所取的值不小于,即则称泛函在曲线上达到极小值,反之---极大值两个函数接近:(一般变量两方向)但(epsilon为一正的小量),有零阶接近度(k阶接近度)从零阶接近度的曲线得到的极值为强极值,反之,弱极值强极大值弱极大值强极小值弱极小值)(0tx))((0txJ0))(())((0txJtxJJ))((txJ)(0tx|)()(|0txtx|)()(|)(0)(txtxkk))((txJ3.泛函的变分泛函增量可表示为:定义泛函增量的线性部分:也可定义为:0|)]()([txtxJ的高阶无穷小部分的线性部分的变分变量其中)())(),(()())(),(()()(:))(),(())(),(())(())()((txtxtxRtxtxtxLtxtxtxtxRtxtxLtxJtxtxJJ))(),((txtxLJ0000((()())|(()())()1{[(),()]}[(),()]()((),()]limlimlimJJxtxtJxtxtJxLxtxtLxtxtxtLxtxt是线性dttxtxtxtxLdttxtxtxdttxdttxtxJdttxJtfttfttfttfttft)()(2)](),([])()()(2[)()]()([)(0200220024.泛函的极值定理:如果可微函数在上达到