第一章绪论第一章绪论一、最优控制简介二、最优控制发展过程三、最优控制应用举例四、小结五、本科程主要内容返回主目录一、最优控制简介在生产过程、军事行动、经济活动以及人类的其它有目的的活动中,常需要对被控系统或被控过程施加某种控制作用以使某个性能指标达到最优,这种控制作用称为最优控制。二、最优控制发展过程以后,拉塞尔(LaSalle)发展了时间最优控制的理论,即所谓Bang—Bang控制理论。1953至1957年间美国学者贝尔曼(Bellman)创立了“动态规划”理论,发展了变分学中的哈密顿—雅可比(Hamilton—Jacobi)理论。上世纪五十年代初期布绍(Bushaw)研究了伺服系统的时间最优控制问题。1956至1958年间苏联学者庞特里雅金等创立了“极大值原理”。这两种方法成为了目前最优控制理论的两个柱石。时至今日,最优控制理论的研究无论在深度上和广度上都有了很大的发展,例如发展了对分布参数系统、随机系统、大系统的最优控制理论的研究等等。三、最优控制应用举例例1-1火车快速运行问题。设有一列火车从甲地出发,要求算出容许的控制使其到达乙地的时间最短。火车的运动方程)(tuxm(1-1)()utM(1-2)式中,是火车的质量,是火车的加速度,为使旅客舒适,其值有限制。是产生加速度的控制作用(即推力),其值也应有限制,设x)(tum选择使为最小。)(tu)(uJ初始条件00()xtx0()0xt(1-3)终端条件ffxtx)(0)(ftx(1-4)性能指标00)(ttdtuJfttf(1-5)月球软着陆问题。为了使宇宙飞船在月球表面上实现软着陆(即着陆时速度要为零),要寻求着陆过程中发动机推力的最优控制规律,使得燃料的消耗最少。设飞船的质量为,离月球表面的高度为,飞船的垂直速度为,发动机推力为,月球表面的重力加速度为,设不带燃料的飞船质量为,初始燃料的质量为,则飞船的运动方程可表示为(参见图1-1)()mt()ht()vt()utgMF例1-2图1-1月球软着陆最优控制问题)()(tth)()()(tmtugt)()(tkutm(1-6)式中为比例系数,表示了推力与燃料消耗率的关系。k控制目的是使燃料消耗量最小,即飞船在着陆时的质量保持最大,即)()(ftmuJ为最大。(1-10)atu)(0容许控制(1-9)0)(fth0)(ft终端条件(1-8)00)(hth00)(tFMtm)(0初始条件(1-7)例1-3是初始时刻的商品存货量,且。从的实际意义来看,显然必须选取生产率使得0x00x)(tx0)(tx],0[ftt(1-13)生产计划问题。设表示商品存货量,表示对商品的需求率,是已知函数,表示生产率,它将由计划人员来选取,故是控制变量。满足下面的微分方程)(tx0)(tr)(tu)(tx(1-12)0)0(xx)()()(tutrtx],0[ftt(1-11)其次,生产能力应该有限制,即容许控制为Atu)(0],0[ftt)(trA],0[ftt(1-14)这里表示最大生产率,另外为了保证满足需求,必须有0A由到的总成本为0tftt要求寻找最优控制,使总成本最小。)(tuJ(),(),()()fxtutthutbxt(1-15)ftdtttutxfuJ0]),(),([)((1-16)假定每单位时间的生产成本是生产率的函数,即。设是单位时间储存单位商品的费用,于是,单位时间的总成本为)(tu)(tuh0b四、小结:由上面的例子可见,求解最优控制问题时要给定系统的状态方程,状态变量所满足的初始条件和终端条件,性能指标的形式(时间最短、消耗燃料最小,误差平方积分最小等)以及控制作用的容许范围等。其中,为维状态向量,为维控制向量,为维向量函数,它可以是非线性时变向量函数,也可以是线性定常的向量函数。状态方程必须精确的知道。()Xtn()Utm(),(),fXtUttn用数学语言来比较详细地表达最优控制问题的内容:(1)建立被控系统的状态方程(),(),XfXtUtt(1-17)而到达终端的时刻和状态则因问题而异。ft()fXtn(2)确定状态方程的边界条件。一个动态过程对应于维状态空间中从一个状态到另一个状态的转移,也就是状态空间中的一条轨线。在最优控制中初态通常是知道的,即00()XtX(1-18)()ffXtX(1-19)例如,在流水线生产过程中,是固定的;在飞机快速爬高时,只规定爬高的高度,而是自由的,要求越小越好。终端状态一般属于一个目标集,即ft()ffXtXft0ftt()fXtS当终端状态是固定的,即时,则目标集退化为维状态空间中的一个点。而当终态满足某些约束条件,即()ffXtXn这时处在维状态空间中某个超曲面上。若终态不受约束,则目标集便扩展到整个维空间,或称终端状态自由。()fXtnn(),0ffGXtt(1-20)上述性能指标包括两个部分,即积分指标和终端指标,这种综合性指标所对应的最优控制问题称为波尔扎(Bolza)问题。当只有终端指标时,称为迈耶尔(Mayer)问题;当只有积分指标时,称为拉格朗日(Lagrange)问题。0(),(),fttLXtUttdt(),ffXtt(3)选定性能指标。性能指标一般有下面的形式:J0(),(),(),ftfftJXttLXtUttdt(1-21)性能指标的确定因问题的性质而异。在导弹截击目标的问题中,我们要求弹着点的散布度最小,这时可用终端指标来表示。在快速控制问题时,要求系统从一个状态过渡到另一个状态的时间最短,即,这就是积分指标。fttdt0min性能指标是控制作用的函数,也就是函数的函数,这种以函数为自变量的函数称为泛函,所以又称为性能泛函。有的文献中也把性能指标称为代价函数、目标函数等等。J()UtJ()Ut(4)确定控制作用的容许范围,即是维控制空间中的一个集合。例如,控制飞机的舵偏角是受限制的,控制电机的电流是受限制的,即有。这时控制作用属于一个闭集。当不受任何限制时,称它属于一个开集。下面将看到处理这两类问题的方法是不同的。可称为容许集合,属于的控制则称为容许控制。mmR()UtM()Ut()Ut(1-22)(5)按一定的方法计算出容许控制将它施加于用状态方程描述的系统,使状态从初态转移到目标集中的某一个终态,并使性能指标达到最大或最小,即达到某种意义下的最优。()()UtUt0()Xt()fXtS五、本课程主要内容课程将介绍求解最优控制问题的方法:经典变分法,极大(小)值原理,动态规划法,线性二次型最优控制(系统为线性,指标为状态和控制的二次型),线性二次型高斯控制(系统为线性且有高斯噪声,指标为二次型),奇异最优控制,微分对策控制(系统受双方控制),最优鲁棒控制等。本书还将介绍最优控制的一些基本的数值求解方法,最后介绍一些MATLAB在求解最优控制问题中的应用实例。