线性二次型最优控制(1/12)第5章线性二次型最优控制对于最优控制问题,极大值原理很好地描述了动态系统的最优控制解的存在性。但对于复杂的控制问题,如非线性系统的控制问题、系统模型与性能指标函数对控制量u(t)不为连续可微的控制问题,其最优控制规律存在性确定有很多困难,如非线性常微分方程求解最优控制的非平凡性问题,会带来闭环控制系统工程实现时困难性,难以得到统一、简洁的最优控制规律的表达式。线性二次型最优控制(2/12)然而,对于线性系统,若以状态变量x(t)和控制变量u(t)的二次型函数的积分作为性能指标泛函,这种动态系统的最优控制问题称为线性系统的最优二次型性能指标的最优控制问题,简称为线性二次型问题,则有很多好的性质。该类问题的优点是能得到最优控制解u*(t)的统一解析表达形式和一个简单的且易于工程实现的最优状态反馈律。因此,线性二次型问题对于从事自动控制研究的理论工作者和工程技术人员都具有很大吸引力。近40年来,人们对各种最优状态反馈控制系统的结构、性质以及设计方法进行了多方面的研究,并且有许多成功的应用。线性二次型最优控制(3/12)线性二次型问题是最优控制理论中发展最为成熟、最有系统性、应用最为广泛和深入的分支。本节将陆续介绍线性二次型问题及其解的存在性、唯一性和最优控制解的充分必要条件。线性系统的二次型性能指标的最优控制问题可表述如下,线性二次型最优控制(4/12)线性二次型最优控制问题对于线性时变系统的状态方程和输出方程为式中,x(t)是n维状态向量,u(t)是r维控制向量,y(t)是m维输出向量假定:A(t),B(t)和C(t)分别是n×n,n×r和m×n维的分段连续的时变矩阵。假定系统的维数满足0mrn,且u(t)不受约束。z(t)表示m维期望的输出,则定义输出误差向量如下e(t)=z(t)-y(t)00()()()()(),()()()()tAttBttttCttxxuxxyx线性二次型最优控制(5/12)控制的目标是寻找最优控制函数u*(t),使下列二次型性能指标泛函为最小式中,F为m×m维非负定的常数矩阵;Q(t)为m×m维时变的分段连续的非负定矩阵;R(t)为r×r维时变的分段连续的正定矩阵,且其逆矩阵存在并有界;末态时刻tf是固定的。0τττ11[()]()()[()()()()()()]d22ftfftJtFttQtttRtttueeeeuu线性二次型最优控制(6/12)下面对论上述性能指标泛函:1)性能指标泛函J[u(·)]中的第1项e(tf)Fe(tf),是为了突出对末态目标的控制误差的要求和限制而引进的,称为末端成本函数。非负定的常数矩阵F为加权矩阵,其各行各列元素的值的不同,体现了对误差向量e(t)在末态时刻tf各分量的要求不同,重要性不同。若矩阵F的第i行第i列元素值较大,代表二次项的重要性较大,对其精度要求较高。线性二次型最优控制(7/12)2)性能指标泛函J[u(·)]中的被积函数中的第1项e(t)Q(t)e(t),表示在系统过渡过程中对误差向量e(t)的要求和限制。由于时变的加权矩阵Q(t)为非负定的,故该项函数值总是为非负的。一般情况下,e(t)越大,该项函数值越大,其在整个性能指标泛函所占的份量就越大。因此,对性能指标泛函求极小化体现了对误差向量e(t)的大小的约束和限制。在e(t)为标量函数时,该项可取为e2(t),于是该项与经典控制理论中判别系统性能的误差平方积分指标一致。0τττ()11[()]()()[()()()()(]d22)ftffttQtJtFttRtttteeueueu线性二次型最优控制(8/12)非负定的时变矩阵Q(t)为加权矩阵,其各行各列元素的值的不同,体现了对相应的误差向量e(t)的分量在各时刻的要求不同、重要性不同。时变矩阵Q(t)的不同选择,对闭环最优控制系统的性能的影响较大。线性二次型最优控制(9/12)3)性能指标泛函J[u(·)]中的被积函数的第2项u(t)R(t)u(t),表示在系统工作过程中对控制向量u(t)的要求和限制。由于时变的加权矩阵R(t)为正定的,故该项函数值在u(t)为非零向量时总是为正的。u(t)越大,该项函数值越大,其在整个性能指标泛函所占的分量就越大。对性能指标泛函求极小化体现了对控制向量u(t)的大小的约束和限制。注:如u(t)为与电压或电流成正比的标量函数时,该项为u2(t),并与功率成正比,u2(t)dt则与在[t0,tf]区间内u(t)所做的功或所消耗的能量成正比。0τττ11[()]()()[()()()]d2()()(2)ftfftJtFttQttttRttuuueeee线性二次型最优控制(10/12)因此,该项是用来衡量控制功率大小的代价(成本)函数。正定的时变矩阵R(t)亦为加权矩阵,其各行各列元素的值的不同,体现了对相应的控制向量u(t)的分量在各时刻(t)的要求不同、重要性不同。时变矩阵R(t)的不同选择,对闭环最优控制系统的性能的影响较大。综上所述,可见线性系统的二次型性能指标泛函的最优控制问题的实质在于用不大的控制量,来保持较小的控制误差,以达到所耗费的能量和控制误差的综合最优。0τττ11[()]()()[()()()()()()]d22ftfftJtFttQtttRtttueeeeuu线性二次型最优控制(11/12)现在讨论上述线性二次型问题的几种特殊情况。1)若令C(t)=I,z(t)=0,则x(t)=-e(t)。这时,线性二次型问题的性能指标泛函变为该问题转化成:用不大的控制能量,使状态x(t)保持在零值附近,称为状态调节器问题。2)若令z(t)=0,则y(t)=-e(t)。这时,线性二次型问题的性能指标泛函变为该问题转化成:用不大的控制能量,使输出值y(t)保持在零值附近,称为输出调节器问题。0τττ11[()]()()[()()()()()()]d22ftfftJtFttQtttRtttuxxxxuufttfftttRtttQttFtJ0d)]()()()()()([21)()(21)]([τττuuyyyyu00()()()()(),()()(),()()(())CttAttBttttetzttxtxxuxxyx线性二次型最优控制(12/12)3)若z(t)≠0,则e(t)=z(t)-y(t)。这时,线性二次型问题为:用不大的控制能量,使输出y(t)跟踪期望信号z(t)的变化,称为输出跟踪问题。下面将陆续介绍状态调节器问题的求解方法,解的性质以及最优状态反馈实现,具体内容为:时变状态调节器定常状态调节器时变状态调节器(1/3)5.1时变状态调节器状态调节器问题为:用不大的控制能量,使状态x(t)保持在零值附近的二次型最优控制问题。该问题的描述如下;时变状态调节器(2/3)有限时间LQ调节器问题设线性时变系统的状态方程和初始条件为式中,控制量u(t)不受约束。寻找最优控制函数u*(t),使下列二次型性能指标泛函为最小式中,F和Q(t)为非负定矩阵;R(t)为正定矩阵;末态时刻tf是固定的。000()()()()(),(),[,]ftAttBttttttxxuxxdtttRtttQttFttuJfttff0)]()()()()()([21)()(21)]([τττuuxxxx时变状态调节器(3/3)由于所讨论的系统为线性系统,给定的性能指标泛函对状态变量x(t)和控制量u(t)均连续可微,因此,状态调节器问题可用变分法、极大值原理和动态规划方法中的任一种求解。本节采用变分法给出最优控制解存在的充分必要条件及最优控制问题解的表达式,讨论最优控制解的存在性、唯一性等性质及解的计算方法。内容为:最优控制的充分必要条件矩阵P(t)的若干性质最优控制的存在性与唯一性最优控制的充分必要条件(1/10)—定理141.最优控制的充分必要条件定理14(有限时间LQ调节器)对于有限时间LQ调节器问题,为其最优控制的充分必要条件是相应的最优轨线为状态方程的解,而最优性能值为式中,P(t)为下述矩阵黎卡提微分方程的正定或半正定解:**1τ()()(),()()()()tKttKtRtBtPtux****000()()()()(),(),[,]ftAttBttttttxxuxx**0001[()](0),02JJtPuxxx0τττ11[()]()()[()()()()(2)()]2ftfftJuttRFttQtttttdtxxxxuu最优控制的充分必要条件(2/10)证明1)必要性证明。若u*(t)是最优控制,需要证明由于系统性能指标泛函的宗量为x(t),u(t)和x(tf)。将有限时间LQ调节器问题(条件极值问题)化为无条件极值问题。引入维向量拉格朗日算子,性能指标函数为**1τ()()(),()()()()tKttKtRtBtPtux0τττ11()()[][]d22ftfftJtFtQRABtxxxxuuλxuxτ1τ0()()()()()()()()()()()[,](),ffPtPtAtAtPtPtBtRtBtPtQttttPtF最优控制的充分必要条件(3/10)因而该优化问题就变为对上述相对于求极值问题。定义哈密顿函数则式(167)可以进一步表示为ττ1(,,)[][]2HQRABxuλxxuuλxu0τττ11()()[][]d(167)22ftfftJtFtQRABtxxxxuuλxux000ττ1()()[(,,)]d21()()()()|[(,,)]d2ffftfftttffttJtFtHttFtttHtxxxuλλxxxλxxuλλx00()()()()1()()()))2[((]ffftfffffftftftHHJxtttdtHHtxdtFtFttttλxλxuxuxxxxλλuxux最优控制的充分必要条件(4/10)根据极值的必要条件J=0,可以求得以及极值条件()()()()()()()()()()()()1()()2()fffffHtAttBttHtQttAtttFttFttxxuλλxλxxxλxx0[()()]()ftffftHHJtFttxdtxλxλuxu()()()()0HRttBttuλu最优控制的充分必要条件(5/10)由极值条件(173)得最优控制律为注意到状态方程和协态方程及其终端条件均为线性,因此,(t)和x(t),之间必定为线性关系,可以表示为由上述两式可以得到u(t)的最优解。其中矩阵P(t)满足规范方程,可由规范方程解出。求解方法如下:*1()()()()tRtBttuλ()()()()0(173)HRttBttuλu*()()()tPttλx最优控制的充分必要条件(6/10)对方程(175)求导数得由方程(171),又有比较上述两式,可以求得矩阵P(t)是矩阵黎卡提微分方程的对称正定或半正定解。因此,证明了定理的必要性。1******()()()()()()()()()()()()()()()()()()()()()[]()PtPtAtPtPttPttPttPttBtRAttPtBtBtPttttλxxxxux*()()()()()(171)()()()(175)tQttAtttPttλxλλx***()()()()()(()))()(()Q