最优控制理论主讲:罗文广授课内容1、最优控制概述2、最优控制中的变分法3、极小值原理及其应用4、动态规划5、线性最优状态调节器6、线性最优输出调节器与跟踪系统考核方式一、小设计+论文(30%)1、选题:每人自选一个与最优控制相关的实际小问题,在小组讨论中初步确定选题。小组4-5人,自行成立。2、解题:通过建模、编程和仿真,获得问题的最优解;或者通过制作实物、编程,对对象实现最优控制。3、论文:通过以上工作,完成一篇小论文。论文撰写格式按照广西工学院学报的格式要求。4、报告和答辩:每人约用10分钟对所做选题进行汇报和答辩5、时间要求:题目确定:第6周,个人上交自拟的题目。答辩时间:12周以后。最后完成时间:本学期最后一周。6、上交材料:(1)编制的程序、仿真结果,或制作的实物;(2)小论文。由班长统一上交(含统计表)二、考试(70%)开卷方式第1章导论1.1引言一、现代控制理论现代控制理论是研究系统状态的控制和观测的理论,主要包括5个方面:1、线性系统理论:研究线性系统的性质,能观性、能控性、稳定性等。以状态空间法为主要工具研究多变量线性系统的理论。2、系统辨识:根据输入、输出观测确定系统数学模型。3、最优控制:寻找最优控制向量u(t)。根据给定的目标函数和约束条件,寻求最优的控制规律的问题。4、最佳滤波(卡尔曼滤波、最优估计):存在噪声情况下,如何根据输入、输出估计状态变量。5、适应控制:利用辨识系统动态特性的方法随时调整控制规律以实现最优控制,即在参数扰动情况下,控制器的设计问题。把鲁棒控制、预测控制均纳入到现代控制理论的范畴。第1章导论1.1引言二、最优控制的发展简史先期工作:1948年,维纳(N.Wiener)发表《控制论》,引进了信息、反馈和控制等重要概念,奠定了控制论(Cybernetics)的基础。并提出了相对于某一性能指标进行最优设计的概念。1950年,米顿纳尔(Medona1)首先将这个概念用于研究继电器系统在单位阶跃作用下的过渡过程的时间最短最优控制问题。1954年,钱学森编著《工程控制论》(上下册),作者系统地揭示了控制论对自动化、航空、航天、电子通信等科学技术的意义和重大影响。其中“最优开关曲线”等素材,直接促进了最优控制理论的形成和发展。第1章导论1.1引言理论形成阶段:自动控制联合会(IFAC)第一届世界大会于1960年召开,卡尔曼(Kalman)、贝尔曼(R.Bellman)和庞特里亚金(Pontryagin)分别在会上作了“控制系统的一般理论”、“动态规划”和“最优控制理论”的报告,宣告了最优控制理论的诞生,人们也称这三个工作是现代控制理论的三个里程碑。1953-1957年,贝尔曼(R.E.Bellman)创立“动态规划”原理。为了解决多阶段决策过程逐步创立的,依据最优化原理,用一组基本的递推关系式使过程连续地最优转移。“动态规划”对于研究最优控制理论的重要性,表现于可得出离散时间系统的理论结果和迭代算法。第1章导论1956-1958年,庞特里亚金创立“极小值原理”。它是最优控制理论的主要组成部分和该理论发展史上的一个里程碑。对于“最大值原理”,由于放宽了有关条件的使得许多古典变分法和动态规划方法无法解决的工程技术问题得到解决,所以它是解决最优控制问题的一种最普遍的有效的方法。同时,庞特里亚金在《最优过程的数学理论》著作中已经把最优控制理论初步形成了一个完整的体系。此外,构成最优控制理论及现代最优化技术理论基础的代表性工作,还有不等式约束条件下的非线性最优必要条件(库恩—图克定理)以及卡尔曼的关于随机控制系统最优滤波器等。第1章导论1.2最优控制问题一、问题的描述已知被控系统的状态方程以及给定的初始状态规定的目标集为S(例如)求一容许控制,使系统在该控制的作用下由初态出发,在某个大于t0的终端时刻tf达到目标集S上,并使性能指标达到最小。],[),,(0fttttfuxx0xx)(0tnptSpf,,0),(RxxrUufttffdtttutxLttxuJ0)),(),(()),(()]([第1章导论1.2最优控制问题从以上最优控制问题的描述中可见:1、有一个被控对象(系统数学模型)它通常由常微分方程组描述的动态模型来表征,即其初态一般是给定的,即2、有一目标集及边界条件目标集:在控制u的作用下,把被控对象的初态x0在某个终端时刻转移到某个终端状态x(tf)。x(tf)通常受几何约束。例如考虑它是一个点集,在约束条件下目标集为],[),,(0fttttfuxx0xx)(0t0),(ftxnptSpf,,0),(Rxx第1章导论1.2最优控制问题边界条件:初始状态:初始时刻t0和x(t0),通常是已知的。末端状态:末端时刻tf和x(tf),通常是未知的。3、容许控制集控制向量u的各个分量ui往往是具有不同物理属性的控制量。在实际控制问题中,大多数控制量受客观条件的限制只能取值于一定的范围,将控制约束条件的点集称为控制域,则将在闭区间[t0,tf]上有定义,且在控制域内取值的每个控制函数u(t)称为容许控制,记做u第1章导论1.2最优控制问题4、性能指标为了能在各种控制律中寻找到效果最好的控制,需要建立一种评价控制效果好坏或控制品质优劣的性能指标函数。又称代价(成本,目标)函数或泛函,记做,它是一个依赖于控制的有限实数,一般的表达式为:该表达式包括了依赖于终端时刻tf和终端状态x(tf)的末值型项,以及依赖于这个控制过程的积分型项。因此,可将最优控制问题的性能指标分为:混合型、末值型和积分型。不同的控制问题,应取不同的性能指标:)]([uJfttffdtttutxLttxuJ0)),(),(()),(()]([第1章导论1.2最优控制问题(1)积分型性能指标:a.最短时间控制:b.最少燃烧控制:c.最小能量控制:(2)末值型性能指标(3)混合型性能指标fttfttdtuJttutxL00)]([,1)),(),((fttdtttutxLuJ0)),(),(()]([mjjtuttutxL1)()),(),((fttmjjdttuJ01)(fttTdttutuJ0)()()()())),(),((tututtutxLT)),(()]([ffttxuJfttffdtttutxLttxuJ0)),(),(()),(()]([第1章导论1.2最优控制问题二、对最优控制问题的进一步说明如果最优控制问题有解,即:使达到极小值的控制函数存在,记为,称为最优控制;相应的状态轨迹x*(t)称为最优轨迹;性能指标称为最优性能指标。三、举例月球上的软着陆问题(最小燃耗问题))]([uJ)]([**uJJ],[)(0*fttttu飞船靠其发动机产生一与月球重力方向相反的推力u(t),以使飞船在月球表面实现软着陆,要寻求发动机推力的最优控制规律,以便使燃料的消耗为最少。第1章导论1.2最优控制问题设飞船质量为m(t),高度为h(t),垂直速度为v(t),发动机推力为u(t),月球表面的重力加速度为常数g。设不带燃料的飞船质量为M,初始燃料的总质量为F.初始高度为h0,初始的垂直速度为v0,那么飞船的运动方程式可以表示为:)()()()()()()(tkutmtmtugtvtvth初始条件FMmvvhh)0()0()0(00终端条件0)(0)(fftvth性能指标是使燃料消耗为最小,即约束条件)(0tu)(ftmJ达到最大值第2章最优控制中的变分法变分法是求解泛函极值的一种经典方法,因此也是研究最优控制问题的一种重要工具。本章的中心内容是介绍经典变分法的基本原理,并加以推广,用以求解某些最优控制问题。尽管经典变分法有其局限性,但本章所涉及的有关内容,在最优控制理论中是最基本的东西。第2章最优控制中的变分法2.1泛函与变分(1)泛函定义:给定函数空间U,若对于任何函数x(t)∈U,总有一个确定的值J(x(t))与之对应,则称J(x(t))是函数x(t)的泛函。这里x(t)常被称做宗量。从定义中可以发现,泛函是变量与函数之间的关系,常称之为“函数的函数”。例:是一个泛函,当x(t)=t时,J=0.5;而不定积分不是一个泛函。10)(dttxJdttxJ)(第2章最优控制中的变分法2.1泛函与变分函数:对于变量t的某一变域中的每一个值,x都有一个值与之相对应,那么变量x称作变量t的函数。记为:x=f(t)t称为函数的自变量自变量的微分:dt=t-t0(增量足够小时)泛函:对于某一类函数x(·)中的每一个函数x(t),变量J都有一个值与之相对应,那么变量J称作依赖于函数x(t)的泛函。记为:J=J[x(t)]x(t)称为泛函的宗量宗量的变分:)()(0txtxx函数与泛函比较:第2章最优控制中的变分法2.1泛函与变分关于变分,可将泛函的变分概念看成是函数微分概念的推广,其作用如同微分在函数中的作用。(2)变分定义:若连续泛函J(x(t))的增量可表示为其中第一项是的连续线性泛函,第二项是关于的高阶无穷小,则称上式第一项为泛函的变分,记做如同函数的微分是函数增量的线性主部一样,泛函的变分就是泛函增量的线性主部。))(),(())(),(())(())()((txtxrtxtxLtxJtxtxJJ))(),((txtxLJ)(tx)(tx第2章最优控制中的变分法2.1泛函与变分显然,直接用定义求泛函的变分很困难。因此必须寻求一种计算方法。(3)计算泛函变分的公式定理2.1如果连续泛函J(x(t))的变分存在,则证明:(见P12)例子:(见P12)为了确定泛函的极小值或极大值,需要考察泛函的二次变分:(4)二次变分定义:P12(5)求解二次变分定理:P12J10,),(00xxJJ第2章最优控制中的变分法2.1泛函与变分例:求下列泛函的变分fttdttxJ0)(2dttxtxdttxtxtxdttxtxtxtxJJffftttttt)()(2|)()]()([2|)]()([|)]()([0000020第2章最优控制中的变分法2.1泛函与变分(6)泛函极值定义:定义2-15对于与x0(t)接近的曲线x(t),泛函J[x(t)]的增量(7)泛函极值的必要条件:定理2-3(8)泛函极小值的充要条件:定理2-4(9)变分引理:定理2-5则泛函J[x(t)]在曲线x0(t)上达到极值。0)]([)]([0)]([)]([00txJtxJJtxJtxJJ或0J泛函极值定理:若可微泛函J[x(t)]在x0(t)上达到极值,则在x=x0(t)上的变分为零。即第2章最优控制中的变分法2.2欧拉方程主要讨论:(1)无约束和有约束情况下,泛函极值存在的必要条件——欧拉方程;(2)泛函极小值的充分条件——勒让德条件。2.2.1无约束泛函极值的必要条件这里所提到的约束或无约束是指状态x(t)的约束问题。无约束:指求解最优控制解时状态无约束,即无状态方程的约束。1、所定义的问题问题2-1:无约束泛函极值问题为)172()](),(,[min0fttxdttxtxtLJ问题为:确定一个函数x(t),使J[x(t)]达到极小(大)值。这条能使泛函J[x(t)]达到极值的曲线称为极值曲线(轨线),记作:x*(t),见图2-2。对于端点固定的情况,容许轨线x(t)应满足下列边界条件:第2章最优控制中的变分法2.2欧拉方程2、极值的必要条件定理2-6:极值轨线x(t)满足欧拉方程证明:P16.注意名词:横截条件(第3节讨论)例2-2:(求极值轨线)2.2.2有等式约束的泛函极值的必要条件在最优控制问题中,泛函J[x(t)]所依赖的函数x(t)往往会受到一定约束条件的限制。在动态最优化