最优控制方法的分析和综合摘要:主要阐述了关于最优控制问题的基本概念,最优控制是最优化方法的一个应用。最优化一般可以分为最优设计、最优计划、最优管理和最优控制四个方面。而最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科,解决最优控制问题的主要方法有古典变分法、极大值原理和动态规划。通过以上知识的讲解使初学者能够快速掌握最优控制的问题。最优控制是最优化方法的一个应用,如果想了解最优控制必须知道什么是最优化方法。所谓最优化方法为了达到最优化目的所提出的各种求解方法。第一章最优控制的一般概念1.1背景知识在现代科学技术的众多领域中,自动控制技术起着越来越重要的作用。所谓的自动控制,是指在没有人直接参与的情况下,利用外加的设备和装置,是机器、设备或生产过程的某个工作状态或参数自动按照预定的规律运行。近几十年来,随着电子计算机技术的发展和应用,在宇宙航行、机器人控制、导弹制导以及核动力等高新技术的领域中,自动控制技术更具有特别重要的作用。自动控制理论是研究自动控制共同规律的技术科学。它的发展初期,是以反馈理论为基础的自动调节原理,主要用于工业控制。第二次世界大战期间,为了设计和制造飞机及船用自动驾驶仪、火炮定位系统、雷达跟踪系统以及其它基于反馈原理的军用装备,进一步促进并完善了自动控制理论的发展。到战后,已形成完整的自动控制理论体系,这就是以传递函数为基础的经典控制理论,它主要研究单输入—单输出、线性定常系统的分析和设计问题。随着现代应用数学新成果的推出和电子计算机技术的应用,为适应宇航技术的发展,自动控制理论跨入了一个新阶段——现代控制理论。它主要研究具有高性能、高精度的多变量变参数系统的最忧控制问题,主要采用的方法是以状态为基础的状态空间法。从数学意义上说,最优化方法是一种求极值的方法,即在一组约束为等式或不等式的条件下,使系统的目标函数达到极值,即最大值或最小值。从经济意义上说,是在一定的人力、物力和财力资源条件下,使经济效果达到最大(如产值、利润),或者在完成规定的生产或经济任务下,使投入的人力、物力和财力等资源为最少。最优化一般可以分为最优设计、最优计划、最优管理和最优控制四个方面。(1)最优设计:世界各国工程技术界,尤其是飞机、造船、机械、建筑等部门都已广泛应用最优化方法于设计中,从各种设计参数的优选到最佳结构形状的选取等,结合有限元方法已使许多设计优化问题得到解决。一个新的发展动向是最优设计和计算机辅助设计相结合。电子线路的最优设计是另一个应用最优化方法的重要领域,它存在着巨大的开发潜力,尤其是对于学电工学的学生来说。配方配比的优选方面在化工、橡胶、塑料等工业部门都得到成功的应用,并向计算机辅助搜索最佳配方、配比方向发展。(2)最优计划:现代国民经济或部门经济的计划,直至企业的发展规划和年度生产计划,尤其是农业规划、种植计划、能源规划和其他资源、环境和生态规划的制订,都已开始应用最优化方法。一个重要的发展趋势是帮助领导部门进行各种优化决策,使工作结构简单,工作效率最高化,节省了很多时间。(3)最优管理:一般在日常生产计划的制订、调度和运行中都可应用最优化方法。随着管理信息系统和决策支持系统的建立和使用,使最优管理得到迅速的发展。(4)最优控制:主要用于对各种控制系统的优化。最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科。它是现代控制理论的重要组成部分。这方面的开创性工作主要是由贝尔曼提出的动态规划和庞特里亚金等人提出的最大值原理。这方面的先期工作应该追溯到维纳等人奠基的控制论。1948年维纳发表了题为《控制论——关于动物和机器中控制与通讯的科学》的论文,第一次科学的提出了信息、反馈和控制的概念,为最优控制理论的诞生和发展奠定了基础。钱学森1954年所著的《工程控制论》直接促进了最优控制理论的发展和形成1.2最优控制的概念在经典控制理论中,设计控制系统的各种方法大多建立在试凑的基础上,设计结果与设计人员的经验有很大的关系。对于多输入—多输出系统,或者要求高控制精度的复杂系统,经典方法显得无能为力,迫切需要探索新的设计方法。20年代60年代初,由于空间技术的迅猛发展和计算机的广泛应用,动态系统的优化理论得到了迅速的发展,形成了最优控制这一重要的学科分支,并在控制工程、经济管理与决策以及人口控制等领域得到了成功的应用,取得了显著地成效。最优控制在被控对象参数已知的情况下,已经成为设计复杂系统的有效方法之一。最优控制是现代控制理论的核心。所谓最优控制,就是在一定的条件下,在完成所要求的控制任务时,使系统的某种性能指标具有最优值。最优控制系统的设计,就是选择最优控制,以使某一种性能指标为最小。为了解决最优控制问题,必须建立描述受控运动过程的运动方程,即系统的数学模型,给出控制变量的允许取值范围,指定运动过程的初始状态和目标状态,并且规定一个评价运动过程品质优劣的性能指标。通常,性能指标的好坏取决于所选择的控制函数和相应的运动状态。系统的运动状态受到运动方程的约束,而控制函数只能在允许的范围内选取。最优控制研究的主要问题是:根据已建立的被控对象的数学模型,选择一个容许的控制律,使得被控对象按预定要求运行,并使给定的某一性能指标达到极限值。从数学的观点来看,最优控制研究的问题是求解一类带有约束条件的泛函极值问题,属于变分学的范畴。然而,经典变分理论只能解决控制无约束,即容许控制属于开集的一类最优控制问题,为了满足工程实践的需要,出现了现代变分理论,其中最常用的方法是动态规划和极小值原理。第二章经典变分法2.1函数与变分2.1.1泛函的概念如果变量J对于某一函数类中的每一个函数x(t),都有一个确定的值与之对应,那么就称变量J为依赖于函数x(t)的泛函,记为:J=J[x(t)]。例2.1.1函数的定积分1.连续时间系统:10()Jxtdt是泛函。因为变量J的值是由函数的选取而确定的。所以最简单的一类泛函可表示为:0[()][(),(),]fttJxtLxtxttdt连续泛函如果满足下列条件:(1)J[x1(t)+x2(t)]=J[x1(t)]+J[x2(t)](2)J[cx(t)]=cJ[x(t)]其中,c是任意常数,就称为线性泛函。例如21[()][()(sin)()]ttJxttxttxtdt21[()][()()()()]ttJxtptxtqtxtdt2[()]()tJxtxt都满足上述两个条件,故均为线性泛函。连续泛函如果满足下列条件:(1)J[x1(t)]+J[x2(t)]=1/2[J[x1(t)+x2(t)]+J[x1(t)-x2(t)]](2)J[cx(t)]=c2J[x(t)]就称为*****二次型泛函*****。例如011()()()()22ftTTfftJxtFxtxtQxtdt是关于x(t)的二次型泛函,其中F、Q均为对称矩阵。2.1.2泛函的变分变分法(calculusofvariations)是处理函数的函数的数学领域,和处理数的函数的普通微积分相对。譬如,这样的泛函可以通过未知函数的积分和它的导数来构造。变分法最终寻求的是极值函数:它们使得泛函取得极大或极小值。如果连续泛函J[x(t)]的增量可以表示为:[()][()()][()]JxtJxtxtJxt[(),()][(),()]Lxtxtrxtxt(2.1.1)其中,L[x(t),x(t)]是关于x(t)的线性连续泛函,而r[x(t),x(t)]是关于x(t)的高阶无穷小。L[x(t),x(t)]称为泛函的变分,记为[(),()]JLxtxt也就是说,泛函的变分是泛函增量的线性主部。当一个泛函具有变分时,即泛函的增量可以用式(2.1.1)来表示时,称该泛函是可微的。例如,泛函120[()]()Jxtxtdt的增量为:11220012011200[()()]()[2()()()]2()()()Jxtxtdtxtdtxtxtxtdtxtxtdtxtdt于是,其变分为:102()()Jxtxtdt可以证明,泛函的变分是唯一的。因为,若泛函的变分不是唯一的,则泛函的增量可以写为:1122[(),()][(),()][(),()][(),()]JLxtxtrxtxtLxtxtrxtxt12[(),()][(),()][(),()]LxtxtLxtxtLxtxt泛函J[x(t)]的变分为:0[()()]JJxtxt例2.1.4求泛函120()xtdt的变分。该泛函的变分为:0[()()]JJxtxt1200[()()]xtxtdt1200[()()]xtxtdt1002[()()]()xtxtxtdt102()()xtxtdt2.1.3泛函的极值如果泛函J[x(t)]在函数空间中点x=x0(t)的邻域内,其增量为:0[()][()]0JJxtJxt就称泛函J[x(t)]在点x0(t)处达到极小值;如果泛函J[x(t)]在函数空间中点x=x0(t)的邻域内,其增量为:0[()][()]0JJxtJxt就称泛函J[x(t)]在点x0(t)处达到极大值;x0(t)的邻域包含满足条件:0[(),()]dxtxt的所有点x(t)的球(即以x0(t)为圆心,以为半径的球)。定理(必要条件)若泛函J[x(t)]是连续可微的,并且在点x0(t)处达到极值,则泛函在点x0(t)处的变分等于零,即0[(),()]0Jxtxt2.2欧拉方程2.2.1三类基本问题最优控制问题中,根据性能指标的类型(积分型性能指标、终值型性能指标、复合型性能指标)的不同,分别对应了古典变分法中的三类基本问题。拉格朗日(Lagrange)问题—基本问题fttdtttxtxLtxJ0]),(),([)]([(2.2.1)麦耶耳(Mayer)问题]),([)]([ffttxtxJ(2.2.2)波尔扎(Bolza)问题fttffdtttxtxLttxtxJ0]),(),([]),([)]([(2.2.3)固定端点的Lagrange问题问题描述:假定点A(t0,x0)和B(tf,xf)是所要寻求的泛函(1.2.1)的极值曲线x(t)的两个固定端点,如图1-5所示,其坐标为:00()()ffxtxxtx(2.2.4)问题:从满足边界条件的二阶可微的函数中,选择使泛函fttdtttxtxLtxJ0]),(),([)]([达到极小值的函数x(t)解:设x*(t)是使泛函达到极小值且满足边界条件的极值曲线。现用()*()()xtxtxt(2.2.5)表示满足边界条件的极值曲线x*(t)的邻域曲线。其中x(t)是泛函宗量x(t)的变分,(01)是一参变量。为使x(t)是满足边界条件的极值曲线x*(t)的邻域曲线,x(t)应具有连续导数且满足条件:x(t0)=x(tf)=0(2.2.6)于是,得到()*()()xtxtxt(2.2.7)由于x*(t)是极值曲线,所以泛函fttdtttxtxLtxJ0]),(),([)]([在极值曲线x*(t)上的变分等于零,即(2.2.1)0J(2.2.8)泛函的变分为0[*()()]JJxtxt(2.2.9)将式(2.2.1)代入式(2.2.9),得0[*()()]JJxtxt00[*()(),*()(),]fttLxtxtxtxttdt00[*()(),*()(),]fttLxtxtxtxttdt0[*(),*(),][*(),*(),]()()()()fttLxtxttLxtxttxtxtdtxtxt0[()()]ftxxtLxtLxtdt(2.