自动化专业实验课第二讲:数据驱动控制发展概述金尚泰北京交通大学先进控制系统研究所电话:51684105办公室:9号教学楼西4012数据驱动控制发展概述基于模型的控制理论数据驱动控制理论数据驱动控制方法分类无模型自适应控制算法MATLAB仿真实际应用3现代控制理论—基于模型的控制理论系统控制建立全局模型(机理,数据)系统假设系统数据假设模型满足A、B、C条件,然后证明某某结论成立。未建模动力学可能会引起所得结论的正确性。没有模型或假设不成立将得不出任何的结论。所有结论都与模型有关,假设不成立,结论不正确!受控对象4理论上的问题:模型的依赖未建模动态鲁棒性问题应用上的问题:建模太困难准确建模成本太高根本建不了因此寻找基于数据的或数据驱动控制理论与方法的研究,具有重要的科学价值和实际应用价值!现代控制理论—基于模型的控制理论5数据驱动控制受控对象控制器设计适应或鲁棒控制等无模型或数据驱动控制方法无模型或数据驱动控制方法有机理模型,但太复杂(阶数、非线性)机理模型基于机理模型设计机理或数据模型,但不准确没有办法建模数据驱动控制理论所要研究的对象6Fromdatatoresultsorcontrolinput数据驱动控制的定义及内涵仅利用受控系统的I/O数据来设计控制器。包括两类:隐含地应用系统的动力学信息数据驱动控制、理想的数据驱动控制。数据驱动控制7数据驱动控制定义:控制器设计不包含受控过程数学模型信息,仅利用受控系统的在线和离线I/O数据以及经过数据处理而得到的知识来设计控制器,并在一定的假设下,有收敛性、稳定性保障和鲁棒性结论的控制理论与方法。或者简单地讲,就是直接从数据到控制器设计的控制理论和方法。Letthedataspeak!设计分析评价侯忠生许建新,数据驱动控制理论及方法的回顾和展望,自动化学报,35(6),2009,pp950-667数据驱动控制8系统控制利用I/O数据不排除数据模型系统规律和特性系统I/O数据特点:数据是出发点,也是归宿;控制律的设计仅用系统的I/O数据,不包含受控系统的任何模型信息和结构信息。不用系统的动力学模型和结构信息受控对象=数据驱动控制91、解决控制系统分析和设计依赖模型的问题。基于模型的控制理论的稳定性、收敛性结论与模型准确性相关;数据驱动控制理论的稳定性、收敛性结论与模型无关!解决理论和实际应用之间的鸿沟问题。2、解决未建模动态和鲁棒性这对“孪生”的问题。数据驱动控制理论:传统的未建模动态、传统的鲁棒性问题不存在;数据驱动控制根本目的数据驱动控制10控制器结构已知的数据驱动方法PID,IFT(1994),VRFT(2000)等控制器结构未知的数据驱动方法基于模型的控制器设计方法:直接自适应控制等无模型的控制器设计方法:ILC(1984),MFAC(1994)等数据驱动控制分类11理想数据驱动控制的特点理论上保证了所设计的控制器结构的合理性。ILC,MFAC有稳定性、收敛性的数学证明!线性、非线性系统的控制器设计及分析几乎没有区别。数据驱动控制分类典型数据驱动控制方法•迭代学习控制(IterativeLearningControl):–系统在有限时间区间上可重复运行(运动)–实现整个时间区间上的完全跟踪性能–实际问题工业机器人控制半导体晶片的温度控制磁盘驱动系统快速路入口匝道控制•Uchiyama1978•Arimoto1984Memory1ControllerPlantMemory2dyku1ku1kyky)(tqkek+1迭代学习控制),()()(tutbtx],0[Tt•定义)()()(txtxteidi•选择学习控制律)()()(11tetutuilii例:简单的例子。考虑如下控制问题:•我们的任务是证明当k趋于无穷时,上述的学习算法保证学习误差收敛到零。而不用辨识b(t)•由此可得•如果,那么•所以收敛条件为•假设,其中已知,则对所有的t都成立。第5次迭代第10次迭代第15次迭代第20次迭代t-1t-1k+1次迭代tt+1tt+1k次迭代tt-1t+1tt-1t+1e(t)u(t)K+1次迭代t-1tt+1K次迭代tt-1t+1e(t)u(t)反馈控制学习控制)()()(11tetutuilii典型的数据驱动控制算法—MFAC非线性系统的动态线性化方法))(,),1(),(),(,),1(),(()1(uynkukukunkykykyfky假设1:系统是输入输出可观测的;可控制的,即对某一系统有界的期望输出信号,存在一有界的可行控制输入信号,使得系统在此控制输入信号的驱动下其输出等于系统的期望输出。假设2:系统关于当前的控制输入信号的偏导数是连续的。假设3:系统是广义Lipschitz的,即满足对任意的k和有其中是常数。yk*()1)(kuuk()0ykbuk()()1ykykykukukukb()()(),()()(),111紧格式线性化定理1对非线性系统,满足假设条件1-3,那么当时,一定存在一个称为是伪偏导数(Pseudo-Partial-Derivative,PPD)的向量,使得并且其中是一个常数。uk()0ykkuk()()()1(),kbb注1:伪偏导数显然是一个时变参数,即使系统是一个线性时不变系统也是如此。如果采样周期及的值均很小的话,PPD可以看成是一个慢时变参数。注2:它们的结构非常简单。它将一个复杂的SISO非线性系统转化成一个带有单参数线性时变系统,因此它是一个目地于控制系统设计的“线性化”方法。注3:PPD不唯一。uk()MFAC的理论基础定理2:非线性系统,满足假设1,2’-3’,那么对某一给定的L,一定存在一个()k,被称为是系统的伪梯度向量(PPD),当Uk()0时,有ykkUkT()()()1且().kb其中()[(),,()].kkkLT1注:此定理给出的所谓偏格式线性化方法将一个离散时间非线性系统转化成了一包括L个时变参数的动态线性化系统,相对于定理1的线性化方法,此处的时变参数()k变化缓慢一些,从而理论上讲,它能更加适用于某些复杂系统的自适应控制设计的目的。MFAC的理论基础MFAC的理论基础注:•对线性系统)()()()(11kuqBkyqAnbnbnanaqbqbqBqaqaqA111111)(1)(Aq()1的根严格在单位园内,这样就可以将上述方程写成ykHquk()()()11Hqhhqhqnhnh().1011当nh充分大时,上述模型就能很好地近似原来的模型。ykHquk()()()11hinih,,,,01假设•对线性时不变有限脉冲响应模型ykHquk()()()11上述时不变模型可以写成LnhhnLMFAC方案稳定性和仿真举例基于紧格式的无模型自适应控制方案(以梯度算法为例))]()1([)()()1()(*2kykykkkukuk))1()1()(()1()1()1()(2kukkykukukkk)1()(kuk或若MFAC方案稳定性和仿真举例定理:在紧格式线性化假设和上述假设下,由不依赖于受控系统数学模型的无模型学习自适应控制方案所组成的自适应控制系统有1):ykykMuk()()()*112):当ykConst*().1时,系统在适当地选取kk,,以后,总存在一个小正数min,使得当min时,系统BIBO稳定的,收敛的。,M是一个常数假设:系统的伪偏导数满足0)(k对充分大的k以后及uk().0且只能在有限个k时刻上,使()k0MFAC方案稳定性和仿真举例•基于偏格式线性化的无模型自适应控制方案ukukkkykykkukikiiL()()()()[()()()()]*1111122()()()()[()()()]kkUkUkykUkkkT112()()()111111kifkMFAC方案稳定性和仿真举例例1ykykykukkykykykukykakukykykk()()()(),()()()()(())()()()().11500121211125002322此系统的结构、阶数、和参数均时变。ykroundkkkkkroundkk*().*().^(/),.*sin(*/).*cos(*/).*().^(/).10511003000510003503007000511007001000MFAC方案稳定性和仿真举例0200400600800100000.511.522.53time-varyingparametera(k)d)时变参数a(k)为MFAC方案稳定性和仿真举例21,,当仿真结果为:02004006008001000-1-0.500.51trackingperformancea)02004006008001000-1-0.500.51controlinputb)MFAC方案稳定性和仿真举例0200400600800100000.20.40.6pseudo-partial-derivativec)MFAC方案稳定性和仿真举例ykykykykykykukukkykykykykykykykykukukk()()()()()()().(),.()()()().sin(.(()()))cos(.(()())).().().15111211150025111070510511411250022222例2两个非线性的非最小相位系统串联,阶数、结构均时变。ykkkkroundkkkkk*()sin(/)cos(/)*().^(/)sin(/)cos(/)155021003005110030070055021007001000取3,1,MFAC方案稳定性和仿真举例02004006008001000-10-50510trackingperformancea)02004006008001000-4-2024controlinputb)MFAC方案稳定性和仿真举例02004006008001000012345pseudo-partial-derivativec)MFAC与PID控制的区别与PID控制–PID控制技术作为最早实用化的控制技术已经有近百年的历史,到目前仍然是应用最为广泛的控制技术。PID控制技术的优点在于简单易懂,使用中不需要有精确的系统模型等先决条件,因而成为应用最广泛的控制器。95%的工业过程到现在还在应用。–PID控制技术的缺点(理论上讲):(1)PID一般只适应简单对象,即单输入单输出、线性时不变(包括参数和模型结构等)的系统;(2)如果过程特性变化,控制器需要重新整定,且调整很不方便,需要控制专家和经验非常丰富的技师来调整,三个可调参数相互耦合;(3)PID对于具有强非线性、时变、耦合及结构及参数不确定性的复杂系统无能为力。位置式PID控制算法:)()()()1()()()()(*0kykykeTkekekTjekkekkuDkjIp增量式PID控制算法:))2()1(2)(()())1()(()(kekekekkekkekekkuDIp主要区别:1迭代学习控制是2-D系统(一个是迭代轴;一个是时间轴);2迭代学习控制运行在重复的控制任务下,追求的是在有限区间上的得完全跟踪,而MFAC则是在无限区间上的渐进跟踪,没有重复的控制环境