迭代学习控制原理与应用

billow310
1 ℃
2020-07-03

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

过程控制研究所迭代学习控制原理与应用报告人：卜旭辉E-mail：bxh@hpu.edu.cnTl39388222Tel：13938182722学习是人类社会进化的源泉学习是一个人成长的必由之路学习是个人成长的必由之路过程控制研究所迭代学习控制原理与应用报告人：卜旭辉学习针对重复性的任务通过反复的练习提高某种能力Example：投篮学习：针对重复性的任务，通过反复的练习提高某种能力Example：投篮Fθ力与角度的学习过程控制研究所迭代学习控制原理与应用报告人：卜旭辉重复现象在控制系统中非常普遍！！重复现象在控制系统中非常普遍！！过程控制研究所迭代学习控制原理与应用报告人：卜旭辉能否将学的思想应用于控制系统ElPID恒值控制能否将学习的思想应用于控制系统Example：PID恒值控制0802205⎧⎡⎤⎡⎤期望输出实际输出[]0.80.220.5(1)()()101()10.5()xtxtutytxt⎧−−⎡⎤⎡⎤+=+⎪⎢⎥⎢⎥⎨⎣⎦⎣⎦⎪=⎩系统0.81实际输出⎩目标()1dyt=0.40.6初始条件12()0,()0xtxt==PI控制0100200300400500600700800900100000.2PI控制(1)()()(()),()()(),0.2,10pidiututketketetytytkk+=++Δ=−==过程控制研究所迭代学习控制原理与应用报告人：卜旭辉()()(),0.2,10dpietytytkk如果上述系统是重复运行的1期望输出实际输出如果上述系统是重复运行的第一次PIPI0.80.220.5(1)()()101xtxtut⎧−−⎡⎤⎡⎤+=+⎪⎢⎥⎢⎥⎨⎣⎦⎣⎦⎪PI控制器0.40.60.8第次[]()10.5()ytxt⎪=⎩制0100200300400500600700800900100000.2第二次PIPI0.80.220.5(1)()()101xtxtut⎧−−⎡⎤⎡⎤+=+⎪⎢⎥⎢⎥⎨⎣⎦⎣⎦PI控制器0.60.81期望输出实际输出第二次PIPI[]101()10.5()ytxt⎢⎥⎢⎥⎨⎣⎦⎣⎦⎪=⎩PI控制器0100200300400500600700800900100000.20.4081期望输出实际输出第N次PIPI[]0.80.220.5(1)()()101()10.5()xtxtutytxt⎧−−⎡⎤⎡⎤+=+⎪⎢⎥⎢⎥⎨⎣⎦⎣⎦⎪=⎩PI控制器0.20.40.60.8过程控制研究所迭代学习控制原理与应用报告人：卜旭辉010020030040050060070080090010000控制器“死心眼”⎧⎡⎤⎡⎤[]0.80.220.5(1)()()101()10.5()xtxtutytxt⎧−−⎡⎤⎡⎤+=+⎪⎢⎥⎢⎥⎨⎣⎦⎣⎦⎪=⎩没有学习的能力，不会根据过去的信息调整控制输入，无论重复多少次，每次都要经历一个很长的暂态过程。过程控制研究所迭代学习控制原理与应用报告人：卜旭辉学习控制的应用学习控制的应用系统[]0.80.220.5(1)()()101()105()xtxtutytxt⎧−−⎡⎤⎡⎤+=+⎪⎢⎥⎢⎥⎨⎣⎦⎣⎦⎪=⎩目标()1,[1,200]dytt=∈()()[]()10.5()ytxt⎩每一次相同初始条件,1,2()0,()0kkxtxt==学习控制每一次相同将系统过去的信息存储0.80.220.5(1)()()kkkxtxtut⎧−−⎡⎤⎡⎤+=+⎪⎢⎥⎢⎥学习控制1()()(()())0.5kkdkututytytαα+=+−=[](1)()()101()10.5()kkkkkxtxtutytxt++⎪⎢⎥⎢⎥⎨⎣⎦⎣⎦⎪=⎩(1)()()(()),()()()pidututketketetytytPIcontroller+=++Δ=−过程控制研究所迭代学习控制原理与应用报告人：卜旭辉k为重复次数，()()(),detytytPIcontroller学习控制的工作方式学习控制的工作方式过程控制研究所迭代学习控制原理与应用报告人：卜旭辉学习控制的仿真结果学习控制的仿真结果1060.80.40.6第1次迭代第3次迭代第5次迭代第20次迭代0.2010020030040050060070080090010000过程控制研究所迭代学习控制原理与应用报告人：卜旭辉[]0.80.220.5(1)()()101()10.5()xtxtutytxt⎧−−⎡⎤⎡⎤+=+⎪⎢⎥⎢⎥⎨⎣⎦⎣⎦⎪=⎩⎩1()()0.5(()())kkdkututytyt+=+−0.60.810.60.810.60.81LearningLearning0100200300400500600700800900100000.20.40100200300400500600700800900100000.20.40100200300400500600700800900100000.20.4由于控制器具有了学习能力：输出性能betterthanbetter过程控制研究所迭代学习控制原理与应用报告人：卜旭辉由于控制器具有了学习能力输出性能跟踪控制跟踪控制[]0.80.220.5(1)()()101()105()kkkxtxtut⎧−−⎡⎤⎡⎤+=+⎪⎢⎥⎢⎥⎨⎣⎦⎣⎦⎪⎩系统[]()10.5()kkytxt⎪=⎩目标()sin(8/100),[1,200]dyttt=∈PI控制学习控制0.40.60.810.40.60.81-0.4-0.200.2-0.4-0.200.20102030405060708090-1-0.8-0.60102030405060708090-1-0.8-0.6过程控制研究所迭代学习控制原理与应用报告人：卜旭辉学习控制的理论描述学习控制的理论描述()()()1⎧⎪AB()()()1ttt++⎧⎪xAxBu线性离散时间系统()()()()()1ttttt+=+⎧⎪⎨=⎪⎩xAxBuyCx()()()()()1kkkkkttttt+=+⎧⎪⎨=⎪⎩xAxBuyCx假设条件:(1)每次迭代初始条件一致，即()()001,2,3,kk==xx(2)系统每次的期望轨迹相同，即()()kdytyt=()()()1kkkttLt+=+uueP型学习控制律收敛性条件1Lρ−≤ICB()(),k→∞()()dyyktt→则有，当满足证明参阅孙明轩专著过程控制研究所迭代学习控制原理与应用报告人：卜旭辉学习控制的理论体系系统类型：连续VS离散时变VS时不变时变VS时不变线性VS非线性算法类型：PID型、一阶、N阶、最优等鲁棒性问题：非严格重复、扰动、未建模动态鲁棒性问题：非严格重复、扰动、未建模动态理论分析方法：压缩映射方法、Liyapunov函数、频域法。Etc...过程控制研究所迭代学习控制原理与应用报告人：卜旭辉应用实例：机器手臂投篮Fθ过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制简介迭代学习控制简介UchiyamaS.Arimoto,S.Kawamura,andF.Miyazaki.BetteringoperationofbtbliJlfUchiyamarobotsbylearning.JournalofRobot.Syst.,1(2):123–140,1984.过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制简介迭代学习控制简介过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制简介迭代学习控制简介过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制简介迭代学习控制简介过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制简介迭代学习控制简介-国内外研究团队9XuJianXinWangDW(NationalUnivofSingapore）9XuJianXin,WangD.W.(NationalUniv.ofSingapore）9Rogers,Owens,Freeman(SouthamptonUniv.)9Nollof,Gannoson(LinköpingsUniv.)9KevinMooreChenYQAhnsong(UtahStateUniv)9KevinMoore,ChenYQ,Ahnsong(UtahStateUniv.)9M.Tomizuka,(UCBerkeley)9(G.Alleyne,UniversityofIllinois)9侯忠生（北京交通大学）侯忠（京交通学）9孙明轩（浙江工业大学）过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制理论研究迭代学习控制理论研究9收敛性和稳定性9算法的设计（线性的、非线性的、最优的）算计（线非线最）9非严格重复（初始条件、期望输出、系统动态）9模型确定的鲁棒性9模型不确定的鲁棒性9扰动和噪声作用的鲁棒性9与其他控制方法的结合9应用9应用过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制理论研究迭代学习控制理论研究SystemsSystems9Open-loopvs.closed-loop.9Discrete-timevs.continuous-time.9Linearvs.nonlinear.Linearvs.nonlinear.9Time-invariantortime-varying.9Relativedegree1vs.higherrelativedegree.过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制理论研究迭代学习控制理论研究Updatealgorithm:Updatealgorithm:9LinearILCvs.nonlinearILC.9First-orderILCvs.higher-order.ILC9Currentcyclevs.pastcycle.9FixedILCoradaptiveILC.9Time-domainvs.frequencyanalysis.qyy9Analysisvs.design.9Assumptionsonplantknowledge9Assumptionsonplantknowledge.过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制理论研究迭代学习控制理论研究Tools:9normλ−9Super-vectorapproach(LiftingApproach)9FDiAh9FrequencyDomainApproach9LiyaponovApproach92Dsystemapproach过程控制研究所迭代学习控制原理与应用报告人：卜旭辉迭代学习控制理论研究迭代学习控制理论研究Monographsandpapers:轩黄宝健代学控制京防版社9孙明轩,黄宝健.迭代学习控制[M].北京:国防工业出版社,19959XuJ.X.LinearandNonlinearIterativeLearningControl[M].Berlin:SpringerVerlag,2003g9BienZ.,&XuJ.X.Iterativelearningcontrol:analysis,design,integrationandapplications[M],Norwell,MA,USA,KluwerAcademicPublishers,19989ChenYQIterativeLearningControl:Convergencerobustnessand9ChenY.Q.IterativeLearningControl:Convergence,robustnessandapplications[M].NewYork:SpringerVerlag,19999AhnH.S.,ChenY.Q.,&KevinL.M.IterativeLearningControl:BriefSurveyandCategorization[J].IEEETransactionsonSystems,Man,AndCybernetics-PartC:ApplicationsandReviews,2007,37(6):1