移动机器人编队控制的现状与问题杨甜甜1,刘志远1,陈虹2,裴润1(1.哈尔滨工业大学控制科学与工程系,黑龙江哈尔滨150001;2.吉林大学控制科学与工程系,吉林长春130025)摘要:随着机器人向系统应用的方向发展,移动机器人编队控制问题成为研究领域的热点问题。为此,依据解决编队控制问题的不同思路,总结了编队控制的各种研究方法:基于行为法、人工势场法、跟随-领航法、虚结构法、循环法、模型预测控制法、分布式控制法,分别对几种编队控制方法的基本思想和特点进行总结和分析,最后从通用性,稳定性,鲁棒性和安全性等方面阐述了移动机器人编队控制理论与应用方面有待进一步研究的几个主要问题。关键词:移动机器人;编队控制;协调;合作中图分类号:TP24文献标识码:A文章编号:Formationcontrolofmobilerobots:thestateandopenproblemsYANGTian-tian1,LIUZhi-yuan1,CHENHong2,PEIRun1(1.DepartmentofControlScienceandEngineering,HarbinInstituteofTechnology,Harbin150001,China;2.DepartmentofControlScienceandEngineering,JilinUniversity,Changchun130025,China)Abstract:Inrecentyears,theresearchofformationcontrolhasreceivedmuchattentioninrobotics.Formultiplemobilerobots,acomprehensivereviewofformationcontrolunderdifferentkindsofscenariosisprovided.Recentresultsonapproachesincludingbehaviorbasedapproach,potentialfieldapproach,leader-followerapproach,virtualstructureapproach,cyclicapproach,modelpredictivecontrolapproach,distributedapproacharereviewed.Someopenproblemsconcerningthetheoreticalandpracticalpropertiesarealsodiscussedfromtheaspectsofgenerality,stability,robustnessandsafety.Keyword:mobilerobot;formationcontrol;coordination;cooperation1近年来,随着计算机技术和无线通信技术的发展,多机器人协调合作已经成为可能,而且得到了越来越多的应用。多个机器人协调合作可以完成单一机器人难以完成的任务。其中编队问题是多机器人协调合作中的一个典型性的问题,所谓的编队控制是指多个机器人在到达目的地的过程中,保持某种队形,同时又要适应环境约束的控制技术。多机器人的编队控制是目前国内外研究的热门课题,也是研究其它协调合作问题的基础。通常协调是为了解决机器人之间的冲突和矛盾。对于自主移动机器人编队问题来说,冲突主要就是碰撞,也就是说在同一时刻多个机器人不能处于同一位置。协作是指机器人通过一种机制合作完成一项任务,对于自主移动机器人编队问题来说合作就是保持队形,在各时刻各机器人的位置满足一种数学关系。对于机器人系统而言,多机基金项目:国家自然科学基金资助项目(60234030)和(60374027)器人之间保持一定的队形具有许多优点,比如,空间结构中特定队形的实现可以充分有效的利用多移动机器人完成任务,缩短执行任务的时间,降低系统的成本,提高系统的工作效率,能充分获取当前的环境信息,在对抗性环境中能增强抵抗外界进攻的能力,并且能够提高鲁棒性等等。编队控制在军事、娱乐、生产等各个领域有广泛的应用。尤其是军事领域有着广泛的应用,例如航天器、无人机的编队飞行、自主水下航行器的编队航行。因此,实现一个合理、有效的编队控制方法将具有重要的理论及现实意义。目前,关于机器人的编队控制国内外的学者作了大量的研究。本文依据解决编队控制问题的不同思路,总结并分析了编队控制的研究现状以及存在的问题。1机器人编队控制方法本文对几种编队控制方法的基本思想和特点进行总结和分析,并且指出关于编队控制需要进一步研究的几个问题。1.1基于行为法基于行为的控制方法主要是通过对机器人基本行为以及局部控制规则的设计使得机器人群体产生所需的整体行为。编队控制器由一系列行为组成,每个机器人有基本的行为方式,每个行为方式又有自己的目标或任务。一般情况下,机器人的行为包括避碰、避障、驶向目标和保持队形等。对于编队控制来说,队形保持是一个基本的独立行为。驶向目标的“目标”是指事先指定的状态,因此队形保持和驶向目标是两个不同的行为。避障是指动态环境下编队机器人运动过程中避免碰到障碍物。避碰是指运动过程中避免机器人之间的相互碰撞。Balch和Arkin首先提出了基于行为的控制方法[1]。文章中考虑一种基于领航的队形,利用两个循环策略设计保持队形行为控制器。文中同时还考虑了其它几种行为,包括避障、避碰、驶向目标。文献[2]提出各子行为加权综合的控制实现方法,即对每个子行为分别求出控制变量,然后对这些控制量进行加权平均求得综合的控制变量;在文献[3]中,利用遗传算法对加权量进行优化配置,从而实现多机器人之间的协调编队控制。文献[4]中,基于行为编队控制方法解决非线性系统的轨迹生成和避障问题。文献[5]借用分子形成晶体的方法确定机器人在队形中的目标位置,从而影响行为的选择。文献[6]采用3层基于行为的控制体系结构,应用“socialroles”来代表机器人在队形中的位置,并动态分配给机器人以形成和保持队形,用局部通信来提高性能,从而支持各种队形及其切换。基于行为的控制器是由一系列行为组成,每个行为有自己的目标或任务。当机器人具有多个竞争性目标时,可以很容易地得出控制策略,并且可以实现分布式控制。但缺点是我们无法明确的指出达到整体行为的局部控制规则,队形控制的稳定性很难得到保证。1.2人工势场法人工势场法主要是通过设计人工势场和势场函数来表示环境以及队形中各机器人之间的约束关系,并以此为基础进行分析和控制。Khatib[7]于1986年提出了人工势场法,它的基本思想是机器人在一个虚拟的力场中运动,障碍物被斥力势场包围,其产生的排斥力随机器人与障碍物距离的减少而迅速增大;目标点被引力势场包围,其产生的吸引力随机器人与目标点的接近而减少;在合力的作用下机器人沿最小化势能的方向运动。文献[8]基于人工势场法提出一种编队控制器,应用在机器人出现故障或者不完整的传感器信息的情况下。文献[9]提出了一种基于势函数的、能够有效地对多机器人系统的编队队形进行稳定性分析的分布控制的方法。文章通过选择适当的、与目标和结构相关的势函数,利用图论知识和李亚普诺夫稳定理论,设计了一种新颖的能够稳定机器人编队队形并有效跟踪目标的分布控制律,并给出了多机器人系统编队队形稳定及控制问题有解的充分条件。在文献[10]中用势场函数表示机器人之间设定的队形和运动轨迹,从而设计编队控制器。文献[11]中同时考虑存在障碍物环境下的编队控制问题,提出非完整移动机器人基于势场函数的分布式控制器。这种分布式控制器能够保证编队机器人达到设定的队形,同时避免相互间的碰撞以及与动态环境下障碍物的碰撞。文献[12]依据在一定范围内吸引远处的邻居并排斥离得太近的邻居的原则,使用势场法,通过虚领航者调整队形或控制队形的运动。文献[13]利用人工势场和虚领航者作为内在的协调框架,提出了控制队形运动的稳定策略。文献[14]将理想队形的约束表示为势场函数,研究了队形的稳定性及控制器的设计。文献[15]将环境的信息如邻居、障碍、威胁和目标等编码为一个势场函数,分析了队形的稳定即匀衡,并仿真实现了利用多个机器人覆盖某一目标区域的任务。人工势场法计算简单,便于实现实时控制,尤其对于处理障碍物空间的避碰问题是比较有效的。但是势场函数的设计比较困难,而且存在局部极值点的问题。Rimon和Koditschek[16]在1992年提出一种更精确构造势场函数的方法。为了区别于之前的势场函数,把这种势场函数描述为导航函数(navigationfunction),它只存在一个局部最小点,同时也是全局最小点。这种描述方法也被应用在同时考虑避障问题的编队控制中文献[17][18][19]。1.3跟随-领航方法跟随领航者法的基本思想是在多机器人组成的群体中,某个机器人被指定为领航者,其余作为它的跟随者,跟随者以一定的距离间隔跟踪领航机器人的位置和方向.对该方法进行拓展,即不仅可以指定一个领航者,也可以指定多个,但群体队形的领航者只有一个。对于跟随领航者法有两种控制器形式:ll控制器和l控制器。l控制器的控制目标是使跟随者和领航者之间的距离和相对转角达到设定值[20]。ll控制器考虑的是三个机器人之间的相对位置问题。当跟随者和两个领航者之间的距离达到设定值的话,就可以认为整个队形稳定了。文献[20]利用跟随者和领航者之间的相对运动模型设计控制器保证无碰撞的达到指定队形,同时能够处理对象模型中的参数不确定性。多机器人编队控制的另一种方法就是将输入输出反馈线性化控制律施加于跟随机器人,其合乎要求的运动轨迹与领航机器人有一定的关系[21,22]。使用输入输出反馈线性化控制方法,多机器人能够取得复杂的编队。编队里的每一个机器人可以跟随一个领航机器人并且作为一个或者多个其他机器人的领航者。文献[23]中利用领航者和跟随者之间的相对方程对领航者的状态进行估计,从而求得跟随者的控制器。目前的跟随-领航模式,如果出现故障的领航机器人后面还有以它为参考点的跟随机器人,其结果将会是出现一个或多个后继机器人掉队,编队无法继续保持,从而直接影响到编队任务的正常完成。文献[24]针对多机器人队伍中某台机器人出现的通信或机械故障,建立一种编队容错控制算法,在机器人出现故障后,机器人队伍能自动重新调整编队,避免故障机器人的后继机器人掉队,实现编队的容错控制。跟随-领航方法控制简单,只需要控制跟随机器人跟踪领航机器人的轨迹,这样仅仅给定领航者的行为或轨迹就可以控制整个机器人群体的行为。可以把编队控制问题简化为独立的跟踪问题,每个机器人只需要获得它的领航机器人的状态信息,从而大大简化了队形间的合作问题。例如在领航-跟随队形中再增加一个机器人的话只需要增加一个局部控制器并指定一个领航机器人就可以,不需要重新设计控制器。而且当某一个机器人失效时,只有后继的跟随机器人受到影响,通过重新安排跟随机器人就可以消除这种失效带来的问题。但是以上的优点是在损失全局最优性的前提下带来的,这里考虑的只是跟随机器人和领航机器人之间的最优问题而不是全局的最优编队问题。1.4虚结构法虚结构的概念最开始被引用在文献[25]中。虚结构法主要应用在飞行器和人造卫星的编队飞行控制中。这类方法的特点是,机器人之间可以保持一定的几何形状,它们之间形成了一个刚性结构,这样的结构称为虚拟结构。虽然每个机器人相对于参考系统位置不变,但它仍可以以一定的自由度来改变自己的方向。多机器人以刚体上的不同点作为各自的跟踪目标就可以形成一定的队形。实现此方法需要三个步骤:首先,定义虚拟结构的期望动力学特性;然后,将虚拟结构的运动转化成每个机器人的期望运动;最后得出机器人的轨迹跟踪控制方法。在文献[26]中,虚结构法、跟随领航法和基于行为法一起用来实现深空飞行器的编队控制。类似的方法也出现在文献[27]中。虚拟结构方法是用刚体的虚拟结构与结构中的固定位置实现队形控制。利用虚拟结构法可以很容易地指定机器人群体的行为(虚拟结构的行为),并可以进行队形反馈,能够