·智能控制技术·徐林孙树栋陈立彬等基于最小值原理的壁面攀爬机器人37基于最小值原理的壁面攀爬机器人时间最优控制徐林,孙树栋,陈立彬,杨建元(西北工业大学机电学院,陕西西安710072)摘要:首先简要介绍了一种新型双索牵引壁面攀爬机器人结构,并建立了该系统的数学模型。其次,依据庞特里雅金最小值原理推出了机器人本体两点间运动时间最优的控制律,并将该非线性方程组的求解看作是一个两点边值问题,通过引入简单打靶法以及一种初值猜测技术来求解该方程组。最后,数值仿真表明所建模型及控制规律是可行的。关键词:壁面攀爬机器人;最小值原理;时间最优控制;两点边值问题;打靶法中图分类号:TP242.3文献标识码:A文章编号:1672-1616(2006)21-0037-05随着城市规模的不断扩大,越来越多的高层建筑如雨后春笋般涌现出来,人们在惊叹现代建筑艺术、享受现代生活的同时,又面临着一个关系生命安危的问题———那就是高层消防和救援问题。研究人员已经提出了利用消防特种机器人和高空作业机器人的方法。但是,现有的消防特种机器人大多只能在地面作业;而高空作业机器人,由于一部分采用的是吸附的运动方式,使得其移动速度较慢,可携带的负载也较轻,无法快速进入着火点实施有效的消防和救援作业;另一部分采用楼顶预置水平轨道的吊篮型装置,虽然其运动迅速,且有一定的负载能力,但是预置楼顶轨道的要求致使这种装置不适用于消防、救灾等作业。针对高空消防、救援等作业的特殊要求,我们提出一种特殊的机器人组合系统,使机器人本体能携带较大负载且能快速到达着火点实施侦察、消防及救援工作。1时间最优控制模型建立1.1原理简述和分析攀爬机器人组合系统工作原理可简述为:通过一种无限程攀爬装置将地面动力电机的绕转扭矩经牵引钢丝绳远距离传递给机器人本体,本体利用摩擦力作用将该扭矩转化为其攀升的动力,从而实现了通过地面电机对机器人本体壁面运动的驱动。这一组合方式大大减小了机器人本身的质量,并实现了机器人作业系统与动力系统的有效分离,通过加大地面电机的驱动能力就可以增加机器人本体的负载能力;通过调节地面电机的转速就可以有效控制机器人壁面运动的速度及方向。图1所示为整个机器人组合系统原理示意图。图1机器人组合系统原理示意图本文的目的在于研究该系统从地面运动到着火点的最优时间控制算法。因此有必要对系统模型加以简化:(1)机器人本体可看作是质点;(2)整个系统处于同一垂直面内;(3)忽略悬挂钢丝绳的重力;(4)不考虑机器人本体在铅锤面内的避障问题;(5)不考虑电机转绕对牵引运动各物理参量的扰动;(6)不考虑阵风等高空环境对机器人的扰动;(7)不考虑控制响应迟滞等问题;(8)不考虑各种影响机器人本体运动的机械阻力;(9)简化运程传输系统,将系统模型简化成两电机位于两牵引绳悬点,电机转绕牵引绳直接驱动机器人本体攀爬的非对称可变摆长的双线摆模型;(10)不考虑机器人本体在壁面法线方向上的运动。收稿日期:2006-07-26基金项目:国家863计划资助项目(2003AA421010);西北工业大学研究生创业种子基金资助项目(Z200528)作者简介:徐林(1982-),男,湖北武汉人,西北工业大学硕士研究生,主要研究方向为机电一体化及机器人技术。L2+(xl0-xl)2-2L(xl0-xl)cos(α+α0)∫382006年11月中国制造业信息化第35卷第21期这样一来,该系统简化模型(如图2所示)的时间最优控制问题就可以看成是一个非对称双线摆沿摆线运动的时间最优控制问题了。图2直角坐标中系统分析图日本东急建设技术研究所开发了一款用于建筑物壁面诊断的绳索牵引式壁面移动机器人[1],它与本文所提到的简化模型基本相同,但是它没有给出详细的自动控制方案,也没有研究相关的时间最优控制问题。其实,对时间最优控制问题的研究由来已久,其理论已相当成熟[2]。目前对时间最优控制问题的研究主要基于两种理论:一种是基于庞特里雅金极大(小)值原理;另一种是基于李雅普诺夫稳定理论。后者相比前者来说因其函数与状态量有关,故更易得到反馈控制规律,但同时也更难以求解。由于本文所研究的最优控制算法将最终用于开环系统的实时计算,并且实际应用对精度要求不是很高,所以本文所研究的非对称双线摆沿摆线运动的时间最优控制问题将基于庞特里雅金最小值原理来加以求解[3]。1.2非对称双线摆的数学模型本系统在两绳牵引力Fl和Fr的作用下有确定的运动速度和轨迹,系统自由度为2。如图2所示建立壁面直角坐标系,设机器人本体在固定起点(x0,y0)处,左牵引绳长为xl0,指向悬点的绳长绝对变化量为xl;左悬绳与水平线所夹锐角大小为-α0(α0为绝对值小于或等于π/2的负数),该夹角逆时针方向的绝对变化量为α。左右牵引绳所形成的夹角为β。设系统广义坐标为xl和α,得系统的拉格朗日方程为:m[¨xl+(xl0-xl)α´2]=Fl+Frcosβ+mgsin(α+α0)m(xl0-xl)α¨-2m´xlα´=Frsinβ-mgcos(α+α0)β=arcsin-Lsin(α+α0)(1)式中:m是机器人本体的质量;L为两悬点间的水平距离;g为重力加速度。1.3最优控制问题的数学描述´xl=vl状态方程为:X´=F(X(t),U(t))=f(X(t))+B(X(t))U(t)(2)控制量约束方程:令α´=ω,将非对称双线摆的数学模型转化0≤U(t)≤Umax(3)为状态方程的形式,并将各种约束条件及边界条件用数学表达式加以表达,从而得到了本文所要研究的非对称双线摆模型时间最优控制的数学描述为:令X(t)=[x1(t),α(t),v1(t),ω(t)]TU(t)=[F1(t),Fr(t)]T0000Umax=[FlmaxFrmax]T边界条件:起点约束X(t0)-X0=0(4)终点约束g(X(tf),tf)=X(tf)-Xf=0(5)Xf=[xlfαf00]TB(X)=1mcosβm指标函数:tf0sinβm(x10-x1)J(®)=1dt=tf-t0(6)t0f(X)=v1ω-gsin(α+α0)-(x1-x10)ω22时间最优控制模型求解2.1时间最优控制律2v1ωx10-x1-gcos(α-α0)x10-x1由系统状态方程可知该系统为一时间tf可变,具有固定端点及控制量约束的最优控制问题。r333·智能控制技术·徐林孙树栋陈立彬等基于最小值原理的壁面攀爬机器人39设存在向量值函数Ψ(t)=[ψ1ψ2ψ3ψ4]T,该模型的哈密顿函数为:H(X,U,Ψ)=-1+ΨTf(X,U,t)+ΨTB(X)U(t)(7)设U3(t)=[Fl3(t),F3(t)]T是式(2)和(6)的最优控制函数,X3(t)=[xl(t),α(t),vl(t),ω3(t)]T是相应的最优轨线,(tf-t0)是最优时间,由最大值原理得最优控制满足以下必要条件:a.状态方程:X´3(t)=f(X3(t))+B(X3(t))U3(t)(8)b.协态方程:(L.Fox)、变量法(R.S.Varga)、配置法(L.Col2latz)、伪线性化法(R.Bellman)和打靶法(P.B.Bailey,H.B.Keller,T.R.Goodman,etc)。其中打靶法由于简单,易于编程且能保证局部收敛性,因此应用较多。但是应用打靶法求解两点边值问题时需要首先猜测未知状态变量的初值,当猜测值与真值相差较大时,计算过程往往会陷入局部极值点,或者使计算过程发散。本文在一种初值猜测技术[4]的基础上应用打靶法[5]求解关于该攀爬机器人时间最优控制的两点边值问题。2.2.1初值猜测将向量值函数Ψ(t)在初始时刻的某些邻域Ψ´(t)=G(X(t),U(t),Ψ(t))=-5H5X(9)内进行一阶泰勒展开,得到如下一组方程式:c.横截条件:5g(X(tf),tf)ψ(tn)=ψ(t0)+ψ´(tn)|t0(tn-t0)(15)ΨT(tf)=-μT5Xf(10)将式(9)、(15)代入式(13)中得:5HT式中μT=[μ1,μ2,μ3,μ4]是待定的Lagrange乘子-1+[Ψ(t0)-5X|t0(tn-t0)][f(X(tn))+向量。此外,H(X3(t),U3(t),Ψ(t))沿U3(t)达到极大,即H(X3(t),U3(t),Ψ(t))=B(X(tn))U(tn)]=0(16)如果控制量U(t)在初始时刻的值可大体估算出来,则将状态方程在该邻域内进行反向积分,max0≤U(t)≤UmaxH(X3(t),U(t),Ψ(t))(11)即可求得X(tn)的值。系统控制为bang-bang型控制量具有闭集约束,因此其最优控制量为一开关函数,该控制过程也即是一典型的Bang-Bang型控制。Umaxq(t)0控制,设在初始时刻t0的某些邻域内U(tn)=U(t0)=Umax,则根据初始条件,f(X(tn))+B(X(tn))U(tn)的值就可以由初始条件计算出来。选取不同的时间点tn,就可以由式(16)得到U3(t)=0q(t)0任意值q(t)=0(12)一组以Ψ(t0)为自变量的线性方程组,求解该方程组就可得到向量值函数Ψ(t)的一组初值。式中q(t)为与时间t等有关的切换函数。另外,由于该系统状态方程及哈密顿函数不显含时间t,系统为一定常系统,且终端时间tf自由,根据哈密顿函数的性质可得:2.2.2打靶法求解首先估计向量值函数的初值Ψ(t0)=Ψ0,解初值为X(t0)=X0,Ψ(t0)=Ψ0的正则方程(式(8)和(9)组成的八元非线性方程组)的初值问题,可解得H(X3(t),U3(t),Ψ(t))≡0(13)X0(t),Ψ0(t)和tf以及X0(tf),Ψ0(tf)。若2.2两点边值问题的数值解法由时间最优控制律可知,系统需要求解的未知量有:X3(t)=[xl(t)α(t)vl(t)ω(t)]T,Ψ(t)=[ψ1(t)ψ2(t)ψ3(t)ψ4(t)]T,X(tf)=Xf,则计算停止;若δX0(tf)=X0(tf)-Xf≠0,则对估计的初值Ψ0(t0)=Ψ0迭代地进行修正Ψ′(t0)=Ψ′=Ψ0+δΨ0(t0),其中δΨ0(t0)是修正的待求变分项。方法要点是通过正则方程的变分方U3(t)=[Fl3(t),F3(t)]T,μ=[μ,μ,μ,r123μ4]T,以及最优时间tf,共15个待求量,而相应的程的转移矩阵算法得到变分形式的修正项δΨ0(t0)。取正则方程沿X0(t),Ψ0(t)的变分方程是:关系式(式(8)~(13)),外加求最优时间tf的关系式:H(X3(tf),U3(tf),Ψ(tf))=0(14)以及式(15)、(16)也有15个待求量,假设系统正5FδX0′5X=δΨ05G5X5F5Ψ5G5Ψ(0)δX0δΨ0(17)则,时间最优控制存在且惟一,则系统可看作是一个两点边值问题。对于两点边值问题目前大多采用数值方法进行求解,主要的数值方法有:插值法上述变分方程的初值中的Ψ′(t0)就是一步迭代求得的初值,即δΨ0(t0)是待定的初值修正项;而初值和终点值可视为是已知的。402006年11月中国制造业信息化第35卷第21期δX0(t0)0=′0Φ11(tf,t0)Φ12(tf,t0)δX0(t0)(21)δΨ0(t0)Ψ(t0)-ΨΦ21(tf,t0)Φ22(tf,t0)δΨ0(t0)δX0(tf)X0(tf)-X(tf)又因为δΨ0(tf)=0δ,X0(t0)=0,所以=(18)0()=Φ(t,t)δΨ0(t)(22)δΨ0(tf)0δXtf12f00欲解变分方程,考虑其转移矩阵方程从而初值修正项为5F5FδΨ0(t0)=Φ-1(t,t)δX0(t)(23)12f0f5X5Ψ0()=X0(t)-X(t),这样就得到dΦ(t,t0)=Φ(t,t0),(19)而δXtfffdt5G5GΨ(t)=Ψ,新的迭代值为5X5Ψ(0)001000Φ(t0,t0)=I8×8则变分方程有解Φ-1Ψ(t0)=Ψ(t0)+δΨ(t0)=Ψ(t0)+012(tf,t0)[X(tf)-X(tf)](24)1δX0(t)Φ11Φ12=