人工智能第八章自动规划8.1机器人规划的作用与任务8.2积木机器的机器人规划8.3STRIPS规划系统8.4具有学习能力的规划系统8.5基于专家系统的机器人规划8.6小结38.1机器人规划的作用与任务8.1.1规划的作用与问题分解途径规划的概念及作用–规划的概念规划是一种重要的问题求解技术,它从某个特定的问题状态出发,寻求一系列行为动作,并建立一个操作序列,直到求得目标状态为止。图8.1子规划的分层结构例子工作日规划上午子规划中午子规划下午子规划吃夹心面包阅读写作回家去上班阅读文章4–规划的作用规划可用来监控问题求解过程,并能够在造成较大的危害之前发现差错。规划的好处可归纳为简化搜索、解决目标矛盾以及为差错补偿提供基础。问题分解途径及方法把某些比较复杂的问题分解为一些比较小的子问题。有两条能够实现这种分解的重要途径。–第一条重要途径是当从一个问题状态移动到下一个状态时,无需计算整个新的状态,而只要考虑状态中可能变化了的那些部分。–第二条重要途径是把单一的困难问题分割为几个有希望的较为容易解决的子问题。问题域的预测于规划的修正–(1)问题论域的预测–(2)规划的修正,问题分解使得影响局部化8.1自动规划的作用与任务58.1.2机器人规划系统的任务与方法在规划系统中,必须具有执行下列各项任务的方法:–根据最有效的启发信息,选择应用于下一步的最好规则。–应用所选取的规则来计算由于应用该规则而生成的新状态。–对所求得的解答进行检验。–检验空端,以便舍弃它们,使系统的求解工作向着更有效的方向进行。–检验殆正确的解答,并应用具体的技术使之完全正确。8.1自动规划的作用与任务6选择于应用规则检验解答与空端修正殆正确解78.2积木世界的机器人规划8.2.1积木世界的机器人问题积木世界由一些有标记的立方形积木,互相堆迭在一起构成;机器人有个可移动的机械手,它可以抓起积木块并移动积木从一处至另一处。CBA机械手8在这个例子中机器人能够执行的动作举例如下:–unstack(a,b):把堆放在积木b上的积木a拾起。在进行这个动作之前,要求机器人的手为空手,而且积木a的顶上是空的。–stack(a,b):把积木a堆放在积木b上。动作之前要求机械手必须已抓住积木a,而且积木b顶上必须是空的。–pickup(a):从桌面上拾起积木a,并抓住它不放。在动作之前要求机械手为空手,而且积木a顶上没有任何东西。–putdown(a):把积木a放置到桌面上。要求动作之前机械手已抓住积木a。8.2积木世界的机器人规划9研究内容是综合机器人的动作序列,即在某个给定初始情况下,经过某个动作序列而达到指定的目标。机器人问题的状态描述和目标描述均可用谓词逻辑公式构成:•ON(a,b):积木a在积木b之上。•ONTABLE(a):积木a在桌面上。•CLEAR(a):积木a顶上没有任何东西。•HOLDING(a):机械手正抓住积木a。•HANDEMPTY:机械手为空手。8.2积木世界的机器人规划10图8.4(a)所示为初始布局的机器人问题。目标在于建立一个积木堆,其中,积木B堆在积木C上面,积木A又堆在积木B上面,如图8.4(b)所示。CBA机械手ABC机械手(a)初始布局(b)目标布局图8.4积木世界的机器人问题8.2积木世界的机器人规划11初始布局可由下列谓词公式的合取来表示:–CLEAR(B):积木B顶部为空–CLEAR(C):积木C顶部为空–ON(C,A):积木C堆在积木A上–ONTABLE(A):积木A置于桌面上–ONTABLE(B):积木B置于桌面上–HANDEMPTY:机械手为空手目标布局:–ON(B,C)andON(A,B)8.2积木世界的机器人规划128.2.2用F规则求解规划序列STRIPS规划系统的规则由3部分组成:•第一部分是先决条件。•第二部分是一个叫做删除表的谓词。•第三部分叫做添加表。8.2积木世界的机器人规划13例:表示堆积木的例子中move这个动作,如下所示:move(x,y,z)表示把物体x从物体y上面移到物体z上面。先决条件:CLEAR(x),CLEAR(z),ON(x,y)删除表:ON(x,y),CLEAR(z)添加表:ON(x,z),CLEAR(y)如果move为此机器人仅有的操作符或适用动作,那么,可以生成如图8.5所示的搜索图或搜索树。CLEAR(X)CLEAR(Z)ON(X,Y)ONTABLE(Y)ONTABLE(Z)CLEAR(X)CLEAR(Y)ON(X,Z)ONTABLE(Y)ONTABLE(z)move(X,Y,Z)图8.5表示move动作的搜索树8.2积木世界的机器人规划14机器人的4个动作(或操作符)可用STRIPS形式表示如下:stack(X,Y)先决条件和删除表:HOLDING(X)∧CLEAR(Y)添加表:HANDEMPTY,ON(X,Y)unstack(X,Y)先决条件:HANDEMPTY∧ON(X,Y)∧CLEAR(X)删除表:ON(X,Y),HANDEMPTY添加表:HOLDING(X),CLEAR(Y)pickup(X)先决条件:ONTABLE(X)∧CLEAR(X)∧HANDEMPTY删除表:ONTABLE(X)∧HANDENPTY添加表:HOLDING(X)putdown(X)先决条件和删除表:HOLDING(X)添加表:ONTABLE(X),HANDEMPTY8.2积木世界的机器人规划15从初始状态开始,正向地依次读出连接弧线上的F规则,我们就得到一个能够达到目标状态的动作序列(如图8.3中粗线所示)于下:{unstack(C,A),putdown(C),pickup(B),stack(B,C),pickup(A),stack(A,B)}就把这个动作序列叫做达到这个积木世界机器人问题目标的规划。8.2积木世界的机器人规划16178.3STRIPS规划系统STRIPS的介绍STRIPS是由Fikes、Hart和Nilsson3人在1981及1982研究成功的,它是夏凯(Shakey)机器人程序控制系统的一个组成部分。STRIPS系统组成–世界模型:为一阶谓词演算公式;–操作符(F规则):包括先决条件、删除表和添加表;–操作方法:应用状态空间表示和中间-结局分析。18Strips是Shakey机器人系统的一个组成部分,Shakey机器人系统包括:–(1)车轮及其推进系统;–(2)传感器,由电视摄像机和接触杆组成;–(3)计算机,接受机器人的传感器信息与输入指令,经过计算后向车轮及其推进系统发出信号;–(4)无线通信系统,用于在车轮与计算机之间的数据传递8.3Strips规划系统19Strips的规划过程问题:–(1)初始状态:INROOM(Robot,R1)andINROOM(Box1,R2)andCONNECTS(D1,R1,R2)–(2)目标状态:INROOM(Robot,R1)andINROOM(BOX1,R1)andCONNECTS(D1,R1,R2)操作符OP1:gothru(d,r1,r2);–先决条件:INROOM(b,r1)andCONNECTS(d,r1,r2)–删除表:对所有S,INROOM(Robot,s)–添加表:INROOM(Robot,r2)8.3Strips规划系统20操作符OP2:pushthru(b,d,r1,r2)–先决条件:INROOM(b,r1)andINROOM(Robot,r1)andCONNECTS(d,r1,r2)–删除表:对所有S,INROOM(b,s),INROOM(Robot,s)–添加表:INROOM(b,r2),INROOM(Robot,r2)问题的差别表:8.3Strips规划系统差别操作符gothrupushthru物体不在目标房间内机器人不在目标房间内机器人和物体不在同一房间内机器人和物体在同一房间内,但不是目标房间XXXX21采用中间-结局分析方法求解步骤:–doGPS的主循环迭代,untilM0与G0匹配为止–Begin•G0不能满足M0,找出M0与G0的差别;•选择操作符OP2:一个与减少差别d1有关的操作符;•消去差别d1,为操作符OP2设置先决条件G1:INROOM(b,r1)andINROOM(Robot,r1)andCONNECTS(d,r1,r2)采用置换:R2/r1,D1/d则G1为:INROOM(BOX1,R2)andINROOM(Robot,R2)andCONNECTS(D1,R2,R1)•重复上述步骤,–差异:INROOM(Robot,R2);–选择操作符OP1;–设置先决条件G2:INROOM(Robot,R1)andCONNECTS(d,r1,R2)–采用置换:R1/r1,D1/d则G2满足•把gothru(D1,R1,R2)作用于M0,得中间状态M1;•把pushthru(BOX1,D1,R2,R1)于M1得中间状态M2=G0–END8.3Strips规划系统22最后的规划为:–{gothru(D1,R1,R2),pushthru(BOX1,D1,R2,R1)}8.3Strips规划系统2324含有多重解答的规划例如:要求机器人ROBOT把3个不同区域的箱子推倒同一区域;采用归结反演和中间-结局分析来求解;得到多重解答。258.4具有学习能力的规划系统PULP-Ⅰ机器人规划系统PULP-Ⅰ机器人规划系统是一种具有学习能力的系统,它采用管理式学习,其作用原理是建立在类比(analogue)的基础上的。STRIPS的弱点需要极其大量计算机内存和时间等。应用具有学习能力的规划系统能够克服这一缺点。268.4.1PULP-Ⅰ系统的结构与操作方式PULP-Ⅰ系统的结构“字典”是英语词汇的集合。“模型”部分包括模型世界物体现有状态的事实。“过程”集中了予先准备好的过程知识。“方块”集中了LISP程序,它配合“规划”对“模型”进行搜索和修正。SENEF程序规划与学习字典模型过程方块响应输入图8.14PULP-Ⅰ系统的总体结构8.4具有学习能力的规划系统27PULP-Ⅰ系统的操作方式PULP-Ⅰ系统具有两种操作方式:–学习方式在学习方式下,输入至系统的知识是由操作人员或者所谓“教师”提供的。图8.15表示出在学习方式下的系统操作。存储任务分析方块匹配过程分解学习教师输入任务知识响应图8.15PULP-Ⅰ系统结构8.4具有学习能力的规划系统28–规划方式当某个命令句子送入系统时,PULP-Ⅰ就进入规划方式。上图表示PULP-Ⅰ系统在规划方式下的结构。检索混合规划方块目标检验匹配单一规划规划输入命令响应过程模型图8.16规划方式下PULP-Ⅰ系统的结构8.4具有学习能力的规划系统29分层规划的思想长度优先搜索NOAH规划系统308.5基于专家系统的机器人规划机器人规划专家系统就是用专家系统的结构和技术建立起来的机器人规划系统。管理式学习能力的机器人规划系统的不足:–表达子句的语义网络结构过于复杂。–与复杂的系统内部数据结构有关的是,PULP-Ⅰ系统具有许多子系统。而且需要花费大量时间来编写程序。–尽管PULP-Ⅰ系统的执行速度要比STRIPS系列快得多,然而它仍然不够快。318.5.1系统结构和规划机理系统结构及规划机理机器人用户机器人专家知识用户接口知识库推理机控制策略工具专家系统知识获取说明与分析问题输入或新情况描述回答问题或建议与解释图8.20机器人规划专家系统的结构32–基于规划的机器人规划专家系统由5个部分组成,如图8.20所示。•知识库•控制策略•推理机•知识获取•解释与说明–基于规则的专家系统的目标就是要通过逐条执行规则及其有关操作来逐步地改变总数据库的状况,直到得到一个可接受的数据库(称为目标数据库)为止。8.5基于专家系统的机器人规划33任务级机器人规划三要素–任务规划是机器人高层规划最重要的一个方面,它包含下列3个要素:•建立模型建立机器人工作环境的世界模型。•任务说明•程序综合任务级机器人规划的最后一步是综合机械手的程