Agent的课件02

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章逻辑Agent逻辑Agent是基于知识的智能体,它采用推理过程来得到关于新世界的表示,并且用这些新表示推到下一步做什么。逻辑Agent能够将常识和当前的感知结合起来,从而在选择行动之前推导出当前状态的隐藏部分。逻辑Agent具有很好的灵活性,能够接受以明确描述目标的形式来表示的新任务,通过被告知或者主动学习环境的新知识从而快速获得能力,并可以通过更新相关知识来适应环境的变化。医生看病自然语言理解逻辑Agent逻辑Agent的核心构件是知识库(KB),它是一个语句的集合,这些语句表示了关于世界的某些断言,它的核心动作是推理——即从已有的语句中推导出新的语句,这也意味着推理过程不能虚构事实。FunctionKB-Agent(percept)returnsanactionStatic:KB,aknowledgebaset,acouter,initially0,indicatingtimeTell(KB,Make-Percept-Sentence(percept,t))ActionAsk(KB,Make-Action-Query(t))Tell(KB,Make-Action-Sentence(action,t))tt+1returnactionMake-Percept-Sentence接受一个感知信息和一个时刻,返回一个声明智能体在该给定时刻接收到了该感知信息的语句Make-Action-Query接受一个时刻作为输入,返回一个询问在该时刻应该执行什么行动的语句逻辑Agent——两关键问题转换问题:把现实世界转换成这个世界的准确恰当的符号表示的问题,这种表示是有用的;表示和推理问题:用符号表示信息并且让Agent使用这种表示进行处理和推理的问题,这种结果是有用的。前一个问题导出视觉、语音理解、学习等方面的工作,后一个问题导出知识表示、自动推理、自动规划等问题。这些问题已做了大量工作,但无论从哪方面来说都还没有解决,如常识推理。逻辑Agent例子——wumpus世界由多个房间组成,用通道连接起来的洞穴。在洞穴的某处隐藏着一只wumpus恶兽,它会吃掉进入它房间的任何人。智能体可以射杀wumpus,但是智能体只有一支箭。某些房间内有陷阱,任何除wumpus之外的人漫游到这些房间将被陷阱吞噬,房间中存在发现一堆金子的可能性。——MichaelGenesereth最先提出臭气陷阱微风金子Agent12434321环境?执行器?传感器?性能度量?wumpus世界的精确定义环境:4×4的房间网格,每次从[4,1]出发,面向右方。金子和wumpus的位置按均匀分布随机选择除了起始方格以外的方格。除了起始方格以外的任一方格都可能是一个陷阱,概率为0.2执行器:智能体可以向前移动,左转90度或右转90度,如果它进入一个有陷阱或者活着wumpus的方格,将悲惨死去,如果智能体前方有一堵墙,那么向前移动无效。行动Grab可以用于捡起智能体所处方格内的一个物体。行动Shoot可以用于向智能体所正对的方向射出一支箭。在没有击中wumpus或者墙之前箭继续向前运动。智能体只有一支箭。传感器:有五个传感器,每个提供一些单一信息•在wumpus所在之处以及直接相邻(非对角)的方格内,智能体能感知到臭气•在与陷阱直接相邻的方格内,智能体能感知到微风•在金子所处的方格内,智能体能感知到闪闪金光•当智能体撞到墙时,它感知到撞击•当wumpus被杀死时,它发出洞穴内的任何地方都可感知到的悲惨嚎叫性能度量:拾到金子+1000,掉入陷阱或被wumpus吞噬-1000,每采用一个行动得-1,而用掉箭-10wumpus世界的知识表示和逻辑推理以前面图示为例进行讲解A:AgentB:BreezeG:Glitter,GoldOK:SafeSquareP:PitS:StenchV:VisitedW:Wumpus如感知[Stench,None,None,None,None]如位置[1,2]用命题逻辑表示和进行推理讨论题假如由Agent来玩扫雷游戏,讨论扫雷游戏中的环境、执行器、感知器和性能度量;在此基础上讨论知识表示和推理规则以及运行的大致过程假如由两个Agent来下五子棋,讨论其环境、执行器、感知器和性能度量讨论题——瓦片世界瓦片世界最初是作为一个实验环境来评价Agent结构的。这是一个仿真的两维网格环境,其中有Agent、瓦片、障碍物和洞穴等。Agent可以向上、下、左、右四个方向运动,如果Agent在一个瓦片旁边,则可以推这个瓦片。障碍物是不能移动的一组网格,Agent不能随意通过这些障碍物。Agent必须用瓦片填满洞穴。Agent得分的点数通过用瓦片填满的洞穴以及时间步综合计算,目标是尽可能快地填满尽可能多的洞穴。关于“瓦片世界”的说明瓦片世界是一个动态环境的例子,从随机产生的世界状态开始,根据用户设定的参数,在离散步中随时改变洞穴的随机出现和消失。用户可以设定瓦片世界的某些参数,包括瓦片、障碍物和洞穴出现的频率。在瓦片世界中,洞穴是随机出现的,它们将按概率生命存在,除非由于Agent的动作使其消失。洞穴相继出现的时间间隔称为洞穴酝酿时间。演绎推理和实用推理用基于逻辑的方法构造Agent,做出决策就是演绎过程。(纯逻辑推理或理论推理)直接导致信念。用于决策的特定的模型称为实用推理,实用推理是直接通过推理得到动作——描述出做什么动作的过程。人类实用推理可由至少两个不同的行为组成:(1)决定想要达到什么状态;(慎思过程)(2)决定如何实现这些状态。(目的-手段推理)实用推理中的意图意图既刻画动作也刻画思维状态,但我们所讲的意图指的是思维状态,特别是指未来的意图,即Agent有意图实现将来的某一状态。意图的特性:预动性:意图将导致行动。持续性:坚持意图并努力实现,但当产生意图的原因消失时也应该放弃意图。一旦采纳了一个意图,这个意图具有的每个事实会约束将来的实用推理。意图与未来的信念有密切关系。意图驱动目标-手段推理没有足够的理由一般不会放弃一个意图意图约束未来的慎思意图影响作为未来实用推理的信念Agent对于信念、愿望和意图保持显示的表示,而并不关心信念等如何进行表示实用推理中的慎思过程模型选择生成函数:)()()(:DesPIntPBelPoption)()(:BelPPerBelPbrf)()()()(:IntPIntPDesPBelPfilter过滤函数:表示所有信念的集合,表示所有可能的意图的集合,表示所有愿望的集合,该函数接受Agent当前的信念和意图,以此为基础产生可能的选择或愿望的集合BelIntDes为了从竞争的选项中作出选择,Agent使用过滤函数,直觉上过滤函数必须作出“最佳”的选择供Agent做出承诺。Agent的信念更新过程通过信念修正函数建模,表示如下:实用推理中的手段-目的推理手段-目的推理是使用已有的手段(即可以采取的动作)决定如何实现目标(即意图)的过程。对手段的承诺Agent用来决定什么时候以及如何放弃意图的机制称为承诺策略•盲目承诺:将一直维持一个意图,直到它相信这个意图真的已经实现为止。也称狂热的承诺。•专一承诺:将一直维持一个意图,直到它相信这个意图已经实现或者已经不可能实现这个意图为止。•坦率承诺:将维持一个意图,只要它相信这个意图仍可能实现。对目的的承诺承诺的程度和承诺的重新考虑之间的权衡用一个Boolean函数,使得当且仅当具有信念B和意图I的Agent重新考虑它的意图的适当的情形,函数值为真。由这个函数决定是否重新考虑意图。),(BIreconsiderDavidKinny和MichaelGeorgeff所做试验的权衡策略:鲁莽的Agent和谨慎的Agent,前者在当前规划的动作被全部执行以前从来不停下来重新考虑他们的意图;后者在Agent执行每次动作之后都停下来重新考虑。结论如下:不同的环境类型需要不同的意图重新考虑和承诺策略,在静态环境中,对意图强承诺的Agent会做的更好,因为重新考虑承诺会耗费资源,但在动态环境中,通过改变意图对变化做出的反应能力变得更为重要,谨慎承诺的Agent做的更好。过程推理系统(PRS)第一个显式嵌入信念-愿望-意图模式的Agent结构,迄今为止开发最持久的Agent结构,已应用于OSASIS的航空运输系统(目前正在悉尼机场进行现场试验)等多个系统中。StandfordResearch研究所:MichaelGeorgeffAmyLanskyAgent信念解释器愿望规划意图动作输出环境来自传感器的数据输入推理Agent的优缺点基于逻辑的方法优美并且(逻辑)语义清晰;考虑到它理论的复杂性,关于复杂、动态的物理环境的表示和推理问题仍然是没有解决的基本问题不能满足构造运行在有时间约束环境中Agent的需要。第四章反应式Agent和混合式Agent反应式AgentBrooks与归类式结构反应式Agent的局限性混合式Agent等级结构InteRRap和Touring例子归类式结构归类式结构是一种有争议的也是最著名的反应式Agent结构,是对符号法Agent最直率、最有影响的批评者之一。其三种主要观点为:智能行为无需明确使用符号AI建议的那类表示方法就能够产生;智能行为无需使用符号AI建议的那类精确的抽象推理就能够产生;智能是某种复杂系统自然产生的属性。归类式结构的特点Agent做决策,通过一个完成任务的行为集合实现的,每一种行为都被看成一个单独的Action函数,一般是将感知的输入直接映射成动作:情景-动作很多行为可以同时触发,这些行为可以组织成归类式等级,等级结构中的底层可以抑制高层,层次越低,优先权就越高,其思想是越高的层次表示越抽象的行为。归类式Agent的决策逻辑可以由硬件实现,以实现计算的简单性。反应式Agent的局限性反应式Agent的优点:简单、经济、易计算性、预防失败的健壮性以及精巧性等。但是:如果Agent没有使用它所处环境的模型,则它在局部环境中一定要有充分的可用的信息来决定一个可以接受的动作;由于纯反应式Agent按照局部信息(即关于Agent当前状态的信息)做出决策,很难想象这种决策方法能考虑非局部信息,它必然是天生的短视;从工程上实现反应式Agent以完成特定的任务非常困难;要构造一个包含很多层的Agent十分困难,不同行为间交互的动态过程变得十分复杂并且难以理解。混合式Agent假定要求Agent具有反应行为能力和预动行为能力,要处理这些不同类型的行为,要包括构造不同的子系统,这种思想导致一类结构:各子系统被排列成层次间互相交互的等级结构。一般来讲至少有两层,分别处理反应行为和预动行为。可以从层次间信息流和控制流的角度来刻画这种结构,可分为水平层和垂直层两类。水平层结构水平层结构中,每一个软件层都与传感器输入和动作输出直接相连,从效果上来讲,每一层都扮演一个Agent的角色,产生关于执行什么动作的建议。第n层第1层第2层……感知输入动作输出垂直层结构垂直层结构中每个传感器输入和动作输出最多与一层有关。第n层第1层第2层……感知输入动作输出第n层第1层第2层……感知输入动作输出一路控制二路控制Touring机——水平层次的Agent机构模型层反应层规划层感知子系统动作子系统控制子系统传感器输入动作输出InteRRap——二路垂直层次Agent世界接口感知输入动作输出行为层世界模型规划层协作层规划知识社会知识

1 / 25
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功