足球机器人决策系统的设计与实现

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

足球机器人决策系统的设计与实现作者:陆永忠,柯文德,LUYong-zhong,KEWen-de作者单位:华中科技大学软件学院,湖北,武汉,430074刊名:计算机仿真英文刊名:COMPUTERSIMULATION年,卷(期):2007,24(9)被引用次数:1次参考文献(13条)1.洪炳熔.韩学东.孟伟机器人足球比赛研究[期刊论文]-机器人2001(04)2.KHKIM.KWKOTheDevelopmentofaMicroRobotSystemforRobotSoccerGame19973.洪炳熔.刘新宇基于视觉的足球机器人系统2001(01)4.刘春阳.柳长安.周宏基于进化机制的足球机器人决策子系统设计[期刊论文]-哈尔滨工业大学学报2004(07)5.赵逢达.孔令富.李贤善基于分层结构模型的机器人足球决策系统设计[期刊论文]-哈尔滨工业大学学报2005(07)6.张小川足球机器人决策子系统的分析与设计2004(zk)7.陈鑫.吴敏.车迅足球机器人决策子系统设计与分析[期刊论文]-计算技术与自动化2001(03)8.郭路生.杨林权.吕维先基于Bézier曲线的机器人足球射门算法[期刊论文]-哈尔滨工业大学学报2005(07)9.周军FIRA足球机器人守门员防守策略设计[期刊论文]-哈尔滨工业大学学报2004(07)10.JHarvey.CChengHighLevelDesignofaMIROSOTSimulator199611.FGirault.SStinchwichFootuxTeamDescription:AHybridRecursiveBasedAgentArchitecture199912.SungHoKim.JongSukChoi.JaeKwonKimACooperativeMicroRobotSystemPlayingSoccer199713.JBorenstein.YKorenReal-timeObstacleAvoidanceforLastMobileRobots1989(05)相似文献(10条)1.学位论文刘阳基于多智能体的足球机器人系统决策模型设计2004足球机器人系统是目前进行人工智能和多智能体系统研究的热点,其集高科技和娱乐性于一体的特点吸引了国内外大批学者的兴趣.足球机器人系统由机器人小车子系统、视觉子系统、决策子系统和通信子系统四部分组成.决策子系统是整个系统的核心部分,它主动完成知识提取并确定机器人的协同任务.目前对足球机器人系统决策策略的研究都是采用物理上甚至逻辑上完全集中式的协调方式,决策模型都是以计算机为载体的,所有的决策任务都是在计算机内完成,小车在系统中只是无智能的执行机构.从物理上来说,这种决策模型结构并不是一个多智能体结构.本文从多智能体的角度,针对MiroSot系列足球机器人3vs3项目建立了一种基于多智能体的决策模型.模型采用集中与分布相结合的协调方式,将决策分为高级控制层和基本控制层两个部分,分别在计算机和小车控制器中完成.在这种模型中,小车要完成部分的决策任务,是具有决策能力的智能个体.在高级控制层的设计中,在原来场地分区法的基础上提出了用状态映射表法进行场上态势分析的方法,这种方法具有更高的动态适应性,可以更准确的反映了场上情况.在基本控制层的设计中,提出了将小车路径分为定点直线运动和圆弧运动两个阶段控制的方法,并且采用模糊控制算法来实现定点直线运动的基本路径控制.在基本控制层的实现中,给出了适合本文决策模型的通信协议.本文的研究为足球机器人系统向全自主式机器人系统开发打下了基础,更接近人类足球比赛,使后续的研究工作更具有现实意义.2.会议论文谢云.杨宜民基于多智能体的全自主足球机器人系统的组织结构及其求解机制自主式足球机器人由于其更具自主性、分布性和功能的完备性,代表着足球机器人的发展方向。本文针对自主式足球机器人系统,构造基于多智能体的全自主足球机器人系统的组织结构及其求解机制。3.学位论文柯文德基于多智能体的足球机器人仿真系统的研究2005在“基于多智能体的足球机器人仿真系统”中通过对足球机器人比赛的分析,研究了基于多主体模型的机器人系统,提出了基于Bezier曲线的机器人路径选择法、守门员策略以及三层决策模型,并通过SimuroSot5Vs5仿真平台验证了其可行性和有效性。其中,在基于主体模型的机器人研究过程中,将每个机器人看作单一主体,并阐述了主体结构,在多个机器人组成的多主体系统中,分析了相互间的协同工作问题。在对比了传统的中垂线法和人工势场法后,考虑并选择了基于Bezier曲线的机器人进攻路径规划。相对于一般的进攻路径而言,采用Bezier曲线规划路径时,算法时间复杂度较低,控制方便灵活,编码实现较为简单,可适应不同环境,并能准确地预测机器人下N个周期位置。由于守门员的角色在比赛中具有相当重要的意义,因此对守门员的防守策略作了较为深入的探讨,研究了“以小球为中心,守门员为主要执行对象”的防守策略,根据场地上足球情况的动态变化,守门员也相应地做出有效的防守。分析了三层决策模型的每个层次结构,确定了足球机器人的基本动作层、运动规划层和协调层,并给出了每层的实现算法。4.期刊论文苗夺谦.李顺勇基于多智能体的对抗平台——微型足球机器人系统-微计算机应用2002,23(3)本文讨论了一种具体的多智能体系统--微型机器人足球系统,主要侧重于其视觉系统和决策系统的研究,以及该系统目前的现状、存在的不足和改进的思路.5.学位论文彭军多智能体系统协作模型及其在足球机器人仿真系统中的应用2005多智能体系统(MAS)的协作是近年来分布式人工智能领域的研究热点。机器人足球世界杯(RoboCup)仿真比赛是检验各种MAS理论的标准平台,在这个极为复杂的多智能体环境中,多智能体必须通过协作才能完成它们的共同目标:多进球赢得比赛。本文在RoboCup仿真球队的设计中,应用规划、学习和预测技术建立了MAS的协作策略和模型,主要研究工作有:针对RoboCup足球机器人仿真系统面临的主要协作问题,提出一种双层的MAS协作模型框架,它包含协作策略和动作决策两层,这种结构不仅可以增强整个系统的智能度,而且还有利于多智能体间的动态实时协作。采用基于状态的规划协作模型,实现了协作智能体对系统的快速实时反应,不仅提高了单个智能体的反应速度,而且还提高了整个MAS协作的效率。从RoboCup仿真比赛进攻的角度提出了一种基于合作意愿矩阵的传球规划协作策略,实现了一种不依赖于通信的显式多智能体协作。用阵形将多个智能体联接成一个拥有共同目标的团队,并引入角色实现事先给定的任务分配和站位配合,从防守的角度出发,实现了基于阵形变换的多智能体动态防守协作,将案例学习应用到阵形设计中,突破了单凭直接经验设置阵形的局限。可实现积极防守阵形和消极防守阵形两个阵形之间动态变换,满足了不同阶段的防守协作要求,显著提高了球队的整体防守性能。提出了一种基于亲密度模型进行动态防守协作的方法。在采用人盯人战术时,智能体通过亲密度的计算确定是否需要协助队友完成人盯人任务;在采用区域防守战术时,由阵形确定每个区域的主要责任人,由亲密度确定每个区域的次要责任人,来共同完成区域的防守任务。通过亲密度模型的应用,实现了智能体间更好的协作,解决了盯人失败导致漏人的问题和区域防守中边界无人盯防的问题,达到了分工和协作的统一。从提高仿真球队的整体协作能力出发,提出了一种基于行为的预测方法,使RoboCup的协作模型设计简单、反应速度快、适应性好和智能度较高。采用基于行为预测的协作模型在CSUYunLu队中实现了球队的协作决策,如传球和下底传中等小局部配合。将统计学习与Q学习技术融合,提出了一种基于统计的多智能体Q学习算法。该算法通过对联合动作的统计来学习其它智能体的策略,并利用策略概率向量的全概率分布保证了对联合最优动作的选择,在理论上保证了算法的收敛性,该算法将多智能体环境下的学习空间由指数空间降为线性空间,有效地提高了学习效率,并将该算法成功应用到RoboCup中协作策略的离线学习。增强学习与其它学习方法之间显著的差别就是:延迟奖赏和试错探索,这带来了时间信用分配问题和无限状态访问问题,在多智能体环境中,使得学习速度很慢甚至不能收敛。为此,提出了基于预测的多智能体Q学习模型,它是一个融合规划、预测与Q学习等技术的两层结构的学习模型。该模型在RoboCup中的成功应用显示了其良好的在线学习性能。通过在CSUYunLu仿真球队中应用实践,验证了论文提出的多智能体协作策略和模型的有效性。6.学位论文甄宗雷集控式机器人足球决策系统研究2004足球机器人是当前机器人研究中的一个热点,涉及机器人学、人工智能、智能控制、计算机视觉等多个领域.足球机器人系统作为一个典型的多智能体协作系统,为机器人学、多智能体系统理论研究和技术应用提供了一个理想的实验平台.该文以基于全局视觉的足球机器人系统为研究对象,研究内容包括多智能体协作框架、差动轮式机器人路径规划与运动控制、足球机器人行为设计及实时决策推理等问题.该文首先针对基于全局视觉的足球机器人系统的特点,综合人工智能自上而下(慎思式)和自下而上(反应式)两种研究方法,提出了一种混合式足球机器人决策结构,即通过一个全局性高层决策模块来决定机器人团队当前队形、战术以及智能体与角色间的映射关系,然后将高层决策结果通知各个队员智能体;队员智能体根据高层决策模块的指示及自己的知识进行反应式的思考和行动.随后,文中建立了差动轮式足球机器人的运动学模型,并给出了一种路径规划与运动控制方法.根据文中提出的一种便于多智能体协作的体系结构,对足球机器人的进攻行为、防守行为以及各种战术行为进行了分析与设计.最后,基于战术、队形、角色等概念,对足球机器人团队协作框架进行了详细的讨论和分析,并给出了形式化描述结果.在该协作框架下,任务分解问题通过特定队形的角色集定义来完成,而任务联结问题通过特定角色的行为选择来完成.7.期刊论文初旭新.韩光胜.CHUXuxin.HANGuangsheng基于足球机器人决策系统的协作模型-系统仿真技术2005,1(3)运用多智能体系统的思想,提出了一种多智能体协作控制模型,通过对多智能体的规划提高了足球机器人系统决策系统的连贯性,系统利用改进的黑板结构有效地解决了角色分配及通信问题.通过实例分析了模型及其策略在系统协作控制方面的实用性.8.学位论文魏天滨一种足球机器人多智能体对抗系统的分层变学习率增强式学习方法2004该文以足球仿真机器人系统为研究平台,研究多智能体对抗系统的高层策略学习问题.通过对足球机器人系统的分析和研究,使用模糊手段描述了复杂的足球机器人状态空间;提出将MAXQ多智体分层增强式学习方法应用于足球机器人进攻策略的学习;并进一步提出通过融入一种在对抗系统中具有良好特性的变学习率学习法则而得到一种适合于多智能体对抗系统的策略学习方法.多智能体系统是近年来人工智能领域的研究热点.它所体现出的群体智能、社会特性比起单智能体系统,更加符合许多应用领域的特点.足球机器人系统由于其可实现性,对抗性,系统模型的信息不完备性迅速成为这一研究领域的标准问题之一.多智能体系统的所有热点问题,如主体的研究、群体协作、智能体间通信等都体现在足球机器人仿真平台上,该文集中研究足球机器人高层策略的分层学习.通过对足球机器人仿真系统特点的研究,从中提练出进攻策略学习问题作为该文的研究问题.环境的描述是智能体学习的先决条件.多智能体系统的智能体大都处在复杂、时变、信息动态不完备的环境中.其环境描述需要根据具体问题来进行.该文分析了足球机器人系统的结构和参数特点,将模糊方法应用于描述其智能体(即单个球员)的状态空间,使用一个合理的状态数目有效描述了智能体所处的状态.MAXQ分层多智能体学习方法是近年来被提出的一种新方法.它改进了传统的单智能体增强式学习方法,以适应多智能体环境的智能学习.该文将其应用于足球机器人系统的进攻策略学习.实验证明该方法产生的策略能够实现进攻目的,适用于该文提出的足球机器人进攻策略学

1 / 8
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功