滑翔机2014:用图表的动态策略米哈伊尔普罗科片科,王彼得,奥利弗妇产科CSIRO的计算信息,统计学习宝box76,埃平,nsw1710,澳大利亚电子邮件:mikhail.prokopenko@csiro.au摘要。RoboCup仿真联赛要求发达soccer2dTAC光学技巧。在本文中,我们描述了一个受雇于我们的团队,gliders2014机制、策略性评价中玩家的行动和选择。该机制是基于Voronoi图和是非常通用的,可以适用于其他足球联赛。所提出的方法已成功地应用于战术多智能体相互作用的,导致对基准性能的改进。1.介绍RoboCup仿真联赛soccer2d这不仅需要自主决策的约束条件下,但也相当复杂的战术计划和团队,专门挑选,设计解决或适应不同的对手[1,2,3,4,5,6,7]。毫无疑问,战术水平要求的2D仿真联赛证明是最高的足球联赛。这些天,低级技能是相当类似的参与者,因此,可以说,前simulation2d球队的战术灵活性实现自己的统治地位,而不是一些新发现的Excel在基本的行为素质。在本文中,我们描述了一种机制的行动选择,这取决于一个动态的战术计划。这个机制是基于Voronoi图,利用滑翔机[8,9]-模拟足球TEAM为RoboCupsoccer2d模拟器[10]。滑翔机2012和滑翔机2013达到半决赛在RoboCup比赛和20132012。团队的代码是使用C++编写的agent2d:由秋山等人提出了著名的库代码。[11],和片段的发布源代码的marlik[12]。其他软件包也被使用:–librcsc(Agent2D及相关工具的底层库):一个机器人足球仿真库(RCS)与各种公用设施描述相关的几何结构,世界模型等;–soccerwindow2(RCSS浏览程序,既可作为monitor,也可作为logplayer):一个RCS浏览程序,作为一个监控客户端,一个玩家日志和一个可视化调试器;–fedit2(球队阵型编辑器):一个agent2d形成编辑器,允许设计团队的形成;–Gliders’in-browserbasicsoccermonitor(GIBBS)(在浏览器的基本吉布斯滑翔):一个viewing2d模拟玩家日志网络浏览器的联盟日志[13];吉布斯是用来在一个浏览器窗口中的匹配[13]。在这个时候,主要实现使用HTML5JavaScript,与一个预处理步骤来创建简单的解析日志文件,可以方便地通过Internet传送。目前的状态可视化的基本但功能,它释放到足球社区希望能随着时间的推移,重新发布,并可用于向公众展示未来的比赛。吉布斯的日志播放器是可用的(以及必要的转换器)在gliders2012网页—v大多数的滑翔机的源代码已经发布2013,并且可以从RoboCup仿真2D比赛联赛官方数据库下载:2.动机和方法:流动性更好、更全面的现场控制是比赛成功的关键。这种思想可以追溯到一个通用的框架来描述抽象的时空关系的关系,通过Dylla等人建议。[14]。后者的工作认为,一个可达关系所需要的球员和球之间的空间关系表示。他们建议使用Vorono图:Voronoi图是分区的平面与N点到N的凸多边形,每个多边形包含一个点与多边形的每一点接近它比任何其他[14]的中心点。这是由秋山等人进一步发展。谁用Voronoi图-一种双重Delaunay三角网[15,16]。Voronoi图是也知道WN出现由于并行计算,一个强大的资源分布和快速运输[17]提供了一个最佳的空间配置。2.1:效应评价对gliders2014战术方案还利用Voronoi图,通过以下行动相关的评价,介绍了gliders2012[8]。具体而言,在任何特定的时间,有所选择的行动是一个简单的,最大限度地减少了所得到的和理想状态之间的距离,即,最大限度地减少这个度量。a∗=argminr(a).(3):重要的是,玩家想要达到的理想状态是不独立的行动,而是行动依赖,这种依赖是战术。(2)允许定义不同不同的理想状态S1=策略(A1)和S2=策略(A2),其中A1,A2。3.战术功能在这一节中,我们描述了执行功能的=策略(一),即,这是一个理想状态的过程,这是一个理想的状态依赖于行动的机制。这个过程的第一步ESS是一个Voronoi图,其中N点由N=11的对手了。例如,图1显示了一个Voronoi图,在时间105之间agent2d游戏(左一队)Dgliders2014(团队)。图中是用soccerwindow2,淡蓝色的线显示生成的Voronoi段,黄/绿色圆圈对应agent2d球员/门将。深蓝色的线,从滑翔机玩家9,表明一个可能的行动,一经通过,终止一些可能的结果状态的(一个),由一个蓝点标记。过程的第二步是构建一组可能的攻击节点(一个),通过它,该团队可以进一步开发攻击。这一套可以,例如,包括Voronoi顶点(节点),即等距的点三个(或更多)点,以及位于交叉口间的Voronoi段和一些线,如越位线节点,和/或线平行于offsi去线,但设置一些距离更深的对手领域。接下来,第三步是设定集V上的约束(一),即构造V(A)⊂V(A)。换句话说,只有子集(一)应该被视为最佳攻击节点的选择例如,只有那些节点在一定半径的可能产生的状态,并有横坐标大于一定值时,依赖于行为的结果状态。图1说明了这些约束在可能产生的状态的深蓝色的圆(半径等于34米)和深蓝色的线25米后所得的STA的x坐标TE。V的所有元素(一)(Voronoi顶点和交叉节点)在圈和左行的标记与DT(V),并确定不同的d(v)=(V)做−DT(V)。在确定这些差异在V的所有节点(A),代理人选择的顶点v∗=argmaxv∈V(A)D(V)。换句话说,换句话说,有一个相对较近的队友和一个相对遥远的节点行动的结果状态的结果之间的距离(A)和最佳攻击节点的∗=策略(一),被方程(2)评估可能的动作质量的考虑。这种选择可能会出现在一个特定的策略的背景下,仅是有意义的。例如,最好的攻击节点v∗,标示在图1红色的小星星,可能有意义当链的传递从球员9认为,在控球的球员,到8附近∗节点v。它可能不会,在第一眼,似乎是明智的尊重||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||致谢我们感谢杰森为他们举行和军刀航天gliders2012[8]的贡献,戴维Budden开发新的自我定位的方法在gliders2013[18],奥利弗CL当且仅当对开发工具对相互作用网络和战术分析[19],并与邓肯和林肯flintoft开发离线训练脚本。一些作者已参与了RoboCup仿真2D的过去,但是他们以前的团队的代码(cyberoos和robolog,看到的,例如,[7,20])不使用滑翔机。工具书类:1.Noda,I.,Stone,P.:TheRoboCupSoccerServerandCMUnitedClients:ImplementedIn-frastructureforMASResearch.AutonomousAgentsandMulti-AgentSystems7(1–2)(July–September2003)101–1202.Riley,P.,Stone,P.,Veloso,M.:Layereddisclosure:Revealingagents’internals.InCastelfranchi,C.,Lesperance,Y.,eds.:IntelligentAgentsVII.AgentTheories,Architectures,andLanguages—7th.InternationalWorkshop,ATAL-2000,Boston,MA,USA,July7–9,2000,Proceedings.LectureNotesinArtificialIntelligence.Springer,Berlin,Berlin(2001)3.Stone,P.,Riley,P.,Veloso,M.:Definingandusingidealteammateandopponentmodels.In:ProceedingsoftheTwelfthAnnualConferenceonInnovativeApplicationsofArtificialIntelli-gence.(2000)4.Butler,M.,Prokopenko,M.,Howard,T.:FlexiblesynchronisationwithinRoboCupenviron-5.ment:Acomparativeanalysis.In:RoboCup2000:RobotSoccerWorldCupIV,London,UK,Springer(2001)119–128MikhailProkopenko,PeterWang,andOliverObst5.Reis,L.P.,Lau,N.,Oliveira,E.:Situationbasedstrategicpositioningforcoordinatingateamofhomogeneousagents.In:BalancingReactivityandSocialDeliberationinMulti-AgentSystems,FromRoboCuptoReal-WorldApplications(selectedpapersfromtheECAI2000Workshopandadditionalcontributions),London,UK,Springer(2001)175–1976.Prokopenko,M.,Wang,P.:Relatingtheentropyofjointbeliefstomulti-agentcoordination.InKaminka,G.A.,Lima,P.U.,Rojas,R.,eds.:RoboCup2002:RobotSoccerWorldCupVI.Volume2752ofLectureNotesinComputerScience.,Springer(2003)367–3747.Prokopenko,M.,Wang,P.:Evaluatingteamperformanceattheedgeofchaos.InPolani,D.,Browning,B.,Bonarini,A.,Yoshida,K.,eds.:RoboCup2003:RobotSoccerWorldCupVII.Volume3020ofLectureNotesinComputerScience.,Springer(2003)89–1018.Prokopenko,M.,Obst,O.,Wang,P.,Held,J.:Gliders2012:Tacticswithaction-dependentevaluationfunctions.In:RoboCup2012SymposiumandCompetitions:TeamDescriptionPapers,MexicoCity,Mexico,June2012.(2012)9.Prokopenko,M.,Obst,O.,Wang,P.,Budden,D.,Cliff,O.:Gliders2013:Tacticalanalysiswithinformationdynamics.In:RoboCup2013SymposiumandCompetitions:TeamDescriptionPapers,Eindhoven,TheNetherlands,June2013.(2013)10.Chen,M.,Dorer,K.,Foroughi,E.,Heintz,F.,Huang,Z.,Kapetanakis,S.,Kostiadis,K.,Kummeneje,J.,Murray,J.,Noda,I.,Obst,O.,Ril