第四学期总结一、全面学习与工作情况本学期学习了使用灰色系统理论处理复杂系统中的不确定信息,使用灰数来表达只知道取值范围而不知道其确切值的数,以克服由于人的认知局限而对反映系统行为的信息难以完全认知的问题;对智能体收集的信息中存在冗余进行研究,通过获得冗余信息来消除信息的不确定性,借用信息论中的熵和互信息概念结合灰色理论中的灰度表示感知信息之间的共性和特性,定性地分析环境认知问题,对灰度进行了基于熵的初步定义。提出了基于准三维灰靶模型的环境空间认知存储体系,针对带有不确定性的复杂环境信息的描述开展研究,以模拟人类对未知环境的知识表达和存储方法为研究基点,使用准三维灰靶对环境知识建立分层抽象存储体系,模拟人类对环境的认知过程,使智能体能够在未知环境中通过自主探测完成自底向上的信息传递得到对环境的认知地图,并通过自顶向下的知识应用完成路径规划。以期解决在未知环境中机器人面临的信息不完备、不精确以及定性知识抽取问题,实现一种快速、稳定的适合于未知环境下的知识表达体系。二、研究工作情况1、研究的内容和意义:随着人工智能的发展,机器人从不具备思维能力、沟通能力的只能按照预先编制的程序运行的简单劳动者逐渐转变为“能够在环境中感知并提取信息,并且可以利用环境知识,以有目的、有意义、安全的方式工作的机器[1]”。智能体对于环境知识的表示[2]是目前人工智能研究的核心和热点,主要是寻求环境空间知识与空间实体表示之间的映射,需要解决的问题有:1)怎样定性地表述知识;2)怎样反映表述中的信息不完备性和不确定性;3)怎样实现定性定量知识的相互转换;4)怎样体现智能体的推理能力。由于环境中物体表现形态的多样性、观察结果的时间可变性使得精确表示环境变得非常困难[3],虽然思维的模糊性和观测的有限性使得人类不能精确地表达获得的信息,并且个体在对环境感知中存在很大差异,但人类仍然可以鲁棒地使用某种形式表示从外界获得的信息,以一种自适应方式[4][5]指导自身在复杂的、动态的不确定的环境中产生正确的行为[6]。人类对于环境的记忆是不精确、不完备的,并且是片段表示的[7]。当人类探测环境时,需要整合连续视图以形成对当前环境的表示即感知地图。在人类对环境的认知中,当环境结构可用时,是不会以高代价的方式存储或加工信息[8],因此传统的度量地图与人类对空间的认知很难匹配[9][10],认知科学[11]是对思维最恰当的理解,被视为是心智的表征结构以及在这些结构上进行的操作,所以使用认知地图表示环境知识更接近于人的思维方式。欧盟智能科学与技术(EU’sIST200223.24)将认知系统定义为是一个通过与社会和个体交互进行理解、学习和自我发展的系统[12]。认知地图模拟人类使用其特定的内部表示方法反映环境状态,是一种粗略但鲁棒的环境表示方法[13],是以观察者自我为中心的、瞬时的状态反映,并且受到观察者所处环境的信息限制。本学期研究以移动机器人对未知环境的探测为背景,针对信息不完备的复杂环境信息的描述、学习以及行为决策开展研究。借助灰靶模型理论来研究当前复杂环境信息中的“小样本、贫信息”认知建模问题,针对带有不确定性的复杂环境信息的描述开展研究,使用准三维灰靶对环境知识建立分层抽象存储体系,模拟人类对环境的认知过程,使智能体能够在未知环境中通过自主探测完成自底向上的信息传递得到对环境的认知地图,并通过自顶向下的知识应用完成路径规划,以形成更接近于人的思维方式的智能知识存储、表达以及推理、行为决策的机制。2、研究的国内外现状,出发点、所处的地位和水平2.1国内外现状1948年,Tolman首次提出认知地图的概念,认为人类对于空间知识的表示类似于地图表示[14],Kuipers认为认知地图是“对于大规模空间的人类知识”[15],因此认知地图是一种将智能体获得的空间信息表示为环境因素间的联系和相互影响的模型。虽然人类在对环境感知中存在很大个体差异,但个体获得的空间知识仍然可以以一种自适应方式[16]指导人类行为,最后成功实现对环境的描述以及在环境中的漫游,这表明模拟人类智能的认知地图对于带有不确定信息的环境表示具有很强的鲁棒性和适应性。目前国内外学者对环境空间知识存储方法的研究,主要分为以下三类:(1)基于概率的度量地图该方法主要用于机器人从一个已知起点开始在未知环境中进行探测,在确定自身位置的同时对环境进行地图绘制,即解决SLAM(同时定位与地图绘制,SimultaneousLocalizationandMapping)问题,主要完成两个功能:建立详细的地图以及对自主机器人进行精确定位。由于机器人制图是以不确定性和传感器噪声为特点的,所以SLAM中大多数制图算法均使用概率算法,以贝叶斯规则为基础的[17],使用贝叶斯滤波提供概率估计来处理测量值、机器人位姿以及地图中的不确定性。解决SLAM问题主要使用的算法均是派生于三种基本SLAM范式:EKFSLAM——基于扩展卡尔曼滤波的SLAM算法[18][19],是最早并在SLAM问题中使用最广泛的算法[20];Graph-BasedSLAM——成功将稀疏非线性最优化方法应用于SLAM问题,成为解决fullSLAM问题的主要范式[21];FastSLAM——将粒子滤波用于SLAM的解决[22],使用一种新型压缩滤波方式降低计算量来解决SLAM算法的实时应用问题[23],常用于在线SLAM,并且对SLAM中的数据关联问题提供了新的解决方法。目前解决SLAM问题的主要方法都是基于概率的、具体的数值处理过程,使用定量手段描述环境中的不确定性,应用递归的方法对环境实现逐步认知,用更新概率分布的方式来实现知识的扩充,存在计算量大、数据关联获取困难、无法在线绘制大规模地图等问题。这类方法以概率为数学基础,能够较为准确的描述未知环境,但是其建立的地图是环境在三维坐标上的复制,是对环境知识的直接表达,通常应用于对精确性要求较高的领域,属于人类最原始的对未知环境的知识表达方法。(2)基于符号表示的拓扑地图该方法通过模仿人类对于环境的宏观描述,从几何结构上将环境建模成一张具有拓扑意义的图[24],通过抽象的理论直观地描述环境,不必精确描述不同节点间的地理位置关系,因此对机器人获取信息的准确度具有较高容忍度,对于地图的表示具有更好的鲁棒性。Vasudevan提出了一种带有对象图的地点的全局拓扑表示[25],该对象图则为局部子地图。连接和组合局部子地图技术被认为是一种创建和包含地图元素的方法。在拓扑地图中进行可靠地点识别中存在两个互补的问题[26]:感知混淆和图片变化,Stankiewicz[27]在创建拓扑地图的过程中使用部分可观测Markov决策过程作为优化算法对室内导航开发了理想导航模型,该模型能够消除无效感知过程、对地图的无效记忆以及无效决策过程。拓扑地图是比度量地图和特征地图更加简洁的表示,能够完成有效的大规模规划。由于其对环境的离散化,因此不存在度量地图中的误差累计问题。拓扑地图从连续、带噪的环境中可靠地提取有用的符号。使用智能体根据自身情境变化自动探测和定性描述离散地点,是对环境知识经过初步处理后的表达,通常应用于对环境的整体粗略表示。(3)基于空间分层的认知地图该方法模拟人类对于环境的宏观描述将环境结构化,使目标地图比度量地图更加简洁、明确,比拓扑地图更具鲁棒性,更接近于人对环境几何结构的感知,其代表为美国密歇根大学的Kuipers所提出的SSH框架理论[28]。PatrickBesson根据人类对于空间结构的自下向上的认知过程对空间进行了分层研究,将SSH进行改进后提出混合空间语义分层[29](HybridSSH),Pronobis提出了一种用于认知机器人系统的空间知识表示结构[30],将空间知识展示在不同抽象层,可以解决复杂的、有交叉形式的带有固有不确定性的动态空间信息。Zender提出了一种包含不同层次抽象的地图的空间表示法[31],使机器人使用和人类相似的方式感知世界,像人类一样学习环境,分享相同的概念。Kruijff等提出了对于多层概念空间制图的基于本体论的方法[32],提供了人机对话的共同点,将获得的信息同固有概念性常识知识结合以便推导出新的知识。认知地图是通过模拟人类对环境的逐步认知得到的,从不同抽象层次、不同空间规模上对环境的不同方面建模,通过在不同抽象层次表示知识,可以处理复杂的、交叉知觉模式的、带有内部不确定性以及动态的空间知识。认知地图不仅能够对机器人的可靠导航提供依据还能提供对环境空间的抽象和交叉推理、规划和认知存储的依据以及提供人机交流的共同基础,该表示符合人类认知模式的发展过程。综观国内外在环境空间知识存储方法上的研究工作,有如下几个问题:(1)注重消除不确定性,忽略了获取信息中所存在的可利用的冗余性;随着智能体在人类社会的角色转换,智能体不仅需要能够在环境中感知并提取信息,并且可以利用环境知识,以有目的、有意义、安全的方式工作[33]。所以处于环境中的智能体,不仅需要能够正确、高效的感知、表示环境,还需要能够对获得的知识进行推导,完成自身的定位、路径规划等任务。对于抽象逻辑与真实世界的联系[34],通常使用知识表达和推理来建立知识、感知以及智能体行为之间的联系。由于真实世界中的物体无法使用有限集进行表示,需要使用已提取的显式知识推导出隐藏知识,然而在实际创建过程中由于语境以及观测点的不同,从一个情境获取的信息包含了某些从其他情境中获取的信息,这种现象被称之为冗余性[35],冗余性能使系统更具有适应性,在信息论中冗余性也代表可用性,信息的确定以及区分都借助于冗余信息,对应于信息的共性和可变性。虽然信息冗余越多系统越稳定,但同时系统执行能力降低,所以如何控制以及利用系统的冗余信息成为了认知地图中的研究重点。(2)自底向上和自顶向下的信息处理是相互独立的;从目前的知识处理过程来看,在未知环境中从传感器数据中获取信息,将感知向量分解为形态,学习每一个形态的结构,通过对形态进行模式识别和分类离散连续环境,最后将离散信息结合本体论得到模拟人类对环境表达的认知。当移动机器人在移动和执行任务过程中,通常使用当前获得的数据信息进行路径规划,而没有利用到之前系统获得的关于其自身、环境以及当前任务的知识。但生物大脑却为达到在感知-认知-行为循环中不同层次的选择,使用“注意”机制将自底向上和自顶向下的信息处理相联系。2.2研究的出发点目前模拟人类对环境的知识表达方法是机器智能研究的基本问题,目的就是要解决“如何对人类对环境的描述方法进行数学表达”的问题,展开基于冗余信息的处理以及人类信息处理模式模拟的研究。以往的研究表明,灰色系统理论处理复杂系统中不完备知识具有独到的优势。由于真实世界中的物体无法使用有限集进行表示,需要使用已提取的显式知识推导出隐藏知识,然而在实际创建过程中由于语境以及观测点的不同,从一个情境获取的信息包含了某些从其他情境中获取的信息。灰靶理论是邓聚龙教授提出的用于处理模式序列的灰关联分析理论。本研究将综合灰靶理论和信息论的优势,采用统一的数据结构来描述由主观不确定性产生的冗余信息中的共性和可变性。另一方面,结合灰色系统理论与本体论在处理知识不完备的复杂系统的优势,提出一种高效的模拟人类定性分析能力的方法。本研究将结合灰色系统理论和本体论的优势,建立未知环境中不确定性知识的灰色定性推导方法,实现知识的多精度、分层次表达,为后期学习、推理、规划的智能行为奠定基础。本研究针对带有不确定性的复杂环境信息的描述开展研究,以模拟人类对未知环境的知识表达和存储方法为研究基点,使用准三维灰靶对环境知识建立分层抽象存储体系,模拟人类对环境的认知过程,使智能体能够在未知环境中通过自主探测完成自底向上的信息传递得到对环境的认知地图,并通过自顶向下的知识应用完成路径规划。以期解决在未知环境中机器人面临的信息不完备、不精确以及定性知识抽取问题,实现一种快速、稳定的适合于未知环境下的知识表达体系。3、你的研究工作的具体内容,工作过程,结果及其分析3.1不确定信息所谓不确定性[36],是指边界不清楚,既在质上没有确切的含义,又在量