机器人的大脑机器人作为为人类的奴仆,已经越来越频繁的出现在我们的生活中,为我们提供着越来越多越来越细致的服务,人们也早就已经习惯了机器人为我们带来的方便。为了让机器人今后为我们提供更加广泛优质的服务,我们就必须要更加了解机器人。机器人这一词语出现在1910年捷克斯洛伐克作家卡雷尔·恰佩克的科幻小说中,他根据捷克文中原意为“劳役、苦工”的Robota和波兰文中原意为“工人”的Robotnik,创造出“机器人”这个词。如今为大家普遍接受的机器人定义是联合国标准化组织所采纳的美国机器人协会给机器人下的定义:“一种可编程和多功能的操作机;或是为了执行不同的任务而具有可用电脑改变和可编程动作的专门系统。”机器人由机械部分、传感部分、控制部分三大部分组成。这三大部分可分为驱动系统、机械结构系统、感受系统、机器人—环境交互系统、人机交互系统、控制系统六个子系统。类比人类的生物机理,大脑是人类思考和决策的指挥中心,而在机器人的系统中,处理器是用来计算机器人关节的运动,确定每个关节应移动多少和多远才能达到预定的速度和位置,并且监视控制器与传感器的协调动作的存在,因次狭义上来讲处理器就是机器人的大脑。而在机器人的实际应用中,处理器通常就是一台专用计算机,它也需要拥有操作系统、程序和像监视器那样的外部设备等,同时它在许多方面也具有与PC处理器同样的功能和局限性。就像人离开大脑就无法生存一样,机器人失去了大脑就失去了思考和判断的能力,无法对身体各部分传回的信息进行分析也就无法对下一步做出判断。机器人大脑的重要性也就可以了解了。机器人的大脑是机器人的核心,一般采用计算机控制系统(PC机、嵌入式计算机系统等),简单的可采用单片机系统。机器人的大脑由集成电路组成,主要负责着信息处理、发布指令的功能,支配着整个机器人机体的正常运作。机器人按其智能程度可分为一般机器人和智能机器人。一般机器人不具有智能,只具有一般编程能力和操作功能。智能机器人按照不同程度的智能,又可分为三种:传感型机器人,具有利用传感信息(包括视觉、听觉、触觉、接近觉、力觉和红外、超声及激光等)进行传感信息处理,实现控制与操作;交互型机器人,通过计算机系统与操作员进行人机对话,实现对机器人的控制与操作;自立型机器人,在设计制作后,机器人无需人的干预,能够在各种环境下自动完成各项拟人任务。一般机器人的大脑依据机器人所需实现的功能不同,机器人的大脑也会有所不同。如非伺服型机器人,往往是“有限顺序”机器人,这种机器人按照预先编好的程序顺序进行工作,使用终端限位开关、制动器、插销板和定序器来控制机器人机械手的运动。其工作原理如下图能源终端制动器插销板定序器驱动装置机械手限位开关智能机器人的大脑传感器型机器人以工作能力更强的伺服控制机器人为例,伺服系统的被控制量即输出可为机器人端部执行装置的位置、速度、加速度和力等。通过反馈传感器取得的反馈信号与来自给定装置的综合信号,用比较器加以比较后,得到误差信号,经过放大后用以激发机器人的驱动装置,进而带动末端执行装置以一定规律运动,到达规定的位置或速度。其智能之处在于可从环境获取参数,即具有感知环境的能力。传感器型机器人之所以需要传感器就是传感器是反映外界环境信息的一种途径,传感器信息的变化对机器人来说也就是外界环境的变化,而智能机器人的智能也就体现在它可以根据外界环境的变化做出主动的反应,改变自身的运动规律。要解决更加复杂的问题做出更加智能的机器人我们就要引入规划的概念。智能机器人的规划机器人在进行目的作业时,根据环境的不同,可能必须改变状态,由现在位置移动到目标位置,计划这种动作的课题就称为动作规划。一个规划是一个行动过程的描述,一般来说,规划是具有某个规划目标的蕴含。对于路径有明确规则的机器人如生产线上有确定分工的工业机器人,其动作规划也是相对简单的。而对于一些工作环境较为复杂且变化性较强的机器人来说,动作规划就显得十分必要了。体现了路径规划且贴近我们智能系学生的例子应该就是会搜索迷宫解法的电脑鼠了。它通过传感器返回的参数来判断前后左右是否有障碍物,为了得到从起点到终点的最优路径也就必须引入路径的规划。路径最短的电脑鼠走迷宫算法实际上是一种基于广度优先搜索(BFS)的算法,首先用一个栈A来存放最短的行走路径,用栈B来存放当前的路径,然后从起点开始依次判断下一个可行点是不是终点,如果是终点则再判断如果栈A为空或者长度比栈B大,则将栈B复制给栈A,否则依次将可行的单元格放入栈B。而判断下一个单元格是否可行有三个条件:它没有越界或者而且不是路障;它没有被访问过;上一个单元格离起点的权值+1小于它离起点的权值。算法的核心是给每一个单元格加入了离起点权值的概念,这样就可以保证找到的路径是最短的了。对于更加复杂的路径求解甚至在是不同位置分别有不同姿势或状态的问题,我们就需要引入C-空间的概念。相对于进行实际作业的作业空间,决定机器人的位置、姿势(结构)q的变量所形成的空间称为结构空间即C-空间。C-空间的优势在于在其中的一个点可以表示以某姿势或状态在作业空间占有一定体积的机器人。具有两个关节的机器人手臂的姿势如下图(a)可转换成C-空间2D圆环面如图(b)上的一点。计划问题可归纳如下:C-空间中在不触碰C-障碍物的情况下,将初始姿势与目标姿势结合,求出如下图(b)的一条路径。如果可以明确地求出C-障碍物,那就只需在C-空间上计划出不碰触到C-障碍物的路径即可,但从下图中可以看出无论是在作业空间中还是在C-空间中,对于这个相对简单的问题要得到这样一条路径都是较为困难的。因此又有人提出使用抽样计划方法,即在C-空间上随机抽样,将抽样结果当做节点,建构出不会触碰到障碍物的途径网络,即路径图。然后利用图形搜索算法推算出自初始位置到目标位置的路径。在此方法中,只需确认在C-空间上取样到的姿势与所连成的局部路径是否会触碰到障碍物即可,而不必计算出C-障碍物的形状。对于容易记述其行动的全方位移动机器人,也可在网格空间中记述环境,直接使用A*探索算法等较为有效的方式。抽样计划多用于多自由度机器人或形状与环境较为复杂的情况。代表性的抽样计划方法有PRM(ProbabilisticRoadMap)法和RRT(Rapidly-exploringRandomTree)法。PRM法是由前处理与计划两个阶段所构成的方法。前处理阶段,在C-空间上对姿势进行随机抽样,选择不碰触C-障碍物的姿势,然后将一定范围内与此接近的节点增加到局部路径,构成路径图。如此重复,直到节点达到一定数目,可由路径图看出环境已被覆盖至某种程度位置。在计划阶段,增加初始姿势、目标姿势与路径图所连结的局部路径,并通过图形搜索高速求得路径。该算法通过在构形空间中进行采样、对采样点进行碰撞检测、测试相邻采样点是否能够连接来表示路径图的连通性。此方法的一个巨大优点是,其复杂度主要依赖于寻找路径的难度,跟整个规划场景的大小和构形空间的维数关系不大。然而当规划的路径需要通过密集的障碍物或者需要经过狭窄的通道时,PRM方法的效率变的低下。RRT法是在C-空间上产生姿势qrand,从此姿势上延伸出树图形,计算从最近的姿势qnear向qrand移动所需的单位距离ε,生成姿势qnew,计算出连结它们的局部路径。该路径如果没有碰触到C-障碍物,则加入路径图。重复此操作,并展开树形图,从路径图上找出可到达目标位置的局部路径,就能得到答案。与PRM不同RRT无需经过前处理阶段,只需一次探索即可计划路径。机器人大脑的深度学习可通过计算机系统实现人机对话的交互型机器人的大脑表现了更高一些的智力,表现在于它不仅具有机器人在一般情况下的决策能力,更具有与外界交换信息模拟人类对话的能力。人会捕捉他人的动作并加以记忆,并以观察与模仿再次重现该动作。同时,人也会在此过程中理解对方的动作意图,进行“学习”这项高级的精神活动。“拟人化”就是将此过程归纳并泛化,以便于让人理解非人者的动作行为。拟人化行为通过将非人的东西视为人类,记忆并解析其行为,然后再以模仿的方式重现其特征并传达给其他人。荷兰乌得勒支大学医学中心神经学家马特因·范登赫费尔发现,较聪明的大脑神经元之间似乎存在更多高效网络———换句话说,在大脑不同区域之间传递信息所需的步骤较少。一个族群的智商差异大约有1/3是由此决定的。机器人自主学习的过程也就是在不断提高其神经网络的效率的过程。近年来“深度学习”逐渐成为机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来识别图像、声音和文本等数据。在许多情形中深度为2的神经网络就足够表示任何一个带有给定目标精度的函数。但是其代价是图中所需要的节点数(比如计算和参数数量)可能变的非常大。理论结果证实那些事实上所需要的节点数随着输入的大小指数增长的函数族是存在的。我们可以将深度架构看做一种因子分解。大部分随机选择的函数不能被有效地表示,无论是用深的或者浅的架构。但是许多能够有效地被深度架构表示的却不能被用浅的架构高效表示。大脑有一个深度架构。例如,视觉皮质得到了很好的研究,并显示出一系列的区域,在每一个这种区域中包含一个输入的表示和从一个到另一个的信号流。这个特征层次的每一层表示在一个不同的抽象层上的输入,并在层次的更上层有着更多的抽象特征,他们根据低层特征定义。深度学习认知过程逐层进行,逐步抽象。在实际中的例证是很常见的,如人类层次化地组织思想和概念;人类首先学习简单的概念,然后用他们去表示更抽象的;工程师将任务分解成多个抽象层次去处理。目前研究者们正在将深度学习用于机器人对语言的情绪识别,在这之前应用最广的情绪分析是“词袋(bagofwodrds)”模型,并没有将词序列入考虑范围。词袋中的词汇被标记为正面或负面的,通过计数来评估整个句子或段落的含义是正面还是负面。将词汇单独分析的方法并不准确,必须将其放入到越来越大的结构中。研究者抽取了12000个句子,并将其粗略分割为214000个词组,每个词组被标记为负面、中立或正面(数字表示),计算机科学家称这些数字化的表述为“特征表示”,类似于人脑理解概念和定义的方式。如何分析和组织这些被标记的数据才是NaSent算法的核心。以下通过对两个句子的分析来理解这个算法:UnlikethesurrealLeon,thismovieisweirdbutlikeable.UnlikethesurrealbutlikeableLeon,thismovieisweird.这两个句子中使用的词汇完全相同,“词袋”模型分析显然不会得到正确的结果。NaSent算法首先会为每个句子构造文法树,如下图所示:在分析句子时,红色的节点代表这个词汇或短语带有负面情绪,例如“weird”虽然是一个负面词汇,但短语“isweirdbutlikeable”被正确理解为正面情绪。如上图所示“surrealbutlikeableLeon”是一个正面词组,但“thismovieisweird”是负面的,整个句子得到的分析结果也是负面的。相比之前模型80%的准确率,NaSent的准确率达到了85%。机器人大脑的智能控制而显示着更接近人类智力能力的自立型机器人无疑是目前研究的热点,更高的拟人程度也就要求着机器人的大脑具有更强的智能性。更高的智能性也就意味着大脑处理信息不再像一般机器人一样具有很强的顺序性,因此提出了智能控制的概念。智能控制是驱动智能机器自主地实现其目标的过程。或者说,智能控制是一类无需人的干预就能够独立地驱动智能机器实现其目标的自动控制。智能控制的主要特点一是同时具有以知识表示的非数学性广义模型和以数学模型表示的混合控制过程,也往往是那些含有复杂性、不完全性、模糊性或不确定性以及不存在已知算法以及不存在已知算法的非数字过程,并以知识进行推理,以启发来引导求解过程。因此,在研究和设计智能控制系统时,不是把主要注意力放在对数学公式的表达、计算和处理上,而是放在对任务和世界模型的描述、符号和环境的识别以及知识库和推理机的设计开发上。也就是说,智能控制系统的设计重点不在常规控制器上,而在智能机模型上。二是智