ArtificialIntelligence人工智能Prof.DongHongye董鸿晔教授donghy001@163.com第8章人机结合的智能系统•8.1计算机的特长与不足•8.2人的心智(humanmind)的作用•8.3集成型模式识别系统的设计•8.4人机结合的互联网系统8.1计算机的特长与不足•计算机技术的进展以及合作方法越来越丰富多彩、巧妙灵活,但计算机所做的一切工作,都是那些主要靠人脑完成的工作,应该看到计算机也有局限性,不是什么样的问题都能解决,需要满足如下条件:所要求解决的问题能用某种形式化的方法加以描述;已经形式化了的问题能找到一个算法去解决;这个算法能在计算机上加以实现。究其原因,就是现在称之为传统的计算机只是一个能对符号进行处理和运算的机器。智能活动分为4类•1979年美国出版的《计算机不能做什么》这本书中指出了用计算机来实现人工智能的局限性。该书把智能活动分为4类:•①各种形式的初级联想型行为,刺激一反应等心理学家最熟悉的领域;•②数学思维的领域,问题可加以形式化,并完全可以计算;•③复杂形式化系统,原则上可形式化而实际上无法驾驭的行为,需要启发式规则支持;•④那些非形式化的领域,包括有规律但无规则支持的,人类的日常活动就属于这一领域。《计算机不能做什么》•对于能够形式化的问题,即使看上去十分繁复,只要能用数学表达,如几何定量证明等问题,计算机就能完善地加以解决。•那些不能形式化的问题,看上去似乎很简单,计算机就无能为力,以计算机为工具解决不了日常生活中所遇到的大量问题。•该书的作者Dreyfus消极地看到了用计算机来实现人工智能的局限性,那么人工智能的工作似乎是白费功夫了。情况并非如此•英国的一位计算心理学家Boden从另外一个观点来评价人工智能的成就,她认为:“AI的主要成就就在于明确地促使我们鉴赏到人的心智(humanmind)是极其巨大、丰富与难以捉摸的。人们可以通过AI的途径来了解人的心智的某些方面,例如人的创造性的某些方面可以通过建立有关创造性的计算机模型开始加以了解。”计算机是“死”的,而人是“活”的•如果说Dreyfus是消极地看出用计算机来实现AI的局限,那么Boden则是从积极方面看到人的意识的作用,而且她的看法说明在心理学和AI之间相互有所反馈,是比较辩证的。•至于Dreyfus所说的第4个领域,对计算机来说是难以处理,而人善于处理的是这一领域的问题,否则人就无法活下去。•说穿了,人具有意识与思维能力,计算机没有;电脑(计算机)是“死”的而人脑是“活”的。完全靠电脑是不够恰当的•人们从实践中认识到,以研制完全靠电脑而不靠人的自主系统为目标,是不够恰当的,这是以往的人工智能给予大家的教训。•1986年我国实施863高技术计划,在这个计划的信息领域中,安排了“智能计算机”主题,即306主题。当时863计划306专家组的成员花了许多功夫讨论究竟能研制成功具有何种程度的智能计算机。人、机结合的智能计算机体系•我国著名科学家钱学森很关心智能计算机的工作,他在1992年3月给306主题专家组负责人的信中讲到:“……我只想说一点:我不以为能造出没有人实时参与的智能计算机。所以奋斗目标不是中国智能计算机,而是人、机结合的智能计算机体系。”8.2人的心智(humanmind)的作用•我们要追求的是人与机器相结合的智能系统,强调的是人脑与电脑的结合,是人类的心智与计算机的高性能相结合。•为了进一步说清楚人脑与电脑结合的重要性与合理性,这里介绍我国哲学家熊十力关于人的智慧的说法,他认为人的智慧,通常叫做心智;而心智又可以分成两部分,一部分叫做“性智”,一部分叫做“量智”,见图。性智•是一个人把握全局,定性进行预测、判断的能力,是通过文学、艺术等方面的培养与训练而形成的,我国古代的读书人所学的功课中,包括琴、棋、书、画,对一个人的修身养性起着重要的作用。•性智可以说是形象思维的结果,难以用电脑模拟。人们对艺术、音乐、绘画等方面的创作与鉴赏能力等都是形象思维的体现。量智•是通过对问题的分析、计算,通过科学的训练而形成的智慧。•人们对理论的掌握与推导,用系统的方法解决问题的能力都属于量智,是逻辑思维的体现。分析现在的电脑的体系结构,用电脑对量智进行模拟是有效的。•人工智能的研究表明用电脑模拟逻辑思维可以取得成功;但是用现在的电脑模拟形象思维基本上是行不通的。人脑与电脑相结合•总而言之,明智的方法是人脑与电脑相结合;性智由人来创造与实现,而与量智有关的则由电脑来实现,这样是合理而又有实效的途径。•从体系上讲,人作为一个成员,综合到整个系统中去,利用并发挥人类和计算机各自的长处,把人和计算机结合起来形成新的体系。人始终起着主导的作用•强调人在未来智能系统中的作用,是对传统人工智能研究,也是对传统自动化研究目标的革命,这将带来一系列在研究方向及研究课题上的变革。•从定性到定量的综合集成技术充分发挥与体现了人机结合的思想,在综合集成的过程中人始终起着主导的作用。•另外,专家在错综复杂的情况下做出的判断、提出的假设以及专家的某些“点子”,是专家经验积累而形成的知识,是人的“心智”的一种体现。综合集成•我们可以认为,综合集成是人用计算机的软、硬件来综合专家群体的定性认识及大量专家系统所提供的结论及各种数据与信息,经过加工处理,从而使之上升为对总体的定量的认识。•综合集成的过程是相当复杂的,即使掌握了大量的定性认识,也不是通过几个步骤、几次处理就能达到对全局的定量认识。结构不良的问题•因为复杂的、智能型的问题往往被称为结构不良的问题(illstructuredproblem),也就是说目标、任务范围、计算机允许的操作都不具有明确的定义,需要一种有反馈的过程来加以解决。•结构不良的另外一种含义是针对被解决的问题而言的,即所具有的知识是不完备或不一致的。例如对于同一个问题,两个专家的看法可能完全不同,发生了矛盾,这就必须靠人参与解决。•另一方面当然也要发挥计算机快速处理的本领,形成人机结合的智能系统。钱学森谈话•关于人机结合的智能系统,钱学森在1991年4月18日与他指导的科研集体中的部分成员做过如下谈话:“智能系统是非常重要的,是国家大事,关系到下一个世纪我们国家的地位。如果在这个问题上有所突破,将有深远的影响。我们要研究的问题不是智能机,而是人与机器相结合的智能系统。不能把人排除在外,应该是一个人机智能系统。”•这是一次重要的谈话,对人工智能、智能计算机以及其他科技领域的研究具有极其深远的指导意义。谈话的内容还包括以下3点•第一,人的意识活动是很丰富的,包括自觉的意识、下意识,人是靠这些来认识世界的;•第二,为认识世界和改造世界,人始终发挥着主导作用,我们要研究的是人和机器相结合的智能系统;•第三,现在还不可能很快实现这种人机智能系统,目前只能做些“妥协”,实事求是,尽量开拓当前计算机制科学技术,使计算机尽可能多地帮助人来做些工作。简要总结•现在我们对人机结合(或称人机一体化)的观点扼要地加以总结:在研制智能系统,应强调的是人类的心智与机器的智能相结合。•从体系上讲,在系统的设计过程中,把人作为成员综合到整个系统中去.充分利用并发挥人类和计算机各自的长处形成新的体系,是今后要深人研究的问题。Lenat和Feigenbaum的话:•“在知识系统的第二个纪元中,系统将在智能计算机与智能人之间形成一种同事关系,人和计算机各自完成自己最擅长的任务,系统的智能是这种合作的产物。人与计算机的这种合作可能达到天衣无缝并极其自然的地步,以至于技能、知识及想法是在人脑中还是在计算机的知识结构中都是没有什么关系的,断定智能在程序之中是不准确的。这样的人机系统将出现超人的智能和能力。”•这段话充分表明了人机结合的前景。人作为智能系统成员•另外,“人作为智能系统成员”的论点,包括两个层次,即界面与体系两方面的含义。•人机界面是实现“人作为智能系统成员”的必要条件。这里所说的人机界面,其含义不同于基于图形学的人机界面,而是包含了模式识别这类涉及感知方面问题的更广义的人机界面。•目前这方面的工作是十分活跃的,有代表性的研究有两类:①多媒体技术;②“灵境”(virtualReality)技术。人机通讯——一种智能行为•根据美国麻省理工学院多媒体实验室对于多媒体的论述,可以看出:多媒体技术是与模拟人类的智能行为紧密相关的,换句话说,就是将人机通讯的过程同样理解为一种智能行为,这是十分引人注目的。•关于“灵境”技术,目前还不够成熟,其思路是力求人在求解问题的过程中使其有身临其境之感。“灵境”技术使人的感觉大大拓宽,小至分子大至宇宙,都可如同亲临其境,将使人的感觉及认知来一次飞跃。8.3集成型模式识别系统的设计•人具有识别模式的能力,所谓模式指的是文字、图像、声音等物理模式,也包括人的心理过程等。•人能够在一大群人中认出自己的朋友,尽管对方与自己已经多年未见面了;人具有联想的能力,例如在看到红色玫瑰时就自然会联想到热闹的婚礼场面。•按照心理学的说法,人通过经验与社会实践等在脑海里形成了心理意象。心理意象大致可分为记忆意象、意识意象以及想象意象三种类型。模式识别•模式识别(PatternRecognition)中的识别(Recognition)在心理学界习惯称为“再认”,即recognition,cognition是“认知”的英文原名,而识别则是再认,也就是说,人的脑海里有大量的记忆意象,当人与外界相接触,遇到的模式与记忆意象两者大致相吻合时,就把输入的模式归之于原先的记忆意象所对应的类别,也就是起到把输入模式进行分类的作用。既简单而又能形式化•记忆意象的性质是忽隐忽现的,模糊不清的。•人因为有了模式识别的能力,所以才能正常地生活。•现在已经有了一门用计算机来进行模式识别的学问,其识别的机理与人大不相同,不是模拟形象思维,而是人为地采取了一种既简单而又能形式化的办法。以文字模式识别为例•首先分析能表征文字的一些具有关键作用的量,称为特征,这种特征不仅仅是一个而是若干个。•例如用几个特征可以刻画一个文字,那么就把每个文字,用一个相应的具有几个分量的向量加以表达。与此同时,对每个文字建立一个“模板”,所谓的模板,也就是用一个标准的向量加以表示,这样一来,对一个新遇到的文字,先寻找与它对应的特征向量,然后把这个向量与模板向量相比较,求两个向量之间的距离。分类、描述与分析•与哪个模板间的距离最小,就判定为是该模板所对应的文字,这样一来文字识别的过程就变得比较简单:首先把文字进行二值化,然后抽取表征该文字的特征、构成一个向量,最后求向量间的距离。•这种方法与人识别文字是大不相同的,虽然人进行识别的机理难以说清楚,但人是从一个字的整体来考虑的,并不注重文字的某些细节。•用计算机进行模式识别的工作对简单的模式而言是进行分类,对复杂的模式,不仅是分类,而且是对模式的描述与分析。日本•早期对模式识别技术较为注意的国家是日本,日本通产省于加世纪70年代初实施了一个发展信息技术的“模式信息处理计划”。•该计划的核心在于发展模式识别技术,其目的是对文字、声音、图像、景物等加以处理、分析、分类、描述及理解,解决计算机与用户以方便的方式直接通信的问题。•例如使计算机能自动识别字符、图形及声音信号等,把这种类型的信息直接送入计算机,或计算机直接输出这种类型的信息。对信函自动分拣•1978年在京都举行的第4届国际模式识别大会上,日本的专家介绍了他们进行这个计划所取得的成就,并组织会议的参加者到东京的邮局参观邮政信函自动分拣系统:这种高度自动化的系统采用10个阿拉伯数字进行邮区编码,通过当时十分先进的数字识别技术对信函自动分拣。•这是字符识别技术的有效应用,参观者对这一新技术产生了深刻的印象。Al还是PR?•模式识别与AI有着密切的联系。•国外的AI专家中,由于受“以逻辑为基础”的思想影响,所以把Al与PR两者分开,而有的AI专家则认为PR是AI的一个分支。•两者最重要的相似点在于两者都致力于了解人类的感知与认知过程,以便使机器具有类似的能力。“只可意会,不可言传”•总之,