人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。交互的信息也由精确的输入输出信息变成非精确的输入输出信息。一、简单的人机交互界面由于受到制造技术和成本等原因限制,早期的人机交互在设计上较少考虑人的因素,一味强调输入输出信息的精确性,因而使用不够自然和高效。1.早期的手工作业。当时交互的特点是由设计者本人(或本部门同事)来使用计算机,他们采用手工操作和依赖机器(二进制机器代码)的方法去适应现在看来是十分笨拙的计算机;2.作业控制语言及交互命令语言。这一阶段的特点是计算机的主要使用者—程序员可采用批处理作业语言或交互命令语言的方式和计算机打交道,虽然要记忆许多命令和熟练地敲键盘,但已可用较方便的手段来调试程序、了解计算机执行情况;3.图形用户界面(GUI)。GUI的主要特点是桌面隐喻、WIMP技术、直接操纵和“所见即所得(WYSIWYG)”。由于GUI简明易学、减少了敲键盘、实现了“事实上的标准化”。因而使不懂计算机的普通用户也可以熟练地使用,开拓了用户人群。它的出现使信息产业得到空前的发展;4.网络用户界面。以超文本标记语言HTML及超文本传输协议HTTP为主要基础的网络浏览器是网络用户界面的代表。由它形成的的支柱。这类人机交互技术的特点是发展快,新的技术不断出现,如搜索引擎、网络加速、多媒体动画、聊天工具等;二、自然的人机交互界面随着网络的普及性发展和无线通讯技术的发展,人机交互领域面临着巨大的挑战和机遇,传统的图形界面交互已经产生了本质的变化,人们的需求不再局限于界面的美学形式的创新,现在的用户更多的希望在使用多媒体终端时,有着更便捷、更符合他们的使用习惯,同时又有着比较美观的操作界面。利用人的多种感觉通道和动作通道(如语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与(可见或不可见的)计算机环境进行交互,使人们从传统的交互方式的束缚解脱出来,使人们进入自然和谐的人机交互时期。这一时期的主要研究内容包括:多通道交互、情感计算、自然语言理解、虚拟现实、智能用户界面等方面。(1)多通道交互多通道交互(MultiModalInteraction,MMI)是近年来迅速发展的一种人机交互技术,它既适应了“以人为中心”的自然交互准则,也推动了互联网时代信息产业(包括移动计算、移动通信、网络服务器等)的快速发展。MMI是指“一种使用多种通道与计算机通信的人机交互方式。通道(modality)涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法,如言语、眼神、脸部表情、唇动、手动、手势、头动、肢体姿势、触觉、嗅觉或味觉等”。采用这种方式的计算机用户界面称为“多通道用户界面”。目前,人类最长使用的多通道交互技术包括手写识别、笔式交互、语音识别、语音合成、数字墨水、视线跟踪技术、触觉通道的力反馈装置、生物特征识别技术和人脸表情识别技术等方面。(2)情感计算让计算机具有情感能力首先是由美国MIT大学Minsky教授(人工智能创始人之一)提出的。他在1985年的专著“TheSocietyofMind”中指出,问题不在于智能机器能否有任何情感,而在于机器实现智能时怎么能够没有情感。从此,赋予计算机情感能力并让计算机能够理解和表达情感的研究、探讨引起了计算机界许多人士的兴趣。这方面的工作首推美国MIT媒体实验室Picard教授领导研究小组的工作。情感计算一词也首先由Picard教授于1997年出版的专著“AffectiveComputing(情感计算)”中提出并给出了定义,即情感计算是关于情感、情感产生以及影响情感方面的计算。MIT对情感计算进行全方位研究,正在开发研究情感机器人,最终有可能人机融合。其媒体实验室与HP公司合作进行情感计算的研究。IBM公司的“蓝眼计划”,可使计算机知道人想干什么,如当人的眼瞄向电视时,它竟知道人想打开电视机,它便发出指令打开电视机。此外该公司还研究了情感鼠标,可根据手部的血压及温度等传感器感知用户的情感。CMU主要研究可穿戴计算机。日本在对感性信息处理的研究中,有众多研究单位参与,主要集中在研究所和高校。特别值得一提的是,日本欧姆龙公司研制生产的机器玩具曾风行一时,最高价达4000美元。随后其它公司也进行机器狗等玩具的生产。显然情感计算的研究不仅具有重要的科学和学术价值,也存在着巨大的商机,有很好的经济效益。(3)虚拟现实虚拟现实(VirtualReality,VR)是以计算机技术为核心,结合相关科学技术,生成与一定范围真实环境在视、听、触感等方面高度近似的数字化环境,用户借助必要的装备与数字化环境中的对象进行交互作用、相互影响,可以产生亲临对应真实环境的感受和体验。虚拟现实是人类在探索自然、认识自然过程中创造产生,逐步形成的一种用于认识自然、模拟自然,进而更好地适应和利用自然的科学方法和科学技术。虚拟现实技术具有很强的应用性。军事方面,将VR技术应用干军事演练,带来了军事演练观念和方式的变革,推动了军事演练的发展。如美国的SIMNET、ACTDSTOW、WARSIM2000和虚拟之旗2006等一系列分布式虚拟战场环境。医学方面,VR技术已初步应用于虚拟手术训练、远程会诊、手术规划及导航、远程协作手术等方面,某些应用已成为医疗过程不可替代的重要手段和环节。如在虚拟手术训练方面,典型的系统有瑞典Men-tiee公司研制的proeedieusMIST系统、SurgiealSei-ence开发的Lapsim系统、德国卡尔斯鲁厄研究中心开发的SeleetITVESTSystem系统等。工业领域方面,VR技术多用于产品论证、设计、装配、人机工效和性能评价等。代表性的应用,如模拟训练、虚拟样机技术等已受到许多工业部门的重视。20世纪90年代美国约翰逊航天中心使用VR技术对哈勃望远镜进行维护训练,波音公司利用VR技术辅助波音777的管线设计,这些都是典型的成功范例。教育文化领域方面,VR已经成为数字博物馆/科学馆、大型活动开闭幕式彩排仿真、沉浸式互动游戏等应用系统的核心支撑技术。如纽约大都会博物馆、大英博物馆、俄罗斯冬宫博物馆和法国卢浮宫等都建立了自己的数字博物馆。(4)智能用户界面智能用户界面(IntelligentUserInterface,IUI)是致力于改善人机交互的高效率、有效性和自然性的人机界面。它通过表达、推理,并按照用户模型、领域模型、任务模型、谈话模型和媒体模型来实现人机交互。智能用户界面主要使用人工智能技术去实现人机通信,提高了人机交互的可用性:如知识表示技术支持基于模型的用户界面生成,规划识别和生成支持用户界面的对话管理,而语言、手势和图像理解支持多通道输入的分析,用户建模则实现了对自适应交互的支持等。当然,智能用户界面也离不开认知心理学、人机工程学的支持。智能体、代理(agents)在智能技术中的重要性已“不言而喻”了。Agent是一个能够感知外界环境并具有自主行为能力的以实现其设计目标的自治系统。智能的agent系统可以根据用户的喜好和需要配置具有个性化特点的应用程序。基于此技术,我们可以实现自适应用户系统、用户建模和自适应脑界面。自适应系统方面,如帮助用户获得信息,推荐产品,界面自适应,支持协同,接管例行工作,为用户裁剪信息,提供帮助,支持学习和管理引导对话等。用户建模方面,目前机器学习是主要的用户建模方法,如神经网络、Bayesian学习以及在推荐系统中常使用协同过滤算法实现对个体用户的推荐。自适应脑界面方面,如神经分类器通过分析用户的脑电波识别出用户想要执行什么任务,该任务既可以是运动相关的任务如移动手臂,也可以是认知活动如做算术题。(5)自然语言理解在“计算机文化”到来的社会里,语言已不仅是人与人之间的交际工具,而且是人机对话的基础。自然语言处理(NLP,NaturalLanguageProcessing)是使用自然语言同计算机进行通讯的技术,因为处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguageUnderstanding),也称为计算语言学(ComputationalLinguistics)。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI,ArtificialIntelligence)的核心课题之一。近年来自然语言理解技术在搜索技术方面得到了广泛的应用,它以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,为用户提供采用自然语言进行信息的检索,从而为他们提供更方便、更确切的搜索服务。现在,已经有越来越多的搜索引擎宣布支持自然语言搜索特性,比如Accoona、Google、网易等。IBM宣称,即将推出的OmniFind软件采用了UIMA架构(UnstructuredInformationManagementArchitecture),能将字词背后的含意解释出来,再输出合适的搜索结果。此外,在自然语言理解技术智能短信服务、情报检索、人机对话等方面也具有广阔的发展前景和极高的应用价值,并有一些阶段性成果出现在商业运用中。