1第一章绪论人机交互定义:人机交互是关于设计、评价和实现供人们使用的交互式计算机系统,且围绕这些方面的主要现象进行研究的科学。人机交互研究:人机交互界面表示模型与设计方法一个交互界面的好坏,直接影响到软件开发的成败。友好人机交互界面的开发离不开好的交互模型与设计方法。因此,研究人机交互界面的表示模型与设计方法,是人机交互的重要研究内容之一。可用性分析与评估可用性是人机交互系统的重要内容,它关系到人机交互能否达到用户期待的目标,以及实现这一目标的效率与便捷性。人机交互系统的可用性分析与评估的研究主要涉及到支持可用性的设计原则和可用性的评估方法等。多通道交互技术在多通道交互中,用户可以使用语音、手势、眼神、表情等自然的交互方式与计算机系统进行通信。多通道交互主要研究多通道交互界面的表示模型、多通道交互界面的评估方法以及多通道信息的融合等。其中,多通道信息整合是多通道用户界面研究的重点和难点。认知与智能用户界面智能用户界面的最终目标是使人机交互和人-人交互一样自然、方便。上下文感知、眼动跟踪、手势识别、三维输入、语音识别、表情识别、手写识别、自然语言理解等都是认知与智能用户界面需要解决的重要问题。虚拟和增强环境中的交互方法“以人为本”的、自然和谐的人机交互理论和方法是虚拟现实的主要研究内容之一。通过研究视觉、听觉、触觉等多通道信息融合的理论和方法、协同交互技术以及三维交互技术等,建立具有高度真实感的虚拟环境,使人产生“身临其境”的感觉。Web设计重点研究Web界面的信息交互模型和结构,Web界面设计的基本思想和原则,Web界面设计的工具和技术,以及Web界面设计的可用性分析与评估方法等内容。移动界面设计移动计算(MobileComputing)、无处不在计算(UbiquitousComputing)等对人机交互技术提出了更高的要求,面向移动应用的界面设计问题已成为人机交互技术研究的一个重要应用领域。针对移动设备的便携性、位置不固定性和计算能力有限性以及无线网络的低带宽高延迟等诸多的限制,研究移动界面的设计方法,移动界面可用性与评估原则,移动界面导航技术,以及移动界面的实现技术和开发工具,是当前的人机交互技术的研究热点之一。2人机交互历史:①手工作业阶段穿孔卡片等,最早的计算机采用②命令方式键盘输入,DOS等操作系统采用③图形用户界面GUI键盘输入,鼠标,Windows系列采用④自然人机交互界面采用人的自然通道(视觉/听觉)实现人机交互手写,语音,视觉,多通道第二章感知和认识基础①人机交互过程中人们经常利用的感知有哪几种?每种感知有什么特点?视觉感知特点:一方面,眼睛和视觉系统的物理特性决定了人类无法看到某些亊物;另一方面,视觉系统进行解释处理信息时可对不完全信息发挥一定的想象力。进行人机交互设计需要清楚这两个阶段及其影响,了解人类真正能够看到的信息。(视觉感知可以分为两个阶段:受到外部刺激接收信息阶段和解释信息阶段。)听觉感知特点:听觉感知传递的信息仅次于视觉,可人们一般都低估了这些信息。人的听觉可以感知大量的信息,但被视觉关注掩盖了许多。听觉所涉及的问题和视觉一样,即接受刺激,把它的特性转化为神经兴奋,并对信息进行加工,然后传递到大脑。听觉系统就像视觉系统一样,利用以前的经验来解释输入。触觉感知特点:触觉在交互中的作用是不可低估的,尤其对有能力缺陷的人,如盲人,是至关重要的触觉的感知机理与视觉和听觉的最大不同在于它的非局部性②颜色模型有哪几种?试说明RGB、CMYK以及HSV颜色模型各适用于在什么情况下应用?RGB颜色模型、CMYK颜色模型(减性原色系统)、HSV颜色模型.RGB:电脑屏幕;CMYK:打印印刷;HSV:图像编辑③人的认知过程分为哪几类?感知和识别注意记忆学习阅读说话和聆听解题、规划、推理和决策3④什么是概念模型和分布式认知模型?概念模型:指的是一种用户能够理解的系统描述,它使用一组集成的构思和概念,描述系统做什么、如何运作、外观如何等。分布式认知模型描述的是认知系统中发生了什么,它通常描述人员之间的交互,人们使用的物品及工作环境。第三章交互设备①输入设备文本输入设备图像输入设备三位图像输入设备指点输入设备②输出设备显示器声音的输出数字纸等③虚拟现实系统中的交互设备掌握内容:1)三维扫描仪分类和优缺点根据传感方式的不同,三维扫描仪主要分为接触式和非接触式两种。接触式的三维扫描仪采用探测头直接接触物体表面,通过探测头反馈回来的光电信号转换为物体表面形状的数字信息。该类设备主要以三维坐标测量机为代表。其优点是具有较高的准确性和可靠性,但也存在测量速度慢、费用较高、探头易磨损以及误差修正等缺点。非接触式的三维扫描仪,主要有三维激光扫描仪,照相式三维扫描仪等,分别是基于激光扫描测量和结构光扫描测量等技术设计的。这类设备的优点是扫描速度快,易于操作,且由于不需接触被测量的物体,所以对物体表面损伤少等。2)三维激光扫描仪工作原理三维激光扫描仪通过高速激光扫描测量技术,获取被测对象表面的空间坐标数据。(时间差测量法、三角测量法)3)运动捕捉设备分类及工作原理分类:机械式、电磁式、光学式捕捉设备机械式动作捕捉设备利用可伸缩的机械结构安装于捕捉物体上,以获得各部分的运动量。电磁式设备将若干低频磁场感应器安装在捕捉物体上,根据感应器接收到的磁场,可以计算出接收器相对于发射器的位置和方向。光学式运动捕捉4摄像机以足够高的速率连续拍摄时,从图像序列中就可以得到该点的运动轨迹。光学式运动捕捉便是利用这一点通过对目标上特定光点的监视和跟踪来完成运动捕捉的任务。4)三维空间定位设备三维空间定位设备1、空间跟踪定位器(三维空间传感器)定位于身体或虚拟现实交互道具上,感知空间6自由度及其变化,跟踪运动。低频磁场式和超声式传感器等不同类型的定位设备取决于应用要求精度、价格等因素。2、数据手套可以精确地捕捉手指和手腕的相对运动,获取各种手势信号,可以配合一个6自由度的跟踪器,跟踪手的实际位置和方向3、触觉和力反馈器包括:力学反馈手套、力学反馈操纵杆、力学反馈笔、力学反馈表面等装置。由于精度、真实感、安全性等问题,目前尚缺乏成熟产品。5)三维显示设备立体眼镜、头盔式显示器、洞穴式显示环境CAVE第四章交互技术掌握内容:人机交互输入模式多通道用户交互界面命令行用户界面、图形用户界面、虚拟现实概念模型图形用户界面主要思想设计图形用户界面的一般性原则窗口的排列方式及其优缺点基本交互技术图形交互技术三维交互技术多通道用户界面的基本特点眼动跟踪的基本原理主要手势识别技术语音识别处理流程表情识别步骤联机手写识别主要阶段和原理框图5人机交互输入模式1)请求模式在请求模式下,输入设备的启动是在应用程序中设置的,应用程序执行过程中需要输入数据时,暂停程序的执行,直到从输入设备接收到请求的输入数据后,才继续执行程序。2)采样模式输入设备和应用程序独立地工作,输入设备连续不断地把信息输入进来,信息的输入和应用程序中的输入命令无关。应用程序在处理其他数据的同时,输入设备也在工作,新的输入数据替换以前的输入数据当应用程序遇到取样命令时,读取当前保存的输入设备数据。优点:这种模式对连续的信息流输入比较方便,也可同时处理多个输入设备的输入信息缺点:当应用程序的处理时间较长时,可能会失掉某些输入信息。3)事件模式输入设备和程序并行工作。输入设备把数据保存到一个输入队列,也称为事件队列,所有的输入数据都保存起来,不会遗失。应用程序随时可以检查这个事件队列,处理队列中的事件,或删除队列中的事件。6图形用户界面(GUI)概念模型图形用户界面又称为WIMP界面,由窗口(Windows),图标(Icons)、菜单(Menus)、指点设备(PointingDevice)四位一体,形成桌面(Desktop)。**********************************多通道用户界面概念模型多通道用户界面的研究是为了消除当前WIMP/GUI用户界面通信带宽不平衡的瓶颈,综合采用视线、语言、手势等新的交互通道、设备和交互技术,通过整合来自多个通道的、精确的和不精确的输入来捕捉用户的交互意图,提高人机交互的自然性和高效性概念模型:**********************************7虚拟现实的概念模型①虚拟现实是人们可以通过视、听、触等信息通道感受到设计者思想的用户界面,由两部分组成:一部分是创建的虚拟世界(环境),另一部分是介入者(人)②虚拟世界的核心是强调两者之间的交互操作,即反映出人在虚拟世界(环境)中的体验。③人机交互是虚拟现实的核心。**********************************图形用户界面的主要思想·图形用户界面的三个主要思想:①桌面隐喻:桌面隐喻是指在用户界面中用人们熟悉的桌面上的图例清楚地表示计算机可以处理的能力。②所见即所得:在WYSIWYG交互界面中显示的用户交互行为与应用程序最终产生的结果是一致的。③直接操纵:直接操纵是指可以把操作的对象、属性、关系显式地表示出来,用光笔、鼠标、触摸屏或数据手套等指点设备直接从屏幕上获取形象化命令与数据的过程·隐喻的分类:1)直接隐喻:隐喻本身就带有操纵的对象如Word中的表格、图表等图标,图标分别代表了操纵对象2)工具隐喻:代表所使用的工具如用磁盘图标隐喻存盘操作、用打印机图表隐喻打印操作等,这种隐喻设计简单,形象直观,应用也是最为普遍。3)过程隐喻:通过描述操作的过程来暗示该操作如Word中的撤销和恢复图标。8窗口状态(WindowsStates)TiledWindowsCascadingWindows【】OverlappingWindowsInterruptedCascade【】WindowInterfaces-MDIWindowInterfaces-TDI**********************************基本交互技术⒈定位是确定平面或一个空间的一个点的坐标,是交互中最基本的输入技术之一⒉笔画输入用于输入一组顺序的坐标点,它相当于多次调用定位输入,输入的一组点常用于显示折线或作为曲线的控制点。⒊定值(或数值)输入用于设置物体旋转角度、缩放比例因子等。它是要在给定的数字范围内输入一个值。⒋选择是在某个选择集中选出一个元素,通过注视、指点或接触一个对象,使对象成为后续行为的焦点,是操作对象时不可缺少的一部分。它可以用于指定命令,确定操作对象或选定属性等。⒌字符串:键盘是目前输入字符串最常用的方式,现在用写字板输入字符也已经很流行。**********************************图形交互技术·橡皮筋技术是拖动的另一种形式,不同的只是被拖动的对象的形状和位置随着光标位置的不同而变化。·操作柄技术操作柄(Handle)技术可以用来对图形对象进行缩放、旋转、错切等几何变换。9先选择要处理的图形对象,该图形对象的周围会出现操作柄,移动或旋转操作柄就可以实现相应的变换。**********************************三维交互技术·直接操作通过三维光标,用户可以选择并直接操作虚拟对象,三维光标可以是人手的三维模型,输入设备的位置和方向被映射为虚拟手的位置和方向。·三维Widgets三维交互界面中的一些小工具。包括在三维空间中漂浮的菜单,用于拾取物体的手的三维图标,平移和旋转指示器等。·三视图输入借助三视图输入技术,用而未输入设备在一定程度上实现三维的输入。**********************************多通道用户界面的基本特点·使用多个感觉和效应通道·允许非精确的交互·三维和直接操纵·交互的双向性·交互的隐含性·(包括各个方面的含义)**********************************眼动跟踪的基本原理用红外摄像机摄取受试者眼睛图像,经过MPEG编码后送入计算机进行图像数据采集分析,实时计算出眼珠的水平和垂直运动的时间、位移距离、速度及瞳孔直径、注视位置。瞳孔-角膜反射向量法(基于注视点)通过固定眼摄像机获取