上海大学硕士学位论文基于计算机视觉的多点触摸系统的设计与实现姓名:李谦升申请学位级别:硕士专业:设计艺术学(数码交互艺术研究)指导教师:汪大伟20080401基于计算机视觉的多点触摸系统的设计与实现作者:李谦升学位授予单位:上海大学相似文献(10条)1.学位论文李娜面向人机交互的单目视频三维人体姿态估计研究2008自动理解图像或者视频序列中的运动人体,一直是计算机视觉研究的重点。除了人类对通过机器探索和仿造自身的兴趣外,促使其成为研究热点的一个重要原因是电子设备的迅猛发展和由其带来的巨大应用市场。本文针对人机交互应用,着重研究单目视频下三维人体姿态估计。单目视频三维人体姿态估计是计算机视觉研究中最具挑战性的问题之一。系统的观测输入为复杂自然图像,状态输出为高维人体姿态,由观测到状态的系统过程是动态且非线性的。此外,面向人机交互应用时,单目视频三维人体姿态估计系统的核心算法需同时满足准确、鲁棒和实时性要求,系统初始化过程应尽可能自动化.针对以上问题,本文依照模块分别展开研究,并将各部分算法集成至人机交互原型系统,从而实现基于单目视频三维人体姿态估计的人机交互.本文将单目视频三维人体姿态估计研究划分为三部分关键技术:图像特征提取、人体姿态估计算法以及初始化过程的自动化。其中,图像特征提取研究针对普通低端摄像设备,提出了基于HSV色彩空间的图像特征提取算法,通过采用与人眼视觉感知一致的HSV空间提高图像特征提取的有效性和鲁棒性。针对人体姿态估计算法,本文提出了判别模型和生成模型相结合的三维人体姿态估计数学模型。通过判别模型确定目标姿态的子空间。进而通过生成模型求解目标姿态,充分发挥了判别式模型和生成式模型各自的优势。针对系统初始化过程,本文重点介绍了手工分割视频对象的框架和评价标准,为用户辅助采集训练数据提供便利,减少用户在系统初始化过程中的交互工作量.根据以上核心算法设计,本文自行开发了基于肢体运动控制的新式人机交互实时系统。为验证系统的有效性,本文进一步开发了一款使用普通网络摄像头交互的简易游戏,为探讨基于人体运动的人机交互设计方法建立了实验平台。通过该平台,本文进行大量用户测试,并探讨这种新型人机交互在全新设计环境下面临的问题和机遇。测试结果表明了本文所提出的单目三维人体姿态估计系统的有效性,同时展示了此类基于人体运动的新型交互系统的独特魅力和广阔应用前景。2.学位论文钟旭基于计算机视觉的人机交互技术研究与应用2006感知人机界面(PerceptualInterfaces)是未来人机交互的发展趋势,其中基于机器视觉的人机界面(VisionBasedInterfaces)技术也受到越来越多研究人员的重视。实现VBI的关键在于对人体动作的准确快速识别,但人运动的视觉分析作为计算机视觉研究的一个热点和难点,仍然有许多理论和技术问题需要解决。本文主要研究了二维空间中的运动图像序列中人体运动的识别和理解,包括输入图像的预处理、人体的几何和运动模型描述以及二维空间中人体简单动作的识别和理解。本文的主要研究内容和创新点可以归结如下几点:1.针对基于色彩空间的肤色检测方法随光照条件不同阈值变化很大不具有自适应功能的缺点,本文在B-P神经网络模型的基础上,构造了一个基于模糊模式的神经网络肤色滤波器。该滤波器具有学习速度快、可适用于较广范围的光照条件等特点,实验表明其可应用于复杂环境下的手势图像检测。2.研究了人体运动的约束和限制,提出了一种利用颜色特征点的自动标注方法,解决了运动的快速跟踪问题。提出了一种新的背景建模方法,有效解决了因环境改变而引起背景改变所带来的问题。基于骨架模型不可能超出人体轮廓这样一个常识,提出了一种新的快速人体运动骨架模型的抽取方法,实验表明该方法快速有效。3.提出了一种新的运动模式描述方法:三层运动描述方法,从而给运动模式的快速、准确、精确识别奠定了好的基础。介绍了两种模式识别方法:基于区域和边缘的姿势评价函数和基于HMM的模式识别。着重分析了HMM方法,并在三层运动描述方法基础上提出了一种新的基于HMM的运动识别方法,实验证明该法切实可行。4.设计并实现了一个幼儿教育游戏系统原型,分析了该原型系统开发的背景及意义,介绍了该系统的建立所需要的三个阶段和图形开发使用的ogre引擎和OpenCV。最后给出了系统的一些效果图。3.学位论文陈燕玲手形识别在人机交互中的应用研究2008近年来,计算机与人类日常生活联系越来越紧密,新的硬件和应用领域不断涌现,然而人机交流方式仍然局限于键盘、鼠标及光笔等,这些交互方式虽然越来越熟悉,但它们限制了人机交流的速度和方便性。因而,基于视觉的手形识别逐渐成为人机交互的研究热点,在计算机游戏、机器人控制和家用电器控制等方面具有广阔的应用前景。对手形识别技术的研究也成为当今计算机视觉领域、模式识别领域、数字信号处理领域的一个重要研究方向。本课题的主要研究目的是为用户提供一种更直观和自然的类键盘输入方式,使用户可以使用简便的交互设备作为人机接口操纵计算机。研究成果主要应用在数控系统的开放式控制面板上。本文主要研究了手形识别的实现,即通过4个手指的伸缩状态来定义计算机指令。以PC机标准键盘上12个字符:0-9数字以及小数点、回车为例进行仿真,从手形图像的预处理、特征提取和识别等三个方面研究了手形识别算法。在特征提取方面,与以往提取手形的重心和指尖、指根的算法相比,本文提出了一种手形特征提取算法,通过小手指外边缘作拟合直线。然后沿它的垂线方向扫描来确定食指、中指、无名指、小手指4个手指指尖的相对位置。最终能够计算出食指、无名指和小手指这3个手指相对中指的伸缩状态。在识别算法方面,以往的研究工作大多数是先建立好手形样本模板库,然后采用基于匹配的识别技术,利用手形分析中提取的特征参数与手形样本模板库进行匹配来完成识别。本文把最小错误率的贝叶斯决策规则作为分类器设计准则。整个算法在Matlab6.5环境下实现。使用摄像头采集了60个手形图像样本进行分析,正确识别率可达85%。实验表明本文提出的手形图像识别技术是行之有效的。4.期刊论文基于计算机视觉的手势识别人机交互技术-硅谷2009(19)随着数字媒体技术的广泛应用及飞速发展,人们希望能够更有效更自然地与计算机进行交流.虽然新的硬件和应用领域不断涌现,而人们熟悉和熟练掌握的人机交互方式仍然局限于键盘、鼠标等,但它们限制了人机交流的速度和自然性.基于视觉的手势识别就成为了实现新一代人机交互不可缺少的一项关键技术.借助计算机视觉,数字图像处理,模式识别等理论与技术,使得计算机通过视觉通道(摄像机)正确感知输入的手势语,同时作出用户所需要的响应,以实现自然的人机交互.5.期刊论文莫锦秋.周晓军.MOJinqiu.ZHOUXiaojun计算机泛视觉体系下的人机交互功能特征-中国机械工程2000,11(5)从计算机泛视觉理论的基本学术思想出发,给出了计算机泛视觉体系下人机交互的功能特征,即其丰富的可视化融合方式,以及在人机交互过程中所实现的主动性和渐进性.6.学位论文孙涵基于PCA重建方法的表情识别方法研究2008情感计算是国际上近几年刚刚兴起的、试图使计算机能够像人类那样具有理解和表达情感能力的一个多学科交叉的新研究领域,在智能人机交互中起着重要作用。由于人的面部表情是情绪重要的外在表现方式,所以人脸表情识别成为情感计算的重要组成部分。人脸表情识别是一个人工智能、计算机视觉、图像处理、心理学、认知学等多学科交叉的研究领域。通过表情识别的研究可以有效地促进人机交互系统的发展和计算机图像自动理解的研究。本文的研究重点是对于静态图像的表情识别方法。在分析和学习了一些常用的表情识别技术的基础上,本文提出了一种新的表情识别的方法,该方法以表情识别中经典方法--PCA算法为算法基础,是一种基于PCA重建方法的表情识别方法。该方法的总体思想是将表情识别的训练集按表情分类形成不同表情子集,然后在子集上进行PCA算法,分别得到对应的正交基。对于待测图像,在不同表情子集生成的正交基上分别进行投影,之后利用投影坐标重建,然后通过比较待测图像与哪幅重建图像最相似来确定待测图像的表情识别结果。对于比较图像相似,本文提出了两种方法--差值和方法和相似点数方法,分别对其效果进行了实验,然后通过使用区分度的概念将两种方法结合起来,成为最终的比较图像相似进行表情分类的方法。本文对该方法与传统PCA+神经网络分类器的识别方法在日本表情数据库上进行了对比实验,该方法得到了优于传统方法的识别率。7.学位论文胡文娟手势驱动编钟演奏技术的研究与系统实现2007中华民族历史悠久,拥有丰富的非物质文化遗产。对这些非物质文化遗产的保护与传承通常需要近距离的接触历史文物,然而,文物保护的需要限制了文化传承的方式,这也使得一种新的交互方式的出现成为必然。因此,以计算机手势识别技术为代表的自然人机交互技术逐渐的成为该领域研究的热点。本论文通过深入研究自然人机交互中的手势识别技术,提出将自然人机交互技术与非物质文化遗产保护相结合,利用基于计算机视觉的手势在三维环境中弹奏编钟,成功地解决了非物质文化遗产保护中珍稀古文物不可直接用于宣传普及的矛盾,丰富了非物质文化遗产保护与传承的方式,具有一定的实用性以及可扩展性。文中首先对几种常见的计算机手势识别技术进行分析比较,并选择最适于系统实现的基于计算机视觉的手势识别技术作为研究重点。然后,针对手势识别过程中会遇到的无效距离的问题给出相应的解决方法——利用基于计算机视觉的立体距离测量法筛选无效距离以优化实现效果,并给出距离测量公式的推导过程。基于计算机视觉的手势识别技术在实现中需要通过手势建模、手势分割以及特征参数提取几个阶段的操作以实现用户手势的实时识别。其中,手势分割是计算机手势识别技术的核心,论文详细论述了手势分割前期的手势定位操作以及依据肤色阈值从图像的HSV色彩空间中划分出人体所在区域的方法,并给出一个利用Freeman链法则进行边缘跟踪优化的算法。最后,应用基于计算机视觉的手势识别技术,论文实现了一个手势驱动编钟演奏的系统,以殷商大型王室墓葬妇好墓出土的五枚编钟作为原型,在OpenGI一环境中重建场景,使用单目摄像头作为手势输入设备,驱动编钟奏乐。论文的最后给出了系统的具体实现。8.学位论文蔡亚计算机视觉技术及LabVIEW在织物疵点检测中的应用2007在纺织品生产中,织物疵点检测是质量控制的一个重要环节。迄今为止,传统的疵点检测都是由人工来完成的,由于人工检测是一种单调、乏味且繁重的劳动,工作人员的检测能力还受到工作环境、自身生理和心理等因素的影响,故人工检测结果受到工作人员主观的影响较大,且人工检测的速度比较慢。随着计算机和图像处理技术的发展,计算机视觉越来越多地被应用于工业生产,基于计算机视觉的织物疵点检测已成为人们关注的热点。在本文中,首先分析了已有的织物疵点自动检测研究成果。通过分析发现,这些研究虽然在疵点检测的精度上能够达到很高的要求,但在检测速度和检测环境适应性方面往往不是很理想。因此,本文从工厂实际应用的要求出发,确立了建立一个具有一定检测精度且在检测速度方面具有明显优势的检测系统的目标。然后,简单介绍了本文疵点检测系统的总体结构和系统中所用到的硬件的工作原理、参数等。在本检测系统中,选用了线阵CCD相机。这是由于与面阵CCD相机相比,线阵CCD相机具有光源容易控制、能够连续扫描高速运动物体等优点,能够满足本检测系统的要求。接着介绍了本文基于LabVIEW平台开发的硬件控制及疵点检测软件。LabVIEW是美国NI公司推出的一种基于G语言的虚拟仪器软件开发工具,是目前国际上应用最广泛的虚拟仪器开发环境之一,主要应用于仪器控制、数据采集、数据分析、数据显示等领域。LabVIEW采用强大的图形化语言编程,面向测试工程师而非专业程序员,编程方便,人机交互界面直观、友好。在本文的后半部分,介绍了采用曲线拟合的方法对采集到的每一行织物图像进行处理。对存在疵点的每一行织物图像,利用该方法突出其中的疵点特征。通过在不同拍摄条件下对具有不同疵点的织物进行