计算机视觉概述本节内容人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用百闻不如一见Onepictureisworthmorethantenthousandwords.人类视觉视网膜外侧膝状体视皮层周围环境中的物体在可见光的照射下,在人眼的视网膜上形成图像,由感光细胞转换成神经脉冲信号,经神经纤维传入大脑皮层进行处理与理解。人类约有75%的信息是通过视觉系统获取的。视觉是思维的一种最基本的工具人类视觉计算机视觉•计算机视觉是一门研究如何使机器“看”的科学,即用摄影机和电脑代替人眼对目标进行识别、跟踪和测量。•用计算机实现对视觉信息处理的全过程计算机视觉人类视觉是通过人眼来感知世界的过程输入:通过眼睛对世界的观察输出:对世界的感知计算机视觉计算机视觉是通过对图像和视频的分析处理,实现类似人类视觉感知能力的过程输入:图像(images)或视频(video)输出:对象的恢复以及对对象信息的使用本节内容人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用视觉的计算理论——Marr的视觉计算理论框架DavidMarr(1945-1980)是英国心理学家。他将心理学、人工智能和神经生理学的结果结合起来,对视觉的研究做出了重要贡献。他是计算视觉的奠基人。DavidMarr70年代末在美国MIT提出了第一个较为完善的视觉系统框架此框架尽管存在很多缺陷,但过去20多年一直处于主导地位D.Marr,Vision,1982.中译本:视觉计算理论姚国正、刘磊、汪云九译,科学出版社,1988。Marr的视觉计算理论框架——视觉系统研究的三个层次表1-1计算理论表示和算法硬件实现计算的目的是什么?如何实现这个计算理论?在物理上如何实现为什么这一计算是合适的?输入、输出的表示是什么?这些表示和算法?执行计算的策略是什么?表示与表示之间的变换是什么?一个例子:超市的自动收银机(cashregister)1)计算理论它做的是加法。为什么它做加法而不是乘法?2)表达与算法加法的输入输出是十进制的阿拉伯数字。加法的算法是满十进一。3)物理实现由电线和晶体管组成的电子设备。Marr的视觉计算理论框架——视觉信息处理的三个阶段低层视觉(Low-levelvision)构成所谓的“要素图”(primarysketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等)Marr的视觉计算理论框架——视觉信息处理的三个阶段低层视觉(Low-levelvision)构成所谓的“要素图”(primarysketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等)Marr的视觉计算理论框架——视觉信息处理的三个阶段低层视觉(Low-levelvision)构成所谓的“要素图”(primarysketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等)Marr的视觉计算理论框架——视觉信息处理的三个阶段中层视觉(Intermediate-levelvision)构成对环境的2.5维描述,即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等,包含了深度信息,但不是真正的物体三维表示。)Marr的视觉计算理论框架——视觉信息处理的三个阶段中层视觉(Intermediate-levelvision)构成对环境的2.5维描述,即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等,包含了深度信息,但不是真正的物体三维表示。)Marr的视觉计算理论框架——视觉信息处理的三个阶段中层视觉(Intermediate-levelvision)构成对环境的2.5维描述,即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等,包含了深度信息,但不是真正的物体三维表示。)Marr的视觉计算理论框架——视觉信息处理的三个阶段高层视觉(High-levelvision)从2.5维描述得到完整的三维描述(恢复、表示和识别三维物体)Marr模型的缺点:假定视觉系统是被动的,给什么图像就处理什么缺乏或者未足够重视高层知识的指导作用由局部信息到整体信息的单向过程,没有反馈Marr框架的计算机视觉三阶段本节内容人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。图像去噪计算机视觉与相关研究领域——计算机视觉与图像处理计算机视觉与相关研究领域——计算机视觉与图像处理图像增强图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。计算机视觉与相关研究领域——计算机视觉与图像处理图像修复图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。计算机视觉与相关研究领域——计算机视觉与图像处理图像去模糊图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。图像中多余物体的去除计算机视觉与相关研究领域——计算机视觉与图像处理图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。•图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。图像处理:人是最终的解释者计算机视觉:计算机是图像的解释者计算机视觉系统需要图像处理模块(利用图像处理技术进行预处理和特征抽取)计算机视觉与相关研究领域——计算机视觉与图像处理计算机视觉与相关研究领域——计算机视觉与计算机图形学计算机图形学(ComputerGraphics):从三维描述到二维图像显示。(给定关于景象结构、表面反射特性、光源配置及相机模型的信息,生成图像。)计算机视觉:从二维图像数据到三维描述。(给定图象,推断景象特性实现的是从模型到图像的变换,也就是说从图象数据提取信息,包括景象的三维结构,运动检测,识别物体等。)在一定意义上讲,计算机视觉是计算机图形学的逆问题两者从最初相互独立的平行发展到最近的融合是一大趋势计算机视觉与相关研究领域——计算机视觉与模式识别模式识别(PatternRecognition):研究各类模式的分类,其中模式可以有不同的物理意义和表现形式。例如,文字识别或指纹识别。字符识别计算机视觉与相关研究领域——计算机视觉与模式识别模式识别(PatternRecognition):研究各类模式的分类,其中模式可以有不同的物理意义和表现形式。例如,文字识别或指纹识别。计算机视觉与相关研究领域——计算机视觉与模式识别图像模式的分类是计算机视觉中的一个重要问题模式识别中的许多方法可以应用于计算机视觉中在计算机视觉中模式识别技术经常用于对图象中的某些部分(例如分割区域)的识别和分类。模式识别(PatternRecognition):研究各类模式的分类,其中模式可以有不同的物理意义和表现形式。例如,文字识别或指纹识别。计算机视觉与相关研究领域——计算机视觉与人工智能人工智能(Artificialintelligence):主要研究智能系统的设计和有关智能的计算理论与方法AImaybeconsideredashavingthreestages:perception,cognitionandaction计算机视觉经常被视为AI的一个分支计算机视觉与相关研究领域——计算机视觉与心理物理学心理物理学(Psychophysics):主要研究人类自身视觉系统的有关机理与现象闪烁的蓝点在你移动视线时,图中的蓝点似乎在闪烁。但如果盯住一个点,这种发光便消失踪影。德国阿伦验光研究所在1994年发现的闪烁网格错觉现象“蓝宝石之光”怀特效应——1979年,塔斯马尼亚高级教育学院的迈克尔·怀特发现了一种错觉现象,彻底改变了视觉学的面貌。如图所示,左侧的灰条亮度超过右侧灰条。而实际上,所有灰条都是一样的。在怀特发现这种现象前,所有亮度错觉均被认为由拮抗过程所致,也就是说,灰色物体在被白色物体包围时看上去更为暗淡,被黑色物体包围时则显得更为明亮。但在这幅错觉图中,被白色包围的灰条亮度更高,被黑色包围时则更为暗淡。迄今为止,怀特效应背后的大脑机制仍旧是一个未知数。年度最佳错觉图结合了怀特效应(窗帘后面的花瓶似乎呈现出不同的颜色)和著名的面部-花瓶错觉(花瓶被换成获胜者的奖杯)构成。怀特效应---眼见未必为实视觉错位本身就是摄影的一种艺术和创作计算机视觉与相关研究领域——计算机视觉与心理物理学心理物理学(Psychophysics):主要研究人类自身视觉系统的有关机理与现象心理物理学的研究结果往往被用来作为建立计算机视觉模型的理论根据本节内容人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用计算机视觉的应用零件识别与定位产品检验移动机器人导航遥感图像分析医学图像分析安全、监控与跟踪国防系统其它(动画、体育、考古)空间探索Sojourner火星车前部图,中部的两个小突出是两个黑白CCD摄像机Sojourner视觉系统获取的立体图象对障碍物探测示意图Sojourner视觉系统对场景的深度恢复地球资源勘探军事应用目标跟踪军事应用隐形飞机、定位轰炸军事应用军事应用交通监控自动驾驶三维人脸重建计算机视觉的应用~lowe/vision.html…………………….小结人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用