计算机视觉绪论

hahahehe2
1 ℃
2020-07-01

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

计算机视觉概论ComputerVision东北大学秦皇岛分校自动化系(谢妤婵博士实验楼412）计算机视觉发展简史计算机视觉研究内容计算机视觉应用状况计算机视觉发展讨论计算机视觉相关学科计算机视觉研究进展计算机视觉面临困难计算机视觉发展简史计算机视觉研究内容计算机视觉应用状况计算机视觉发展讨论计算机视觉相关学科计算机视觉研究进展计算机视觉面临困难人类通过视觉感知外界信息。俗话说“百闻不如一见”，就是说视觉感知环境信息的效率很高。人类感知外界信息，80%以上是通过视觉得到的，让计算机或机器人具有视觉，是人类多年以来的梦想。虽然，目前我们还不能让计算机也具有像生物那样高效、灵活的视觉，但这种希望正在逐步实现。人类是通过眼睛与大脑来获取、处理与理解视觉信息的。周围环境中的物体在可见光的照射下，在人眼的视网膜上形成图像，由感光细胞转换成神经脉冲信号，经神经纤维传入大脑皮层进行处理与理解。视觉，不仅指对光信号的感受，它包括了对视觉信息的获取、传输、处理、存储与理解的全过程。人们试图用摄像机获取环境图像并将其转换成数字信号，用计算机实现对视觉信息处理的全过程，这样，就形成了一门新兴的学科——计算机视觉。计算机视觉的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。这种能力将不仅使机器能感知三维环境中物体的几何信息，包括它的形状、位置、姿态、运动等，而且能对它们进行描述、存储、识别与理解。计算机视觉的发展得益于神经生理学、心理学与认知科学对动物视觉系统的研究，但计算机视觉已发展起一套独立的计算理论与算法，它并不刻意去“仿真”生物视觉系统。视觉信息处理概略图形工程物体建摸、造型真实感图形显示动画制作场景模拟图形用户界面图形生成图象工程图象处理、效果增强图象查询、分类机器视觉三维重构模型生成视觉信息处理=图象工程+图形工程自然场景数字化场景图形工程图象分割特征抽取模型重构图形显示图象量化图象工程几何模型数字图象计算机视觉研究从20世纪50年代末开始，计算机开始被作为实现人类智能和人类感知的工具，借助计算机人类第一次可以象借助机械实现对体力的延伸一样实现对脑力和感知能力的延伸。对人类视觉感知能力的计算机模拟导致计算机视觉的产生。具体地讲，计算机视觉要达到的基本目的有3个：根据一幅或多幅二维图像计算出观测点到目标物体的距离；根据一幅或多幅二维图像计算出观测点到目标物体的运动参数；根据一幅或多幅二维图像计算出观测点到目标物体的表面物理特性。计算机视觉要达到的最终目的可简单描述为：实现对于三维景物世界的理解，即实现人的视觉系统的某些功能；或者从形式上讲，利用二维投影图像来重构三维物体的可视部分。计算机视觉发展简史20世纪50年代：用统计模式识别，集中在二维图像的分析和识别上如：光学字符识别、工件表面、显微图片和航空图片的分析和解释等。20世纪60年代：Roberts(1965)通过计算机程序从数字图像中提取出诸如立方体、稧状体、棱柱体等多面体的三维结构，并对物体形状及物体的空间关系进行描述。Roberts的研究开创了以理解三维场景为目的的计算机视觉的研究。Roberts对积木世界的创造性研究给人们以极大的启发，许多人相信：一旦由白色积木玩具组成的三维世界可以被理解，则可以推广到理解更复杂的三维场景。对积木世界的研究范围从边缘、角点等特征提取，到线条、平面、曲面等几何要素分析，一直到图像明暗、纹理、运动以及成象几何等，并建立了各种数据结构和推理规则。20世纪70年代，出现了一些视觉应用系统。计算机视觉发展简史70年代中期，麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”(MachineVision)课程。同时，MITAI实验室吸引了国际上许多知名学者参与机器视觉的理论、算法、系统设计的开放而轻松的研究。DavidMarr教授于1973年应邀在MITAI实验室领导一个博士生为主体的研究小组，1977年提出了不同于“积木世界”分析方法的计算机视觉(ComputerVision)理论，该理论在80年代成为机器视觉研究领域中的一个十分重要的理论框架(Marr1982)—视觉计算理论。从一份刊物的名称变化可以看到计算机视觉的学科进展：1972，CGIP(计算机图形学与图像处理)创刊；1983年，改名为CVGIP(计算机视觉、图形学与图像处理)；1991年，分成两个版本，分别称CVGIP-GMIP(图形模型与图像处理)和CVGIP-IU(图像理解)；1995年，转成两个期刊，前者命名为GMIP(图形模型与图像处理)，后者命名为CVIU(计算机视觉与图像理解)。计算机视觉发展简史对计算机视觉的全球性研究热潮是从20世纪80年代开始的，到了80年代中期，计算机视觉获得了蓬勃发展，新概念、新方法、新理论不断涌现。到目前为止，计算机视觉仍然是一个非常活跃的研究领域。许多会议论文集和许多学术期刊都反映了该领域的最新进展。比如：InternationalConferenceonComputerVisionandPatternRecognition,CVPR；InternationalConferenceonComputerVision,ICPR；InternationalConferenceonRoboticsandAutomation,ICRA；WorkshoponComputerVision,WCV；其它许多IEEE和SPIE等的会议。IEEETransactiononPatternAnalysisandMachineIntelligence(PAMI);ComputerVision,Graphics,andImageProcessing(CVGIP);IEEETransactiononImageProcessing;IEEETransactiononSystem,Man,andCybernetics(SMC);MachineVisionandApplication;InternationalJournalonComputerVision(IJCV);ImageandVisionComputing;PatternRecognition；ComputerVisionandImageUnderstanding。计算机视觉发展简史计算机视觉研究内容计算机视觉应用状况计算机视觉发展讨论计算机视觉相关学科计算机视觉研究进展计算机视觉面临困难计算机视觉研究进展•从60年代初至今，计算机视觉已经经历了近50年的研究，取得了一系列的研究成果，这使得这一领域在过去的40多年中成为AI研究中最为活跃的一部分。•其主流研究分成三大阶段：阶段1：以模型世界为主要对象的视觉基本方法研究；阶段2：以计算理论为核心的视觉模型研究；阶段3：以应用为目标的计算机视觉方法。以模型世界为主要对象的视觉方法这个阶段以Roberts的开创性工作为标志—三维重建1965年，Roberts(Machineperceptionofthree-dimensionalsolids,1965)通过计算机程序从数字图像中提取诸如立方体、稧状体、棱柱体等多面体的三维结构，并对物体形状及物体的空间关系进行描述。在Roberts的工作中引入了三维物体与二维成像的关系，采用了一些简单的边缘特征提取方法并引入了组合线段的方法。随后，人们对积木世界进行了深入的研究，研究范围从边缘、角点等特征提取，到线条、平面、曲面等几何要素分析，到图像明暗、纹理、运动以及成象几何等，并建立了各种数据结构和推理规则。Guzman(Computerrecognitionofthreedimensionalobjectsinavisualscene,1968)首先引入符合处理和启发式方法；Huffman(Impossibleobjectsasnonsensesentences,1971)、Clowes(OnSeeingThing,1971)和Waltz(Generatingsemanticdescriptionfromdrawingofsceneswithshadows,1972)等对积木世界进行研究并分别解决了由线段解释景物和处理阴影等问题。积木世界的研究反映了视觉早期研究中的一些特点，即从简化的世界出发开始研究。这些工作对视觉的发展起了促进作用，但对于稍微复杂的景物便难以奏效。主要原因在于：这一时期的工作虽然建立在三维空间关系分析的基础上，但对三维关系的分析仅仅是依靠简单的边缘线段等简单约束关系，并没有充分考虑人类或其它动物视觉系统感知三维空间关系的方式。以模型世界为主要对象的视觉方法以计算理论为核心的视觉模型20世纪70年代开始，对计算机视觉的研究进入更为理性化的阶段主要出发点是：从生理学、光学和射影几何的方法出发，研究成像及其逆问题。主要集中在各种本征特性的恢复，包括三维形状、运动、光源等的恢复。在这一阶段中，以Marr为代表的一些研究者提出了以表示为核心、以算法为中间转换过程的一般性视觉处理模型。在其理论中，强调表示的重要性，并要从不同层次上去研究信息处理问题，在计算理论和算法实现上，特别强调计算机理论的重要性。在三维信息的感知方面，根据人类感知深度的不同视知觉线索提出了一系列从X恢复形状(这里X是指不同的线索)的方法。以计算理论为核心的视觉模型•在这个阶段，有代表性的工作包括：–对视知觉现象中侧抑制现象的模拟。主要是通过采用不同尺度的LoG算子实现对不同尺度边缘信息的感知。–对双眼深度线索的分析导致对立体视觉的研究。–对单眼深度线索的分析导致了从X恢复形状的技术的出现(这里X包括阴影、纹理、遮挡、聚焦、线条透视等)。–对运动物体成像过程的研究导致光流计算以及从运动恢复结构等技术的出现。以应用为目标的计算机视觉方法进入20世纪90年代之后，随着关于人工智能研究的反思，在计算机视觉的研究方面也开始考虑过去的方法是否正确，理论是否有实际的意义，这一方向的研究是否具有明确的目标等一系列问题。从单纯的理论框架研究转入结合躯干运动、结合各种应用的研究。在以往的研究中生物视觉的一些重要特性没有得到足够的重视，如主动性、视觉系统中的高分辨率中央凹与外围视觉的结合等。因此，在80年代末、90年代初先后提出了主动视觉、定性视觉等新方法、新思路，标志着视觉发展到了新的阶段。利用主动视觉方法使得一些本来复杂的计算机可以得到化简，一些病态问题可以转化为良态问题，从而得到圆满的解决。基于内容的图像和视频检索(Content-BasedImageandVideoRetrieval,CBIVR)等视觉信息处理系统的研究既是对计算机视觉的应用继承，也对计算机视觉的研究和应用产生了影响。计算机视觉发展简史计算机视觉研究内容计算机视觉应用状况计算机视觉发展讨论计算机视觉相关学科计算机视觉研究进展计算机视觉面临困难计算机视觉应用状况工业视觉：通过外形照片来进行外形检验及位置检验；通过X射线或超声探测获取物体内部的图像实现表面缺陷检验、内部无损探伤等；通过摄像机和相关的视觉信息处理系统，根据不同的物体选择不同颜色或性质的传输带，实现将物体从传输带上的分离并进行识别和定位，引导机器人进行抓取和操作。如工业检测、自动生产流水线、邮政自动化、计算机辅助外科手术、显微医学操作以及危险场合工作的机器人等。用于生产线上具有简单视觉系统的工业机器人系统计算机视觉应用状况人机交互：让计算机可借助于人的手势动作(手语)、嘴唇动作(唇读)、躯体运动(步态)、表情测定等了解人的愿望要求而执行指令，这既符合人类的交互习惯，也可增加交互方便性和临场感等。如人脸识别、智能代理等。人头部跟踪视觉导航：利用两个或以上摄像机同步获取的一组图像来恢复三维场景信息，并用三维场景信息来识别目标、判别道路、确定障碍物等，实现道路的规划、自主导航、与周围环境自主交互作用；计算机视觉应用状况由移动机器人立体视觉系统获取的立体图像对，可用来重建场景三维信息视