计算机视觉概况孟春婵测试计量技术及仪器一、定义计算机视觉是用计算机来模拟人的视觉机理获取和处理信息的能力。计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。计算机视觉要达到的基本目的至少有三个:1.根据一幅或多幅二维投影图象计算出观察点到目标物体的距离;2.根据一幅或多幅二维投影图象计算出目标物体的运动参数;3.根据一幅或多幅二维投影图象计算出目标物体的表面物理特性;要达到的最终目的是实现对于三维景物世界的理解,即实现人的视觉系统的某些功能。计算机视觉研究的本质问题——利用二维投影图象来重构三维物体的可视部分。计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。二、计算机视觉的研究方法与内容1、交叉学科涉及几何(射影几何、空间解析几何)、线性代数、概率、随机过程、优化方法、信息论、生理学、心理学、光学、热力学等2、主要方法从简化世界出发(早期的主要手段)恢复精确三维形状3、研究内容立体视觉、运动视觉、ShapefromX、高层表示与推理、视觉学习、主动视觉三、视觉系统计算机视觉系统的结构形式很大程度上依赖于其具体应用方向。有些是独立工作的,用于解决具体的测量或检测问题;也有些作为某个大型复杂系统的组成部分出现,比如和机械控制系统,数据库系统,人机接口设备协同工作。计算机视觉系统的具体实现方法同时也由其功能决定——是预先固定的抑或是在运行过程中自动学习调整。尽管如此,有些功能却几乎是每个计算机系统都需要具备的:1、图像获取一幅数字图像是由一个或多个图像感知器产生,这里的感知器可以是各种光敏摄像机,包括遥感设备,X射线断层摄影仪,雷达,超声波接收器等。去绝不与同的感知器,产生的图片可以是普通的二维图像,三维图组或者一个图像序列。图片的像素值往往对应于光在一个或多个光谱段上的强度(灰度图或彩色图),但也可以是相关的各种物理数据,如声波,电磁波或核磁共振的深度,吸收度或反射度。2、预处理在对图像实施具体的计算机视觉方法来提取某种特定的信息前,一种或一些预处理往往被采用来使图像满足后继方法的要求。例如:二次取样保证图像坐标的正确;平滑去噪来滤除感知器引入的设备噪声;提高对比度来保证实现相关信息可以被检测到;调整尺度空间使图像结构适合局部应用。3、特征提取从图像中提取各种复杂度的特征。例如:线、边缘提取;局部化的特征点检测如边角检测,斑点检测;更复杂的特征可能与图像中的纹理形状或运动有关。4、检测分割在图像处理过程中,有时会需要对图像进行分割来提取有价值的用于后继处理的部分,例如:筛选特征点;分割一或多幅图片中含有特定目标的部分。5、高级处理到了这一步,数据往往具有很小的数量,例如图像中经先前处理被认为含有目标物体的部分。这时的处理包括:验证得到的数据是否符合前提要求;估测特定系数,比如目标的姿态,体积;对目标进行分类。四、主要研究的问题比如简单几何图形识别,人脸识别,印刷或手写文件识别或者车辆识别。1、识别一个计算机视觉,图像处理和机器视觉所共有的经典问题便是判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。2、运动基于序列图像的对物体运动的监测包含多种类型,诸如:自体运动:监测摄像机的三维刚性运动。图像跟踪:跟踪运动的物体。3、场景重建给定一个场景的二或多幅图像或者一段录像,场景重建寻求为该场景建立一个计算机模型/三维模型。最简单的情况便是生成一组三维空间中的点。更复杂的情况下会建立起完整的三维表面模型。4、图像恢复图像恢复的目标在于移除图像中的噪声,例如仪器噪声,模糊等。五、视觉系统研究的三个层次计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。1、计算理论层次信息处理的计算理论,研究的是对什么信息进行计算和为什么要进行这些计算。2、表达与算法层次研究的是如何进行所要求的计算,也就是要设计特定的算法,能把某种实体或某几类信息表达清楚的形式化系统。3、硬件实现层次研究完成某一特定算法的计算机构。六、视觉信息处理的三个阶段按视觉信息的表示,可将视觉信息处理分为三个阶段:1、初始简图检测亮度的变化,表示并分析局部的几何结构,以及检测光源、强光部和透明度等照明效应等,这一步得到的表示称为初始简图。未处理的初始简图:边缘、线、点等,基元图完全的初始简图:对原始的基元进行选择、聚合和概括等过程来构成更大、更为抽象的标记。2、2.5维简图建立包括表面朝向,观察者的距离,以及朝向和距离的不连续性,表面的反射情况,以及对主要照明情况的某种粗略的描述。初始简图和2.5维简图都是在以观察者为中心的坐标系中构成的。3、三维模型被观察形状的三维结构组织在以物体为中心的坐标系中表示,以及在这种坐标系下对物体表面性质的一些描述七、相关学科有不少学科的研究目标与计算机视觉相近或与此有关。这些学科中包括图象处理、模式识别或图象识别、景物分析、图象理解等。由于历史发展或领域本身的特点这些学科互有差别,但又有某种程度的相互重迭。1、图象处理图象处理技术把输入图象转换成具有所希望特性的另一幅图象。例如,可通过处理使输出图象有较高的信-噪比,或通过增强处理突出图象的细节,以便于操作员的检验。在计算机视觉研究中经常利用图象处理技术进行预处理和特征抽取。2、模式识别模式识别技术根据从图象抽取的统计特性或结构信息,把图象分成予定的类别。例如,文字识别或指纹识别。在计算机视觉中模式识别技术经常用于对图象中的某些部分,例如分割区域的识别和分类。3、图象理解给定一幅图象,图象理解程序不仅描述图象本身,而且描述和解释图象所代表的景物,以便对图象代表的内容作出决定。在人工智能视觉研究的初期经常使用景物分析这个术语,以强调二维图象与三维景物之间的区别。图象理解除了需要复杂的图象处理以外还需要具有关于景物成象的物理规律的知识以及与景物内容有关的知识。在建立计算机视觉系统时需要用到上述学科中的有关技术,但计算机视觉研究的内容要比这些学科更为广泛。计算机视觉的研究与人类视觉的研究密切相关。为实现建立与人的视觉系统相类似的通用计算机视觉系统的目标需要建立人类视觉的计算机理论。异同点:计算机视觉的研究对象主要是映射到单幅或多幅图像上的三维场景,例如三维场景的重建。计算机视觉的研究很大程度上针对图像的内容。图象处理与图像分析的研究对象主要是二维图像,实现图像的转化,尤其针对像素级的操作,例如提高图像对比度,边缘提取,去噪声和几何变换如图像旋转。这一特征表明无论是图像处理还是图像分析其研究内容都和图像的具体内容无关。机器视觉主要是指工业领域的视觉研究,例如自主机器人的视觉,用于检测和测量的视觉。这表明在这一领域通过软件硬件,图像感知与控制理论往往与图像处理得到紧密结合来实现高效的机器人控制或各种实时操作。模式识别使用各种方法从信号中提取信息,主要运用统计学的理论。此领域的一个主要方向便是从图像数据中提取信息。八、用途智能计算机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人,就可以使这些自动化系统和智能机器人具有适应环境,和自主作出决策的能力。这就可以在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务。计算机视觉的一个重要应用领域就是自主车辆的视觉导航,目前还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,目前人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。九、需要注意的问题光源布局影响大需审慎考量。正确的选择镜组,考量倍率、空间、尺寸、失真。选择合适的摄影机(CCD),考量功能、规格、稳定性、耐用。视觉软件开发需靠经验累积,多尝试、思考问题的解决途径。以创造精度的不断提升,缩短处理时间为最终目标。