机器视觉技术发展现状文献综述

joe220
2 ℃
2019-12-31

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第1页（共7页）机器视觉技术发展现状人类认识外界信息的80%来自于视觉，而机器视觉就是用机器代替人眼来做测量和判断，机器视觉的最终目标就是使计算机像人一样，通过视觉观察和理解世界，具有自主适应环境的能力。作为一个新兴学科，同时也是一个交叉学科，机器视觉是通过对相关的理论和技术进行研究，从而建立由图像或多维数据中获取“信息”的人工智能系统，其特点是可提高生产的柔性和自动化程度。目前机器视觉技术已经在很多工业制造领域得到了应用，并逐渐进入我们的日常生活。一、机器视觉简介机器视觉就是用机器代替人眼来做测量和判断。机器视觉主要利用计算机来模拟人的视觉功能，再现于人类视觉有关的某些智能行为，从客观事物的图像中提取信息进行处理，并加以理解，最终用于实际检测和控制。机器视觉是一项综合技术，其包括数字处理、机械工程技术、控制、光源照明技术、光学成像、传感器技术、模拟与数字视频技术、计算机软硬件技术和人机接口技术等，这些技术相互协调才能构成一个完整的工业机器视觉系统[1]。机器视觉强调实用性，要能适应工业现场恶劣的环境，并要有合理的性价比、通用的通讯接口、较高的容错能力和安全性、较强的通用性和可移植性。其更强调的是实时性，要求高速度和高精度，且具有非接触性、实时性、自动化和智能高等优点，有着广泛的应用前景[1]。一个典型的工业机器人视觉应用系统包括光源、光学成像系统、图像捕捉系统、图像采集与数字化模块、智能图像处理与决策模块以及控制执行模块。通过CCD或CMOS摄像机将被测目标转换为图像信号，然后通过A/D转换成数字信号传送给专用的图像处理系统，并根据像素分布、亮度和颜色等信息，将其转换成数字化信息。图像系统对这些信号进行各种运算来抽取目标的特征，如面积、数量、位置和长度等，进而根据判别的结果来控制现场的设备动作[1]。机器视觉一般都包括下面四个过程：第2页（共7页）二、机器视觉的发展历史机器视觉是在20世纪50年代从统计模式识别开始，当时的工作主要集中在二维图像分析、识别和理解上。从20世纪70年代才真正开始发展，并涌现出了主动视觉理论框架、基于感知特征群岛物体识别理论框架等新的概念、方法及理论。Marr视觉计算机理论是视觉研究迄今较为完善的理论，其使视觉研究有了一个较为明确的体系[2]。Marr视觉理论从计算视觉理论出发，将立体视觉分为自上而下的三个阶段，即早期的二维视觉数据获取、中期的要素处理和后期三维信息的形成和表达。经历这单个阶段即可完成二维到三维的转换工作.早期阶段的“要素图”（primarysketch）是由二维图像中的点、直线、曲线和纹理等特征组成，早期阶段的处理是从图像中获取这些特征。中期阶段的处理是处理特征要素的位置和相互关系，从而完成对物体的识别、运动分析和形状恢复等操作，该阶段处理的结果仅仅是对空间场景的二维半描述。如若要完成对空间场景的真正三维描述，还需第三阶段的后期视觉处理，将物体自身坐标统一到一个世界坐标系中[3]。图2Marr理论框架的三个阶段第3页（共7页）作为立体视觉的基础理论，Marr理论具有极其重要的指导作用，但Marr理论自身有缺陷，如单向性（视觉处理只能从前至后处理）、被动性（视觉处理只能是给什么图像处理什么图像）、目的单一性（视觉处理的目标一般只是恢复空间场景中的物体形状和位置）等。经过几十年的发展，许多学者纷纷提出了Marr理论的改进框架，如在框架前增加图像拾取模块，使其能根据分析要求和分析结果自主获取图像；增加反馈环节，使视觉处理结果能反向指导图像获取环节，前后互动；增加高层指导模块和视觉目的模块，使整个视觉处理按照视觉目的的要求，在高层指导模块的指导下完成不同的视觉处理操作，实现其功能多样化.总之，改进的Marr理论框架使立体视觉趋于自动化、智能化和多功能化[3]。三、机器视觉相关技术1、图像采集技术——机器视觉的基础图像采集部分一般由光源、镜头、数字摄像机和图像采集卡构成。采集过程可简单描述为在光源提供照明的条件下，数字摄像机拍摄目标物体并将其转化为图像信号，最后通过图像采集卡传输给图像处理部分。在设计图像采集部分时，要考虑到多方面的问题，主要是关于数字摄像机、图像采集卡和光源方面的问题。（1）光源照明照明是影响机器视觉系统输入的重要因素，其直接影响输入数据的质量和应用效果。到目前为止，还未有哪种机器视觉照明设备能通用各种应用，因此在实际应用中，需针对应用选择相应的照明设备以满足特定需求。在光源照明方案选择过程中，应尽可能地突出物体特征，在物体需要检测的部分与不重要部分之间尽量产生明显的区域，增加对比度，同时还应保证足够的整体亮度，而物体位置的变化不应影响成像的质量。照明系统按其照射方法可分为:背向照明、前向照明、结构光和频闪光照明等。其中，背向照明是指将被测物放在光源和摄像机之间，以提高图像的对比度。前向照明是光源和摄像机位于被测物的同侧，其优点是便于安装。结构光照明是将光栅或线光源等投射到被测物上，并根据其产生的畸变，解调出被测物的三维信息。频闪光照明是将高频率的光脉冲照射到物体上，摄像机拍摄要求与光源同步[1]。（2）光学摄像头第4页（共7页）光学摄像头的任务就是进行光学成像，一般在测量领域都又专门的用于测量的摄像镜头，因为其对成像质量有着关键性的作用。摄像头需要注意的一个问题是畸变。这个就需要使用相应的畸变校正方法，目前也开发出了很多自动畸变自动校正系统。（3）CCD摄像机及图像采集卡CCD(ChargeCoupledDevice)摄像机及图像采集卡共同完成对目标图像的采集与数字化。目前CCD，CMOS等固体器件的应用技术，线阵图型敏感器件，像元尺寸不断减小，阵列像元数量不断增加，像元电荷传输速率也得到大幅提高。在基于PC机的机器视觉系统中，图像采集卡是控制摄像机拍照来完成图像的采集与数字化，并协调整个系统的重要设备。图像采集卡直接决定了摄像头的接口为:黑白、彩色、模拟、数字等形式。2、图像处理与分析——机器视觉的核心用于机器视觉的图像处理与分析方法的核心是，解决目标的检测识别问题。为此，提出方法的思想中心是如何获得可正确描述目标物与非目标物的特征。当所需要识别的目标比较复杂时，就需要通过几个环节，从不同的侧面综合来实现。对目标进行识别提取的时候，首先是要考虑如何自动地将目标物从背景中分离出来。目标物提取的复杂性一般就在于目标物与非目标物的特征差异不是很大，在确定了目标提取方案后，就需要对目标特征进行增强。增强方法有颜色特征的增强、累计特征的增强等。经过特征增强后，最后就是目标物的提取了。这里也有很多不同的方法，比如伪目标删除方法、自适应阈值方法、逐步骤类方法、多信息融合方法等[4]。随着计算机技术、微电子技术以及大规模集成电路的发展，图像信息处理工作越来越多地借助硬件完成，如DSP芯片、专用的图像信号处理卡等。软件部分主要用来完成算法中并不成熟又较复杂或需不断完善改进的部分。这一方面提高了系统的实时性，同时又降低了系统的复杂度。四、机器视觉的发展现状及应用目前，最先进的机器视觉技术仍然由欧美、日本等国家掌握，发达国家针对工业现场的应用开发出了相应的机器视觉软硬件产品。中国目前正处于由劳动密集型向技术密集型转型的时期，对提高生成效率、降低人工成本的机器视觉方案第5页（共7页）有着旺盛的需求，中国正在成为机器视觉技术发展最为活跃的地区之一。长三角和珠三角成为国际电子和半导体技术的转移地，同时也就成为了机器视觉技术的聚集地。许多具有国际先进水平的机器视觉系统进入了中国，国内的机器视觉企业也在与国际机器视觉企业的良性竞争中不断茁壮成长，许多大学和研究所都在致力于机器视觉技术的研究。在国外，机器视觉主要应用在半导体及电子行业，其中，半导体行业占40%～50%。例如，PCB印刷电路、SMT表面贴装、电子生产加工设备等。此外机器视觉还在质量检测的各方面及其他领域均有着广泛应用。（1）在工业检测方面近几十年来，在工业检测中利用视觉系统的非接触、速度快、精度合适、现场抗干扰能力强等突出的优点，使机器视觉技术得到了广泛的应用，取得了巨大的经济与社会效益。自动视觉识别检测目前已经用于产品外形和表面缺陷检验，如木材加工检测、金属表面视觉检测、二极管基片检查、印刷电路板缺陷检查、焊缝缺陷自动识别等。这些检测识别系统属于二维机器视觉，技术已经较为成熟，其基本流程是用一个摄像机获取图像，对所获取的图像进行处理及模式识别，检测出所需的内容[5]。（2）在医学上的应用在医学领域，机器视觉主要用于医学辅助诊断。首先采集核磁共振、超声波、激光、Ｘ射线、γ射线等对人体检查记录的图像，再利用数字图像处理技术、信息融合技术对这些医学图像进行分析、描述和识别，最后得出相关信息，对辅助医生诊断人体病源大小、形状和异常，并进行有效治疗发挥了重要的作用。不同医学影像设备得到的是不同特性的生物组织图像，如Ｘ射线反映的是骨骼组织，核磁共振影像反映的是有机组织图像，而医生往往需要考虑骨骼有机组织的关系，因而需要利用数字图像处理技术将两种图像适当地叠加起来，以便于医学分析[5]。（3）交通监控领域中的应用智能交通监控领域中，在重要的十字路口安放摄像头，就可以利用摄像头的快速拍照功能，实现对违章、逆行等车牌的车牌进行自动识别、存贮，以便相关第6页（共7页）的工作人员进行查看。（4）在桥梁检测领域中的应用人工检测法和桥检车法都是依靠人工用肉眼对桥梁表面进行检测，其速度慢，效率低，漏检率高，实时性差，影响交通，存在安全隐患，很难大幅应用；无损检测包括激光检测、超声波检测以及声发射检测等多种检测技术，它们仪器昂贵，测量范围小，不能满足日益发展的桥梁检测要求；智能化检测有基于导电性材料的混凝土裂缝分布式自动检测系统和智能混凝土技术，也有最前沿的基于机器视觉的检测方法。导电性材料技术虽然使用方便，设备简单，成本低廉，但是均需要事先在混凝土结构上涂刷或者埋设导电性材料进行检测，而且智能混凝土技术还无法确定裂缝位置、裂缝宽度等一系列问题距实用化还有较长的距离；而基于机器视觉的检测方法是利用CCD相机获取桥梁表观图片，然后运用计算机处理后自动识别出裂缝图像，并从背景中分离出来然后进行裂缝参数的计算的方法，它具有便捷、直观、精确、非接触、再现性好、适应性强、灵活性高、成本低廉的优点，能解放劳动力，排除人为干扰，具有很好的应用前景[6]。据统计，混凝土桥梁的损坏有90%以上都是由裂缝引起的，因此对桥梁的健康检测主要是对桥梁表观的裂缝进行检测与测量。基于机器视觉的桥梁检测技术主要包括三部分内容：桥梁表观图像的获取技术、基于图像的裂缝自动识别理论与算法以及基于图像的裂缝宽度等病害程度定量化测量方法。基于机器视觉的自动化、智能化检测技术已经在道路、隧道上得到了成功应用，在桥梁上也得到了初步的应用，但主要集中在视线开阔的高空混凝土构件表观图像获取技术上，在病害的自动识别方面仍停留在理论研究阶段，还无法应用于实际工程当中。针对量大面广的混凝土梁体，智能化视频桥梁检测车进入理论与关键部件模型的研制阶段，但是受到桥梁细小裂缝自动识别与清晰图像快速化获取难度大的限制，目前离达到实用化程度的要求还相距甚远[6]。五、机器视觉技术发展遇到的问题对于人类来说，识别和理解周围场景是一件非常容易的事，但对于机器人来说，却是一件很困难的事。主要困难有一下几个方面：（1）稳定性问题现实中的环境因素是多变的，场景中的诸多因素，包括照明、物体形状、表第7页（共7页）面颜色、摄像机以及空间关系变化都会对生成的图像有影响。比如用于智能交通检测的设备，如何保证其在恶劣天气下依旧保持较高的稳定性就是一个很难解决的问题。（2）构造出性能良好的识别算法图像处理与分析技术是机器视觉的核心，所以构造出一个良好的、适应相关领域应用的识别算法显得尤为重要。而且现在的应用领域越来越要求检测设备具有准确、高速地识别出目标的能力，如果我们不能构造出一个更好的识别算法，就不能适应不断增长的需求。（3）数据量大机器视觉所获取的数据量非常非常大的。比如用于手机上的人脸识别功能，识别一次要投射多大几万个红外线点