人工神经网络在图像处理中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

人工神经网络在图像处理中的应用王国雷(山东大学控制科学与工程学院生物医学工程2008级)摘要:图像处理可以看作一大类图像技术,着重强调在图像之间的变换,图像处理是包含丰富内容和具有广阔应用领域的研究学科。近几年来,作为具有自组织、自学习和联想功能的人工神经网络理论已成功地应用于图像处理的许多方面,如图像压缩、图像分割、边缘检测、图像增强、图像识别等。概括得说,神经网络应用于图像处理的主要思路是:把原始图像或经过适当预处理的图像作为网络的输入信号,在网络的输出端得到处理后的图像信号或分类结果。关键词:图像处理,人工神经网络,图像压缩、图像分割、边缘检测、图像增强、图像识别。TheApplicationOfArtificialNeuralNetworkInTheAreaOfImageProcessingWangGuolei(BiomedicalEngineering,2008Grade,CollegeofControlScienceandEngineering,ShandongUniversity)Abstract:Imageprocessingcanbeseenasalargeclassofimagingtechnology,emphasizingonthetransformationbetweentheimages,imageprocessingisasubjectwithrichcontentandbroadapplicationareas.Inrecentyears,asaself-organizing,self-studyandassociatefunctionartificialneuralnetworktheoryhasbeensuccessfullyappliedtomanyaspectsofimageprocessingsuchasimagecompression,imagesegmentation,edgedetection,imageenhancement,imagerecognitionandsoon.Ingeneral,themainideaofneuralnetworkapplicationinimageprocessingisasbelow:puttheoriginalimageoranappropriatepre-processingimageastheinputsignalofnetwork,thenetworkoutputistheresult:processedimagesignalorclassificationresults.Keywords:Imageprocessing,artificialneuralnetwork,imagecompression,imagesegmentation,edgedetection,imageenhancement,imagerecognition.1.引言图像是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼进而产生视觉的实体。图像技术在广义上是各种与图像有关的技术的总称。包括利用计算机和其他电子设备进行和完成的一系列工作。例如图像的采集、获取、编码、存储和传输,图像的合成和产生,图像水印的嵌入和输出,图像的变换、增强、恢复和重建,图像的分割,目标的检测、跟踪、表达和描述,目标特征的提取和测量。因此,为了对各种图像技术进行综合研究、集成应用、有必要建立一个整体框架——图像工程。图像工程根据抽象程度和研究方法等的不同可分为3个层次:图像处理、图像分析和图像理解。随着科学技术,特别是信息技术的发展,图像处理技术已经成为科学研究不可缺少的强有力工具,传统的图像处理方法已经无法满足需要,研究人员开始探索新的更有效的方法,其中利用神经网络进行图像处理是最活跃的方向.神经网络算法比起传统的算法表现出了很大的优越性,这主要表现在:(1)高度并行处理能力,处理的速度远远高于传统的序列处理算法;(2)具有自适应功能,能够根据学习提供的数据样本找出和输出数据的内在联系;(3)非线性映射功能,图像处理很多问题是非线性问题,神经网络为处理这些问题提供了有用的工具;(4)具有泛化功能,能够处理带有噪声的或不完全的数据。最初,人工神经网络是作为模式识别分类器和聚类技术在图像处理领域中得到应用的。然后随着神经网络理论的进一步研究,神经网络的特点得到人们充分的认识,在图像处理的各个领域得到了充分的应用,如印刷体和手写字符识别、语音识别、指纹、人脸识别、图像压缩复原等。2.图像处理的知识2.1图像处理的定义图像处理可以看作一大类图像技术,着重强调在图像之间的变换。狭义的图像处理技术的主要目标是要对图像进行各种加工以改善图像的视觉效果并为其后的目标自动识别打基础,或对图像进行压缩编码以减少图像存储所需的空间或图像传输所需的时间。图像处理(imageprocessing),是用计算机对图像进行分析,以达到所需结果的技术,又称影像处理,一般指数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。2.2图像压缩,增强和复原,图像匹配、描述和识别图像压缩是由数字化得到的一幅图像的数据量十分巨大,一幅典型的数字图像通常由500×500或1000×1000个像素组成。如果是动态图像,是其数据量更大。因此图像压缩对于图像的存储和传输都十分必要。主要有两类压缩算法,即不失真的方法和近似的方法。最常用的不失真压缩取空间或时间上相邻像素值的差,再进行编码。近似压缩算法大都采用图像交换的途径,例如对图像进行快速傅里叶变换或离散的余弦变换。著名的、已作为图像压缩国际标准的JPEG和MPEG均属于近似压缩算法。前者用于静态图像,后者用于动态图像。它们已由芯片实现。图像增强的目标是改进图片的质量,例如增加对比度,去掉模糊和噪声,修正几何畸变等;图像复原是在假定已知模糊或噪声的模型时,试图估计原图像的一种技术。图像增强按所用方法可分成频率域法和空间域法。前者把图像看成一种二维信号,对其进行基于二维傅里叶变换的信号增强。采用低通滤波(即只让低频信号通过)法,可去掉图中的噪声;采用高通滤波法,则可增强边缘等高频信号,使模糊的图片变得清晰。具有代表性的空间域算法有局部求平均值法和中值滤波(取局部邻域中的中间像素值)法等,它们可用于去除或减弱噪声。早期的数字图像复原亦来自频率域的概念。现代采取的是一种代数的方法,即通过解一个大的方程组来复原理想的图片。图像匹配、描述和识别对图像进行比较和配准,通过分制提取图像的特征及相互关系,得到图像符号化的描述,再把它同模型比较,以确定其分类。图像匹配试图建立两张图片之间的几何对应关系,度量其类似或不同的程度。匹配用于图片之间或图片与地图之间的配准,例如检测不同时间所拍图片之间景物的变化,找出运动物体的轨迹。3.人工神经网络3.1人工神经网络的定义和原理。人工神经网络是运用生物神经网络的机理,即通过大量相对简单的非线性神经元之间复杂而又灵活的联接来模仿人脑的智能化信息处理过程。人工神经网络并没有完全地真正反映大脑的功能,它只是对生物神经网络进行某种抽象、简化和模拟。采用大量简单的处理单元即神经元并行连接而构成一种复杂的信息处理系统,整个系统通常是高度非线性的。并且这种系统是可以训练的,即可以随着经验的积累而改善自身的性能。同时由于高度的并行性,它们能够进行快速判决并具有容错性。利用神经元构造的各种人工神经网络,用来模拟生物神经网络实现各种信息的处理。神经网络目前在图像处理技术,语音识别,字符识别,图案识别和分类,信号过程,过程控制和优化等领域得到许多应用。其中,数字图像处理是神经网络目前较新的和最重要的应用领域。尽管对生物神经网络的研究因为手段的限制显得非常有限,但目前已经应用这种人工神经网模型取得了很大的成功。例如:常见的传统神经网络有:BP、Hopfield、Kohonen等。还有些特殊的神经网络模型如:细胞神经网络、协同神经网络、模糊神经网络等,还有上世纪90年代开始正在研究的PCNN脉冲耦合神经网络。3.2BP网络BP(BackPropagation)神经网络是一种采用误差反向传播算法的多层前馈网络。典型的BP网络是一个三层前馈的阶层网络,即:输入层、隐含层(也称中间层)、输出层。相邻层之间的各神经元实现全连接,而且每层各神经元之间无连接。它以一种有教师示教的方式进行学习。随着“模式顺传播”和“误差逆传播”过程的交替反复进行。网络的实际输出逐渐向各自所对应的期望输出逼近,网络对输入模式的响应的正确率也不断上升。通过此学习过程,确定各层间的连接权值之后,就可以对图像进行相应的处理了。由于BP网及误差逆传播算法具有中间隐含层并有相应的学习规则可寻,使得它能够逼近任意的非线性映射关系,而且有很好的泛化能力。特别是其数学意义明确、步骤分明的学习算法,更使其具有广泛的应用前景。BP网络所擅长的是处理那种规律隐含在一大堆数据中的映像逼近问题,特别是处理那种通过学习自适应可调的是实时性问题,像图像分割、模式识别、自适应模糊控制等。在图像处理领域中,作为一种非自适应的神经网络技术应用非常广泛。但BP网并不是十分的完善,它存在以下一些主要缺陷:学习收敛速度太慢、网络的学习记忆具有不稳定性,容易陷入局部极小点。3.3Hopfield网络Hopfield网络是由JohnHopfield在1982年提出来的。这是一个具有自反馈的动态网络。每个单元只能有两种输出:−1(表示抑制)或+1(表示兴奋)。但每个单元具有多个输入,每个连接均被指派一个特定的强度。在每个时刻单元把来自它的全部连接的效果总和起来。每个输入对单元的影响是将当前的输入信号(−1或+1)与其相对应的权重相乘而得到的,如果这个总和大于0则置输出状态为+1(平均而言,当单元兴奋性输人大于抑制性输入时,则输出为正),否则就输出-1。这意味着一个单元的输出会因为来自其它单元的输人发生变化而产生变化。计算将被一遍遍地反复进行,直到所有单元的输出都稳定为止。所有单元的状态并不是同时改变的,而是按随机次序一个接一个进行的。Hopfield从理论上证明了,给定一组权重(连接强度)以及任何输入,网络将不会无限制地处于漫游状态,也不会进入振荡,而是迅速达到一个稳态。Hopfield网络中使用所谓的“赫布规则”来调节神经元之间的连接权重,即如果两个单元具有相同的输出,则它们之间的相互连接权重都设为+1。如果它们具有相反的输出,则两个权重均设为-1。大致地说,每个单元激励它的朋友并试图削弱它的敌人。Hopfield神经网络主要用于联想记忆和优化计算。如果我们能把某个待研究解决的问题化成一个Hopfield计算能量函数,且使这个计算能量函数的最小极值正好对应于一定约束条件下的问题解答时,那么这个问题就可以利用Hopfield网络来求解了。Hopfield网络在图像边缘检测、图像模式匹配和识别等图像处理方面应用比较多。3.4Kohonen自组织特征映射网络(SelforganizingFeatureMap,SOFM)除了前面介绍的BP网络等有监督的人工神经网络外,还有一种无监督的Kohonen网络,它是一种无监督自学习的、自组织的人工神经网络。竞争型神经网络是基于人的视网膜及大脑皮层对剌激的反应而引出的。神经生物学的研究结果表明:生物视网膜中,有许多特定的细胞,对特定的图形(输入模式)比较敏感,并使得大脑皮层中的特定细胞产生大的兴奋,而其相邻的神经细胞的兴奋程度被抑制。对于某一个输入模式,通过竞争在输出层中只激活一个相应的输出神经元。许多输入模式,在输出层中将激活许多个神经元,从而形成一个反映输入数据的“特征图形”。竞争型神经网络是一种以无教师方式进行网络训练的网络。这种网络的学习目的是从一组数据中提取有意思的特征或某种内在的规律性(分布特征或按某种目的聚类)。它通过

1 / 13
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功