模式识别理论的研究与应用摘要:通过对模式识别系统的简要评述,对近年来几种基本的模式识别方法进行了总结,并对模式识别在字符识别方面的应用原理作了介绍。字符识别技术属于模式识别的范畴,本文首先介绍模式识别的基本理论和基本方法,然后阐述了模式识别技术在光学识别技术上的应用,并将其应用到角铁字符识别系统上。实践证明,采用模式识别!能减轻人工操作的复杂性和失误。关键字:字符识别;模式识别;凹凸字符;OCR(光学字符识别);特征抽取ResearchandApplicationofPatternRecognitionTheoryAbstract:Inthispapercomponentsofpatternrecognitionsystemwereintroduced.Severalbasicpatternrecognitionmethodswhichwerefrequentlyutilizedaresummedup.FinallyChinesecharacterrecognitionwhichisaapplicationofpatternrecognitionwereintroduced.Characterrecognitiontechnologybelongstothecategoryofpatternrecognition,thispaperfirstintroducethebasictheoryandbasicmethodsofpatternrecognition,andthenexpoundstheapplicationofpatternrecognitiontechnologyinopticalrecognitiontechnology!AndapplyittotheAngleironcharacterrecognitionsystem.Practicehasprovedthatusingpatternrecognition!Toreducethecomplexityofmanualoperationandfailure.KeyWord:CharacterRecognition;PatternRecognition;ProtuberantCharacters;OpticalCharacterRecognition;FeatureExtraction引言字符识别是模式识别领域的一项传统课题,其中汽车车牌及手写字体、印刷字体等的识别研究己经取得了很大的进展并且得到了广泛应用,但是对于“无色差字符”(即字符与背景的材质相同)图像的研究远不如前者多,在研究成果和应用上也就相应产生了差距。这主要是由于这种“无色差字符”是靠凸、凹字模对压形成突出或者凹进表面的字体,在光学成像时,字符的轮廓是靠其表面不同强度的反射光,而不是靠材质对光线的不同吸收程度而形成的,比较有代表性的就是角铁、轮胎、标牌等。但是提高这种“无色差字符”的识别率,在诸多行业中,例如冶金、建材等均具有重要意义。对于车牌等字符识别的研究也均有极大的参考价值。1模式识别技术的基本理论模式识别是信号处理与人工智能的一个重要分支。人工智能是专门研究用机器人模拟人的动作、感觉和思维过程与规律的一门科学,而模式识别则是利用计算机专门对物理量及其变化过程进行描述与分类,通常用来对图像、文字、相片以及声音等信息进行处理、分类和识别。它诞生于20世纪,20年代,随着40年代计算机的出现,50年代人工智能的兴起,模式识别在60年代初迅速发展为一门科学。它所研究的理论和方法在很多科学和技术领域中得到了广泛的重视与应用,推动了人工智能系统的发展,扩大了计算机应用的可能性。我们在生活中时时刻刻都在进行模式识别,如识物辨声辨味等行为均属于模式识别的范畴。模式识别技术在社会生活和科学研究的许多方面有着巨大的现实意义,己经在许多领域得到了广泛应用。随着计算机技术和人工智能、思维科学研究的迅速发展,模式识别技术正在向更高、更深的层次发展。计算机出现后,人们企图用计算机来实现人或动物所具备的模式识别能力。当前主要是模拟人的视觉能力、听觉能力和嗅觉能力,如现在研究比较热门的图像识别技术和语音识别技术。这些技术己被广泛应用于军事与民用工业中。模式识别的理论和方法还广泛应用于工业控制系统、地质地理、气象、化工、环境、生物医学等领域中去。1.1模式识别的基本概念一个模式识别系统可分为四个主要部分,其框图如图一所示:预处理分类决策特征提取和选择数据获取分类器设计图一模式识别系统的组成通常,把通过对具体个别事物进行观察所得到的,具有时间和空间分布的信息称为模式,而把模式所属的类别或同一类中模式的总体称为模式类。一个模式识别系统主要由4个部分组成:数据获取、预处理、特征提取和选择、分类决策,其基本职能就是对系统所要处理的模式究竟属于哪一类别做出判别。把输入模式转换成适合于机器处理的形式,这就是数据获取的过程。预处理的目的是去除噪声,加强有用的信息,并对由输入设备或其他因素造成的退化现象进行复原,以利于特征提取的进行。经过预处理后的数据维数很高,为了有效地实现分类识别,需要对原始数据进行变换,得到最能反映原始模式本质的特征向量。把原始数据组成的空间叫做测量空间,把分类识别赖以进行的空间叫做特征空间。通过变换可以把在维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式,这就是特征的提取和选择。一组稳定的、具有代表性的特征,是一个识别算法的核心,因此,采用不同特征的识别算法尽管分类策略相同也应属于不同的算法。分类决策是在特征空间中用所设计的分类器把被识别对象归为某一类别。构造一个模式识别系统包括两个方面:一是系统设计,二是系统的实现。首先需要从每一类别中找出能代表该类的样本,作为训练集,利用这些样本进行分类器的设计,然后再利用设计好的分类器对输入模式进行识别。广义上说,模式(pattern)是供模仿用的完美无缺的标本,通常,把通过对具体的个别事物进行观察所得到的具有时间和空间分布的信息称之为模式;而把模式所属的类别或同一类中模式的总体称为模式类。模式识别(PatternRecognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。1.2模式识别的方法1.2.1决策理论法又称统计法,是发展较早也比较成熟的一种方法。被识别对象首先数字化,变换为适于计算机处理的数字信息。一个模式常常要用很大的信息量来表示。许多模式识别系统在数字化环节之后还进行预处理,用于除去混入的干扰信息并减少某些变形和失真。随后是进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间。这时,模式可用特征空间中的一个点或一个特征矢量表示。这种映射不仅压缩了信息量,而且易于分类。在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。特征抽取后可进行分类,即从特征空间再映射到决策空间。为此而引入鉴别函数,由特征矢量计算出相应于各类别的鉴别函数值,通过鉴别函数值的比较实行分类。1.2.2句法方法又称结构方法或语言学方法。其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述,在底层的最简单的子模式称为模式基元。在句法方法中选取基元的问题相当于在决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述,又要易于用非句法方法加以抽取。显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句。这相当于在语言中,句子和短语用词组合,词用字符组合一样。基元组合成模式的规则,由所谓语法来指定。一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。模式识别方法的选择取决于问题的性质。如果被识别的对象极为复杂,而且包含丰富的结构信息,一般采用句法方法:被识别对象不很复杂或不含明显的结构信息。一般采用决策理论方法。这两种方法不能截然分开,在句法方法中!基元本身就是用决策理论方法抽取的。在应用中,将这两种方法结合起来分别施加于不同的层次,常能收到较好的效果。1.2.3模糊识别法模糊识别的理论基础是模糊数学。它根据人辨识事物的思维逻辑,吸取人脑的识别特点,将计算机中常用的二值逻辑转向连续逻辑。模糊识别的结果是用被识别对象隶属于某一类别的程度即隶属度来表示的,一个对象可以在某种程度上属于某一类别,而在另一种程度上属于另一类别。一般常规识别方法则要求一个对象只能属于某一类别。基于模糊集理论的识别方法有:最大隶属原则识别法、择近原则识别法和模糊聚类法。1.2.4人工神经网络识别法人工神经网络的研究起源于对生物神经系统的研究。它将若干处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制(如BP网络)可以模仿人的神经系统的动作过程,以达到识别分类的目的。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。神经网络侧重于模拟和实现人认知过程中的感知觉过程、形象思维、分布式记忆、自学习和自组织过程,与符号处理是一种互补的关系。但神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学习的能力,特别适用于处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。1.2.5模板匹配识别模板匹配的原理是选择已知的对象作为模板,与图像中选择的区域进行比较,从而识别目标。模板匹配依据模板选择的不同,可以分为两类:①以某一已知目标为模板,在一幅图像中进行模板匹配,找出与模板相近的区域,从而识别图像中的物体,如点、线、几何图形、文字以及其他物体;②以一幅图像为模板,与待处理的图像进行比较,识别物体的存在和运动情况。模板匹配的计算量很大,相应的数据的存储量也很大,而且随着图像模板的增大,运算量和存储量以几何数增长。如果图像和模板大到一定程度,就会导致计算机无法处理,随之也就失去了图像识别的意义。模板匹配的另一个缺点是由于匹配的点很多,理论上最终可以达到最优解,但在实际中却很难做到。1.2.6支持向量机的模式识别V.Vapnik提出的支持向量机(SupportVectorMachine,即SVM)的基本思想是:先在样本空间或特征空间,构造出最优超平面,使得超平面与不同类样本集之间的距离最大,从而达到最大的泛化能力。支持向量机结构简单,并且具有全局最优性和较好的泛化能力,自20世纪90年代中期提出以来得到了广泛的研究。支持向量机方法是求解模式识别和函数估计问题的有效工具。SVM在数字图像处理方面的应用是:寻找图像像素之间的特征的差别,即从像素点本身的特征和周围的环境(临近的像素点)出发,寻找差异,然后将各类像素点区分出来。2模式识别技术在OCR(OpticalCharacterRecognition)中的应用利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动!,提高处理效率,50年代开始探讨一般文字识别法,并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。60年代后期,出现了多种字体和手写体文字识别机,其识别精度和机器性能都基本上能满足要求,如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。2.1文字识别系统的组成一般来说,文字识别系统主要由3个部分组成:信息采集、信息分析和处理及信息的分类判别,如图二所示。信息采集,将纸面上的文字灰度变换成电信号,输入到计算机中去。信息采集由文字识别机中的送纸机构和光电变换装