XXX大学课程设计报告书课题名称模式识别姓名学号院、系、部专业指导教师xxxx年xx月xx日模式识别方法简述摘要:模式识别(PatternRecognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。关键词:模式识别;模式识别方法;统计模式识别;模板匹配;神经网络模式识别模式识别(PatternRecognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。模式识别是一种借助计算机对信息进行处理、判别的分类过程。判决分类在科学研究和生产实践中的应用是相当广泛的,但往往因所需处理的影响因子过多,过于复杂,给问题的研究和解决增加了困难。多因子问题的目标(结果或性能)与影响因子之间难以找出直接的联系,或是很难直接用理论的途径解决,在各因子之间一时也找不到明显的关联。计算机模式识别的引入给复杂问题的解决带来了曙光。模式识别使得人们在影响因素很多的情况下仍能对众多信息进行方便的处理,利用计算机技术对数据进行总结,寻找目标与众多因子之间的某种联系或目标的优化区域、优化方向,对实际问题的解决具有指导意义和应用价值,因此获得广泛应用,并取得较大成功。模式识别方法(PatternRecognitionMethod)是一种借助于计算机对信息进行处理、判决分类的数学统计方法。一个完整的模式识别系统由数据获取、数据处理、特征提取和选择、分类决策4部分组成,如下图所示。分类器设计信息获取预处理特征提取和选择分类决策图一模式识别系统在设计模式识别系统时,需要注意模式类的定义、应用场合、模式表示、特征提取和选择、聚类分析、分类器的设计和学习、训练和测试样本的选取、性能评价等。针对不同的应用目的,模式识别系统各部分的内容可以有很大的差异,特别是在数据处理和模式分类这两部分,为了提高识别结果的可靠性往往需要加入知识库(规则)以对可能产生的错误进行修正,或通过引入限制条件大大缩小待识别模式在模型库中的搜索空间,以减少匹配计算量。在某些具体应用中,如机器视觉,除了要给出被识别对象是什么物体外,还要求出该物体所处的位置和姿态以引导机器人的工作。下面分别简单介绍模式识别系统数据获取、数据处理、特征提取、分类决策或模型匹配的工作原理。数据获取是指利用各种传感器把被研究对象的各种信息转换为计算机可以接受的数值或符号(串)集合。习惯上,称这种数值或符号(串)所组成的空间为模式空间。这一步的关键是传感器的选取。为了从这些数字或符号(串)中抽取出对识别有效的信息,必须进行数据处理,包括数字滤波和特征提取。数据处理是为了消除输入数据或信息中的噪声,排除不相干的信号,只留下与被研究对象的性质和采用的识别方法密切相关的特征(如表征物体的形状、周长、面积等等)。举例来说,在进行指纹识别时,指纹扫描设备每次输出的指纹图像会随着图像的对比度、亮度或背景等的不同而不同,有时可能还会产生变形,而人们感兴趣的仅仅是图像中的指纹线、指纹分叉点、端点等,而不需要指纹的其它部分或背景。因此,需要采用合适的滤波算法,如基于块方图的方向滤波、二值滤波等,过滤掉指纹图像中这些不必要的部分。特征提取是指从滤波数据中衍生出有用的信息,从许多特征中寻找出最有效的特征,以降低后续处理过程的难度。我们对滤波后的这些特征进行必要的计算后,通过特征选择和提取形成模式的特征空间。人类很容易获取的特征,对于机器来说就很难获取了,特征选择和提取是模式识别的一个关键问题。一般情况下,候选特征种类越多,得到的结果应该越好。但是,由此可能会引发维数灾害,即特征维数过高,计算机难以求解。因此,数据处理阶段的关键是滤波算法和特征提取方法的选取。不同的应用场合,采用的滤波算法和特征提取方法以及提取出来的特征也会不同。基于数据处理生成的模式特征空间,人们就可以进行模式识别的最后一部分:模式分类或模型匹配。该阶段最后输出的可能是对象所属的类型,也可能是模型数据库中与对象最相似的模式编号。模式分类或描述通常是基于己经得到分类或描述的模式集合而进行的。人们称这个模式集合为训练集,由此产生的学习策略称为监督学习。学习也可以是非监督性学习,在此意义下产生的系统不需要提供模式类的先验知识,而是基于模式的统计规律或模式的相似性学习判断模式的类别。应用模式识别方法的首要步骤是建立模式空间。所谓模式空间是指在考察一客观现象时,影响目标的众多指标构成的多维空间。每个指标代表一个模式参量。假设一现象有几个事件(样本)组成,每一个事件都有P个特征参量(X1,X2,...Xp),则它就构成P维模式空间,每一个事件的特征参量代表一个模式。模式识别就是对多维空间中各种模式的分布特点进行分析,对模式空间进行划分,识别各种模式的聚类情况,从而做出判断或决策。分析方法就利用映射!和逆映射!技术。映射是指将多维模式空间进行数学变换到二维平面,多维空间的所有模式(样本点)都投影在该平面内。在二维平面内,不同类别的模式分布在不同的区域之间有较明显的分界域。由此确定优化方向返回到多维空间(原始空间),得出真实信息,帮助人们找出规律或做出决策,指导实际工作或实验研究。针对不同的对象和不同的目的,可以用不同的模式识别理论、方法,目前主流的技术方法是:统计模式识别、模板匹配、神经网络模式识别统计模式识别方法是受数学中的决策理论启发而产生的一种识别方法。其基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中,这个空间包含了所有的特征矢量。不同的特征向量,或者说不同类别的对象,都对应于此空间中的一点。在分类阶段,则利用统计决策的原理对特征空间进行划分,从而达到识别不同特征对象的目的。统计识别中应用的统计决策分类理论相对比较成熟,研究的重点是特征提取。统计模式识别方法适用于在给定的有限数量样本集,已知研究对象统计模型或已知判别函数类条件下,根据一定的准则通过学习算法能够把d维特征空间划分为c个区域,每一个区域与每一类别相对应,模式识别系统在进行工作时只要判断被识别的对象落入哪一个区域,就能确定出它所属的类别。统计模式识别方法也称为决策论模式识别方法,它是从被研究的模式中选择能足够代表它的若干特征(设有d个),每一个模式都由这d个特征组成的在d维特征空间的一个d维特征向量来代表,于是每一个模式就在d维特征空间占有一个位置。一个合理的假设是同类的模式在特征空间相距较近,而不同类的模式在特征空间则相距较远。如果用某种方法来分割特征空间,使得同一类模式大体上都在特征空间的同一个区域中,对于待分类的模式,就可根据它的特征向量位于特征空间中的哪一个区域而判定它属于哪一类模式。这类识别技术理论比较完善。方法也很多,通常较为有效,现已形成了完整的体系。尽管方法很多,但从根本上讲,都是直接利用各类的分布特征,即利用各类的概率分布函数、后验概率或隐含地利用上述概念进行分类识别。其中基本的技术为聚类分析、判别类域界面法、统计判决等。模板匹配的原理是选择己知的对象作为模板,与图像中选择的区域进行比较,从而识别目标。模板匹配依据模板选择的小同,可以分为两类:1)以某一己知目标为模板,在一幅图像中进行模板匹配,找出与模板相近的区域,从而识别图像中的物体,如点、线、几何图形、文字以及其他物体;2)以一幅图像为模板,与待处理的图像进行比较,识别物体的存在和运动情况。模板匹配的计算量很大,相应的数据的存储量也很大,而且随着图像模板的增大,运算量和存储量以几何数增长。如果图像和模板大到一定程度,就会导致计算机无法处理,随之也就失去了图像识别的意义。模板匹配的另一个缺点是由于匹配的点很多,理论上最终可以达到最优解,但在实际中却很难做到。模板匹配主要应用于对图像中对象物位置的检测,运动物体的跟踪,不同光谱或者不同摄影时间所得的图像之间位置的配准等。上世纪50年代末,F.Rosenblatt[16]提出了一种简化的模拟人脑进行识别的数学模型—感知机,初步实现了通过给定类别的各个样本对识别系统进行训练,使系统在学习完毕后具有对其他未知类别的模式进行正确分类的能力。80年代,J.Hopfield深刻揭示出人工神经元网络所具有的联想存储和计算能力,为模式识别技术提出了一种新的途径,短短几年在很多方面就取得了显著成果,从而形成了人工神经元网络模式识别方法。神经元模式识别利用神经元网络中出现的神经计算模式进行。大部分神经元网络都有某种训练规则,如基于现有模式调节连接权重。换句话说,神经元网络直接对例子进行学习,得出其结构特征进行推广,就像孩子从狗的例子中认识狗一样。人工神经元网络可以超越传统基于计算机的模式识别系统的能力。人们可以利用计算机或神经元网络进行模式识别。计算机利用传统的数学算法来检测给定的模式是否跟现有模式相匹配。这是一个简单易懂的方法。但是,该方法只能进行是或非的判断,且不允许模式有噪声。另一方面,神经元网络允许模式可以有噪声,而且如果训练得当,神经元网络会对未知模式的类别做出正确的响应。虽然神经元网络不能创造奇迹,但是如果采用合适的结构,对好的数据进行正确的训练,不仅在模式识别领域,而且在其他科学或商业应用中,神经元网络都可以给出令人惊异的结果。比如,BP神经网络直接从观测数据(训练样本)学习,非常简便有效,因而获得了广泛应用,但它是一种启发式技术,缺乏指定工程实践的坚实理论基础。随着计算机软硬件技术的快速发展,模式识别得到越来越多的关注,模式识别技术也越来越完善,并在越来越多的领域得到了成功应用,如数据挖掘、文献分类、财政预测、多媒体数据库的组织和检索、生物(比如根据人的物理特征,如人脸、指纹等识别人)、医学(医学图像分析)、地质、能源、气象(天气预报)、化工、冶金、航空(卫星航空图片解释)、工业产品检测等领域。近年来发展最快的模式识别领域应属于计算机视觉与听觉领域,如手写文字识别,生物特征识别(包括:指纹识别、虹膜识别、视网膜识别、掌纹识别、人脸识别、手掌静脉分布识别等),印刷品版面分析识别,互联网有害信息检测,语音识别(语音输入系统,语音应答系统)等。Picard[13]提出了模式识别的又一应用—情感计算,使得计算机可以像人类一样识别和表达感情、对人类的情感做出睿智的响应,并可以利用情感机制进行决策。美国微软公司主席比尔·盖茨认为人类计算的未来就是要让计算机会看、会听、会说、会思考;美国总统信息技术顾问委员会PITAC(President’sInformationTechnologyAdvisoryCommittee)在其提交给联邦政府关于“面向未来的信息技术研究”的咨询报告中,强调模式识别和感知等方面的基础研究将极大地改善人类与机器之间的交互。如果有一天,模式识别发展到了