-1-模式识别综述摘要:介绍了模式识别系统的组成及各组成部分包含的内容。就统计模式识别、结构模式识别、模糊模式识别、神经网络模式识别等模式识别的基本方法进行简单介绍,并分析了其优缺点。最后列举了模式识别在各领域的应用,针对其应用前景作了相应分析。关键字:模式识别系统、统计模式识别、结构模式识别、模糊模式识别、神经网络模式识别背景随着现代科学技术的发展,特别是计算机技术的发展,对事物认识的要求越来越高,根据实际需求,形成了一种模拟人的各种识别能力(主要是视觉和听觉)和认识方法的学科,这个就是模式识别,它是属于一种自动判别和分类的理论。这一理论孕育于20世纪60年代,随着科学技术的发展,特别是20世纪70年代遥感技术的发展和地球资源卫星的发射,人们通过遥感从卫星取得的巨量信息,需要进行空前规模的处理、识别和应用,在此推动下,模式识别技术便得以迅速发展[1]。发展到现在,应用领域已经非常广阔,包括文本分类、语音识别、视频识别、信息检索和数据挖掘等。模式识别技术在生物医学、航空航天、工业生产、交通安全等许多领域发挥着重要的作用[2]。基本概念什么是模式呢?广义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或是否相似,都可以称之为模式。但模式所指的不是事物本身,而是我们从事物获取的信息。因此模式往往表现为具有时间或空间分布的信息[3]。人们在观察各种事物的时候,一般是从一些具体的个别事物或者很小一部分开始的,然后经过长期的积累,随着对观察到的事物或者现象的数量不断增加,就开始在人的大脑中形成一些概念,而这些概念是反映事物或者现象之间的不同或者相似之处,这些特征或者属性使人们对事物自然而然的进行分类。从而窥豹一斑,对于一些事物或者现象,不需要了解全过程,只需要根据事物或者现象的一些特征就能对事物进行认识。人脑的这种思维能力视为“模式”的概念。模式识别就是识别出特定事物,然后得出这些事物的特征。识别能力是人类和其他生物的一种基本属性,根据被识别的客体的性质可以将识别活动分为具体的客体与抽象的客体两类。诸如字符、图像、音乐、声音等是具体的客体,他们刺激感官,从而被识别。而思想、信仰、言论等则是抽象的客体,这些属于政治、哲学的范畴。我们研究的主要是一些具体客体的识别,而且仅限于研究用机器完-2-成识别任务有关的基本理论和实用技术[4]。模式识别的目的就是利用计算机实现人的类识别能力,是对两个不同层次的识别能力的模拟。对信息的理解往往含有推理过程,需要专家系统,知识工程等相关学科的支持。模式识别系统一个典型的模式识别系统如图1所示,由数据获取、预处理、特征提取、分类决策及分类器设计五部分组成。一般分为上下两部分:上部分完成未知类别模式的分类;下半部分属于分类器设计的训练过程,利用样品进行训练,确定分类器的具体参数,完成分类器的设计。而分类决策在识别过程中起作用,对待识别的样品进行分类决策[5]。数据获取预处理特征提取分类决策分类结果未知类别模式的分类图1模式识别系统及识别过程训练样本输入预处理特征选择确定判别函数改进判别函数分类器设计误差检验模式识别系统组成单元功能如下。(1)数据获取用计算机可以运算的符号来表示所研究的对象,一般获取的数据类型有一下几种。1二维图像:文字、指纹、地图、照片等。2一维波形:脑电图、心电图、季节震动波形等。3物理参量和逻辑值:体温、化验数据、参量正常与否的描述。(2)预处理对输入测量仪器或其他因素所造成的退化现象进行复原、去噪声,提取有用信息。(3)特征提取和选择对原始数据进行变换,得到最能反映分类本质的特征。将维数较高的测量空间(原始数据组成的空间)转变为维数较低的特征空间(分类识别赖以进行的空-3-间)。(4)分类决策在特征空间中用模式识别方法把被识别对象归为某一类别。(5)分类器设计基本做法是在样品训练基础上确定判别函数,改进判别函数和误差检验。模式识别的方法1.统计模式识别统计模式识别是对模式的统计分类方法,即结合统计概率论的贝叶斯决策系统进行模式识别的技术,又称为决策理论识别方法。识别是从模式中提取一组特性的度量,构成特征向量来表示,然后通过划分特征空间的方式进行分类。利用模式与子模式分层结构的树状信息所完成的模式识别工作,就是结构模式识别或句法模式识别。统计模式识别主要是利用贝叶斯决策规则解决最优分类器问题。统计决策理论的基本思想就是在不同的模式类中建立一个决策边界,利用决策函数把一个给定的模式归入相应的模式类中。在统计模式识别中,贝叶斯决策规则从理论上解决了分类器的设计问题,但贝叶斯方法计算条件概率函数是非常困难的,因为在实际中条件概率一般是未知的,必须从数据样本中估计出来,然而在估算条件概率的时候,受制于样本的数量。样本太少,不能够表征要研究的某类问题,样本太多,给数据采集会造成一定的麻烦,而且计算量也增大了。为此人们提出了各种解决方法:1.1最大似然估计和贝叶斯估计这两种方法的前提条件是各类别的条件概率密度的形式已知,而参数类未知。在此情况下,对现有的样本进行参数估计。参数估计在统计学中是很经典的算法,而最大似然估计和贝叶斯估计也是参数估计中常用的方法。最大似然估计是把待估参数看作确定性的量,只是其取值未知,最大似然估计方法所寻找的是能最好解释训练样本的那个参数值;贝叶斯估计把待估参数看作是符合某种先验概率分布的随机变量,而训练样本的作用就是把先验概率转化为后验概率[6]。实际生活中,用的更多的还是最大似然估计,因为此方法更容易实现,而且样本数据充足的情况下,得到的分类器效果比较好。1.2监督参数统计法1)KNN法及其衍生法KNN法也成为K最近领域法,是模式识别的标准算法之一。其基本原理是先将已经分好类别的训练样本点记入到多维空间,然后将待分类的未知样本也记入空间。考察未知样本的K个近邻,弱近邻中某一个类样本最多,则可以将未-4-知样本也判为该类。2)Fisher判别分析法Fisher判别分析法的基本原理是将多维空间样本点分布的图像投影到二维或者一维,投影方向选择的原则是使两类样本点尽可能分开。求投影方向得到两类点分开的最佳方向也次方向,由这两个方向张成二维平面,可使投影形成二维分类图;垂直于分界线的法线代表使样本向一类或者二类转化的方向。此外统计模式识别还有判别函数法(包括线性判别函数法和非线性判别函数法)、特征分析法、主因子分析法等。统计模式识别的优点:由于其基本方法是基于对模式的统计,统计的方法及处理等由于发展的早,比较成熟,在处理中能考虑干扰、噪声等影响,识别模式基元的能力强。统计模式识别的缺点:由于统计的模式其数量要求大,对结构复杂的模式抽取特征困难。若数据量小则不能反映模式的结构特征,难以归纳模式的性质,难以从整体角度考虑识别问题。2.结构模式识别对于较复杂的模式,对其描述需要很多数值特征,从而增加了复杂度。结构模式识别通过采用一些比较简单的子模式组成多级结构来描述一个复杂的模式。基本思路是先将模式分为若干个子模式,子模式再分解成简单的子模式,然后子模式再分解,直到根据研究的需要不再需要细分的程度。最后一级最简单的子模式称为模式基元[7]。结构模式识别的优点:由于采用模式分为若干子模式,子模式再分解到基元,这样其识别方便,可以从简单的基元开始,逐步推理,由简至繁。它能反映模式的结构特性,对模式的性质能很好的描述出来,对图像畸变的抗干扰能力较强。结构模式识别的缺点:当存在干扰及噪声时,对基元的影响很大,抽取基元困难,且容易将噪声一块儿抽取,造成失误。3.模糊模式识别模糊模式识别是以模糊理论和模糊集合数学为支撑的一种识别方法。模糊集合是指没有明确的边界的集合。例如:“水很烫”,“枇杷很大”,“某学生考试成绩一般”,“这件衣服很贵”等,这些都是模糊集合。但是虽然模糊,缺可以通过一些方法表征出来,因此也可以说这个是清晰的。模糊集合理论是通过隶属度来描述元素的集合程度,主要用于解决不确定性问题。在平常的事物中,由于噪声、扰动、测量误差等因素影响,使得不同模式类的边界不明确,然而这些不明确有模糊集合的性质,因此在模式识别中可以把模式类当做模糊集合,利用模糊理论的方法对模式进行分类,从而解决问题。-5-模糊模式识别的优点:由于采用了模糊推理的方法,用隶属函数作为样本和模板的度量,故能反映模式的整体特征,针对样品中的干扰和畸变,有很强的剔除能力。模糊模式识别的缺点:模糊规则往往是根据经验的来的,准确合理的隶属函数往往难以建立,从而也限制了它的应用。4.神经网络模式识别人工神经网络是由大量简单的处理单元广泛互连而成的复杂网络,起源于对生物神经系统的研究。它将若干处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制(如BP网络)可以模仿人的神经系统的动作过程,以达到识别分类的目的。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。神经网络侧重于模拟和实现人认知过程中的感知觉过程、形象思维、分布式记忆、自学习和自组织过程,与符号处理是一种互补的关系。但神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学习的能力,特别适用于处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题[8]。神经网络模式识别的优点:由于其是由模式的基元互连而成,能够反映局部信息,可以处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。针对样品有较大的缺损或畸变,它能很好的纠正。神经网络模式识别的缺点:模型在不断丰富与完善,目前能识别的程式类还不够多。5.多分类器融合多分类器融合,也称为多分类器集成,就是融合多个分类器提供的信息,得到更加精确的分类结果[7]。多分类器融合常见的结构有三种:并行结构、串行结构、串并行结构。输入分类器1输出集成输出分类器3分类器2分类器N图3多分类器集成的串并行结构分类器1分类器N输出集成分类器2分类器3输入图2多分类器集成的并行结构-6-分类器1分类器2分类器N输入输出输出输出图4多分类器集成的串行图2所示的并行结构中,各分类器是独立进行设计的,他们之间没有关联。图3所示的串并行结构是串行结构中某一级的分类器由多个并行结构的分类器组成,从而有串行结构和并行结构的特点。图4所示的串行结构中,前一级分类器为后一级分类器提供信息,它们之间有一定的关联。模式识别的应用经过几十年的迅速发展,如今模式识别已经广泛应用于各个领域,这些领域包括农业、工业、医学、自然科学和社会科学等。在农业中,模式识别用于分析农产品的收成;分析土壤成分,以决定种植何种作物,或者种植某种作物需要的养料是否充足,最终达到增产的目的;在作物生长的过程中,对作物的施肥、浇水等进行智能控制。工业生产中,模式识别的应用可谓种类繁多,枚不胜举,有文字识别、过程控制(根据图像控制一些机械等)、语音分析、地下探测、签名分析、图像处理、冶金和建材等。医学中主要有药物作用研究、心电图与向量心电图分析、脑电图描绘与神经生物信号处理、放射性同位素检查、显微观察与生物医学数据分析、基因染色体研究等[4]。自然科学中,模式识别在天文、地球和行星探测、地质、卫星数据分析、遥远星球生命探测等方面应用广泛。以上的种种应用都是随着问题的出现而出现的解决方法,至今模式识别还没有发展成统一的、有效的可以应用于所有模式识别的理论。当前有一个普遍的看法是:不存在对所有的模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的是一个工具袋,我们所要做的是结合具体问题把模式识别方法结合起来,把模式识别与人工智能中的启发式搜索结合起来,把人工神经网络、不确定方法、智能技术结合起来,深入掌握各种工具的效能和应用的可能性,互相取长补短,开创模式识别应用的新局面[5]。模式识别的发展前景模式识别是人工只能的一部分,在未来是信息化、智能化、网络化的时代,模式识别将得到更大的发展,具有广阔的应用前景。类人机器人作为今后研究的主流,要让其具有人类的听觉、视觉、感知等能力,这些都能用模式识别来实现。第六代计算机,也称生物计算机,借助于生物工程研发