第三章知觉第五节模式识别(patternrecognition)一、模式识别模式(事物)是由若干元素或特征按照一定的关系组合在一起构成的,比如:汉字有8种笔划和251类偏旁等特征;英文字母有水平线、斜线、垂直线、直角、锐角、连续曲线和不连续曲线7种基本特征。模式识别:是指人把输入刺激(模式)的信息与长时记忆中的信息进行匹配,并辨认出该刺激属于什么范畴的过程。因此,对物体、图像、语音、符号或人脸的识别过程,即为模式识别。模式识别依赖于人的知识经验,离开个体已有的知识经验,就无法理解输入信息的意义。模式识别是人的一种基本认知能力,当代认知心理学的知觉研究主要涉及模式识别,特别是视知觉的模式识别。模式识别受到计算机科学家的关注,为进一步开发人工智能,人们正试图将人类的模式识别过程及其能力赋予计算机,使其具有像人一样的认知活动和人工智能。二、模式识别过程:分析、比较和决策。分析:把感觉登记中短暂滞留的感觉信息的物理特征与属性抽取出来,并把这些信息分解成各个组成成分。如:把“A”分解成2条斜线、1条水平线。比较:把这些特征或属性与长时记忆中储存的各种知识经验进行比较。决策:比较后,对刺激信息模式与哪一种记忆信息编码最为匹配作出判断,从而了解模式的意义并赋予模式名称,使刺激信息模式得到识别,即识别了某个事物。三、模式识别理论模板匹配理论(Template-matchingTheories)原型匹配理论(PrototypeTheories)特征匹配理论(Distinctive-FeatureTheories)计算途径(computationalapproach)(1)模板匹配理论(Template-matchingTheories)在人长时记忆所编码的信息中,存储着各式各样的来自个体过去的各种外部模式的拷贝或复本,即模板,它们与外部的刺激模式存在着一一对应的关系。当一个刺激作用于人的感觉器官时,刺激信息得到编码并与头脑中所存储的模板进行比较和匹配,确定哪一个模板与刺激信息最为吻合,就把该刺激信息确认为是与头脑中的某个模板相同,即产生模式识别效应。模式识别是刺激信息与脑中某个或某些模板产生最佳匹配的过程。模板匹配理论的缺陷:•强调刺激信息与脑中模板的最佳匹配,如果刺激信息稍有变化,就无法与模板最佳匹配,无法完成模式识别。•要求在长时记忆中存储无数个模板,会给记忆带来沉重负担,也会使人在识别事物时缺少灵活性。•无法解释为何有时能够非常迅速地识别一个新的、不熟悉的事物。•没有说明模板匹配的信息编码形式,即外部刺激模式与脑中模板的比较是平行加工还是系列加工;是从局部开始还是从整体开始等。(2)原型匹配理论(PrototypeTheories)原型:是一类事物所具有的基本的、共同的特征。原型匹配理论:所有的外部刺激信息,都是以原型的表征方式存储于人的长时记忆系统中,任何具体事物都是通过原型及其一系列变式存储在人脑中的。人的长时记忆中,存储着的不是与外部客观事物一一对应的具体模板,而是一系列客观事物的原型,外部刺激信息或事物只要能与人脑中的原型相匹配,即完成了模式识别。例:各种不同形状、型号的飞机,其原型是有2个翅膀的长筒,机场停着的飞机和画里的飞机,尽管差异很大,但由于与脑中表征的原型相似,仍然能够被识别出来。换了发型的张老师仍然能被识别出。原型匹配理论的优点:减轻记忆负担,使人的模式识别活动更加灵活。缺点:没有非常具体和详细地描述刺激与原型之间的匹配过程。(3)特征匹配理论或区别性特征理论(Distinctive-FeatureTheories)特征匹配理论:任何模式都可以被分解成诸多特征或属性,模式识别就是通过对刺激信息特征的分析,抽取出该刺激模式的有关特征或属性加以合并,再与长时记忆中所存储的各种刺激的特征进行比较,一旦获得了最佳的匹配,来自外部的刺激信息模式就得到了识别。如各种字体的同一个字,只要其基本特征保持不变,就可得到识别。特征模型支持证据*诺贝尔奖得主Hubel和Wiesel的研究将微电极插入动物视皮层的一系列神经元中,呈现简单视觉刺激(垂直光栅),结果表明,每个神经元只对特定方向的光栅反应特别强烈。一小块视皮层包含了各种各样的神经元,分别对垂直、水平、倾斜线条作出反应,视觉系统似乎有一些专门的特征检测器,帮助我们对字母和简单模式的某些特征作出反应。*what通路和where通路what通路从枕叶初级视皮层向颞叶下行,主要负责加工视觉刺激的颜色、形状和特性(即刺激的身份或刺激是什么)。where通路则从枕叶向顶叶上行,主要负责位置和运动信息的加工。为了识别外界环境中的物体和所发生的事件,特征信息至少要输送到这两个不同系统。V1V2V2V3V4V5MT顶叶颞下回What通路——Where通路奈塞尔的实验结果:表1中找“Z”比在表2中找“Z”快。原因:表1中干扰字母的曲线特征与“Z”的直线特征不同。表2中干扰字母的直线特征与“Z”的直线特征相同。心理学家从中得到启示:人在模式识别过程中,首先从刺激模式中抽取特征并加以编码,然后再把目标字母和背景字母加以比较。*Gibson的研究表明:当一些字母共用很多关键特征(如P和R)时,判断这些字母是否相同需要花更长的时间。字母G和M各自使用许多不同的区别性特征,对类似于这样的字母对,判断的速度相对要快。*局部优先效应(Localprecedenceeffect,Martin,1979):当局部小字母的间距更宽时,整体优先效应反转,出现局部优势效应,即对局部特征的识别优先于整体特征的识别,当局部特征和整体特征不一致时,局部特征干扰整体的识别。这说明:整体优先效应的出现有一些制约条件——小字母的间距,刺激的大小。*谢夫里奇和奈塞尔根据特征匹配理论,设计了一套计算机程序让计算机识别,这些字母区别于人用手写的英文字母,结果计算机能够很好地完成这个任务。“魔鬼城堡”模型(PandemoniumModel)(谢夫里奇)“魔宫”里群居着许多“鬼”,他们分属于4个层次,每个层次的“鬼”执行着某个特殊的任务,并依次工作,直到最终实现模式识别。“映象鬼”——对外部刺激信息进行编码,形成刺激模式的表象或映象。“特征鬼”——从“映象鬼”得到的表象中搜索一定的特征,每个“特征鬼”都有其特定的功能和任务,它们只搜索和选择自己负责的那个特征,找到后就喊叫或标记出这种刺激特征及其数量。“认知鬼”——每个“认知鬼”负责一个特殊的模式,它们在倾听“特征鬼”的喊叫中搜索自己负责的某个模式的有关特征,一旦发现有关特征,就会大喊大叫,发现的特征越多,喊叫声就越大。“认知鬼”的喊叫声表明它们已经组合了某个字母。“决策鬼”——听取所有“认知鬼”的喊叫声,判断哪一个“认知鬼”的喊叫声最大,根据喊叫声最大的“认知鬼”来决定并呈现出那个字母。特征模型不支持证据整体优先效应(Globalprecedenceeffect):当要求识别整体时,局部特征的性质,即局部特征是否与整体特征相匹配,并不影响整体的知觉。然而,当要求识别局部时,整体特征的性质,即整体特征是否与局部特征相匹配,影响局部的知觉。这提示知觉过程中存在整体优先。特征匹配理论或区别性特征理论的优缺点:优点:更灵活有效地解释人的模式识别过程。缺点:忽略了自上而下的加工过程。一个模式识别理论,不应只是简单地罗列刺激中能够发现的一些特征,还必须描述特征之间的物理关系,如:T和L特征一样,但物理关系不一样。只能解释相对简单的字母识别,很难解释更复杂的刺激的识别过程。(4)计算途径(computationalapproach)主要目的在于发展一些基于计算机的理论。利用这些理论,计算机能够完成一些人类能够完成的任务,如快速和精确的三维客体识别。目前已有几个模式识别的计算途径。其中一个是Biederman的成分识别理论。成分识别理论:一个特定观察角度的物体,可以用一些简单的三维形状的排列来表征,这些简单形状为几何子。象字母一样,几何子可以构成一些有意义的东西。如,几何子3和5可以形成具有不同意义的物体,即茶杯和提桶。本质上为三维物体识别的区别性特征理论。成分识别理论的支持证据:迄今尚未得到广泛检验,在正常人和特异性视觉缺陷的病人身上进行的一些早期研究,基本支持成分识别模型(Banks和Krajicek,1991)成分识别理论的不支持证据:Cave&Kosslyn,1993的实验:任务:识别2种碎片,一种是与几何子一致的“自然”碎片,一种是“非自然”的碎片。结果:识别速度同样快和准确。表明:首先编码整体,然后才对部分进行分析。上面讨论的模式识别理论主要集中在如何觉察孤立的客体。自下而上加工强调刺激本身在模式识别中的重要性,与刺激有关的信息来自感受器,这些信息触发了模式识别过程,简单的基础水平特征的结合,使我们能够识别更复杂的、整体的模式。但知识和期望也能帮助我们识别客体,除了自下而上加工外,模式识别还涉及另一个重要过程,即自上而下加工,这种加工强调概念和高水平过程对模式识别的影响。四、自上而下加工和模式识别1、背景和模式识别字词优势效应:识别一个字词中的字母,比识别一个单独的字母的正确率要高。客体优势效应:识别一个客体图形时,图形中的线段要优于识别结构不严的图形中的同一线段或单独的线段。构形优势效应:识别一个完整的图形要优于识别图形的某一部分。WordSuperiorityEffect(Reicher,1969;Wheeler,1970)DWORDDKWORDWORK许多研究证明了自上而下加工在字母识别中的重要作用。甚至在镶嵌目标字母的单词中,目标字母不发音时,词优效应也存在。2、过去经验和模式识别Schacter和他的同事(1991)证明,与物体有关的过去经验,的确能够帮助人们识别物体。Schacter等不可能图形的实验。