第四讲 模糊模式识别

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

什么是模糊模式识别•模式(pattern):供模仿用的标本•模式识别:判定给定的事物与哪个标本相同或相近声音识别文字识别图象识别景物识别等•模糊模式识别:标本或待识别的事物具有模糊性时,利用模糊数学方法处理模式识别问题问题:.上的模糊集也是待识别对象XA,,,,21个模式(标本)个模糊集,代表上的是nnXAAAn2020/1/312OUTLINE一、F集的贴近度二、F模式识别原则三、几何图形识别四、手写文字识别2020/1/313一、F集的贴近度贴近度是用以表示两个模糊集接近程度的数量指标,其定义如下:定义:映射N:F(U)F(U)[0,1]称为F(U)上的贴近度,如果满足:1.N(A,A)=12.N(A,B)=N(B,A)3.ABCN(A,C)N(A,B)N(B,C)2020/1/314常见的贴近度公式1.Minkowski距离表示:Np(A,B)=1[Mp(A,B)]1/p,其中p选取适当的常数.特别地,当p=1时(Haming贴近度)111(,)1|()()|niiiNABAuBun;或者11(,)1|()()|baNABAuBuduba当p=2时(Euclidean贴近度),2211(,)1(()())niiiNABAuBun或者221(,)1(()())baNABAuBuduba2020/1/3152.测度贴近度111()()(()())(,)(()())()()nkkknkkkAxBxAxBxdxNABAxBxdxAxBx1212()()2(()())(,)(()())()()nkkknkkkAxBxAxBxdxNABAxBxdxAxBx2020/1/3163.格贴近度1).内积1()()()()nkkuUkABAuBuAuBu外积1()()()()nkkuUkABAuBuAuBu2).格贴近度(,)()()CNABABAB或(,)[()()]CNABABAB内外积性质:性质1,ABBA.ABBA性质2cccBABA)(cccBABA)(证明:))()((1)(xBxABAXxc))](1())(1[(xBxAXx))()((xBxAccXxccBA性质3BABABABA,证明:))()((xBxABAXxAxAXx)(同理,BBA.BABA故BABA类似可得:性质4AAAAAA,5.0,5.0ccAAAA证明:))()((xAxAAAXxAxAXx)())()((xAxAAAcXxc5.0))(1)((xAxAXxAAA.5.0类似可证及cAA解释:;,,值越大越靠近来说对内积ABBA.5.0,,,值低于时达最大值时cABAAB;,,值越小越靠近来说对外积ABBA.5.0,,,值高于时达最小值时cABAAB2020/1/3110例1:某农作物在A地生长很好,现准备把它移植到B地或C地,问B、C两地哪个最适宜?已知:论域X={x1,x2,x3},其中,x1气温;x2湿度;x3土壤。根据评定得到三个模糊集A=(0.8,0.4,0.6);B=(0.9,0.6,0.3);C=(0.6,0.4,0.5)计算:N1(A,B)=0.80;N1(A,C)=0.90或者N2(A,B)=0.78;N2(A,C)=0.87从而C地最适宜。2020/1/3111例2:设有四本书A1,A2,A3,A4,考虑它们的以下特性:x1科学性;x2逻辑性;x3思想性;x4可读性;x5表述明确性。设论域X={x1,x2,x3,x4,x5},A1=(1,0.8,0.8,0.7,0.6);A2=(0.7,0.9,0.7,0.7,0.5);A3=(0.6,0.8,0,0.5,0.6);A4=(0.7,0.9,1,0.6,0.6)。现要在四本书中找出一本,使之比较符合要求:B=(0.9,0.8,0.7,0.7,0.5).计算:N1(A1,B)=0.94;N1(A2,B)=0.94;N1(A3,B)=0.74;N1(A4,B)=.84或者N2(A1,B)=0.92;N2(A2,B)=0.90;N2(A3,B)=0.65;N2(A4,B)=0.82从而,A1最符合要求2020/1/3112例3:企业的经营管理状况可以由以下指标反映:u1:生产;u2:销售;u3:材料;u4:存储;u5:运输.因此,企业状况可以表示为U={u1,u2,u3,u4,u5}上的模糊集.现有四种不同类型的企业管理经验,它们分别为:A1=(0.9,0.6,0.5,0.7,0.6);A2=(0.5,0.2,0.9,0.4,0.4);A3=(0.3,0.4,0.8,0.5,0.6);A4=(0.7,0.5,0.4,0.1,0.9).现有企业B,其状况为B=(0.4,0.9,0.7,0.8,0.5),问该企业应采取哪种管理措施?计算:N1(A1,B)=0.76;N1(A2,B)=0.70;N1(A3,B)=0.78;N1(A4,B)=.58或者N2(A1,B)=0.72;N2(A2,B)=0.63;N2(A3,B)=0.73;N2(A4,B)=.56从而,A3最符合要求。.2020/1/31132020/1/31142020/1/3115二、F模式识别原则最大隶属度原则标准类型是一些表示模糊概念的模糊集,待识别对象是论域中的某一元素时,往往由于识别对象不能绝对地属于哪一标准类型,因而隶属度不为1。我们经常选择它对标准类型的隶属度最大的来确定。最大隶属度原则:设A1,A2,…,AnF(U)是n个标准类型,u0U,如果Ai(u0)=max{Ak|1kn}则认为u0隶属于Ai所代表的标准类型.邻近原则已知n个标准类型A1,A2,…,An,B是待识别对象,N为贴近度。如果N(Ai,B)=max{N(Ak,B)|k=1,…n}则认为B与Ai最贴近,判定B属于标准类型Ai.类型1A早熟2A矮杆3A大粒4A高肥丰产5A中肥丰产例3(小麦亲本识别)小麦的百粒重分布为,)(2axexF小麦的类型及各类小麦对应的参数如下:a:,其百粒重分布为现有未知小麦A3.03.03.03.02.07.39.26.59.37.3,)(228.043.3xexA应属何种类型?问A解:0.78),(23.028.07.343.31eAANL0.44,),(2AANL0,),(3AANL0.52,),(4AANL0.68),(5AANL根据择近原则,A应为早熟型。选定格近度.LN例4细胞染色体形状的模糊识别细胞染色体形状的模糊识别就是几何图形的模糊识别,而几何图形常常化为若干个三角图形,故设论域为三角形全体.即X={(A,B,C)|A+B+C=180,A≥B≥C}标准模型库={E(正三角形),R(直角三角形),I(等腰三角形),I∩R(等腰直角三角形),T(任意三角形)}.某人在实验中观察到一染色体的几何形状,测得其三个内角分别为94,50,36,即待识别对象为x0=(94,50,36).问x0应隶属于哪一种三角形?先建立标准模型库中各种三角形的隶属函数.直角三角形的隶属函数R(A,B,C)应满足下列约束条件:(1)当A=90时,R(A,B,C)=1;(2)当A=180时,R(A,B,C)=0;(3)0≤R(A,B,C)≤1.因此,不妨定义R(A,B,C)=1-|A-90|/90.则R(x0)=0.955.或者其中p=|A–90|则R(x0)=0.54.11,0,(,,)901,0.pppRABCp正三角形的隶属函数E(A,B,C)应满足下列约束条件:(1)当A=B=C=60时,E(A,B,C)=1;(2)当A=180,B=C=0时,E(A,B,C)=0;(3)0≤E(A,B,C)≤1.因此,不妨定义E(A,B,C)=1–(A–C)/180.则E(x0)=0.677.或者其中p=A–C则E(x0)=0.02.11,0,(,,)1801,0.pppEABCp等腰三角形的隶属函数I(A,B,C)应满足下列约束条件:(1)当A=B或者B=C时,I(A,B,C)=1;(2)当A=180,B=60,C=0时,I(A,B,C)=0;(3)0≤I(A,B,C)≤1.因此,不妨定义I(A,B,C)=1–[(A–B)∧(B–C)]/60.则I(x0)=0.766.或者p=(A–B)∧(B–C)则I(x0)=0.10.11,0,(,,)601,0.pppIABCp等腰直角三角形的隶属函数(I∩R)(A,B,C)=I(A,B,C)∧R(A,B,C);(I∩R)(x0)=0.766∧0.955=0.766.任意三角形的隶属函数T(A,B,C)=Ic∩Rc∩Ec=(I∪R∪E)c.T(x0)=(0.766∨0.955∨0.677)c=(0.955)c=0.045.通过以上计算,R(x0)=0.955最大,所以x0应隶属于直角三角形.或者(I∩R)(x0)=0.10;T(x0)=(0.54)c=0.46.仍然是R(x0)=0.54最大,所以x0应隶属于直角三角形.2020/1/3123例5:(癌细胞识别)在癌细胞识别问题中,细胞分成四个标准类型,即:癌细胞(M),重度核异质细胞(N),轻度核异质细胞(R),正常细胞(T).选取表征细胞状况的七个特征:x1:核面积,x2:核周长,x3:细胞面积,x4:细胞周长,x5:核内总光密度,x6:核内平均光密度,x7:核内平均透光率.根据病理知识,反映细胞是否癌变的主要指标有以下六个,它们都是X={x1,…,x7}上的模糊集.A:核增大:12121()1aaAXx(a为正常核面积);B:核染色增深:1225()1aBxx;C:核浆比例值:1321()1aCxx;D:核内染色资不均:1247276()1(lg)axDxxx2020/1/3124E:核畸形:152221()1(4)aExxx;F:细胞畸形:162243()1(4)aFxxx上述a1,…,a6是适当选取的常数.细胞识别中的几个标准类型分别定义为:M=[ABC(DE)]F;N=ABCMCR=A0.5B0.5C0.5MCNC;T=MCNCRC上述定义中的模糊集A0.5的隶属函数为A0.5(x)=[A(x)]0.5,另两个模糊集B0.5、C0.5的隶属函数类似定义.给定识别细胞x0X,即可给出x0的核面积等七个特征值,由此可以计算出M(x0),N(x0),R(x0),T(x0),最后按最大隶属度原则识别.DNA序列分类与模糊识别2000网易杯全国大学生数学建模竞赛题:生物学家发现DNA序列是由四种碱基A,T,C,G按一定顺序排列而成,其中既没有“断句”,也没有标点符号,同时也发现DNA序列的某些片段具有一定的规律性和结构.由此人工制造两类序列(A类编号为1~10;B类编号为11~20).网址:现在的问题是如何找出比较满意的方法来识别未知的序列(编号为21~40),并判断它们那些属于A类,那些属于B类,那些既不属于A类又不属于B类.(1)已知类别DNA序列的模糊分类提取已知类别的20个DNA序列的A,T,C,G的百分含量构成如下矩阵:X=(xij)20×4,其中xi1,xi2,xi3,xi4分别表示第个DNA系列中的A,T,C,G的百分含量.采用切比雪夫距离法建立模糊相似矩阵,然后

1 / 34
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功