模式识别-最小平方误差算法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

3.7最小平方误差算法3.7最小平方误差算法(leastmeansquareerror,LMSE;亦称Ho-Kashyap算法)上述的感知器算法、梯度算法、固定增量算法或其他类似方法,只有当模式类可分离时才收敛,在不可分的情况下,算法会来回摆动,始终不收敛。当一次次迭代而又不见收敛时,造成不收敛现象的原因分不清,有两种可能:a)迭代过程本身收敛缓慢b)模式本身不可分对可分模式收敛。对于类别不可分的情况也能指出来。LMSE算法特点:最小平方误差算法1.分类器的不等式方程NnNnnNNnnnnnnwxwxwxwwxwxwxwwxwxwxwXXX对对对00012211212222211111122111类1类20TiXW两类分类问题的解相当于求一组线性不等式的解。如果给出分属于,两个模式类的训练样本集,应满足:12},,2,1,{NiiX其中,Xi是规范化增广样本向量,。T21]1,,,,[iniiixxxX上式分开写为:01分类器的不等式方程写成矩阵形式为:令N×(n+1)的长方矩阵为X,则变为:0TiXW0XW011112112122221112110000111NnnnnNNnNNnnNnNnnNNnnnnnnwxwxwxwwxwxwxwwxwxwxwXXX对对对00012211212222211111122111类1类201分类器的不等式方程01分类器的不等式方程式中:T121,,,,nnW121TT1TT2T1nNNNiXXXXXX0XW011112112122221112110000111NnnnnNNnNNnn0为零向量感知器算法是通过解不等式组,求出W。0XW02LMSE算法2.LMSE算法1)原理的求解。式中:∴两式等价。T21,,,,,NibbbbB为各分量均为正值的矢量。LMSE算法把对满足XW0的求解,改为满足BXW①在方程组中当行数列数时,通常无解,称为矛盾方程组,一般求近似解。在模式识别中,通常训练样本数N总是大于模式的维数n,因此方程的个数(行数)模式向量的维数(列数),是矛盾方程组,只能求近似解W*,即说明:极小BXW*02LMSE算法②LMSE算法的出发点:选择一个准则函数,使得当J达到最小值时,XW=B可得到近似解(最小二乘近似解)。③LMSE算法的思路:BWBXWXW、通过求准则函数极小找求解对求解对0转化为转化为准则函数定义为:221,,BXWBXWJ“最小二乘”:——最小:使方程组两边误差最小,也即使J最小。——二乘:次数为2,乘了两次最小平方(误差算法)1111121111221111111111NNinnnnNNnNininnbbbBXWNNiiNNnnNnNinnininnnbbbbwwxwxbwwxwxbwwxwxXWXWXWTT11T1111111111111向量各分量的平方和向量各分量的平方和22BXWNiiiNNbbb12T2T211T2XWXWXWBXW考察向量(XW-B)有:02LMSE算法可以看出:①当函数J达到最小值,等式XW=B有最优解。即又将问题转化为求准则函数极小值的问题。②因为J有两个变量W和B,有更多的自由度供选择求解,故可望改善算法的收敛速率。21T22121,,NiiibJXWBXWBXWXW=B的近似解也称“最优近似解”:——使方程组两边所有误差之和最小(即最优)的解。准则函数:02LMSE算法BXBXXXWBXXWXBXWX#T1TTTT0使J对W求最小,令,得:2)推导LMSE算法递推公式与问题相关的两个梯度:BXWXWTJBXWBXWB21J(3-46)(3-47)由(3-47)式可知:只要求出B,就可求出W。求递推公式:(1)求W的递推关系X为N×(n+1)长方阵,X#为(n+1)×N长方阵。T1T#XXXX称为X的伪逆,式中:(3-45)0WJ02LMSE算法(2)求B(k+1)的迭代式kJckkBBBBB1kkkkckkBXWBXWBB21(3-46)代入,得cc2kkkeBXW令,定义(3-49)kkckkeeBB1(3-50)(3-46)BXWBXWB21J利用梯度算法公式有:kJckk,102LMSE算法kkBBXXXXX#T1TkckckeXeXBX###(3)求W(k+1)的迭代式将(3-50)代入(3-47)式W=X#B有:kkckkkeeBXBXW##11kkkBXWXXXeXT1T#=0kckeXW#0kkkeBXW(3-49)kkckkeeBB1(3-50)02LMSE算法11#BXWkkkBXWekckkeXWW#1kkckkeeBB111#kkBXW总结:设初值B(1),各分量均为正值,括号中数字代表迭代次数。……W(k+1)、B(k+1)互相独立,先后次序无关。……求出B,W后,再迭代出下一个e,从而计算出新的B,W。11#BXWkkkBXWekkckkeeBB1或另一算法:先算B(k+1),再算W(k+1)。02LMSE算法3)模式类别可分性判别②如果e(k)0,表明XW(k)B(k)0,隐含有解。继续迭代,可使e(k)→0。③如果e(k)0(所有分量为负数或零,但不全为零),停止迭代,无解。此时若继续迭代,数据不再发生变化。可以证明:当模式类线性可分,且校正系数c满足时,该算法收敛,可求得解W。10c理论上不能证明该算法到底需要迭代多少步才能达到收敛,通常在每次迭代计算后检查一下XW(k)和误差向量e(k),从而可以判断是否收敛。①如果e(k)=0,表明XW(k)=B(k)0,有解。分以下几种情况:02LMSE算法111kkkBXWekkWW1kkee1kkBB111#kkBXW情况③分析:kkckkeeBB1e(k)002LMSE算法综上所述:只有当e(k)中有大于零的分量时,才需要继续迭代,一旦e(k)的全部分量只有0和负数,则立即停止。事实上,往往早在e(k)全部分量都达到非正值以前,就能看出其中有些分量向正值变化得极慢,可及早采取对策。通过反证法可以证明:在线性可分情况下,算法进行过程中不会出现e(k)的分量全为负的情况;若出现e(k)的分量全为负,则说明模式类线性不可分。4)LMSE算法描述(1)根据N个分属于两类的样本,写出规范化增广样本矩阵X。(2)求X的伪逆矩阵。T1T#XXXX02LMSE算法……(3)设置初值c和B(1),c为正的校正增量,B(1)的各分量大于零,迭代次数k=1。开始迭代:计算11#BXW(4)计算,进行可分性判别。kkkBXWe如果e(k)0,线性可分,若进入(5)可使e(k)→0,得最优解。如果e(k)0,线性不可分,停止迭代,无解,算法结束。如果e(k)=0,线性可分,解为W(k),算法结束。否则,说明e(k)的各分量值有正有负,进入(5)。02LMSE算法kckkeXWW#1kkckkeeBB1kkckkeeBB111#kkBXW(5)计算W(k+1)和B(k+1)。方法1:分别计算方法2:先计算再计算迭代次数k加1,返回(4)。3.算法特点(1)算法尽管略为复杂一些,但提供了线性可分的测试特征。(2)同时利用N个训练样本,同时修改W和B,故收敛速度快。(3)计算矩阵复杂,但可用迭代算法计算。1TXX02LMSE算法例3.11已知两类模式训练样本:TT11,0,0,0:TT21,1,0,1:1x2x01211试用LMSE算法求解权向量。111101110100X解:(1)写出规范化增广样本矩阵:02LMSE算法Aij是aij的代数余子式,注意两者的行和列的标号互换。T1T#XXXX(2)求伪逆矩阵422221212111101110100111110101100TXX*11AAA求逆矩阵:333231232221131211aaaaaaaaaA332313232212312111*AAAAAAAAAA若,则|A|——A的行列式A*——A的伴随矩阵02LMSE算法422221212TXX划去aij所在的行和列的元素,余下元素构成的行列式做aij的余子式,记作Mij,将叫做元素aij的代数余子式。例:代数余子式定义:ijijAMji1-323112113231121132231-aaaaaaaaA322240204413222402041T1TXXXX44884416422221212TXX行列式:333231232221131211aaaaaaaaaA*11AAA02LMSE算法1113222222224111111010110032224020441#X1024084111111113222222224111#BXW(3)取和c=1开始迭代:T1,1,1,11B.0000111111111111102111101110100111BXWe121xdX解为W(1),判断函数为:T1T#XXXX02LMSE算法图示如下:1x2x0120.511121xdX02LMSE算法例3.12

1 / 27
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功