模糊C均值聚类

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

主讲:周润景教授单位:电子信息工程学院模糊C均值聚类目录模糊C均值聚类应用背景模糊C均值算法模糊C均值聚类的MATLAB实现模糊C均值聚类结果分析一.模糊C均值聚类应用背景传统的聚类分析是一种硬划分(CrispPartition),它把每个待辨识的对象严格地划分到某类中,具有“非此即彼”的性质,因此这种类别划分的界限是分明的。然而实际上大多数对象并没有严格的属性,它们在性质和类属方面存在着中介性,具有“亦此亦彼”的性质,因此适合进行软划分。Zadeh提出的模糊集理论为这种软划分提供了有力的分析工具,人们开始用模糊方法来处理聚类问题,并称之为模糊聚类分析。模糊聚类得到了样本属于各个类别的不确定性程度,表达了样本类属的中介性,建立起了样本对于类别的不确定性的描述,能更客观地反映现实世界,从而成为聚类分析研究的主流。在基于目标函数的聚类算法中模糊C均值(FCM,FuzzyC—Means)类型算法的理论最为完善,应用最为广泛。二.模糊C均值算法1.模糊C均值聚类的准则设是n个样本组成的样本集合,c为预定的类别数目,是第i个样本对于第j类的隶属度函数。用隶属度函数定义的聚类损失函数可以写为其中,b1,是一个可以控制聚类结果的模糊程度的常数。在不同的隶属度定义方法下最小化聚类损失函数,就得到不同的模糊聚类方法。其中最有代表性的是模糊C均值方法,它要求一个样本对于各个聚类的隶属度之和为1,即:),...,2,1(nixi)(ijx211)(jibcjniijfmxxJnixcjij,...,2,11)(1二.模糊C均值算法2.模糊C均值算法步骤(1)设定聚类数目c和加权指数b:J.C.Bezdek根据经验,认为b取2最合适。Cheung和Chen从汉字识别的应用背景得出b的最佳取值应在1.25~1.75之间。Bezdek和Hathaway等人从算法收敛性角度着手,得出b的取值与样本数目n有关的结论,建议b的取值要大于n/(n2)。Pal等人从聚类有效性方面的实验研究得到b的最佳选取区间为[1.5,2.5],在不做特殊要求下可取区间中值b=2。二.模糊C均值算法(2)初始化各个聚类中心:式中,Ni是第i聚类中的样本数目。(3)重复下面的运算,直到各个样本的隶属度值稳定:用当前的聚类中心根据下式计算隶属度函数:imiyiiyNm1ckbkibjiijmxmxx11/121/12)/1()/1()(i二.模糊C均值算法用当前的隶属度函数按下式更新计算各类聚类中心:当模糊C均值算法收敛时,就得到了各类的聚类中心和各个样本对于各类的隶属度值,从而完成了模糊聚类划分。如果需要,还可以将模糊聚类结果进行解模糊,即用一定的规则把模糊聚类划分转化为确定性分类。nibijniibijjxxxm11)()(三.模糊C均值聚类的MATLAB实现1.重要程序代码这里对酒瓶颜色进行分类。下面介绍其重要程序代码:1)MATLAB模糊C均值数据聚类识别函数在MATLAB中(b=2),只要直接调用如下程序即可实现模糊C均值聚类:[Center,U,obj_fcn]=fcm(data,cluster_n)data:要聚类的数据集合,每一行为一个样本;cluster_n:聚类数;Center:最终的聚类中心矩阵,每一行为聚类中心的坐标值;U:最终的模糊分区矩阵;obj_fcn:在迭代过程中的目标函数值。三.模糊C均值聚类的MATLAB实现注意:在使用上述方法时,要根据中心坐标Center的特点分清楚每一类中心所代表的实际中的哪一类,然后才能准确地将待聚类的各方案准确地分为各自所属的类别;否则,就会出现张冠李戴的现象。2)MATLAB图形显示聚类模式使用命令[center,U,obj_fcn]=fcm(data,4)进行聚类后,可调用MATLAB图形窗口显示聚类结果,命令格式如下:maxU=max(U);%最大隶属度index1=find(U(1,:)==maxU)%找到属于第一类的点index2=find(U(2,:)==maxU)%找到属于第二类的点index3=find(U(3,:)==maxU)%找到属于第三类的点index4=find(U(4,:)==maxU)%找到属于第四类的点三.模糊C均值聚类的MATLAB实现为了提高图形的区分度,添加如下命令:line(data(index1,1),data(index1,2),data(index1,3),'linestyle','none','marker','*','color','g');line(data(index2,1),data(index2,2),data(index2,3),'linestyle','none','marker','*','color','r');line(data(index3,1),data(index3,2),data(index3,3),'linestyle','none','marker','+','color','b');line(data(index4,1),data(index4,2),data(index4,3),'linestyle','none','marker','+','color','y');三.模糊C均值聚类的MATLAB实现2.MATLAB实现模糊C均值聚类完整程序clearall;data=[1739.941675.152395.96373.33087.052429.471756.7716521514.98864.451647.312665.9222.853059.542002.33877.882031.663071.181803.581583.122163.052352.122557.041411.53401.33259.942150.98363.343477.952462.861571.171731.041735.33104.83389.832421.83499.853305.752196.22三.模糊C均值聚类的MATLAB实现2297.283340.14535.622092.623177.21584.321418.791775.892772.91845.591918.812226.492205.363243.741202.692949.163244.44662.421692.621867.52108.971680.671575.781725.12802.883017.111984.98172.783084.492328.652063.543199.761257.211449.581641.583405.121651.521713.281570.38341.593076.622438.63291.023095.682088.95237.633077.782251.96三.模糊C均值聚类的MATLAB实现1702.81639.792068.741877.931860.961975.3867.812334.682535.11831.491713.111604.68460.693274.772172.992374.983346.98975.312271.893482.97946.71783.641597.992261.31198.833250.452445.081494.632072.592550.511597.031921.522126.761598.931921.081623.331243.131814.073441.072336.312640.261599.633543300.122373.612144.472501.62591.51三.模糊C均值聚类的MATLAB实现426.313105.292057.81507.131556.891954.51343.073271.722036.942201.943196.22935.532232.433077.871298.871580.11752.072463.041962.41594.971835.951495.181957.443498.021125.171594.392937.7324.223447.312145.011269.071910.722701.971802.071725.811966.351817.361927.42328.791860.451782.881875.13];[center,U,obj_fcn]=fcm(data,4);plot3(data(:,1),data(:,2),data(:,3),'o');三.模糊C均值聚类的MATLAB实现grid;maxU=max(U);index1=find(U(1,:)==maxU)index2=find(U(2,:)==maxU)index3=find(U(3,:)==maxU)index4=find(U(4,:)==maxU)line(data(index1,1),data(index1,2),data(index1,3),'linestyle','none','marker','*','color','g');line(data(index2,1),data(index2,2),data(index2,3),'linestyle','none','marker','*','color','r');line(data(index3,1),data(index3,2),data(index3,3),'linestyle','none','marker','+','color','b');line(data(index4,1),data(index4,2),data(index4,3),'linestyle','none','marker','+','color','y');title('模糊C均值聚类分析图');xlabel('第一特征坐标');ylabel('第二特征坐标');zlabel('第三特征坐标');四.模糊C均值聚类结果分析运行MATLAB程序,数据的模糊C均值聚类分析数据如下:Iterationcount=1,obj.fcn=28484303.583307Iterationcount=2,obj.fcn=22894174.219903Iterationcount=3,obj.fcn=22492974.034424Iterationcount=4,obj.fcn=20879539.602697Iterationcount=5,obj.fcn=14444987.068964Iterationcount=6,obj.fcn=8322567.664727Iterationcount=7,obj.fcn=7551351.839018Iterationcount=8,obj.fcn=7439273.677928Iterationcount=9,obj.fcn=7421451.003657Iterationcount=10,obj.fcn=7417960.721127Iterationcount=11,obj.fcn=7417133.213718Iterationcount=12,obj.fcn=7416918.432660Iterationcount=13,obj.fcn=7416860.845351Iterationcount=14,obj.fcn=7416845.240472Iterationcount=15,obj.fcn=7416840.997724四.模糊C均值聚类结果分析Iterationcount=16,obj.fcn=7416839.842995Iterationcount=17,obj.fcn=7416839.

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功