信息与通信工程学院信息与通信工程学院信息与通信工程学院信息与通信工程学院模式识别模式识别模式识别模式识别实验报告实验报告实验报告实验报告班级:2009211125姓名:周游学号:09210690序号:27日期:2011年12月第2页实验一、BayesBayesBayesBayes分类器设计一、一、一、一、实验目的实验目的实验目的实验目的对模式识别有一个初步的理解,能够根据自己的设计对贝叶斯决策理论算法有一个深刻地认识,理解二类分类器的设计原理。二、二、二、二、实验原理实验原理实验原理实验原理最小风险贝叶斯决策可按下列步骤进行:(1)在已知)(iPω,)(iXPω,i=1,…,c及给出待识别的X的情况下,根据贝叶斯公式计算出后验概率:∑==cjiiiiiPXPPXPXP1)()()()()(ωωωωωj=1,…,x(2)利用计算出的后验概率及决策表,按下面的公式计算出采取ia,i=1,…,a的条件风险∑==cjjjiiXPaXaR1)(),()(ωωλ,i=1,2,…,a(3)对(2)中得到的a个条件风险值)(XaRi,i=1,…,a进行比较,找出使其条件风险最小的决策ka,即()()1,minkiiaRaxRax==⋯则ka就是最小风险贝叶斯决策。第3页三、三、三、三、实验内容实验内容实验内容实验内容假定某个局部区域细胞识别中正常(1ω)和非正常(2ω)两类先验概率分别为正常状态:P(1ω)=0.9;异常状态:P(2ω)=0.1。现有一系列待观察的细胞,其观察值为x:-3.9847-3.5549-1.2401-0.9780-0.7932-2.8531-2.7605-3.7287-3.5414-2.2692-3.4549-3.0752-3.99342.8792-0.97800.79321.18823.0682-1.5799-1.4885-0.7431-0.4221-1.11864.2532已知类条件概率是的曲线如下图:-6-4-2024600.10.20.30.40.50.60.70.8)|(1ωxp)|(2ωxp类条件概率分布正态分布分别为N(-2,0.25)、N(2,4)第4页试对观察的结果进行分类。四、四、四、四、实验步骤实验步骤实验步骤实验步骤1.用matlab完成基于最小错误率的贝叶斯分类器的设计,要求程序相应语句有说明文字,要求有子程序的调用过程。2.根据例子画出后验概率的分布曲线以及分类的结果示意图。3.如果是最小风险贝叶斯决策,决策表如下:最小风险贝叶斯决策表:状态决策1ω2ωα106α210请重新设计程序,画出相应的后验概率的分布曲线和分类结果,并比较两个结果。五、五、五、五、实验程序实验程序实验程序实验程序1.最小错误率贝叶斯决策����分类器设计x=[-3.9847-3.5549-1.2401-0.9780-0.7932-2.8531-2.7605-3.7287-3.5414-2.2692-3.4549-3.0752第5页-3.99342.8792-0.97800.79321.18823.0682-1.5799-1.4885-0.7431-0.4221-1.11864.2532]pw1=0.9;pw2=0.1e1=-2;a1=0.5e2=2;a2=2m=numel(x)%得到待测细胞个数pw1_x=zeros(1,m)%存放对w1的后验概率矩阵pw2_x=zeros(1,m)%存放对w2的后验概率矩阵results=zeros(1,m)%存放比较结果矩阵fori=1:m%计算在w1下的后验概率pw1_x(i)=(pw1*normpdf(x(i),e1,a1))/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))%计算在w2下的后验概率pw2_x(i)=(pw2*normpdf(x(i),e2,a2))/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))end第6页fori=1:mifpw1_x(i)pw2_x(i)%比较两类后验概率result(i)=0%正常细胞elseresult(i)=1%异常细胞endenda=[-5:0.05:5]%取样本点以画图n=numel(a)pw1_plot=zeros(1,n)pw2_plot=zeros(1,n)forj=1:npw1_plot(j)=(pw1*normpdf(a(j),e1,a1))/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))%计算每个样本点对w1的后验概率以画图pw2_plot(j)=(pw2*normpdf(a(j),e2,a2))/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))第7页endfigure(1)holdonplot(a,pw1_plot,'b^-',a,pw2_plot,'m*-')fork=1:mifresult(k)==0plot(x(k),-0.1,'b^')%正常细胞用^表示elseplot(x(k),-0.1,'m*')%异常细胞用*表示end;end;legend('正常细胞后验概率曲线','异常细胞后验概率曲线')xlabel('样本细胞的观察值')ylabel('后验概率')title('后验概率分布曲线')gridonreturn;第8页����实验内容仿真实验内容仿真实验内容仿真实验内容仿真x=[-3.9847,-3.5549,-1.2401,-0.9780,-0.7932,-2.8531,-2.7605,-3.7287,-3.5414,-2.2692,-3.4549,-3.0752,-3.9934,2.8792,-0.9780,0.7932,1.1882,3.0682,-1.5799,-1.4885,-0.7431,-0.4221,-1.1186,4.2532]disp(x)pw1=0.9pw2=0.1[result]=bayes(x,pw1,pw2)2.2.2.2.最小风险贝叶斯决策����分类器设计分类器设计分类器设计分类器设计x=[-3.9847-3.5549-1.2401-0.9780-0.7932-2.8531-2.7605-3.7287-3.5414-2.2692-3.4549-3.0752-3.99342.8792-0.97800.79321.18823.0682-1.5799-1.4885-0.7431-0.4221-1.11864.2532]pw1=0.9;pw2=0.1m=numel(x)%得到待测细胞个数R1_x=zeros(1,m)%存放把样本X判为正常细胞所造成的整体损失第9页R2_x=zeros(1,m)%存放把样本X判为异常细胞所造成的整体损失result=zeros(1,m)%存放比较结果e1=-2a1=0.5e2=2a2=2%类条件概率分布px_w1:(-2,0.25)px_w2(2,4)r11=0r12=1r21=6r22=0%风险决策表fori=1:m%计算两类风险值R1_x(i)=r11*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))+r21*pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))R2_x(i)=r12*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*nor第10页mpdf(x(i),e2,a2))+r22*pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))endfori=1:mifR2_x(i)R1_x(i)%第二类比第一类风险大result(i)=0%判为正常细胞(损失较小),用0表示elseresult(i)=1%判为异常细胞,用1表示endenda=[-5:0.05:5]%取样本点以画图n=numel(a)R1_plot=zeros(1,n)R2_plot=zeros(1,n)forj=1:nR1_plot(j)=r11*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2第11页*normpdf(a(j),e2,a2))+r21*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))R2_plot(j)=r12*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))+r22*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))%计算各样本点的风险以画图endfigure(1)holdonplot(a,R1_plot,'b^-',a,R2_plot,'m*-')fork=1:mifresult(k)==0plot(x(k),-0.1,'b^')%正常细胞用上三角表示elseplot(x(k),-0.1,'m*')%异常细胞用*表示end;第12页end;legend('正常细胞后验概率曲线','异常细胞后验概率曲线')xlabel('细胞分类结果')ylabel('条件风险')title('风险判决曲线')gridonreturn����实验内容仿真实验内容仿真实验内容仿真实验内容仿真x=[-3.9847-3.5549-1.2401-0.9780-0.7932-2.8531-2.7605-3.7287-3.5414-2.2692-3.4549-3.0752-3.99342.8792-0.97800.79321.18823.0682-1.5799-1.4885-0.7431-0.4221-1.11864.2532]disp(x)pw1=0.9pw2=0.1[R1_x,R2_x,result]=danger(x,pw1,pw2)第13页六、六、六、六、实验分析实验分析实验分析实验分析1.最小错误率贝叶斯决策后验概率曲线与判决结果在一张图上:后验概率曲线如图所示,带*的红色曲线为判决成异常细胞的后验概率曲线;另一条带三角的蓝色曲线为判为正常细胞的后验概率曲线。根据最小错误概率准则,判决结果见曲线下方,其中“上三角”代表判决为正常细胞,“*”代表异常细胞。各细胞分类结果:0000000000000101110001010为判成正常细胞,1为判成异常细胞第14页2.2.2.2.最小风险贝叶斯决策后验概率曲线与判决结果在一张图上:后验概率曲线如图所示,带*的红色曲线为判决成异常细胞的后验概率曲线;另一条带三角的蓝色曲线为判为正常细胞的后验概率曲线。根据贝叶斯最小风险判决准则,判决结果见曲线下方,其中“上三角”代表判决为正常细胞,“*”代表异常细胞各细胞分类结果:第15页100010010000110111001101其中,0为判成正常细胞,1为判成异常细胞3.3.3.3.比较分析由最小错误率的贝叶斯判决和基于最小风险的贝叶斯判决得出第16页的图形中的分类结果可以看出,样本-3.9934、-3.9847、-3.7287、-0.7932、-0.7431在前者中被分为“正常细胞”,在后者中被分为“异常细胞”,分类结果截然不同。因为在给予最小风险的贝叶斯判决中,影响决策结果的因素多了一个“损失”。可以看出,在图1中,这两个样本点下两类决策的后验概率相差很小,当结合最小风险贝叶斯决策表进行计算时,“损失”就起了主导作用,导致出现了相反的结果。另外,最小错误率贝叶斯决策就是在0-1损失函数