模式识别谭超电气与自动化工程学院tanchao@tju.edu.cnPage2第二章贝叶斯分类器模式识别的分类问题就是根据待识客体的特征向量值及其它约束条件将其分到某个类别中去。贝叶斯决策理论是处理模式分类问题的基本理论之一。采用贝叶斯分类器必须满足下列两个先决条件:①要决策分类的类别数是一定的;②各类别总体的概率分布是已知的。2.1最小错误率贝叶斯决策12PPxxx1212xPage3贝叶斯公式:iiipPPpxxx1122pPpPppxxxx12x将不等式两边的分母消去:1122pPpPxx12xPage4推广到c类情况,最小错误率贝叶斯决策规则为:(1)后验概率形式ijPPxx1,2,3,,jjic;ix(2)类条件概率密度形式iijjpPpPxxixPage5例2.1有一家医院为了研究癌症的诊断,对一大批人作了一次普查,给每人打了试验针,然后进行统计,得到如下统计数字:①这批人中,每1000人有5个癌症病人;②这批人中,每100个正常人有1人对试验的反应为阳性;③这批人中,每100个癌症病人有95人对试验的反应为阳性。正常人用类表示,癌症病人用类表示。以试验结果作为特征,特征值为阳(+)或阴(-)。根据统计数字,得到如下概率:10.995P20.005P10.01p10.99p20.95p20.05p-12Page6王某试验结果为阳性(+),诊断结果是什么?111122220.010.9950.009950.950.0050.00475pPpPpPpPxx1122pPpPxx1x王某属正常人。应用贝叶斯决策规则对模式进行分类的分类器称为贝叶斯分类器。Page7对于c类分类问题,通常定义c个判别函数12,idxic,,,12iidPicxx,,,12iiidpPicxx,,,①②决策规则可写为:12ijddjcjixx,,,;ix决策域Ri与Rj是相邻的,则分割这两个决策域的决策边界方程应满足:ijddxxPage8一般的说,模式x为一维时,决策为一分界点;x为二维时决策边界为一曲线;x为三维时,决策边界为一曲面;为维n时(n3)时,决策边界为一超曲面。图2.1贝叶斯分类器的结构Page92.2最小风险贝叶斯决策11111220.010.99567.7%0.010.9950.950.005pPPpPpP该人属正常人的概率为67.7%,换句话说,他属癌症病人的概率为32.2%。风险是什么?条件风险定义为:将模式判属某类所造成的损失的条件数学期望。Page10仍以细胞识别为例。假定:模式x本属正常类而判属正常类所造成的损失为L11;模式x本属癌变类而判属正常类所造成的损失为L21;模式x本属正常类而判属癌变类所造成的损失为L12;模式x本属癌变类而判属癌变类所造成的损失为L22。根据条件风险的定义,将模式x判属正常类w1的条件风险为将模式x判属w1类所造成的损失的条件数学期望:1111212rLPLPxxx同理,将模式x判属癌变类w2的条件风险为:2121222rLPLPxxxPage11根据条件风险的大小来决策111212121222LPLPLPLPxxxx12x利用贝叶斯公式,上面的决策规则改写为:1122112211211222pPpPpPpPLLLLppppxxxxxxxx1111212212112222LpPLpPLpPLpPxxxx12xPage12将两类情况推广到c类情况:①后验概率形式②类条件概率密度形式决策规则为:1cikikkrLPxx1cikikkkrxLpxPijrrxx1,2,3,.........;jcjiixPage13例2.2在例2.1条件的基础上,令L11=0,L21=3,L12=1,L22=0按最小风险贝叶斯决策为王某诊断。计算条件风险:1111121222121122220.013250.00995rLpPLpPrLpPLpPxxxxxx12rrxx2x采用最小风险贝叶斯决策,各种损失的确定很关键。一定要客观地分析错判所造成的严重程度,确定恰当的损失值。Page14两种贝叶斯决策规则之间的关系,以两类问题为例加以分析。最小错误率贝叶斯决策规则可写为:1221pPpPxx12x其中,在统计学中称为似然比,不等号右边的值称为似然比阈值。12plpxxx假定错误决策总是比正确决策所造成的损失要大,即L12L11,L22L21,最小风险贝叶斯决策规则为:121222212111pLLPpLLPxx12xPage152.3贝叶斯分类器的错误率在分类器设计出来后,通常总是以错误率评价其性能。在模式识别的理论和实践中错误率是非常重要的参数。所谓错误率是指平均错误率,以P(e)来表示,其定义为:,PePedPePdxxxxx对于两类问题,整个模式空间划分为两个决策域R1和R2。假设我们采用最小错误率贝叶斯决策。21PPePxxx1221PPPPxxxx当Page161221RRPePpdPpdxxxxxx122211RRpPdpPdxxxx122211RRPpdPpdxxxx2211PPePPe这样就有图2.2贝叶斯分类器的错误率Page171.一种特殊情况下的错误率的理论计算假设为两类情况,模式服从正态分布,而且两类的协方差矩阵相等,即111112211exp22TnpCCxxmxm122212211exp22TnpCCxxmxm1221pPpPxx12x根据Page18两边取负对数,进一步改写为:1122lnlnlnPppPxx12x令,称负对数似然比,则决策规则简化为:12lnlnhppxxxhx12lnPtPhtx12x1222tRPepdphdhxx1112tRPepdphdhxxPage19H(x)可写为12lnlnhppxxx11111ln2ln222Tn-C-Cxmxm12211ln2ln222TnCCxmxm11121112212TTTCCCmmxmmmmH(x)服从一维正态分布,即1ph11N,2ph22N,Page20111112111122112121E()/212TTTThCCCCxmmmmmmmmmmm22121111212E2ThCxmmmm122121212TEhCxmmmm221222212122TEhCxmmmm1121212TCmmmm1令:得,Page212111212211exp2212exp2ttthPephdhdhd2221212211exp2212exp2ttthPephdhdhdPage22图2.3概率密度函数2.错误率的估计如果先验概率P(wi)未知,错误率的估计值等于被错分的样本数目与样本总数之比,即^NPage231NNPCln()01PN^N如果先验概率P(wi)已知2121211iiiiiNNiiiPPPC,^iiiN^2^^'11221iiiiPPPN总的错误率估计为Page242.4聂曼——皮尔逊决策条件:采用拉格朗日乘子法求解条件极值问题,按拉格朗日乘子法建立数学模型:20Pe120PePe211RPepdxx1220RPepdxx=21121-RRpdpdxxxx10211Rppdxxx根据:得:Page25由:决策规则可写为21ppxx12ppxx1x同理:20121Rppdxxx12ppxx12ppxx2x综合起来得到:12ppxx12xPage260x确定值:12ppxx例2.3一个两类问题,模式分布为二维正态,其分布参数,,。11,0Tm21,0Tm12CCI200.046Pe假定,求聂曼——皮尔逊决策阈值。11111exp22Tpxxxmm221211exp122xx22211exp22Tpxxxmm221211exp122xxPage27112exp2pxpxx故得决策边界为:1exp2x11ln2x图2.4决策边界将模式空间分割为两个决策域Page28122RPepdxx221ln1221211exp22xxdxdx21ln12111exp22xdx不同的值时,可求得的值2Pe表2-1Page292.5均值向量和协方差矩阵的估计均值向量定义xEpdmxxxx^11NjjNmx111212122212nnnnnnccccccCccc,TlkllkkllkklklkcExmxmxmxmpxxdxdx协方差矩阵为Page30协方差矩阵写成向量形式为EE2ETTTTTTCxmxmxxxmmmxxmm协方差矩阵的估计量为^11()NjjTTjCNxxmm向量和协方差矩阵的估计量的迭代