1第五章不确定性推理(Chapter5UncertaintyReasoning)董春游(ChunyouDong)PhD,ProfessorEmail:chunyoudong@126.comHeilongjianginstituteofScienceandTechnologyHarbin150027,China)March10,2006第一稿2012年6月1第五次修改稿人工智能ArtificialIntelligence逆概率方法要求给出结论Hi的先验概率P(Hi)以及证据Ej的条件概率P(Ej/Hi),这在实际中是相当困难的。杜达、哈特于1976年在Bayes公式的基础上提出了主观Bayes方法。主观Bayes方法知识不确定性的表示在主观Bayes方法中,知识是用产生式规则表示的,形式为:IFETHEN(LS,LN)H(P(H))(1)E是知识的前提条件(2)H是结论,P(H)是H的先验概率,其值是由领域专家根据以往的实践及经验给出。(3)LS称为充分性度量,用于指出E对H的支持程度,取值范围是[0,+∞),其定义为:(4)LN称为必要性度量,用于指出E对H的支持程度,即E对H为真的必要性程度,取值范围是[0,+∞),其定义为:LS、LN的值由领域专家给出。)H/E(P)H/E(PLS)H/E(P1)H/E(P1)H/E(P)H/E(PLN证据不确定性表示在主观Bayes方法中,证据的不确定性也是用概率表示的。在PROSPECTOR中,由于根据观察S直接求出P(E/S)非常困难,所以它采用了一种变通的方法,即引进了可信度C(E/S)的概念,用户可根据实际情况在[-5,5]中选取一个整数作为初始证据的可信度。可信度C(E/S)与概率P(E/S)的对应关系可用下式表示:C(E/S)=-5,表示在观察S下证据E肯定不存在,即P(E/S)=0;C(E/S)=0,表示在观察S与证据E无关,即P(E/S)=P(E);C(E/S)=5,表示在观察S下证据E肯定存在,即P(E/S)=1。P(E/S)-55P(E)C(E/S)组合证据不确定性的算法(1)对于组合证据E=E1ANDE2AND…ANDEn则P(E/S)=min{P(E1/S),P(E2/S),…,P(En/S)}(2)对于组合证据E=E1ORE2OR…OREn则P(E/S)=max{P(E1/S),P(E2/S),…,P(En/S)}(3)对于“非”运算P(E/S)=1-P(E/S)不确定性的传递算法在主观Bayes方法中,P(H)是专家对结论给出的先验概率,是在没有考虑任何证据时给出的,随着证据的获得,对H的信任度应有所改变,主观Bayes方法就是根据证据E的概率P(E)及LS、LN的值,把H的先验概率P(H)改为后验概率P(H/E)或P(H/E)。P(H)P(H/E)或P(H/E)P(E)LS,LN几率函数为了下面讨论方便,我们引入几率函数,它与概率的关系为:(x)=P(x)1-P(x)P(x)=(x)1+(x)(x)表示x的出现概率与不出现概率之比,显然随P(x)的加大(x)也加大,而且当P(x)=0时,有(x)=0当P(x)=1时,有(x)=∞于是,P(x)取值于[0,1],(x)取值于[0,∞]。下面就证据E存在的情况分几种情况介绍:1、证据肯定存在的情况证据E确定出现时,即P(E)=P(E/S)=1,由Bayes公式以上两式相除,得由LS的定义和几率公式,可得:(H/E)=LS×(H)表示证据肯定存在时,先验几率(H)更新为后验几率(H/E)的计算公式。)H(LS)H(P)H(P)H/E(P)H/E(P)E/H(P)E/H(P)E/H(P1)E/H(P)E/H(如果把几率换成概率,有表示证据肯定存在时,先验概率P(H)更新为后验概率P(H/E)的计算公式。由以上两式可以看出:(1)当LS1时,(H/E)(H),表明证据E的存在,将增大结论H为真的概率——E的存在对H为真是充分的,故为充分性度量。(2)当LS=1时,(H/E)=(H),表明证据E与结论H无关;(3)当LS1时,(H/E)(H),表明证据E的存在,将减小结论H为真的概率。(4)当LS=0时,(H/E)=0,表明证据E的存在,将使结论H为假。在领域专家为LS赋值时,证据E越支持H,LS越大。2、证据肯定不存在的情况证据E确定不出现时,即P(E)=P(E/S)=0,由Bayes公式:)E(P/)H(P)H/E(P)E/H(P)E(P/)H(P)H/E(P)E/H(P两式相除得)H(P)H(P)H/E(P)H/E(P)E/H(P)E/H(P由LN的定义和几率公式,可得:(H/E)=LN×(H)表示证据肯定不存在时,先验几率(H)更新为后验几率(H/E)的计算公式。如果把几率换成概率,有表示证据肯定不存在时,先验概率P(H)更新为后验概率P(H/E)的计算公式。由以上两式可以看出:(1)当LN1时,(H/E)(H),表明证据E不存在,将增大结论H为真的概率。(2)当LN=1时,(H/E)=(H),表明E与结论H无关;(3)当LN1时,(H/E)(H),表明证据E的不存在,将减小结论H为真的概率。(4)当LN=0时,(H/E)=0,表明证据E的不存在,将使结论H为假——E的存在对H为真是必要的,故为必要性度量。在领域专家为LN赋值时,证据E对H越必要,LN越小。由于E和E不可能同时支持H或同时反对H,所以在一条知识中LS和LN一般不应该出现以下情况:(1)LS1,LN1(2)LS1,LN1例5.3设有如下知识:R1:IFE1THEN(10,1)H1(0.03)R2:IFE2THEN(20,1)H2(0.05)R3:IFE3THEN(1,0.002)H3(0.3)求:当证据E1,E2,E3存在及不存在时,P(Hi/Ei)及P(Hi/Ei)的值各是多少?解:由于R1和R2中的LN=1,所以E1与E2不存在时对H1和H2不产生影响,即不需要计算P(H1/E1)和P(H2/E2),但因它们的LS1,所以在E1与E2存在时需要计算P(H1/E1)和P(H2/E2)。由于R3中的LS=1,所以E3存在时对H3不产生影响,不需要计算P(H3/E3),但因它的LN1,所以在E3不存在时需要计算P(H3/E3)。00086.013.0)1002.0(3.0002.01)H(P)1LN()H(PLN)3E/3H(P51.0)2E/2H(P24.0103.0)110(03.0101)H(P)1LS()H(PLS)1E/1H(P同理由此可见,由于E1的存在使H1为真的可能性增加到原来的8倍;由于E2的存在使H2为真的可能性增加到原来的10倍——更充分(LS=2010)。由此可见,由于E3的不存在使H3为真的可能性减少了350倍——很必要(LN=0.002);3、证据不确定的情况当证据E不确定时,即0P(E/S)1就不能用上面的公式计算后验概率,可用Duda于1976年给出的公式P(H/S)=P(H/E)×P(E/S)+P(H/E)×P(E/S)来计算出后验概率。这分为四种情况:④当P(E/S)为其它值时,通过分段线性插值的方法,就可以得到计算P(H/S)的公式P(E/S)01P(E)P(H/S)P(H)P(H/E)P(H/E)结论不确定性的合成算法若有n条规则都支持相同的结论,而且每条规则的前提条件所对应的证据Ei(i=1,2,…,n)都有相应的观察Si与之对应,此时只要先对每条规则分别求出)H()H()S/H()H()S/H()H()S/H()S,,S,S/H(n21n21例5.4设有如下知识:r1:IFE1THEN(2,0.001)H1r2:IFE2THEN(100,0.001)H1r3:IFH1THEN(200,0.01)H2已知:(H1)=0.1,(H2)=0.01C(E1/S1)=2,C(E2/S2)=1求:(H2/S1,S2)=?H2E1E2H1S1S2(200,0.01)(2,0.001)(100,0.001)C(E1/S1)=2C(E2/S2)=114.0878.0122.0)1S/1H(P1)1S/1H(P)1S/1H(122.0)09.017.0(09.0)1S/1E(C)]1H(P)1E/1H(P[)1H(P)1S/1H(P).1S/1H(PCP02)1S/1E(C17.01.0211.02)1H(1LS1)1H(1LS)1E/1H(1)1E/1H()1E/1H(P09.01.011.0)1H(1)1H()1H(P)1S/1H()1(:5251公式的后半部计算使用计算解476.0)1H()1H()2S/1H()1H()1S/1H()2S,1S/1H()2S,1S/1H()3(34.002541254.0)2S/1H(P1)2S/1H(P)2S/1H(254.0)09.091.0(09.0)2S/2E(C)]1H(P)2E/1H(P[)1H(P)2S/1H(P).2S/1H(PCP01)2S/2E(C91.01.010011.0100)1H(2LS1)1H(2LS)2E/1H(1)2E/1H()2E/1H(P09.0)1H(P)2S/1H()2(5151计算公式的后半部计算使用由上面的计算得知计算212.0175.01175.0)2S,1S/2H(P1)2S,1S/2H(P)2S,1S/2H(175.0165.001.0)01.067.0(01.0)2S,1S/2H(P67.001.0200101.0200)2H(3LS1)2H(3LS)1H/2H(1)1H/2H()1H/2H(P32.0)2S,1S/1H(1)2S,1S/1H()2S,1S/1H(P01.001.0101.0)2H(1)2H()2H(P)]2H(P)1H/2H(P[)1H(P1)1H(P)2S,1S/1H(P)2H(P)2S,1S/2H(P,EH)1H(P)2S,1S/1H(P)1H()2S,1S/1H(1.0)1H(,476.0)2S,1S/1H()2S,1S/2H()2S,1S/2H(P)4(09.0109.032.0476.1476.0即公式的后半部分选用即及计算H2的原先几率是0.01,运用知识后H2的后验几率是0.212,增加了20多倍。主观Bayes方法的特点主观Bayes方法是在概率论的基础上发展起来的,具有较完善的理论基础,且知识的输入转化为对LS和LN的赋值,这就避免了大量的数据统计工作,是一种比较实用且较灵活的不确定性推理方法。但是,它在要求专家给出LS和LN的同时,还要求给出先验概率P(H),而且要求事件间相互独立,这仍然比较困难,从页也就限制了它的应用。