不确定性推理--可信度方法内容简介一.不确定性推理的基本概念与原理二.可信度方法的基本模型和三个扩展方法基本概念--不确定性推理的定义从不确定性的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。事实和知识是构成推理的两个基本要素。已知事实称为证据(E),用以指出推理的出发点及推理时应该使用的知识;而知识是推理得以向前推进,并逐步达到最终目标(H)的依据。基本概念--一些基本问题1.不确定性的表示与量度a.知识不确定性的表示制定表示方法时需要考虑:一是要能根据领域问题的特征把其不确定性比较准确地描述出来,满足问题求解的需要;另一是要便于推理过程中对不确定性的推算。一般由领域专家给出,称为知识的静态强度。静态强度可以是相应知识在应用中成功的概率,也可以是该条知识的可信程度或其他。基本概念--一些基本问题b.证据的不确定性的表示证据来源于用户在求解问题时提供的初始证据或者在推理中用前面推出的结论作为当前推理的证据。证据的不确定性称为动态强度。不管怎么表示,通常证据的不确定性表示方法与知识的不确定性表示方法保持一致,以便于推理过程中对不确定性进行统一的处理。基本概念--一些基本问题c.不确定性的量度不确定性的程度是不同的,需要用数值表示其确切程度,当然也要事先规定它的取值范围,这样在推理中计算不确定性才有意义,是定量的。(例如MYCIN专家系统中可信度取值范围为[-1,1]等)基本概念--一些基本问题2.不确定性匹配算法及阈值的选择问题:知识所要求的不确定性程度与证据实际具有的不确定性程度不一定相同,那么如何匹配才算成功?解决办法:设计一个算法用来计算匹配双方相似的程度,另外再指定一个相似的“程度”,用来衡量匹配双方相似的程度是否落在指定的限度内。这个限度就是阈值。基本概念--一些基本问题3.组合证据不确定性的算法在基于产生式规则的系统中,知识的前提条件既可以是简单条件,也可以是用AND或OR把多个简单条件连接起来构成的复合条件。这组复合条件对应于一组证据,就称为组合证据。目前有三种计算组合证据不确定性的方法:a.最大最小方法T(E1ANDE2)=min{T(E1),T(E2)}T(E1ORE2)=max{T(E1),T(E2)}b.概率方法T(E1ANDE2)=T(E1)*T(E2)T(E1ORE2)=T(E1)+T(E2)-T(E1)*T(E2)c.有界方法T(E1ANDE2)=max{0,T(E1)+T(E2)-1}T(E1ORE2)=min{1,T(E1)+T(E2)}注:T(E)表示证据E为真的程度,如可信度、概率等。基本概念--一些基本问题4.不确定性的传递算法不确定性程度由用户提供的证据中给出,通过推理过程中运用的知识(其本身也有不确定性程度)传递到结论,而结论又可以作为新的证据供以后推理用,这样不确定性程度依次传递,到最终结论。5.结论不确定性的合成当用不同的知识进行推理得到了相同的结论,但不确定性的程度却不同,这样就需要对这些不确定性程度进行合成。(注意:如果推出的结论不同就产生冲突,无法进行合成)基本概念--不确定性推理方法的分类沿着两条路线发展:一是模型方法,与控制策略无关;二是控制方法,没有统一模型,依赖于控制策略。我们只讨论模型方法。模型方法分为数值方法和非数值方法。对数值方法又可分为基于概率的方法和基于模糊理论的模糊推理。现在人们在纯概率方法上发展了一些新理论和方法,主要有可信度方法、证据理论和主观Bayes方法等。下面主要介绍可信度方法。可信度方法--概念根据经验对一个事物或现象为真的相信程度称为可信度。可信度带有较大的主观性和经验性。可信度方法是一个集合,其中C-F模型是基本方法,然后通过加入一些可行的因子发展出其他方法。可信度方法--C-F模型1.知识不确定性的表示知识是用产生式规则来表示的,形式为:IFETHENH(CF(H,E))说明:a.E是知识的前提条件,可以是简单条件也可以是复合条件。如:E=E1ANDE2ANDE3或E=E1ORE2或E=E1AND(E2ORE3)etc.可信度方法--C-F模型b.H是结论,可以是单一的也可以是多个的,就如上述前提条件。c.CF(H,E)是该条知识的可信度,称为可信度因子(CertaintyFactor),相当于静态强度。表示E对应的证据为真时对结论H为真的支持程度(联系程度),其值越大就越支持H为真。例如:IF发热38°以上AND四肢关节疼痛无力AND胸闷咳嗽THEN患SARS(0.7)表示病人如有上述症状则有七成把握认为他患SARS可信度方法--C-F模型定义:CF(H,E)=MB(H,E)-MD(H,E),其中CF(H,E)∈[-1,1]MB(MeasureBelief)--信任增长度,表示因与E匹配的证据的出现,使H为真的信任增长度。可信度方法--C-F模型MD(MeasureDisbelief)--不信任增长度。表示与E匹配的证据的出现,对H的不信任增长度。(注:P(H)表示H的先验概率,P(H/E)是条件概率)上面两条公式的实际意义如下:MB:因E而对H信任的增长/不相信H的概率MD:因E而对H信任的减少/相信H的概率并有0≤MB(H,E)≤1,0≤MD(H,E)≤1可信度方法--C-F模型对上述公式作如下分析:I.当MB(H,E)0时--P(H/E)P(H).由于E的证据的出现增加了对H的信任程度。II.当MD(H,E)0时--P(H/E)P(H).由于E的证据的出现增加了对H的不信任程度。同一个证据不可能既增加对H的信任程度,又增加对H的不信任程度。所以MB(H,E)与MD(H,E)是互斥的。即:MB(H,E)0时,MD(H,E)=0MD(H,E)0时,MB(H,E)=0可信度方法--C-F模型IV.根据CF(H,E)的定义及MB(H,E)和MD(H,E)的互斥性,可得到CF(H,E)的计算公式:可信度方法--C-F模型V.由CF(H,E)计算公式可知其意义:若CF(H,E)0,则P(H/E)P(H).也有CF(H,E)↑=H为真的可信度↑。若CF(H,E)0,则P(H/E)P(H).也有CF(H,E)↓=H为假的可信度↑。若CF(H,E)=0,则P(H/E)=P(H),即H与E独立,E的证据的出现与否均对H没有影响。可信度方法--C-F模型2.证据不确定性的表示I.在C-F模型中,证据的不确定性也是用可信度因子表示的。如CF(E)=0.5II.来源:作为初始证据,其值由用户给出;由先前推出的结论作为当前推理的证据,其值通过传递算法计算得到。III.值域:当0CF(E)1时,表示证据以某种程度为真。当-1CF(E)0时,表示它以某种程度为假。当CF(E)=0时,表示无法知道它的真假。IV.CF(H,E)和CF(E)的区别:静态强度CF(H,E)表示知识的强度,即E为真时对H的影响程度。动态强度CF(E)表示证据的不确定性程度。可信度方法--C-F模型3.组合证据不确定性的算法当组合证据是多个单一证据的合取时,即E=E1ANDE2AND…ANDEn则有CF(E)=min{CF(E1),CF(E2),…,CF(En)}当组合证据是多个单一证据的析取时,即E=E1ORE2OR…OREn则有CF(E)=max{CF(E1),CF(E2),…,CF(En)}可信度方法--C-F模型4.不确定性的传递算法CF(H)=CF(H,E)×max{0,CF(E)}其中H可作为E的证据来供下次推理使用,因而可信度由初始证据开始通过传递算法传递到最终结论。分析上式可知:若E为假时,CF(E)0-CF(H)=0。说明该模型没有考虑证据为假时对结论H所产生的影响。若E完全为真时,CF(E)=1-CF(H)=CF(H,E)。说明知识强度CF(H,E)实际上就是在前提条件对应的证据为真时结论H的可信度。可信度方法--C-F模型5.结论不确定性的合成算法当不同知识推出具有不同可信度的相同结论时,要将各结论H的可信度进行合成。(注:推出不同结论时将出现冲突,后面会讲解决办法)设有如下两条知识:IFE1THENH(CF(H,E1))IFE2THENH(CF(H,E2))合成步骤:I.分别对每一条知识求出各自的CF(H):CF1(H)=CF(H,E1)×max{0,CF(E1)}CF2(H)=CF(H,E2)×max{0,CF(E2)}II.用以下公式求合成CF1,2(H)可信度方法--C-F模型如果是三个或以上的结论合成,那么就将某两个先合成,得到的CF1,2(H)再与CF3(H)运用上式合成,这样不断循环直至全部合成完毕。可信度方法--带有阈值限度的不确定性推理在C-F模型上添加阈值限度λ,用以限制不合要求的证据和对应的知识的运用。1.知识不确定性的表示在带有阈值限度的不确定性推理中,知识用下述公式表示:IFETHENH(CF(H,E),λ)说明:可信度方法--带有阈值限度的不确定性推理I.CF(H,E)的取值范围是(0,1]。取消了不信任增长度MD(H,E)对知识可信度的影响。只表示知识为真的可信程度。II.λ是阈值。它对相应知识的可应用性规定了一个限度,只有当支持前提条件E的证据的可信度CF(E)≥λ时,相应的知识才有可能被应用。λ取值范围为:0λ≤1可信度方法--带有阈值限度的不确定性推理2.证据不确定性的表示证据可信度的取值范围也作了改变:0≤CF(E)≤1CF(E)=0时,表示该证据可信度无法得知。3.组合证据不确定性的算法与C-F模型一样。可信度方法--带有阈值限度的不确定性推理4.不确定性的传递算法当CF(E)≥λ时,结论H的可信度CF(H)由下式计算得到:CF(H)=CF(H,E)×CF(E)注:由于CF(E)≥0,所以用CF(E)与CF(H,E)“相乘”,而不是max{0,CF(E)};并且这里的“×”既可为“相乘”运算,也可为“取极小”或其他运算,要按实际情况定。(后面出现的“×”号均表示这个意思,不再赘述)可信度方法--带有阈值限度的不确定性推理5.结论不确定性的合成算法跟C-F模型相似,也是分两步完成。首先分别对每条知识求出它的CFi(H),(i=1,2,…,n),即:CFi(H)=CF(H,Ei)×CF(Ei)然后用以下方法中任一种求出合成可信度CF(H)(注:C-F模型只限于一条公式)I.求极大值法:可信度方法--带有阈值限度的不确定性推理II.加权求和法:CF(H,Ei)被看作权值III.有限和法:各结论H的可信度和不能大于1,否则CF(H)取1可信度方法--带有阈值限度的不确定性推理上式是加权求和法下式是有限和法可信度方法--带有阈值限度的不确定性推理IV.递推计算法:从CF1(H)开始,按知识被应用的顺序逐步进行递推。可用以下两条公式表示:令C1=CF(H,E1)×CF(E1)对任意的k1,当k=n时,Ck就是综合可信度CF(H)可信度方法--带有阈值限度的不确定性推理6.小结与C-F模型相比,不同之处有:a.多了一个阈值λ,只有CF(E)≥λ时,才能应用该知识b.知识的可信度值域为(0,1],证据的可信度值域为[0,1],而不是[-1,1].c.计算结论H可信度时用CF(H)=CF(H,E)×CF(E),而不是:CF(H)=CF(H,E)×max{0,CF(E)}d.结论H可信度的合成算法有多种选择,而不是C-F模型中只有一种。e.传递算法公式中的“×”号不仅表示乘法,也表示取极小或其他运算。可信度方法--加权的不确定性推理当知识的前提条件E是复合条件时(E=E1ANDE2AND…ANDEn),前面讨论的方法都默认要求E1、E2、…、En是彼此独立的,但现实情况不是这样,如:IF天气预报说有寒流来到本地AND气温急剧下降AND你感到有些冷THEN你应多穿衣服这里各子条件之间存在着依赖关系,如“气温急剧下降”依赖于“天气预报说有寒流来到本地”。