第四章不确定性推理14.1概述不精确思维并非专家的习惯或爱好所至,而是客观现实的要求。很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一在人类的知识和思维行为中,精确性只是相对的,不精确性才是绝对的。知识工程需要各种适应不同类的不精确性特点的不精确性知识描述方法和推理方法。2在客观世界中,由于事物发展的随机性和复杂性,人类认识的不完全、不可靠、不精确和不一致性,自然语言中存在的模糊性和歧义性,使得现实世界中的事物以及事物之间的关系极其复杂,带来了大量的不确定性。大多数要求智能行为的任务都具有某种程度的不确定。不确定性可以理解为在缺少足够信息的情况下做出判断。3确定性推理是建立在经典逻辑基础上的经典逻辑的基础之一就是集合论这在很多实际情况中是很难做到的,如高、矮、胖、瘦就很难精确地分开。经典逻辑不适合用来处理不确定性。不确定推理是建立在非经典逻辑基础上的一种推理,它是对不确定性知识的运用与处理。不确定性推理就是从不确定性初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。4在专家系统中,不确定性表现在证据、规则和推理三个方面,需要对专家系统中的事实与规则给出不确定性描述,并在此基础上建立不确定性的传递计算方法。要实现对不确定性知识的表达,须解决:表示问题计算问题语义问题表示问题1表示问题指的是采用什么方法描述不确定性。通常有数值表示和非数值的语义表示方法。数值表示便于计算、比较;非数值表示,是一种定性的描述。在专家系统中的“不确定性”分为:知识的不确定性(E→H,f(H,E))它表示相应知识的不确定性程度,称为知识或规则强度。证据的不确定性(E,C(E))它表示证据E为真的程度。它有两种来源:初始证据(由用户给出);前面推出的结论作为当前证据(通过计算得到)。56计算问题2计算问题主要指不确定性的传播与更新,即获得新信息的过程。它是在领域专家给出的规则强度和用户给出的原始证据的不确定性的基础上,定义一组函数,求出结论的不确定性度量。它主要包括如下三个方面:(1)不确定性的传递算法已知规则的前提E的不确定性C(E)和规则强度f(H,E),求假设H的不确定性C(H),即定义函数f1,使得:C(H)=f1(C(E),f(H,E))7(2)结论不确定性合成即已知由两个独立的证据E1和E2,求得的假设H的不确定性度量C1(H)和C2(H),求证据E1和E2的组合导致的假设H的不确定性C(H),即定义函数f2,使得:C(H)=f2(C1(H),C2(H))(3)组合证据的不确定性算法已知证据E1和E2的不确定性度量C(E1)和C(E2),求证据E1和E2的析取和合取的不确定性,即定义函数f3和f4使得:C(E1∧E2)=f3(C(E1),C(E2))C(E1∨E2)=f4(C(E1),C(E2))语义问题38语义问题指上述表示和计算的含义是什么。如C(H,E)可理解为当前提E为真时,对结论H为真的一种影响程度,C(E)可理解为E为真的程度。处理不确定性问题的主要数学工具:概率论模糊数学概率论与模糊数学所研究和处理的是两种不同的不确定性。概率论研究和处理随机现象,事件本身有明确的含义,只是由于条件不充分,使得在条件和事件之间不能出现决定性的因果关系(随机性)。模糊数学研究和处理模糊现象,概念本身就没有明确的外延,一个对象是否符合这个概念是难以确定的(属于模糊的)。无论采用什么数学工具和模型,都需要对规则和证据的不确定性给出度量。4.2主观贝叶斯方法9补充知识:概率论基础概率论是研究随机现象中数量规律的科学。所谓随机现象是指在相同的条件下重复进行某种实验时,所得实验结果不一定完全相同且不可预知的现象。众所周知的是掷硬币的实验。人工智能所讨论的不确定性现象,虽然不完全是随机的过程,但是实践证明,采用概率论的思想方法考虑能够得到较好的结果。10补充知识:随机事件随机实验:随机实验是一个可观察结果的人工或自然的过程,其产生的结果可能不止一个,且不能事先确定会产生什么结果。样本空间:样本空间是一个随机实验的全部可能出现的结果的集合,通常记作Ω,Ω中的点(即一个可能出现的实验结果)成为样本点,通常记作ω。随机事件:随机事件是一个随机实验的一些可能结果的集合,是样本空间的一个子集。常用大写字母A,B,C,…表示。11两个事件A与B可能有以下几种特殊关系:–包含:若事件B发生则事件A也发生,称“A包含B”,或“B含于A”,记作AB或BA。–等价:若AB且BA,即A与B同时发生或同时不发生,则称A与B等价,记作A=B。–互斥:若A与B不能同时发生,则称A与B互斥,记作AB=φ–对立:若A与B互斥,且必有一个发生,则称A与B对立,记作或,又称A为B的余事件,或B为A的余事件。任意两个事件不一定会是上述几种关系中的一种。12设A,B,A1,A2,…An为一些事件,它们有下述的运算:–交:记C=“A与B同时发生”,称为事件A与B的交,C={ω|ω∈A且ω∈B},记作或。类似地用来表示事件“n个事件A1,A2,…An同时发生”。–并:记C=“A与B中至少有一个发生”,称为事件A与B的并,C={ω|ω∈A或ω∈B},记作并。类似地用表示事件“n个事件A1,A2,…An中至少有一个发生”。–差:记C=“A发生而B不发生”,称为事件A与B的差,C={ω|ω∈A但ω∈B},记作差。13事件的运算有以下几种性质:–交换率:–结合律:–分配律:–摩根率:事件计算的优先顺序为:求余,交,差和并。ABBABAAB)()(CBACBA)()(BCACAB)()()(BCACCBA))(()(CBCACABiniiniAA~)(~11iniiniAA~)(~11补充知识:概率定义定义:设Ω为一个随机实验的样本空间,对Ω上的任意事件A,规定一个实数与之对应,记为P(A),满足以下三条基本性质,称为事件A发生的概率:–若二事件AB互斥,即,则以上三条基本规定是符合常识的。1)(0AP1)(P0)(P)()()(BPAPBAP14定义:设{An,n=1,2,…}为一组有限或可列无穷多个事件,两两不相交,且,则称事件族{An,n=1,2,…}为样本空间Ω的一个完备事件族,又若对任意事件B有BAn=An或φ,n=1,2,…,则称{An,n=1,2,…}为基本事件族。完备事件族与基本事件族有如下的性质:定理:若{An,n=1,2,…}为一完备事件族,则,且对于一事件B有有若{An,n=1,2,…}为一基本事件族,则nnA1)(nnAPnnBAPBP)()(BAnnAPBP)()(15对任意事件A,有必然事件Ω的概率P(Ω)=1,不可能事件φ的概率P(φ)=0对任意事件A,有设事件A1,A2,…An(k≤n)是两两互不相容的事件,即有,则设A,B是两事件,则1)(0AP)(1)(~APAP)(...)()()(211kikiAPAPAPAP)()()()(BAPBPAPBAP16定义:设A,B为随机事件且P(A)0,称为事件A已发生的条件下,事件B的条件概率,P(A)在概率推理中称为边缘概率。简称P(B|A)为给定A时B发生的概率。P(AB)称为A与B的联合概率。有联合概率公式:)()()|(APABPABP)()|()(APABPABP17,若,则乘法公式:全概率公式:设A1,A2,…An互不相交,,且,则对于任意事件A有1)|(0ABP1)|(AP0)|(AP21BB)|()|()|(2121ABPABPABBP)|()()(ABPAPABP)...|()...|()|()()...(12121312121nnnAAAAPAAAPAAPAPAAAPiiAniAPi,...,2,1,0)(iiiAAPAPAP)|()()(18补充知识:贝叶斯定理设A,B1,B2,…,Bn为一些事件,P(A)0,B1,B2,…,Bn互不相交,P(Bi)0,i=1,2,…,n,且,则对于k=1,2,…,n,贝叶斯公式容易由条件概率的定义,乘法公式和全概率公式得到。在贝叶斯公式中,P(Bi),i=1,2,…,n称为先验概率,而P(Bi|A)i=1,2,…,n称为后验概率也是条件概率。1)(iiBPiiikkkBAPBPBAPBPABP)|()()|()()|(19补充知识:贝叶斯网络独立:如果X与Y相互独立,则P(X,Y)=P(X)P(Y)P(X|Y)=P(X)条件独立:如果在给定Z的条件下,X与Y相互独立,则P(X|Y,Z)=P(X|Z)实际中,条件独立比完全独立更重要20联合概率:P(X1,X2,…,XN)–二值,则有2N可能的值,其中2N-1个独立。如果相互独立:P(X1,X2,…,XN)=P(X1)P(X2)…P(XN)条件概率:P(X1,X2,…,XN)=P(X1|X2,…,XN)P(X2,…,XN)迭代表示:P(X1,X2,…,XN)=P(X1)P(X2|X1)P(X3|X2X1)…P(XN|XN-1,…,X1)=P(XN)P(XN-1|XN)P(XN-2|XN-1XN)…P(X1|X2,…,XN)实际应用中就是利用条件独立性的性质简化网络复杂性的。21举例:道路交通问题假设你在道路上驾驶,因为交通拥挤,你在慢慢减速。你开始寻找减速的原因。莫非前方道路施工?或者出现交通事故?不过,能确定的是你在不断的减速。假设有三个参数:S表示交通缓慢(减速);C表示道路施工;A表示交通事故。有关于该道路的交通统计数据:根据统计,有交通缓慢S,道路施工C,交通事故A的联合概率分布,如右表。可以计算当交通不拥堵但前方有道路施工的概率为0.01+0.05=0.06等交通数据处理问题。22当你还在寻找减速原因的时候,你发现在隔离墩上摆放有橙色桶开始切断外车道的交通,此时,你能判定是因为前方道路施工导致交通缓慢,而不是交通事故原因。类似地,如果你已经在前方看到闪光灯,可能是警车或救护车发出,在得到新证据后,你能判定出现交通事故了。不过,我们说某个假设是基本可以排除的,并不意味着该假设就完全不可能。确切地说,在发现新证据的背景下,此假设的可能性减少了。23所以,道路施工(C)与橙色桶(B)和交通缓慢(T)是有关系的。同样,交通事故(A)与闪光灯(L)和交通缓慢是相关的,如右图。通过分析,构造C和T的联合概率分布表,如右表。如右表,如果道路不施工,那么出现交通缓慢的可能性相对较小(0.1),反之就较大。CATBL道路施工交通事故闪光灯交通缓慢橙色桶24考虑,如果交通缓慢,那么是由道路施工引起的概率有多少?即P(C|T)=?P(C|T)=P(C=t,T=t)/(P(C=t,T=t)+P(C=f,T=t))=0.3/(0.3+0.1)=0.75该道路出现施工的先验概率为0.5。如果知道出现交通缓慢,该道路施工的概率将上升为0.75。由于橙色桶的出现,基本排除交通事故的假设。CATBL道路施工交通事故闪光灯交通缓慢橙色桶25贝叶斯网络(BayesianNetworks)也被称为信念网络(BelifNetworks)或者因果网络(CausalNetworks),又叫概率网络(ProbabilityNetwork),是描述数据变量之间依赖关系的一种图形模式,是一种用来进行推理的模型。贝叶斯网络为人们提供了一种方便的框架结构来表示因果关系,这使得不确定性推理变得在逻辑上更为清晰、可理解性强。一个贝叶斯网由节点和节点之间的弧组成。每个节点对应一个随机变量X,并且具有一个对应该随机变量的概率值P(X)。如果存在一条从节点X到节点Y的有向弧,则表明X对Y有直接影响。该影响被条件概率P(Y|X)所指定。网络是一个有向无环图