电子与信息工程学院综合自动化研究所电话(029)82668775随机集理论——统一人工智能的数学工具韩崇昭西安交通大学控制科学与工程系主任综合自动化研究所所长教授、博士导师电话:(029)82668775(办)(029)82669846(家)电子邮件:czhan@mail.xjtu.edu.cn电子与信息工程学院综合自动化研究所电话(029)82668775目录复杂系统与经典概率的困境随机集理论的基本概念证据理论的随机集描述模糊集的随机集描述粗糙集的随机集描述条件事件代数与随机集未来应用的展望电子与信息工程学院综合自动化研究所电话(029)82668775复杂系统与经典概率的困境从医生诊断病例说起经典概率公理体系的缺陷解决复杂系统问题的思路电子与信息工程学院综合自动化研究所电话(029)82668775从医生诊断病例说起成因肺炎气管炎肺心病......遗传生活条件自然环境医疗条件工作条件......结果每个疾病的发生都有复杂的成因;每个疾病的发生不是绝对互斥的事件;每个疾病发生的可能性分布不符合概率公理;因果分析具有明显的层次结构。电子与信息工程学院综合自动化研究所电话(029)82668775经典概率公理体系的缺陷概率公理设是一个概率空间,其中是基本事件集合,是由的子集构成的集类,称为事件集合;空集是不可能事件,而是必然事件;是定义在上的概率测度,满足中的互斥事件满足可列可加性,即(,,)PFFPFFF0()1,;PAAF()0()1;PP,11()(),,iiiiijPAPAAAij。F概率公理体系的缺陷上述病例中如肺炎、气管炎、肺心病等的复杂事件不一定是互斥的;各个事件的可能性分布不必满足概率公理,如肺炎的可能性是80%、说不清楚哪种病的可能性是20%等;用于概率计算的方法受到限制。电子与信息工程学院综合自动化研究所电话(029)82668775解决复杂系统问题的思路建立新的数学框架来描述复杂系统,模糊数学、证据理论、粗糙集理论、可能性理论、条件事件代数等都是解决复杂性问题的数学方法。但是,随机集理论却是统一人工智能各个分支的一个有效的数学工具。ABCBACBCACABABC=UU()UP复杂性用集合的幂集来提升;把集合上“概率”的概念推广到其幂集上的“mass函数”;引入可能性分布以代替概率分布。电子与信息工程学院综合自动化研究所电话(029)82668775随机集理论的基本概念随机变量概念的推广集值映射与随机集随机集的上逆、下逆与逆随机集的并、交、补运算随机集的焦集与关系划分函数随机集的上概率与下概率可测选择类与值集电子与信息工程学院综合自动化研究所电话(029)82668775随机变量概念的推广设是一个概率空间,是一个可测空间,其中U是观测集合,而表示相应的Borel-域;P是概率测度。随机变量定义为通常把P转换成可测空间上的概率分布,即也就是说,对于,从而有(,,)PFUB(,)UUB1:[0,1]xUPPxBUAB1(){:()}xAxAF(){:()}xPAPxA随机变量是由基本事件空间到观测空间的一个映射,这样才有了概率分布的概念,比古典概率有了本质的进步。随机变量符合概率公理的一切结论。然而,在解决复杂系统问题时就难免遇到困难,所以需要对随机变量的概念进行推广,以满足复杂系统分析的需要。:xU电子与信息工程学院综合自动化研究所电话(029)82668775集值映射与随机集设是一个概率空间,是一个可测空间,其中U是观测集合,而表示相应的Borel-域。定义集值映射为其中是U的所有子集构成的幂集。如果对则称X是强可测的,称其为随机集。(,,)PFUB(,)UUBUAB随机集是对随机变量概念的推广,是由基本事件空间到观测空间的幂集的一个映射,它比随机变量高了一个复杂层次。随机集不再符合概率公理的一切结论。然而,在解决复杂系统问题时就可能克服所遇到困难,这种对随机变量的概念进行推广,在一个复杂层次上可以满足系统分析的需要。:()XUP()UP(){:()}XAXAF电子与信息工程学院综合自动化研究所电话(029)82668775随机集的上逆、下逆与逆对于给定的集合,其上逆定义为:下逆定义为:逆定义为:注意:一个集合A未必有逆!()AUPAUAAU1AA随机集上逆、下逆的示意图随机集逆的示意图(){:()}AXAXA(){:()}AXAXA11(){:()}AXAXA()AUP电子与信息工程学院综合自动化研究所电话(029)82668775随机集的并、交、补运算如果X,Y都是定义在相同空间上的随机集,那么其交、并、补运算定义如下并有如下性质:()()()(),()()()(),()()[()],ccXYXYXYXYXXìïïïïíïïïïî()()()(),()XYAXAYAAUP()()()(),()XYAXAYAAUP()()()(),()XYAXAYAAUP()()()(),()XYAXAYAAUP电子与信息工程学院综合自动化研究所电话(029)82668775随机集的焦集与关系划分函数对于,定义如果则成A为j的一个焦集。表示所有焦集构成的集类。可以证明,焦集具有如下性质()AUP1A1()jA2A3A4A2()jA3()jA4()jAU()AUP1()()jAXA()jA{()():(),}jAjAAUJP121212{():},,(),()();jAAUAAUAAjAjAP此性质表明,焦集构成的集类是对基本事件空间的一个划分。由上图可以清楚地看出,U中j的焦集在的逆象非空,而且所有的逆象互不相交,同时占满全空间,这就是关系划分。电子与信息工程学院综合自动化研究所电话(029)82668775随机集的上概率与下概率()AUP设是随机集,对于,其上概率定义为;下概率定义为;在假定,时,则,,此时有,这就是集合A的上概率和下概率。()()/()XPAPAPU()1PU()()()XPAPAPA()()()XPAPAPA:()XUP()()/()XPAPAPU()XU电子与信息工程学院综合自动化研究所电话(029)82668775可测选择类与值集我们可以把随机集视为对一个随机变量不精确观察的结果,这个随机变量就称为原始随机变量。我们有关这个随机变量的所有知识就是它属于X的可测选择类或称为选择器是随机变量,的概率分布属于的信息由如下值集给出,:()XUP0:xU{:XSxU()(),}xX0x{:}XxXPPxS0()xPA(){():}XxXPAPAxSUAB电子与信息工程学院综合自动化研究所电话(029)82668775证据理论的随机集描述再说医生诊断病例mass函数的定义mass函数与随机集Dempster-Shafer合成公式合成公式的随机集证明可能性分布与mass函数的转换电子与信息工程学院综合自动化研究所电话(029)82668775再说医生诊断病例{,}Uuu设有两个医生给同一病人诊断疾病,甲医生认为0.9的可能性是感冒,0.1的可能性是说不清楚的病症;乙医生认为0.2的可能性不是感冒,0.8的可能性是说不清的病症。我们的问题就是判定患者是感冒的可能性究竟有多大,或者判定这种可能性落在什么范围内。注意,该问题不符合概率公理!1()0.9mu1()0.1mU2()0.8mU(){,{},{},}UuuUP设表示基本事件空间,其中表示感冒,表示不是感冒;其幂集是;于是,可能性分别是::甲医生认为是感冒的可能性;:表示甲医生认为是说不清楚何种病症的可能性。:表示乙医生认为不是感冒的可能性;:表示乙医生认为是说不清楚何种病症的可能性。uu2()0.2mu注意:事件的可能性是定义在幂集上,而不是基本事件空间上!电子与信息工程学院综合自动化研究所电话(029)82668775mass函数的定义11()[(1)():{1,2,,}]nIiiiiIPlAPlAIn设U是一个有限集合,是U的所有子集构成的幂集,而映射满足,,则称m是U上的一个mass函数。如果且,则称A是m的一个焦元;m的所有焦元构成m的一个焦集,记为()0mA()AUP如果集函数,满足(1)(2)对于任意的则称Bel是U上的一个信任测度。11()[(1)():{1,2,,}]nIiiiiIBelABelAIn()0,()1BelBelU()UP:()[0,1]mUP()0,()mAAUP()()1AUmAP{():()0}AUmAMP12,,,()nAAAUP:()[0,1]BelUP如果集函数,满足(1)(2)对于任意的则称pl是U上的一个似然测度。()0,()1plplU12,,,()nAAAUP:()[0,1]plUP电子与信息工程学院综合自动化研究所电话(029)82668775mass函数与随机集1A1()jA2A3A4A2()jA3()jA4()jA()U设是一个概率空间,U是一个有限集合构成的属性空间,而是随机集,且对,,则(,,)PF:()XUP(),()XXU1(){()}mAPXA(){()}()()BelAPXAPAPA(){()}()()PlAPXAPAPA注意:原来mass函数、信任测度和似然测度可以用随机集完全描述。mass函数是集合逆的概率,而信任测度只是集合下逆的概率,似然测度只是集合上逆的概率。电子与信息工程学院综合自动化研究所电话(029)82668775Dempster-Shafer合成公式设是U上的两个mass函数,则m是mass函数,其中21,mm0)(m121()()()EFAmAmEmFAN,12()()0EFNmEmFDempster-Shafer合成公式的意义在于,两个不同的可能性判断,经过合成后变成统一的判断,这是一种形式的信息融合,在许多实际问题中都有应用。注意,这是一种集合运算,与概率的数值计算完全不同!在医生诊断的例子中,FEFmEmN)()(21121212()()()()()()mumUmUmumUmU82.08.01.02.01.08.09.01210.90.836()()()0.820.8241mumumU1210.10.21()()()0.820.8241mumUmu1210.10.84()()()0.820.8241mUmUmU36()()()41vuBelumvmuÍ===å36440()()()()4141vuplumvmumU电子与信息工程学院综合自动化研究所电话(029)82668775合成公式的随机集证明设是一个概率空间,是一个有限集,是的幂集,是一个随机集,而是另一个随机集,相应的mass函数分别是和,则Dempster-Shafer合成公式就是随机集的交运算:(,,)PBU()UP1:()XU®P2:()XU®P1m2m12(){:()()}mAPXXA=?注意:应用如此广泛且理论推导如此晦涩的证据合成理论,用随机集的观点来看竟然是如此简单,仅仅是两个随机集的交运算!我们可以合理地期望,利用随机集理论得到更为有用的结论。电子与信息工程学院综合自动化研究所电话(029)82668775可能性分布与mass函数的转换由mass函数计算可能性分布给定随机集的mass函数,计算相应的电点覆盖函数,即可能性分布函数如下:uU?()(),XuAu