贝叶斯网络教学ppt论文专用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2020/4/26数据仓库与数据挖掘1第7章贝叶斯网络2贝叶斯网络是20世纪80年代发展起来的,最早由JudeaPearl于1986年提出,多用于专家系统,成为表示不确定性知识和推理问题的流行方法。贝叶斯网络最早起源于贝叶斯统计分析,它是概率理论和图论相结合的产物。本章通过引例讨论贝叶斯网络需要解决的问题;介绍贝叶斯概率基础;对贝叶斯网络进行概述;讲解贝叶斯网络的预测、诊断和训练算法;讲述SQLServer2005中贝叶斯网络的应用方法。37.l引例先看一个关于概率推理的例子。图7.1中有6个结点:参加晚会(party,PT)、宿醉(hangover,HO)、患脑瘤(braintumor,BT)、头疼(headache,HA)、有酒精味(smellalcohol,SA)和X射线检查呈阳性(posxray,PX)。可以把图7.1想象成为这样一个场景:一个中学生回家后,其父母猜测她参加了晚会,并且喝了酒;第二天这个学生感到头疼,她的父母带她到医院做头部的X光检查……图7.1基于结点间概率关系的推理4通过长期的观察,或者从别人那里了解,这个中学生的父母知道他们的女儿参加晚会的概率。通过长时间的数据积累,他们也知道他们的女儿参加晚会后宿醉的概率。因此,结点party和结点hangover之间有一条连线。同样,有明显的因果关系或相关关系的结点之间都有一条连线,并且连线从原因结点出发,指向结果结点。针对图7.1所示的网络,有许多问题需要解决。例如:1)如果父母已知他们的女儿参加了晚会,那么第二天一早,她呼出的气体中有酒精味的概率有多大?也就是说,当party发生时,smellalcohol发生的概率有多大?2)如果他们的女儿头疼,那么她患脑瘤的概率有多大?这时,如果他们又知道昨晚她参加了晚会,那么综合这些情况,她患脑瘤的可能性有多大?这两个例子都是从原因推理结果的。还有许多从结果反推原因的例子。例如,如果父母早晨闻到他们的女儿呼出的气体中有酒精味,那么她昨晚参加晚会的概率有多大?等等。为了系统地解决上面的各类问题,需要先掌握一定的概率基础知识。57.2贝叶斯概率基础贝叶斯概率是贝叶斯网络运行的理论基础。就贝叶斯概率而言,其原理和应用都比较简单。但贝叶斯概率理论经历了长时间的波折才被逐渐认可,直到20世纪60年代,贝叶斯概率理论才被广泛接受并大量应用。下面将从基本的条件概率公式和全概率公式入手介绍贝叶斯概率。7.2.1先验概率、后验概率和条件概率下面介绍贝叶斯概率中用到的有关概率论的基本概念。(1)先验概率。先验概率是指根据历史的资料或主观判断所确定的各种事件发生的概率,该概率没有经过实验证实,属于检验前的概率。(2)后验概率。后验概率一般是指通过贝叶斯公式,结合调查等方式获取了新的附加信息,对先验概率修正后得到的更符合实际的概率。(3)条件概率。当条件确定时,某事件发生的条件概率就是该事件的条件概率。6例如,1号箱中有2个白球和4个红球,2号箱中有5个白球和3个红球,现随机地从1号箱中取出一球放人2号箱,然后从2号箱随机取出一球,问从2号箱取出红球的概率是多少?【解】令A表示事件“最后从2号箱中取出的是红球”;令B表示从1号箱中取出的是红球。则由式(7—5):7.2.3全概率公式设A,B是两个事件,那么A可以表示为:显然,如果P(B),P(B)0,则:7上例采用的方法是概率论中常用的方法,为了求复杂事件的概率,往往可以把它分解成若干个互不相容的简单事件,然后利用条件概率和乘法公式,求出这些简单事件的概率,最后利用概率可加性,得到最终结果,这一方法的一般化就是所谓的全概率公式。设Ω为试验E的样本空间,A为E的事件,B1,B2,…,Bn为E的一组事件,若满足以下两个条件:则称B1,B2,…,Bn为样本空间Ω的一个分割。若B1,B2,…,Bn为样本空间的一个分割,那么,对每一次试验,事件B1,B2,…,Bn必有一个且仅有一个发生。8例如,设实验E为“掷一颗骰子观察其点数”。它的样本空间Ω={1,2,3,4,5,6)。Ω的一组事件B1={l,2},B2={3,4),B3={5,6}是样本空间Ω的一个分割。而事件组B1={1,2,3),B2={3,4),B3={5,6)不是样本空间Ω的一个分割,因为B1B2={3}≠Ø。设实验E为样本空间,A为E的事件,B1,B2,…,Bn为Ω的一个分割,且P(Bi)0,i=1,2,…,n,则式(7—6)被称为全概率公式。9【例】甲、乙、丙三人向同一飞机射击。设甲、乙、丙射中的概率分别为0.4,0.5和0.7。又设若只有一人射中,飞机坠落的概率为0.2;若有两人射中,飞机坠落的概率为0.6;若有三人射中,飞机必坠落。求飞机坠落的概率。【解】记A={飞机坠落),Bi={共i个人射中飞机),i=1,2,3。Bi分别为:B1=(甲射中,乙丙未射中)+(乙射中,甲丙未射中)+(丙射中,甲乙未射中)B2=(甲未射中,乙丙射中)+(乙未射中,甲丙射中)+(丙未射中,甲乙射中)B3=(甲乙丙均射中)可以计算i个人射中飞机的概率P(B1)=0.4×0.5×0.3+0.6×0.5×0.3+0.6×0.5×0.7=0.36P(B2)=0.6×0.5×0.7+0.4×0.5×0.7+0.4×0.5×0.3=0.41P(B3)=0.4×0.5×0.7=0.14再由题设,P(A|B1)=0.2,P(A|B2)=O.6,P(A|B3)=1。利用全概率公式10设实验E为样本空间,A为E的事件,B1,B2,…,Bn为Ω的一个分割,且P(Bi)0,i=1,2,…,n,则式(7~7)被称为贝叶斯公式。例如,某电子设备厂所用的元件是由三家元件厂提供的,根据以往的记录,这三个厂家的次品率分别为0.02,0.01,0.03,提供元件的份额分别为0.15,0.8,0.05,设这三个厂家的产品在仓库是均匀混合的,且无区别的标志。.问题1:在仓库中随机地取一个元件,求它是次品的概率。问题2:在仓库中随机地取一个元件,若已知它是次品,为分析此次品出自何厂,需求出此元件由三个厂家分别生产的概率是多少?7.2.4贝叶斯公式11=0.15×0.02+0.80×0.01+0.05×0.03=0.0125对于问题2,由贝叶斯公式:【解】设A取到的元件是次品,Bi标识取到的元件是由第i个厂家生产的,则P(B1)=0.15,P(B2)=0.8,P(B3)=0.05对于问题1,由全概率公式:以上结果表明,这个次品来自第2家工厂的可能性最大,来自第1家工厂的概率次之,来自第3家工厂的概率最小。127.3贝叶斯网络概述贝叶斯网络是一种图形模型(概率理论和图论相结合的产物),又被称为贝叶斯信念网络、因果网络,是描述随机变量(事件)之间依赖关系的一种图形模式。是一种将因果知识和概率知识相结合的信息表示框架,使得不确定性推理在逻辑上变得更为清晰.理解性更强。已经成为数据库中的知识发现和决策支持系统的有效方法。从大量数据中构造贝叶斯网络模型,进行不确定性知识的发现。7.3.1贝叶斯网络的组成和结构贝叶斯网络由网络结构和条件概率表两部分组成。贝叶斯网的网络结构是一个有向无环图.由结点和有向弧段组成。每个结点代表一个事件或者随机变量,变量值可以是离散的或连续的,结点的取值是完备互斥的。表示起因的假设和表示结果的数据均用结点表示。例如,图7.1描述的网络符合贝叶斯网络的条件,是一个典型的贝叶斯网络。137.3.2贝叶斯网络的优越性贝叶斯网络的优势主要体现在以下方面。(1)贝叶斯网络推理是利用其表达的条件独立性,根据已有信息快速计算待求概率值的过程。应用贝叶斯网络的概率推理算法,对已有的信息要求低,可以进行信息不完全、不确定情况下的推理。(2)具有良好的可理解性和逻辑性,这是神经元网络无法比拟的,神经元网络从输入层输入影响因素信息,经隐含层处理后传人输出层,是黑匣子似的预测和评估,而贝叶斯网络是白匣子。(3)专家知识和试验数据的有效结合相辅相成,忽略次要联系而突出主要矛盾,可以有效避免过学习。(4)贝叶斯网络以概率推理为基础,推理结果说服力强,而且相对贝叶斯方法来说,贝叶斯网络对先验概率的要求大大降低。贝叶斯网络通过实践积累可以随时进行学习来改进网络结构和参数,提高预测诊断能力,并且基于网络的概率推理算法,贝叶斯网络接受了新信息后立即更新网络中的概率信息。147.3.3贝叶斯网络的三个主要议题贝叶斯网络的主要功能是进行预测和诊断,在贝叶斯网络工作之前,需要对历史数据进行训练。所以,预测、诊断和训练构成了贝叶斯网络的三个主要议题。1.贝叶斯网络预测贝叶斯网络是一种概率推理技术,使用概率理论来处理在描述不同知识成分之间的条件而产生的不确定性。贝叶斯网络的预测是指从起因推测一个结果的推理,也称为由顶向下的推理。目的是由原因推导出结果。已知一定的原因(证据),利用贝叶斯网络的推理计算,求出由原因导致的结果发生的概率。2.贝叶斯网络诊断贝叶斯网络的诊断是指从结果推测一个起因的推理,也称为由底至上的推理。目的是在已知结果时,找出产生该结果的原因。已知发生了某些结果,根据贝叶斯网络推理计算造成该结果发生的原因和发生的概率。该诊断作用多用于病理诊断、故障诊断中,目的是找到疾病发生、故障发生的原因。153.贝叶斯网络学习贝叶斯网络学习是指由先验的贝叶斯网络得到后验的贝叶斯网络的过程。先验贝叶斯网络是根据用户的先验知识构造的贝叶斯网络,后验贝叶斯网络是把先验贝叶斯网络和数据相结合而得到的贝叶斯网络。贝叶斯网络学习的实质是用现有数据对先验知识的修正。贝叶斯网络能够持续学习.上次学习得到的后验贝叶斯网络变成下一次学习的先验贝叶斯网络,每一次学习前用户都可以对先验贝叶斯网络进行调整,使得新的贝叶斯网络更能体现数据中蕴涵的知识。贝叶斯网络的学习关系如图7.2所示。图7.2贝叶斯网络持续学习16贝叶斯网络模型是由网络结构和条件概率分布表(ConditionalProbabilityTable,CPT)组成的,因此,必须通过给出贝叶斯网络的网络结构及每个结点上的CPT表来描述一个贝叶斯网络。相应地,基于贝叶斯网络的学习包括结构学习和参数学习两个内容。结构学习,即利用训练样本集,尽可能结合先验知识,确定最合适的贝叶斯网络模型结构。参数学习是在给定结构下,确定贝叶斯网络模型的参数,即每个结点上的CPT表。按照学习的目的以及训练样本集是否完整,可以把学习方法归为以下几类,如表7.1所示。表7.1贝叶斯网络学习算法分类表177.4贝叶斯网络的预测、诊断和训练算法本节将从图7.1所示的简单贝叶斯网络的例子人手,分别介绍贝叶斯网络的预测、诊断和训练算法。假定网络中的概率和条件概率都已经知道,也就是说网络已经训练完毕。这些数据给出如下。7.4.1概率和条件概率数据图7.1中的Party和BrainTumor两个结点是原因结点,没有连线以它们作为终点。首先给出这两个结点的无条件概率,如表7.2所示。表7.2中的第二列是关于Party(参加晚会)的概率:参加晚会的概率是0.2,不参加晚会的概率是0.8。第三列是关于患脑瘤的概率:患脑瘤的概率是0.001,不患脑瘤的概率是0.999。下面还将给出几组条件概率,分别是PT已知的情况下HO的条件概率,如表7.3所示;HO已知的情况下SA的条件概率,如表7.4所示;BT已知的情况下PX的概率,如表7.5所示。表7.2结点PT、BT的无条件概率分布18上面三个表的结构相似,给出的都是条件概率。表7.3中第2列的意思是:当参加晚会后,宿醉的概率是0.7;不宿醉的概率是0.3。第3列的意思是:当不参加晚会后,不会发生宿醉的情况。对表7.4和表7.5的解释类似。表7.3已知结点PT时HO的条件概率19最后给出的是一个联合条件概率:已知HO和BT时HA的概率,如表7.6所示。表7.6已知HO和BT时HA的概率当没有宿醉但患有脑瘤的情况下,头疼的概率是0.9,不头疼的概率是0.01。B当宿醉发生和有脑瘤的情况下,头疼的概率是0.99,不头疼的概率是0.01。当宿醉发生但没有脑瘤的情况下,头疼的概

1 / 33
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功