1浅谈贝叶斯公式及其应用摘要贝叶斯公式是概率论中很重要的公式,在概率论的计算中起到很重要的作用。本文通过对贝叶斯公式进行分析研究,同时也探讨贝叶斯公式在医学、市场预测、信号估计、概率推理以及工厂产品检查等方面的一些实例,阐述了贝叶斯公式在医学、市场、信号估计、推理以及产品检查中的应用。为了解决更多的实际问题,我们对贝叶斯公式进行了推广,举例说明了推广后的公式在实际应用中所适用的概型比原来的公式更广。从而使我们更好地了解到贝叶斯公式存在于我们生活的各个方面、贝叶斯公式在我们的日常生活中非常重要。关键词:贝叶斯公式应用概率推广2第一章引言贝叶斯公式是概率论中重要的公式,主要用于计算比较复杂事件的概率,它实质上是加法公式和乘法公式的综合运用。贝叶斯公式出现于17世纪,从发现到现在,已经深入到科学与社会的许多个方面。它是在观察到事件B已发生的条件下,寻找导致B发生的每个原因的概率.贝叶斯公式在实际中生活中有广泛的应用,它可以帮助人们确定某结果(事件B)发生的最可能原因。目前,社会在飞速发展,市场竞争日趋激烈,决策者必须综合考察已往的信息及现状从而作出综合判断,决策概率分析越来越显示其重要性。其中贝叶斯公式主要用于处理先验概率与后验概率,是进行决策的重要工具。贝叶斯公式可以用来解决医学、市场预测、信号估计、概率推理以及产品检查等一系列不确定的问题。本文首先分析了贝叶斯公式的概念,再用贝叶斯公式来解决实际中的一些问题。然后将贝叶斯公式推广,举例说明推广后的贝叶斯公式在实际应用中所适用的概型。3第二章叶斯公式的定义及其应用2.1贝叶斯公式的定义给出了事件B随着两两互斥的事件12,,...,nAAA中某一个出现而出现的概率。如果反过来知道事件B已出现,但不知道它由于12,,...,nAAA中那一个事件出现而与之同时出现,这样,便产生了在事件B已经出现出现的条件下,求事件(1,2,...)iAin出现的条件概率的问题,解决这类问题有如下公式:2.1.1定义设12,...,nBBB为的一个分割,即12,...,nBBB互不相容,且1niiB,如果P(A)0,()0iPB(1,2,...,)in,则1()(/)(/),1,2,...,()(/)iiinjjjPBPABPBAinPBPAB。证明由条件概率的定义(所谓条件概率,它是指在某事件B发生的条件下,求另一事件A的概率,记为(/)PAB)()(/)()iiPABPBAPA对上式的分子用乘法公式、分母用全概率公式,()()(/)iiiPABPBPAB1()()(/)niijPAPBPAB1()(/)(/),1,2,...,()(/)iiinjjjPBPABPBAinPBPAB结论的证。42.1.2分析贝叶斯公式的定义贝叶斯公式可以作如下解释:假定有n个两两互斥的“原因”12,,...,nAAA可引起同一种“现象”B的发生,若该现象已经发生,利用贝叶斯公式可以算出由某一个原因(1,2,...,)iAjn所引起的可能性有多大,如果能找到某个iA,使得(/)=max(/)jiPABPAB1in则jA就是引起“现象”B最大可能的“原因”。生活中经常会遇到这样的情况,事件A已发生,我们需要判断引起A发生的“原因”这就需要用到贝叶斯公式来判断引起A发生的“原因”的概率。贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。本文首先给出贝叶斯公式的定义以及证明,对条件概率公式和全概率公式进行了回顾,加深了对贝叶斯公式的理解,为下面对贝叶斯公式自如地运用做铺垫。2.2贝叶斯公式的应用2.2.1贝叶斯公式在医疗诊断上的应用例1、某地区肝癌的发病率为0.0004,先用甲胎蛋白法进行普查。医学研究表明,化验结果是存在错误的。已知患有肝癌的人其化验结果99%呈阳性(有病),而没有患肝癌的人其化验结果99.9%呈阴性(无病)。现某人的检查结果呈阳性,问他真患肝癌的概率是多少?解记B事件“被检查者患有肝癌”,A为事件“检查结果为阳性”,有题设知()0.0004PB()0.9996PB(/)0.99PAB(/)0.001PAB5我们现在的目的是求(/)PBA,由贝叶斯公式得()(/)(/)()(/)()/)PBPABPBAPBPABPBPAB0.00040.990.00040.990.99960.0010.284这表明,在检查结果呈阳性的人中,真患肝癌的人不到30%。这个结果可能会使人吃惊,但仔细分析一下就可以理解了。因为肝癌发病率很低,在10000人中越有四人,而约有9996人不患肝癌。对10000个人中,用甲胎蛋白法进行检查,按其错检的概率可知,9996个不患肝癌者中约有约有99960.00190996个呈阳性。另外四个真患肝癌者的检查报告中约有40.993.96个呈阳性,仅从13.956个呈阳性者中看出,真患肝癌的3.96人约占28.4%。进一步降低错检的概率是提高检验精度的关键,在实际中由于技术和操作等种种原因,降低错检的概率有事很困难的。所以在实际中,常采用复查的方法来减少错误率。或用另一些简单易行的辅助方法先进行初查,排除了大量明显不是肝癌的人后,再用甲胎蛋白法对被怀疑的对象进行检查,此时被怀疑的对象群体中,肝癌的发病率已大大提高了,譬如,对首次检查得的人群再进行复查,此时()PB=0.284,这时再用贝叶斯公式计算得0.2840.990.2840.990.7160.001(/)PBA0.997这就大大提高了甲胎蛋白法的准确率了。在上面的例子里面,如果我们将事件B(“被检查者患有肝癌”)看作是“原因”,将事件A(“检查结果呈阳性”)看作是最后“结果”。则我们用贝叶斯公式在已知“结果”的条件下,求出了“原因”的概率(/)PBA。而求“结果”的(无条件)概率()PA,用全概率公式。在上例中若取()PB=0.284,则()()(/)()/)PAPBPABPBPAB0.2840.990.7160.00160.2819条件概率的三公式中,乘法公式是求事件交的概率,全概率公式是求一个复杂事件的概率,而贝叶斯是求一个条件概率。在贝叶斯公式中,如果()iPB为iB的先验概率,称(/)iPBA为iB的后验概率,则贝叶斯公式是专门用于计算后验概率的,也就是通过A的发生这个新信息,来对iB的概率作出的修正。评注:此例子是现实生活中很常见的一个例子。用了两次贝叶斯公式,第一次利用贝叶斯公式计算出检出是阳性然后患肝癌的概率,第二次利用贝叶斯公式计算出利用甲胎蛋白检测的准确率。通过计算出来的概率,人们采用有效的方法降低错检的概率。使人们的生命财产得到更多的保障。2.2.2贝叶斯公式在市场预测中的应用例2、我们知道,国外的旧车市场很多。出国留学或访问的人有时花很少的钱就可以买一辆相当不错的车,开上几年也没问题。但运气不好时,开不了几天就这儿坏那儿坏的,修车的钱是买车钱的好几倍,经常出毛病带来的烦恼就更别提了。为了帮助买旧车的人了解各种旧车的质量和性能,国外出版一种专门介绍各品牌旧车以及各年代不同车型各主要部件质量数据的旧车杂志。比如有个买主想买某种型号的旧车,他从旧车杂志上可发现这种旧车平均有30%的传动装置有质量问题。除了从旧车杂志上寻找有关旧车质量的信息外,在旧车市场上买旧车时还需要有懂车的内行来帮忙。比如可以找会修车的朋友帮助开一开,检查各主要部件的质量。因为旧车杂志上给出的是某种车辆质量的平均信息,就要买的某一辆来讲可能是好的传动装置,也可能会有问题。比较常见的方法是花一点钱请个汽车修理工帮助开几圈,请他帮助判断一下传动装置和其他部件的质量。当然,尽管汽车修理工很有经验,也难免有判断不准的时候。假定从过去的记录知道某个修理工对于传动装置有间题的车,其中90%他可以判断出有问题,另有10%他发现不了其中的问题。对于传动装置没问题的车,他的判断也差不多同样出色,其中80%的车他会判断没问题,另外的20%他会认为有问题,即发生判断的错误。根据这些已知信7息请你帮助买主计算如下的问题:1、若买主不雇用修理工,他买到一辆传动装置有问题的车的概率是多少?2、若买主花钱雇修理工帮他挑选和判断,当修理工说该车“传动装置有问题”时该车传动装置真有问题的概率是多少?3、当修理工说该车“传动装置没问题”时而该车传动装置真有问题的概率是多少?解1、问题是简单的,即有30%的可能性买到一辆有传动装置间题的旧车,我们在这里只利用旧车杂志的信息。第2问和第3问是贝叶斯估计或者利用贝叶斯公式进行决策的问题。2、我们知道,贝叶斯公式是个条件概率的公式,即1()(/)(/)()(/)iiikjjjPAPBAPABPAPBA其中(/)iPAB称为事件iA的后验概率,即在已知事件B发生条件下事件iA发生的概率;()iPA是事件iA的先验概率;(/)iPBA称为样本信息,即在iA发生条件下事件B的概率。对于第2问,我们不妨令:1A=实际有问题,2A=实际没问题1B=修理工判断“有问题”,2B=修理工判断“没问题”则可将贝叶斯公式改写成:(/P实际有问题修理工判断“有问题”)((/=((/+((/PPPPPP实际有问题)修理工判断“有问题”实际有问题)实际有问题)修理工判断“有问题”实际有问题)实际没问题)修理工判断“有问题”实际没问题)111111212()(/)=()(/)()(/)PAPBAPAPBAPAPBA根据已知条件,计算式中各项的概率分别为:1()(=0.3PAP实际有问题)2()(=0.7PAP实际没问题)11(/)(=0.9PBAP修理工判断“有问题”/实际有问题)812(/)(=0.2PBAP修理工判断“有问题”/实际没问题)21(/)(=0.1PBAP修理工判断“没问题”/实际没问题)22(/)(=0.8PBAP修理工判断“没问题”/实际没问题)代入上式(/P实际有问题修理工判断“有问题”)111111212()(/)=()(/)()(/)PAPBAPAPBAPAPBA0.30.9=0.30.9+0.70.2=0.66这个结果表明,当修理工判断某辆车的传动装置“有问题”时,实际有问题的概率为0.66,即修理工的判断有问题使得真有问题的概率由0.30增长到0.66。3、(/P实际有问题修理工判断“没问题”)((/=((/+((/PPPPPP实际有问题)修理工判断“没问题”实际有问题)实际有问题)修理工判断“没问题”实际有问题)实际没问题)修理工判断“没问题”实际没问题)111121222()(/)=()(/)()(/)PAPBAPAPBAPAPBA由问题2知道(/P实际有问题修理工判断“没问题”)121121222()(/) =()(/)()(/)PAPBAPAPBAPAPBA0.10.3=0.30.1+0.70.8=0.05这个结果表明,当修理工判断某辆车的传动装置“没问题”时,实际有问题的概率为0.05,即修理工的判断没问题而实际上有问题的概率由0.3下降到0.05。评注这是一个生活中很常见的问题。利用贝叶斯公式计算出买主花钱雇修理工帮他挑选和判断,当修理工说该车“传动装置有问题”时该车传动装置真有问题的概率,当修12理工说该车“传动装置没问题”时而该车传动装置真有问题的概率。如果买主没有请修理工,他买到的旧车有质量问题的概率高达0.3,但是如果请修理工帮忙试车的话买到的旧车有质量问题的概率却可以降到0.05。这样不仅为买主剩下较多修车的钱,还帮助买主避免了日后的很多麻烦。2.2.3贝叶斯公式在信号估计中的应用例3背景:1948年,美国科学家香农发表了著名的论文《通信的数学理论》。世界上第一个给通信系统建立了数学模型。他认为通信系统由以下几个基本要素组成:信源、信道、编码、译码和干扰源。信源指产生信息的来源。信道指传递信息的通道。将噪声统一为干扰源。编码是从消息到信号的函数,而译码是从信号到消息的函数。因为信源