1贝叶斯决策第一节先验分布1.先验概率分布作决策分析时,最先确定的各种自然状态的概率,它是在做任何实验或调查以前就确定了的。2.客观的先验分布根据某些客观的情报或证据,对自然状态估计或指定的先验概率。2表5-1由这些资料可以确定未来任何一天的销售量(即自然状态)的概率分布。日销量天数频率10以下10~3030~5050以上391530.10.30.50.1例如一个商店的某种商品在过去30天内的销售记录如下:3先验分布例子:用某一段时间内每批产品所包含的不合格品数目,来估计该产品不合格品率的概率分布;用过去历年秋季广州市火灾的次数,来估计明年秋季火灾次数的概率分布。3.主观的先验分布3.1定义:决策者小心分析自然状态的各种情况,评估各种自然状态出现的可能性大小之后,主观指定的先验概率分布。43.2指定方法决策者凭经验,凭预感或直觉去指定这些概率。请教一些银行家、经济学家、市场研究机构等等,综合他们的意见后再来指定这些先验概率。5第二节Bayes定理与后验概率分布1.后验分布利用Bayes定理将补充信息和先验分布结合起来,产生的综合信息。2.Bayes定理设自然状态θ有k种,分别用θ1,θ2,…,θk表示P(θi)表示自然状态θi发生的先验概率分布用χ表示调查结果,P(χ|θi)表示在状态θi条件下,调查结果刚好为χ的概率。后验概率(Bayes公式)为6P(χ∣θi)P(θi)P=(θi|χ)=─────────────∑P(χ∣θj)P(θj)(i=12,…,k)比先验概率分布更为准确。3Bayes定理的应用例1某自动生产设备在生产过程中可能正常亦可能不正常,正常时产品的合格率为80%,不正常时产品的合格率为30%。从某时刻生产的产品中抽取一件进行检验,要求我们根据这件产品的情况来判断设备是否正常。设备正常和设备不正常,分别用θ1和θ2表示,先验概率为P(θ1)=0.5P(θ2)=0.57情况1:从某时刻的产品中抽取一件产品,若发现为合格品,即抽样的结果为χ=“合格品”,这就得到了一种补充的信息,P(合格品|θ1)=0.8P(合格品|θ2)=0.3利用Bayes公式得:73.05.03.05.08.05.08.0||||2211111PPPPPPP合格品合格品合格品合格品827.05.03.05.08.05.03.0||||2211222PPPPPPP合格品合格品合格品合格品即抽得一件产品为合格品后算得设备为正常的概率是0.73,设备不正常的概率为0.27,故应判断此时设备正常,即θ=θ19情况2:若从某时刻生产的产品中抽到的一件产品为不合格品,利用Bayes公式算得故应判断此时设备不正常,即θ=θ222.05.07.05.02.05.02.0|||不合格品|2211111PPPPPPP不合格品不合格品不合格品78.05.07.05.02.05.07.0||||2211222PPPPPPP不合格品不合格品不合格品不合格品10情况3:如果从某时刻生产的产品中连续抽取两件产品的结果为χ=“合•合”,即两件产品皆为合格品,容易算得09.03.03.0|||64.08.08.0|||222111合合合合合合合合PPPPPP877.05.009.05.064.05.064.0||||2211111PPPPPPP合合合合合合合合利用概率的性质得P(θ2∣合·合)=1—P(θ1∣合·合)=0.123判断此时设备为正常,即θ=θ111情况4:抽样结果为X=“合·不”,P(合·不∣θ1)=P(合∣θ1)×P(不∣θ1)=0.8×0.2=0.16P(合·不∣θ2)=P(合∣θ2)×P(不∣θ2)=0.3×0.7=0.21由Bayes公式以及概率的性质知568.05.021.05.016.05.021.0|.|.|..|432.05.021.05.016.05.016.0||.|.|22112222211111PPPPPPPPPPPPPP不合不合不合不合不合不合不合不合因此,应判断此时设备不正常12情况5:可以抽出的两件产品皆为不合格品,即X=“不·不”,P(θ1∣不·不)=0.075P(θ2∣不·不)=0.432若两件产品皆为不合格品,判断此时产品不正常情况6:第一件产品为不合格品,第二件产品为合格品,即X=“不·合”的后验概率P(θ1∣不·合)=0.432P(θ2∣不·合)=0.568判断是此时不正常。很多情况下,容易知道某一事件或实验结果(X)在各种状态下发生的概率P(X∣θi),因此,上面的贝叶斯公式很有实用价值。134.全概率公式ikiipxpxp1/例二一商店出售某种商品,其货源可能来自甲,乙,丙三厂产品的合格率份别是95%,92%和90%,但知道销售甲的时间为20%,销售乙的时间为40%,销售丙的时间为40%那么(1)这种商店出售的这种商品的总合格率为多少?(2)如果某人买一件这种商品发现为不合格品,此时商店正在出售那个工厂的产品?14由题意知p(甲)=0.2p(乙)=0.4p(丙)=0.4p(x/甲)=0.95p(x/乙)=0.92p(x/丙)=0.90有全概率公式p(x)=0.95×0.2+0.92×0.4+0.90×0.4=0.918若用表示X“某种商品为不合格商品”p(甲)=0.05p(乙)=0.08p(丙)=0.10122.04.01.04.008.02.005.02.005.0|||||丙丙乙乙甲甲甲甲甲PxPPxPPxPPxPxP因此由贝叶斯公式知:15488.0|390.0|xPxP丙乙因此,商店此时最有可能在出售丙厂的产品。同理可得:16第三节后验决策及其优良性决策方案δ(x)的贝叶斯风险:B(δ)=Eθ[P(θ,δ)]=P(θi,δ)P(θ=θi)它反映这一决策方案的平均损失。例如,如果设备正常,而判断为不正常,会损失1500元;判断为正常,损失为0。若设备不正常,而判断为正常会损失2000元;判断为不正常则损失为0,我们来求各种决策方案的风险值和贝叶斯风险。用a1表示“判断设备正常”,a2表示“判断设备不正常”,该决策问题的损失矩阵为:17表14-3损失矩阵表θP(θ=θi)a1a1θ11/201500θ21/220000“不”“合”“不”“合”“不”“合”“不”“合”xaxaxxaxaxxaxaxxaxax22411312221118P(θ=θ1)=1/2P(θ=θ2)=1/2P(x=“合”|θ=θ1)=0.8P(x=“不”|θ=θ1)=0.2P(x=“合”|θ=θ2)=0.3P(x=“不”|θ=θ2)=0.7对于决策方案δ1(x)R(θ1,δ1(合))=R(θ1,a1)=0R(θ1,δ1(不))=R(θ1,a2)=1500R(θ2,δ1(合))=R(θ2,a1)=2000R(θ2,δ1(不))=R(θ2,a2)=0于是δ1(x)的风险值为P(θ1,δ1)=Ex|θ=θ1[R(θ1,δ1(x))]=R(θ1,δ1(合))P(合|θ1)+R(θ1,δ1(不))P(不|θ1)=0×0.8+1500×0.2=300(元)19P(θ2,δ1)=Ex|θ=θ2[R(θ2,δ1(x))]=R(θ2,δ1(合))P(x=“合”|θ=θ2)+R(θ2,δ1(不))P(x=“不”|θ=θ2)=2000×0.3+0×0.7=600(元)故决策方案δ1(x)的贝叶斯风险为B(δ1)=P(θ1,δ1)P(θ=θ1)+P(θ2,δ1)P(θ=θ2)=300×1/2+600×1/2=450(元)决策方案δ2(x)的贝叶斯风险R(θ1,δ2(合))=R(θ1,a2)=1500R(θ1,δ2(不))=R(θ1,a1)=0R(θ2,δ2(合))=R(θ2,a2)=0R(θ2,δ2(不))=R(θ2,a1)=2000于是δ2(x)的风险值为20对于决策方案δ3(x)R(θ1,δ3(合))=R(θ1,a1)=0R(θ1,δ3(不))=R(θ1,a2)=0R(θ2,δ3(合))=R(θ2,a1)=2000R(θ2,δ3(不))=R(θ2,a2)=2000P(θ1,δ2)=Ex|θ=θ1[R(θ1,δ2(x))]=R(θ1,δ2(合))P(合|θ1)+R(θ1,δ2(不))P(不|θ1)=1500×0.8+0×0.2=1200P(θ2,δ2)=Ex|θ=θ2[R(θ2,δ2(x))]=R(θ2,δ2(合))P(x=“合”|θ=θ2)+R(θ2,δ2(不))P(x=“不”|θ=θ2)=0×0.3+2000×0.7=1400(元)B(δ2)=1200×½+1400×½=1300(元)21于是δ3(x)的风险值为P(θ1,δ3)=Ex|θ-θ1[R(θ1,δ3(x))]=0×0.8+0×0.2=0(元)P(θ2,δ3)=Ex|θ-θ2[R(θ2,δ3(x))]=2000×0.3+2000×0.7=2000(元)故决策方案δ3(x)的贝叶斯风险为B(δ3)=P(θ1,δ3)P(θ=θ1)+P(θ2,δ3)P(θ=θ2)=0×1/2+2000×1/2=1000(元)同理方案δ4(x)的贝叶斯风险B(δ4)=750(元)因此,若用贝叶斯风险衡量,方案δ1(x)优于其他三种方案。22若抽取两件产品来补充情报信息,这时决策方案共有八个,分别记为δ1,δ2,δ3,δ4,δ5,δ6,δ7,δ8,各个决策方案的风险值和贝叶斯风险见表5-4:状态θ先验分布P(θ)P(x|θ=θ1)θ=θ10.5θ=θ20.5合·合0.64合·不0.32不·不0.04合·合0.09合·不0.42不·不0.49方案δ1损失R风险值P贝叶斯风险Ba10a10a10a12000a12000a12000020001000表5-423方案δ2损失R风险值P贝叶斯风险Ba10a10a21500a12000a12000a20605401020方案δ3损失R风险值P贝叶斯风险Ba10a21500a10a12000a20a120004808201160方案δ4损失R风险值P贝叶斯风险Ba21500a10a10a20a12000a120009601390182024方案δ5损失R风险值P贝叶斯风险Ba10a21500a21500a12000a20a20540360180方案δ6损失R风险值P贝叶斯风险Ba21500a10a21500a20a12000a201020930840方案δ7损失R风险值P贝叶斯风险Ba21500a21500a10a20a20a120001440121098025方案δ8损失R风险值P贝叶斯风险Ba21500a21500a21500a20a20a20150075001124'aaax合”“合x不”“不x不“合x故不”“合不”“不合”“合,xxxxP001500'412664.0P1合合04.0P1不不111不合合不不合PPP=0.16+0.16=0.329600.3200.60400.641500,',141141xxPxRRiiki同理求得P元1820'4227得的贝叶斯风险为B用贝叶斯风险的大小来衡量,决策方案元13905.018205.