贝叶斯分析决策

cx2120637
36 ℃
2019-07-08

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

4-1贝叶斯分析BayeseanAnalysis§4.0引言一、决策问题的表格表示——损失矩阵对无观察(No-data)问题a=δ可用表格(损失矩阵)替代决策树来描述决策问题的后果(损失):a1…aj…amπ(1)l11lj1lm1…π(i)li1lij…π(n)lm1lnm或π(1)…π(i)…π(n)a1l11li1ln1…ajlij…amlm1lmn损失矩阵直观、运算方便二、决策原则通常，要根据某种原则来选择决策规则δ，使结果最优(或满意)，这种原则就叫决策原则，贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析以前先介绍芙他决策原则。三、决策问题的分类：1.不确定型(非确定型)自然状态不确定,且各种状态的概率无法估计.2.风险型自然状态不确定,但各种状态的概率可以估计.四、按状态优于：lij≤likI,且至少对某个i严格不等式成立,则称行动aj按状态优于ak§4.1不确定型决策问题一、极小化极大(wald)原则(法则、准则)a1a2a4minjmaxil(i,aj)或maxjminiuij例:4-2a1a2a3a411087924192313161214469810各行动最大损失:13161214其中损失最小的损失对应于行动a3.采用该原则者极端保守,是悲观主义者,认为老天总跟自己作对.二、极小化极小minjminil(i,aj)或maxjmaxiuij例:a1a2a3a411087924192313161214469810各行动最小损失:4172其中损失最小的是行动a2.采用该原则者极端冒险，是乐观主义者，认为总能撞大运。三、Hurwitz准则上两法的折衷，取乐观系数入minj［λminil(i,aj)＋（1－λ〕maxil(i,aj)］例如λ=0.5时λminilij:20.53.51（1－λ〕maxilij:6.5867两者之和：8.58.59.58其中损失最小的是：行动a4四、等概率准则(Laplace)用ilij来评价行动aj的优劣选minjilij上例：ilij:33343635其中行动a1的损失最小五、后梅值极小化极大准则(svage-Niehans)定义后梅值sij=lij-minklik其中minklik为自然状态为i时采取不同行动时的最小损失.构成后梅值(机会成本)矩阵S={sij}mn,使后梅值极小化极大,即:minmaxjisij4-3例:损失矩阵同上,后梅值矩阵为:3102308114020324各种行动的最大后梅值为:3484其中行动a1的最大后梅值最小,所以按后梅值极小化极大准则应采取行动1.六、Krelle准则：使损失是效用的负数(后果的效用化),再用等概率(Laplace)准则.七、莫尔诺(Molnor)对理想决策准则的要求(1954)1.能把方案或行动排居完全序；2.优劣次序与行动及状态的编号无关；3.若行动ak按状态优于aj，则应有ak优于aj；4.无关方案独立性：已经考虑过的若干行动的优劣不因增加新的行动而改变；5.在损失矩阵的任一行中各元素加同一常数时，各行动间的优劣次序不变；6.在损失矩阵中添加一行，这一行与原矩阵中的某行相同，则各行动的优劣次序不变。§4.2风险型决策问题的决策原则一、最大可能值准则令π(k)=maxπ(i)选ar使l(k,ar)=minjl(k,aj)例：π(i)a1a2a310.276.5620.534530.3410π(2)概率最大,各行动损失为345∴应选行动a1二、贝叶斯原则使期望损失极小：minj{il(i,aj)π(i)}上例中,各行动的期望损失分别为4.13.63.7,对应于a2的期望损失3.6最小∴应选a2.三、贝努利原则损失函数取后果效用的负值,再用Bayes原则求最优行动.四、E—V(均值—方差)准则若Elij≤Elik且jk则aj优于ak通常不存在这样的aj4-4上例中:a1a2a3E4.13.63.7V(2)2.293.795.967不存在符合E—V准则的行动,这时可采用f(μ,σ)的值来判断(μ为效益型后果的期望)μ-ασf(μ，σ)=μ-ασ2μ-α(μ2+σ2)f越大越优.五、不完全信息情况下的决策原则(Hodges-Lehmann原则)状态概率分布不可靠时,可采用:φ(aj)=λuijii+miniuiji=1,2,…,mj=1,2,…,nφ越大越优.§4.3贝叶斯定理一、条件概率1.A、B为随机试验E中的两个事件P(A｜B)=P(AB)/P(B)由全概率公式:Ajj=1,2,…,n是样本空间的一个划分,P(B)=jP(B|Aj)P(Aj)得Bayes公式P(Ai|B)=P(B|Ai)·P(Ai)/P(B)=P(B|Ai)·P(Ai)/jP(B|Aj)P(Aj)2.对Θ,Χ两个随机变量·条件概率密度f(θ|x)=f(x|θ)f(θ)/f(x)·在主观概率论中π(θ|x)=f(x|θ)π(θ)/m(x)其中：π(θ)是θ的先验概率密度函数f(x｜θ)是θ出现时，x的条件概率密度,又称似然函数.m(x)是x的边缘密度,或称预测密度.m(x)=f(x|θ)π(θ)dθ或ip(x|i)π(i)π(θ｜x)是观察值为x的后验概率密度。例：A坛中白球30%黑球70%B坛中白球70%黑球30%两坛外形相同，从中任取一坛，作放回摸球12次,其中白球4次，黑球8次，求所取为A坛的概率.解：设观察值4白8黑事件为x，记取A坛为1,取B坛为2在未作观察时，先验概率p(1)=p(2)=0.54-5则在作观察后，后验概率P(1|x)=p(x|1)p(1)p(x|1)p(1)+p(x|2)p(2)=034.×078.×0.5(034.×078.×0.5+074.×038.×0.5)=074.(074.×034.)=0.24010.2482=0.967显然,通过试验、观察、可修正先验分布.§4.4贝叶斯分析的正规型与扩展型一、正规型分析由Baysean原则：先验分布为π(θ)时，最优的决策规则δ是贝叶斯规则,使贝叶斯风险r(π,)=infr(π,δ(x))其中：r(π,δ(x))=ER(θ,δ(x))=E[Exl(θ,δ(x))=xl(θ,δ(x))f(x|θ)dxπ(θ)dθ(1)据(1)式，选使r(π，δ)达到极小，这就是正规型的贝叶斯分析。在解实际问题时，求使(1)式极小的δ(x)往往十分困难，尤其在状态和观察值比较复杂时，Δ集中的策略数目很大，穷举所有的δ(x)有困难，且计算量颇大。实际上可用下法：二、扩展型贝叶斯分析(ExtensiveFormAnalysis)在(1)式中因l(θ,δ)-∞，f(x｜θ)，π(θ)均为有限值。∴由Fubini定理，积分次序可换即r(π,δ(x))=xl(θ,δ(x))f(x|θ)dxπ(θ)dθ=xl(θ,δ(x))f(x|θ)π(θ)dθdx(2)显然，要使(2)式达到极小，应当对每个x∈X，选择δ，使l(θ,δ(x))f(x|θ)π(θ)dθ（2’）为极小∵δ(x)=a∴若对给定的x,选a，使l(θ,δ(x))f(x|θ)π(θ)dθ为极小亦即，使1mx()l(θ,a)f(x|θ)π(θ)dθ=l(i,a)π(i|x)dθ或il(i,a)p(i|x)(3)达极小，即可使(1)式为极小.·结论：对每个x，选择行动a，使之对给定x时θ的后验分布π(θ｜x)的期望损失为极小，即可求得贝叶斯规则。这种方法叫贝叶斯分析的扩展型，由此确定的贝叶斯规则叫formalBayeseanRule——RaiffaSehlaifer,1961年提出。·Note·使(3)式达极小的行动可能不只一个，即可能有多个贝叶斯规则；·扩展型比正规型更直观，也容易计算，故更常用；·许多分析人员只承认扩型，理由是：4-6i，π(θ｜x)描述了试验后的θ的分布，比π(θ)更客观，因此，只要损失函数是由效用理论导出的(即考虑了DMer的价值判断、风险偏好)，在评价行动a的优劣时就应当用后验期望损失。ii,r(π，δ)是根据π(θ)求出的，而用先验分布π(θ)来确定行动a并不一定适当。从根本上讲，这种观点是正确的。·无论从何种观点来进行贝叶斯分析，从理论上讲，结果是一样的，所以采用何种方法可视具体问题，据计算方便而定。·已经证明，形式贝叶斯分析对一类非随机性决策规则是成立的，也可以证明它对随机性决策规则同样成立。使所有x上后验期望损失极小的贝叶斯规则也是随机性规则集Δ*中的Bayes规则，因此，总可以找到一验期望损失极小的非随机性规则。三、例(先看无观察问题)农民选择作物问题，设某地旱年1占60%，正常年景2占40%;a1种植耐旱作物a2种不耐旱作物，后果矩阵为:a1a21200260100决策人的效用函数u(y)=10865.(1-ey002.)解：i令：l(y)=1-u(y)ii,作决策树：a1a2()1()1()260.81.19yul20.38.62001100104-7iii,在无观察时,R=l,r=11nl(i,a)π(i)r(π,a1)=l(1,a1)π(1)+l(2,a1)π(2)=0.62×0.6+0.19×0.4=0.448r(π,a2)=l(1,a2)π(1)+l(2,a2)π(2)=1.0×0.6+0×0.4=0.6风险r小者优,∴δ=a1，是贝叶斯规则,即贝叶斯行动.即应选择耐旱作物。四、例(续上)设气象预报的准确性是0.8，即p(x1|1)=0.8p(x2|2)=0.8其中，x1预报干旱x2预报正常年景则m(x1)=p(x1|1)π(1)+p(x1|2)π(2)=0.8×0.6+0.2×0.4=0.56m(x2)=0.44π(1|x1)=p(x1|1)π(1)m(x1)=0.8×0.6／0.56=0.86π(1|x2)=p(x2|1)π(1)m(x2)=0.2×0.6／0.44=0.27π(2|x1)=0.14π(2|x2)=0.731.正规型分析①策略1:a1=1(x1)a2=1(x2)r(π,1)=ijl(i,1(xj))p(xj|i)π(i)4-7=l(1,a1)p(x1|1)π(1)+l(1,a2)p(x2|1)π(1)+l(2,a1)p(x1|2)π(2)+l(2,a2)p(x2|2)π(2)=0.62×0.8×0.6+1.0×0.2×0.6+0.19×0.2×0.4+0.0×0.8×0.4=0.4328②策略2:a1=2(x2)a2=2(x1)r(π,2)=ijl(i,2(xj))p(xj|i)π(i)=l(1,a1)p(x2|1)π(1)+l(1,a2)p(x1|1)π(1)+l(2,a1)p(x2|2)π(2)+l(2,a2)p(x1|2)π(2)=0.62×0.2×0.6+1.0×0.8×0.6+0.19×0.8×0.4+0.0×0.8×0.4=0.6152③策略3:a1=3(x1)a1=3(x2)r(π,3)=0.45④策略4：a2=4（x1）a2=4（x2）r(π,4)=0.6∵r(π,1)＜r(π,3)＜r(π,4)＜r(π,2)4-8∴13421是贝叶斯行动。x1a1x21a1a2a2(|)11x(|)21x(|)21x(|)22x(|)22x(|)11x(|)12x(|)11x(|)12x4－82.扩展型之一：据(2’):l(θ,δ(x))f(x|θ)π(θ)dθ记作r’①给定x1(预报干旱):采用a1r‘=il(i,a1)p(x1|i)π(i)=l(1,a1)p(x1|1)π(1)+l(2,a1)p(x1|2)