一个决策树算法案例分析剖析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1兵者,国之大事也。死生之地,存亡之道,不可不察也。故经之以五事,效之以计,而索其情。一曰道,二曰天,三曰地,四曰将,五曰法。夫未战而庙算胜者,得算多者;未战而庙算不胜者,得算少也。多算胜,少算不胜,而况於无算乎?兵法:一曰度,二曰量,三曰数,四曰称,五曰胜。地生度,度生量,量生数,数生称,称生胜。24.1决策分析案例背景匹兹堡开发公司(PDC)已购得一块地用于建造一个高档的沿河综合商业楼,其位置对繁华的匹兹堡和金三角有很好的景观,所谓金三角是指两条小河汇流成俄亥俄(Ohio)河的地段。每一个建30万~120万,取决于单元所处楼层,面积以及备选的设施。公司对这套楼房的设计,d1——小型楼,有6层,30d2——中型楼,有12层,60d3——大型楼,有18层,90个单元。决策问题是要从这三个方案中选择其中之一,并提出决策分析的书面报告,包括分析计算书,建议,以及风险提示。常规(用)决策技术和效用理论3为了进行决策分析,(1)市场调研,综合楼被市场接受的程度如何?亦即市场的需求如何?对此问题,公司管理者通过调研认为,只有两种市场接受状态,称为决策者无法控制的自然S1——高的市场接受程度,S2——低的市场接受程度,对楼房需求有限。(2)要根据工程设计与造价核算以及销售价格计算出不同方案,不同自然状态时,楼房的盈亏(益损)表。对该问题,经计算得到如下益损矩阵Vij备选方案自然状态高的市场接受程度S1低的市场接受程度S2小型楼d1800万700万中型楼d21400万500万大型楼d32000万-900万4其中i——表示方案,j——表示状态。比如:V32=-900万,表示大型楼方案d3在低的市场接受S2时,楼房不能正常销售,估计可能带来亏损900万。4.2常用决策分析方法按照问题面临的自然状态出现的概率无法知道,抑或可以通过调研统计得到,常用决策方法划分为不确定性决策方法与风险决策方法。一、不确定性决策方法(自然状态出现的概率不知道)1对各方案先从不同状态的Vij中取一最大值者,得:最大值小型楼d1→800中型楼d2→1400大型楼d3→2000万←Max·Max再从不同方案的最大值中取一最大值,为2000万,所对应的方案——大型楼方案d3为决策的最佳方案。52对各方案,先从不同状态的Vij中取一最小值者,得:最小值d1→700←Max·Mind2→500d3→-900再从不同方案的最小值中取一最大值,如700万,所对应的方案——小型楼方案d1为决策的最佳方案。3该方法认为,不同自然状态出现的概率彼此相等。在等概率原则下,则可分别先将各不同方案的所有自然状态的益损值求和,d1→800+700=1500d2→1400+500=1900万←Maxd3→2000-900=1100再从各方案的合计和值中取一最大值,如1900万,所对应方案d2的最佳方案。64该方法相似于保守方法,取悲观态度。首先从益损矩阵中求后悔值,即机会损失值RijRij=V*j-Vij(j=1,2,…,n)(i=1,2,…,m)式中V*j——对状态SjVij——状态Sj、方案di相应的益损值。由此,可得后悔值Rijs1s2d12000-800=1200700-700=0d22000-1400=600700-500=200d32000-2000=0700-(-900)=1600再分别对各方案,从不同自然状态的后悔值中取一最大者,d1→1200d2→600万←Mind3→1600然后从各方案的最大后悔值中选取一最小者,为600万,则它对应的方案d2为最佳方案。7二、风险决策方法(自然状态出现的概率已知)既然各种可能的自然状态出现的概率已经通过调研获得,则可以以此求各方案的期望益损值。令n——P(Sj)——自然状态Sj的概率。则有P(Sj)≥0,(j=1,2,…,n)各方案dj益损期望值为最大者对应的方案,可选为最佳方案。对本问题而言,若已知:P(S1)=0.8,P(S2)=0.2,有:EV(d1)=0.8×800+0.2×700=780EV(d2)=0.8×1400+0.2×500=1220EV(d3)=0.8×2000+0.2×(-900)=1420万可见,方案d3建大楼为最佳方案。1)(...)()()(211nnjjSPSPSPSPijnjjiVSPdEV*)()(18为了较形象直观地作出决策,也可应用决策树方式进行分析,决策树决策结点用□表示,由它生出方案枝;各方案枝分别生出状态结点,用○表示,由状态结点引出各种状态分枝,分枝末梢绘上相应的益损值。对本3142)(,)(,2211SPsSPs0.80.20.80.20.80.2)(,)(,2211SPsSPs)(,)(,2211SPsSPs80070014005002000-90078012201420d2d3d1首先计算出各个状态结点的期望值,从中选取一个最大期望值,往回找对应的方案,为最佳方案,如上图,④点最大,选d3方案为最佳方案。9§4.4灵敏度分析灵敏度分析是将自然状态出现的概率加以改变,来考察这一改变对决策方案选取将带来什么样的影响。比如:高的接受程度S1的概率降到0.2,低的接受S2的概率升为0.8,即P(S1)=0.2,P(S2)=0.8,EV(d1)=0.2×800+0.8×700=720EV(d2)=0.2×1400+0.8×500=680EV(d1)=0.2×2000+0.8×(-900)=-320可见,小楼方案d1为最佳,大楼方案为最差的。如果问题只涉及两种自然状态,则可以按以下方式求出各方案的临界设自然状态S1的概率P(S1)=P,则自然状态S2的概率P(S2)=1-P。按本问题的益损矩阵,EV(d1)=P×800+(1-P)×700=100P+700EV(d2)=900P+500EV(d3)=2900P-90010(1)当EV(d1)=EV(d2)时,即100P+700=900P+500可解得P=200/800=0.25(2)当EV(d2)=EV(d3)时,可解得P=0.7按此,用不同P值(P=0~1.0)从图可见,当高的市场接受状态的概率P0.25时,第一方案d1当0.25≤P≤0.7时,方案d2当P0.7时,方案d3最佳。0.20.40.60.81.02000150010005000-500-1000d1可得最大EV的P区间d2可得最大EV的P区间d3可得最大EV的P区间EV(d3)EV(d2)EV(d1)11§4.5前述两种自然状态出现的概率P(S1)=0.8,P(S2)=0.2,只是一种比较粗糙地调研而获得的自然状态的概率分布,也即是一种所谓先验概率。如果我们能够再深挖一些新信息,用以修正先验概率,最终获得一种所谓后验概率,用来进行决策,则决策的效果更好、更科学。一般讲,补充信息是可以通过对自然状态样本信息设计的实验方法来取得,包括原始资料的采样、产品检验、市场调研等等。比如:通过天气预报的验证信息,来修正天气状态的先验概率;通过产品检验的正确与否的信息,来修正产品的正、废品先验概率。对PDC问题来讲,可以通过市场调查,调查有多少比率的人有兴趣买楼,记为I1,有多少比率的人没有兴趣买楼,记为I2,则可以获得四个条件概率,记为:P(I1|S1),P(I2|S1),P(I1|S2),P(I2|S2),它们也叫做似然函数。对PDC问题,经过调查,获得了下表的似然函数。自然状态有兴趣买楼,即支持者I1无兴趣买楼,不支持者I2高接受S1,P(S1)=0.8P(I1|S1)=0.90P(I2|S1)=0.10低接受S2,P(S2)=0.2P(I1|S2)=0.25P(I2|S2)=0.7512这个似然函数的意义是:在真正高接受者中核查为有兴趣(即支持建楼)买楼的概率为0.9,而不支持的为0.1;在真正低接受者中,核查为不支持的概率为0.75,反而支持的为0.25。这些补充信息是在明确了高、低接受者的条件下,进一步调查核实的信息,由此统计出的条件概率。有了先验概率和似然函数,可以运用贝叶斯全概率公式,计算出后验概率P(S|I):I=1,2,…..n,k=1,2,…,m按以上数据,可算得其后验概率为:有兴趣(支持)买楼者I1的有关概率计算表niiKiiKiKiSIPSPSIPSPISP1)|()()|()()|(自然状态Si先验概率P(Si)条件概率P(I1|Si)联合概率P(I1∩s1)P(Si|I1)s10.80.10.720.9635s20.20.750.050.065自然状态Si先验概率P(Si)条件概率P(I1|Si)联合概率P(I1∩s1)P(Si|I1)s10.80.10.080.348s20.20.750.150.652没有兴趣(支持)买楼者I2的有关概率计算表13根据上列概率计算表,123987654高接受S1,P(S1|I1)=0.935低接受S2,P(S2|I1)=0.065高接受S1,P(S1|I1)=0.935低接受S2,P(S2|I1)=0.065高接受S1,P(S1|I1)=0.935低接受S2,P(S2|I1)=0.065高接受S1,P(S1|I2)=0.348低接受S2,P(S2|I2)=0.652高接受S1,P(S1|I2)=0.348低接受S2,P(S2|I2)=0.652高接受S1,P(S1|I2)=0.348低接受S2,P(S2|I2)=0.6528百万714520-98714520-9小型d1中型d2大型d3小型d1中型d2大型d3支持的,I1P(I1)=0.77支持的,I2P(I2)=0.7714可算出:状态结点④的EV=0.935×8+0.065×7=7.935状态结点⑤的EV=13.416状态结点⑥的EV=18.118……状态结点⑦的EV=0.348×8+0.652×7=7.348状态结点⑧的EV=8.130……状态结点⑨的EV=1.086,应选d3,应选d2方案。结论是:当市场报告是支持建楼,I1时,应建大型楼;当市场报告是不支持,I2时,应建中型楼。2315§4.5效用与风险分析(UtilityandRiskAnalysis)以前所述的决策分析方法是按照最好的货币期望值选择方案,但在决策分析中除了要考虑方案的货币益损因素以外,还要考虑风险程度,包括决策人对待风险的态度这一主观偏好因素。因而,往往单从货币益损期望值选择的方案,不一定是最佳方案。本节将介绍决策分析中的期望效用。所谓效用是一种特定结果的总价值的相对尺度,它反映决策者面对诸如利润、损失和风险等因素集合的态度。一般在一些技术较复杂、投资费用较大,开发周期较长的项目中,往往存在许多不确定因素。如前所述如果可以给出这些不确定因素的概率分布,最常用的决策方法是采用益损期望值、其方差和效用函数来进行分析。案例:某公司有一投资项目,有3个投资方案A、B、C,这三个方案的经济收益取决于今后两年的经济状态,经济状态估计为三种及其概率为:好(0.3);中(0.5);差(0.2)。投资方案经济状态及其概率,收益(万元)好,0.3中,0.5差,0.2A18001500800B160012001000C2000160090016各方案的收益期望值Vi,其均方差σi和方差系数γi可按下列公式计算:iiiiijnjjiijnjjiVVVPVPV211)(,式中方差系数γ,又称风险系数,因为均方差σ是收益风险的一种测度。按上表的数据,VA=1450,σA=350,γA=0.2414VB=1280,σB=223,γB=0.1742VC=1580,σC=382,γC=0.2418从这些结果看,三个方案中没有一个占绝对优势,即没有一个方案既有较大的收益期望值,同时又有较小的均方差和方差系数。因此,无法确定最佳方案,需要进一步分析。为此,可根据效用理论来权衡。效用函数U(x)是一种相对度量尺度,0≤U(x)≤1,或者0≤U(x)≤10,其中x对本问题而言是收益期望值。效用函数U(x)值的确定方法较多,其中常用的一种方法是标准博奕法,即针对具体决策问

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功