1第八章决策论李勇建博士2不确定环境中进行决策实际问题制造商向市场推出新产品潜在顾客将会做出什么反应?制造商应当生产多少产品?是否需要在一个小区域中进行试销?为了成功推出产品,需要打多少广告?政府工程承包商投标一个新的合同工程的实际成本是多少?哪些公司会投标?他们可能的投标价是多少?3决策分析介绍确定性决策(DecisionsUnderCertainty)自然状态确定(Stateofnature)选择产生最大收益的决策例子:生产组合(ProductMix)分销配送(Distribution)人员排程(Scheduling)4不确定下的决策(风险决策)自然状态不确定(有多个可能状态)例子:石油勘探新产品开发拍电影决策分析介绍5石油勘探问题一个石油勘探公司要对是否对新疆某地进行石油勘探,如果勘探则发生$200,000的勘探成本,如果发现石油,值$800,000.如果没有发现石油则价值为0收益表决策状态实际举例不勘探勘探有油没油00600000-200000决策问题的特征:一系列可供选择的决策;具有一系列的未来可能出现的自然状态;每个自然状态下,每个选择都对应一个支付数;对未来事件发生的可能性进行估计;决策的评估标准。67决策分析术语决策者(DecisionMaker)是对一个决策(或一系列决策)负责的人或团体备择方案(Alternatives)是决策者将作出的决策的选项自然状态(Stateofnature)决策结果受到决策者无法控制的随机因素影响收益(Payoff)每一种决策的备选方案及自然状态的组合都会导致某种结果,是衡量决策结果对决策者的价值的量化指标8【例1】(投资问题)请问如何决策?S1:经济形势上升S2:经济形势稳定S3:经济形势下滑表1:证券投资收益表(单位:元)9不确定性决策准则悲观准则(Maximin准则)乐观准则(Maximax准则)折衷准则(Hurwicz准则)等可能准则(Laplace准则)遗憾准则(Minimaxregret准则)10【例1】(投资问题)请问如何决策?悲观准则乐观准则折衷准则等可能准则其中=0.6表1:证券投资收益表(单位:元)11(5)遗憾准则遗憾准则的后悔矩阵12最终结果为不同准则下的决策结果1314总结悲观准则(Maximin准则):对未来持悲观态度。从每个方案可能出现的最差结果出发,从最不利的结果中选取最有利的结果。乐观准则(Maximax准则):对未来持乐观态度,总是假设会出现对自己最有利的状态。折衷准则(Hurwicz准则):介于悲观准则和乐观准则之间。采用一个乐观系数来反映决策者对状态估计的乐观态度。等可能准则(Laplace准则):将各种可能出现的状态“一视同仁”,认为各状态出现的可能性是相等的。选择具有最大平均收益的方案为最优方案。遗憾准则(Minimaxregret准则):基本思想是尽量减少决策后的遗憾,使决策者不后悔或者少后悔。15举例某书店希望订购新出版的一部书籍。据以往经验,新书的销售量可能为50本,100本,150本,或200本。已知每本新书订购价为4元,零售价为6元,剩书的处理价为1元。试分别用乐观难则、悲观准则、折衷准则(乐观系数=0.8)和遗憾准则确定该书的订购量。乐观准则100200300400悲观准则100-50-200-350折衷准则10015020025016后悔矩阵s1s2s3s40100200300150010020030015001004503001500最大后悔300200300450所以,所作决策分别为乐观准则:采购200本;悲观准则;采购50本;折衷准则:采购200本;遗憾准则:采购100本172风险决策【例2】继续考虑例1。根据经验估计,经济形势S1,S2,S3三种情形发生的先验概率分别为0.1,0.5,0.4。此时投资者应该选择哪种方案,使的收益最大?再者先验概率对自然状态的估计可能不准确,那么花费一些钱以获得更好的估计(后验概率)是否值得呢?若此概率信息需要花费15万元才能购买得到,则投资者是否值得去购买这些信息?0.10.50.4表1:证券投资收益表(单位:元)18先验决策--概率最大原则概率最大的那一个状态在一次决策中最可能出现,因此应该在具有最大发生概率的状态下选择行动方案。具体方法:发现概率最大的自然状态选择在这种自然状态下收益最大的备择方案如上例,应该在状态S2前提下选择方案A2。存在的问题如果这些其他收益中有一些是致命的怎么办?如果其他这些收益远比所选择的方案的收益丰厚怎么办?如果最可能的自然状态下收益的差异远小于另一个具有一定可能性的自然状态下的收益,那么决策者会更加关注后者如果有很多种自然状态且它们的可能性几乎相同,最可能自然状态变为现实的概率就会相当低19先验决策--最大期望收益(Bayes)准则适用于一次决策多次重复进行生产的情况。具体方法:每一种备择方案,将每一个收益乘以相应自然状态的先验概率,乘积相加就得到收益的加权平均选择具有最大期望收益的备择方案在例2中,根据Bayes准则决策结果是选择方案A2,可得收益565元.0.10.50.4加权平均475565400表1:证券投资收益表(单位:元)20先验决策--最大期望收益(Bayes)准则先验决策问题在WinQSB中的实现方法完全同于不定决策问题的实现,只是在输入数据时,需要确定各状态的概率而已.存在的问题在确定先验概率时,仍然有相当大的不确定性先验概率在相当大的程度上是主观的,然而安全的决策应当是基于客观数据和程序的对于平均结果,期望(货币上的)收益忽视了可能的结果对决策者的影响2S2A2A212.2信息价值通常一个初步的研究会对自然状态的概率有一个更好的近似.例如:市场调研(Marketsurveys)市场测试(Test-marketing)地震测试(Seismictestingforoil)问题:我们得为得到这些信息付多少价值呢?22全信息价值EP(无更多信息)=以原始的先验概率用贝叶斯决策规则得到的期望收益EP(拥有全信息)=如果知道真实的自然状态进行决策得到的期望收益EVPI=全信息价值=EP(拥有全信息)-EP(无更多信息)C=获取更多信息的花费如果EVPI<C,不值得获取更多的信息如果EVPI≥C,值得获取更多的信息23【例3】继续考虑例2.投资者是否需要花费100元购买此完全信息?分析完全信息价值,为因此不值得购买该信息。元)元)(565(6004.05005.06001.01000EMVEPPL(元)35EMVEPPLEVPI313序列决策--决策树某些决策问题,在进行决策后会产生一些新情况,此时需要进行新的决策;接着又会出现新情况,又进行新决策。这样,决策、情况、决策……构成一个序列,即序列决策。描述序列决策的工具是决策树。利用决策树对多阶段风险决策问题进行分析是以期望值准则为决策准则。我们前面的风险决策问题可以应用决策树的方法来描述。32例4:某公司需要对某新产品生产批量作出决策,各种批量在不同的自然状态下的收益情况如下表(收益矩阵)。N1发生的概率是0.3。自然状态行动方案N1(需求量大)P(N1)=0.3N2(需求量小)P(N2)=0.7S1(大批量生产)30-6S2(中批量生产)20-2S3(小批量生产)10533决策树决策S1S2S3大批量生产中批量生产小批量生产N1(需求量大);P(N1)=0.3N1(需求量大);P(N1)=0.3N1(需求量大);P(N1)=0.3N2(需求量小);P(N2)=0.7N2(需求量小);P(N2)=0.7N2(需求量小);P(N2)=0.730-62010-254.84.66.56.534决策树法的计算过程(1)绘制决策树;(2)自右到左计算各方案的收益期望值,将结果标在方案节点处;(3)选收益期望值最大(损失期望值最小)的方案为最优方案。主要符号决策点方案节点结果节点35例5:投标决策华光公司考虑为一项建设工程进行投标。投标准备费为1万元。中标的可能性为40%。若中标后能按期保质完成,则可盈利40万元,若延期1月,罚款5万;延期2月,罚款10万。公司有两种修建方法,一是传统方法,该方法按期完成的可能性为60%,延期1月的可能性为20%,延期2个月的可能性为20%;另一个是改进方法,但需要花1.5万元购置一种设备。改进方法按期完成的可能性为85%,延期1月的可能性为10%,延期2个月的可能性为5%。公司是否应该为这项工程进行投标呢?中标后选择哪一种方法呢?361437.51439370万元不准备准备中标0.4-1万元不中标0.6改进,-1.5不改进按期完成0.85延1月0.1延2月0.05按期完成0.6延1月0.2延2月0.240万元35万元30万元40万元-1万元35万元30万元374效用函数【例5】决策问题的期望收益准则比较问题(1):A1:稳获100元;B1:获得250和0元的概率各为50%。问题(2):A2:稳获100元;B2:掷一枚硬币,直到出现正面为止,设共掷了N次,则可获取2N元。直观上,大家喜欢选择方案A1和A2。但是因为(1)同一货币量,在不同风险情况下,对同一决策者带来的主观上的满足程度不一样,也就是具有不同的效用值;(2)决策者大多是根据不同结果或方案对其需求个体的满足程度来进行决策的,而不仅仅是依据货币期望收益最大为原则进行决策。(3)效用正是衡量或比较不同商品、劳务满足人的主观愿望的程度,可用来衡量人们对某些事物的主观价值、态度、偏爱、倾向等。11()()EBEA22()()EBEA38风险态度将货币价值转化为反映决策者偏好的正确标度的途径称为货币效用函数。效用值是一个相对的指标值,无量纲。一般,凡是决策者最爱好、最倾向的事物的效用值为1。对待效用的态度:保守型,风险回避者(RiskAverse)对损失的金额愈多愈敏感。随着货币数量的增加,函数的斜率递减,称为递减的货币边际效用冒险型,风险偏好者(RiskSeeker)对损失金额的反应比较迟钝。效用函数的斜率随着货币数量的增加而增大,具有递增的货币边际效用中间型,风险中性者(Risk-neutral)认为钱的价值等同于其货币价值,货币效用简单地与货币的数量呈直线关系40使用效用值进行决策:首先把要考虑的因素折合成效用值,然后用决策准则下选出效用值最大的方案,作为最优方案。例6:求下表显示问题的最优方案(万元)自然状态行动方案N1(需求量大)p(N1)=0.3N2(需求量中)p(N2)=0.5N3(需求量小)p(N3)=0.2S1(作项目A)6040-100S2(作项目B)100-40-60S3(不作项目)00041用收益期望值法:E(S1)=0.360+0.540+0.2(-100)=18万E(S2)=0.3100+0.5(-40)+0.2(-60)=-2万E(S3)=0.30+0.50+0.20=0万得到S1是最优方案,最高期望收益18万。一种考虑:由于财务情况不佳,公司无法承受S1中亏损100万的风险,也无法承受S2中亏损50万以上的风险,结果公司选择S3,即不作任何项目。42产生效用函数的方法1,直接提问法向决策者提出一系列问题,然后让决策者进行主观衡量并作出回答。2,对比提问法设两种备选方案A1、A2。A1表示无任何风险情况下得到得到金额x2。A2表示可以以概率p得到金额x1,或以概率1-p得到金额x3。若决策者认为pU(x1)+(1-p)U(x3)=U(x2),则x2对应的效用为p。x1和x3一般取决策问题可能收益的最大和最小值。一般改变x2三次,确定三点的效用,再加上x1,x2,即可由“五点法”确定效用曲线。43用效用函数解释:把上表中的最大收益值100万元的效用定为10,U(100)=10;最小收益值-100万元的效用定为0,U(-100)=0。•对收益60万元确定其效用值:设经理认为使下两项等价的p=0.95(1)得到确定的收益60万;(2)以p的概率得到100万,以1-