决策分析模型

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

决策分析模型不确定性决策问题风险性决策问题一、决策分析的数学模型1.决策问题的基本要素四个基本要素:可能采取的行动方案;影响决策的自然状态;反映效果的收益函数;指导行动的决策准则。它们的关系可用如下形式表示:OPtd=f(a,s,q)这里d为在一定决策准则下的决策值,a为可能采取的行动方案;s为可能出现的自然状态。q=(a,s)则为自然界(或社会)处于状态s时人们选择行动方案a所得到的收益。设行动集,状态集,收益函数可取mxn个值,这些值组成如下矩阵:},,,{21maaaA},,,{21nsssS),(jiijsaqqmnmnqqqqQ1111收益矩阵2.不确定性决策模型在一些决策问题中,决策者对可能出现的不同自然状态缺乏必要的信息,无法确定自然状态发生的概率,这类问题称为不确定性决策问题.例1.某电视机厂面对激烈的市场竞争,拟制订利用先进技术对机型改型的计划.下表给出了三种自然状态下不同的改型方案所获得预期收益的情况.高需求s1一般需求s2低需求s3(a1)提高图象质量(a2)提高图象质量并增强画面功能(a3)提高图象质量和音响质量5080100304020200-40AS这是一个不确定性决策问题.在这个决策问题,状态集为,其中分别表示高需求、一般需求和低需求;行动集为,其中分别表示提高图象质量、提高图象质量并增强画面功能、提高图象和音响质量三种改型方案。收益矩阵为},,{321sssS321,,sss},,{321aaaA321,,aaa402012004080203050Q下面在几种不同的决策准则下求解该决策问题。(1)悲观准则悲观准则又称小中取大准则.该准则反映决策者对决策问题持保守态度,即对每个方案先找出其最不利状态下的收益,然后从中选取收益最大的方案作为决策方案.在悲观准则下,有}{minmaxijjiqd根据悲观准则,对于每个方案,有)3,2,1(iai.40}40,20,120min{,0}0,40,80min{,20}20,30,50min{321ddd则,故方案是最优决策方案.20}40,0,20max{*1d1a(2)乐观准则乐观准则又称大中取大准则.该准则反映决策者对决策问题持乐观态度,因而对每个方案先找出其最大收益,然后从这些最大收益中再选取收益最大的方案作为决策方案.或者说,从收益矩阵Q中选取最大收益值所对应的方案为决策方案.在乐观准则下,有}{maxmaxijjiqd.120}40,20,120max{,80}0,40,80max{,50}20,30,50max{321ddd则,故方案是最优决策方案.120}120,80,50max{*3d3a根据乐观准则,对于每个方案,有)3,2,1(iai(3)适度乐观准则适度乐观准则是一种介于乐观准则与悲观准则之间的用折中的方法进行决策的决策准则,该准则要求决策者根据经验判断为各种可能出现的最大收益确定一个乐观系数,并利用乐观系数对每个行动方案计算折中值.然后从中选取折中值最大的方案为最优决策方案.)10(在适度乐观准则下,有}1|)1(max{)2()1(miqqdii其中}1|min{},1|max{)2()1(njqqnjqqijiiji根据适度乐观准则,给定,这时对于每个方案,有)3,2,1(iai6.0.56)40(4.01206.0,4804.0806.0,38204.0506.0321ddd则,故方案是最优决策方案.56}56,48,38max{*3d3a(4)后悔准则后悔准则是一种使后悔值最小的准则.所谓后悔值是指决策者在某种自然状态下本应选取收益最大的方案获得最大收益时选择了其他方案而造成机会损失的损失值.该准则要求决策者首先计算每个方案的最大损失值,然后从中选取损失值最小的方案为最优决策方案.在后悔准则下,有}{maxminijjjiqqd其中}1|max{miqqijj根据后悔准则,对于每个方案,有)3,2,1(iai.60)}40(20,2040,120120max{,40}020,4040,80120max{70}2020,3040,50120max{321dd,d则,故方案是最优决策方案.40}60,40,70min{*2d2a(5)等可能准则等可能准则是一种机会均等的准则.该准则认为各种自然状态发生的可能性在缺乏资料而又没有理由说明哪一个状态发生的可能性更大的情况下应当是相等的.决策者首先计算每个方案收益的均值,然后从中选取均值最大的方案为最优决策方案.在等可能准则下,有.}1|/)max{(minqdij根据等可能准则,对于每个方案,有)3,2,1(iai.3.333)4020120(,403)04080(,3.333)203050(321ddd则,故方案是最优决策方案.40}3.33,40,3.33max{*2d2a3.风险性决策模型决策问题的不确定性给决策者的决策带来困难.决策者努力收集有关自然状态的以往信息,以便获得各个自然状态发生的概率.这些以往的信息称为先验信息,由于先验信息加工整理得到的概率分布称为先验分布.如果决策者已经具有各自然状态发生的概率,则该决策问题为风险性决策.在风险性决策的问题中,人们还可能追加新的样本信息来修正原有的先验分布,获得后验分布,以提高决策的可靠性,与不确定性决策一样,风险性决策也会受不同准则的影响而导出不同的结果.例2在例1中,决策者通过样本调查得知,出现高需求、一般需求、低需求三种状态的概率分别为.2.0)(,5.0)(,3.0)(321spspsp现利用几个常用的准则进行决策.(1)最大可能准则最大可能准则要求决策者首先找出概率明显最大的自然状态,然后在这一状态下选取收益最大的方案为最优决策方案.在最大可能准则下,有}.1|max{miqdit其中t满足}.1|)(max{)(njspspjt根据最大可能准则,且对于每个方案,有}31|)(max{)(2jspspj)3,2,1(iai40}20,40,30max{2d故方案是最优决策方案.2a(2)期望收益准则期望收益准则要求决策者首先计算出每个行动方案的期望收益,然后从中选取期望值最大的方案为最优决策方案.在期望收益准则下,有}.1|)(max{jjijmispqd根据期望收益准则,对于每个方案,有)3,2,1(iai.38)40(2.0205.01203.0,4402.0405.0803.0,34202.0305.0503.0321ddd则,故方案是最优决策方案.44}38,44,34max{*2d2a(3)期望损失准则期望损失准则要求决策者首先计算出由后悔而产生的每个行动方案的期望损失值,然后从中选取期望值最小的方案为最优决策方案.在期望收益准则下,有}.1|))((min{jijjjmiqqspd根据期望损失准则,对于每个方案,有)3,2,1(iai.22602.0205.003.0,16202.005.0403.0,2602.0105.0703.0321ddd则,故方案是最优决策方案.16}22,16,26min{*2d2a其中}1|max{miqqijj(4)后验期望准则后验期望准则要求,决策者在追加样本信息的基础上利用贝叶斯公式求得有关状态的后验分布,然后将后验分布取代先验分布,求出期望收益值最大的方案为最优决策方案.在后验期望准则下,有)|(xspj其中满足贝叶斯公式}.1|)|(max{jjijmixspqdkkkjjjspsxpspsxpxsp)()|()()|()|(根据后验期望准则所体现的原理,决策者应进行市场调查,追加样本信息.假设决策者现向40户打算购买彩电的人发出购买该厂彩电的订单,其中有3户回函购买该厂彩电,记这一组抽样试验结果为x,则试验x相当于进行了40次独立试验,其中3次成功.根据二项分布,计算出.1396.096.004.0)|(,2162.094.006.0)|(,2313.092.008.0)|(973340397334029733401CsxpCsxpCsxp根据贝叶斯公式,由2054.02.01396.05.02162.03.02313.0得sj(j=1,2,3)的后验概率分布分别为.1358.02054.0/2.01396.0)|(,5264.02054.0/5.02162.0)|(,3378.02054.0/3.02313.0)|(321xspxspxsp这时,对于每个方案,有)3,2,1(iai.642.45)40(1358.0205264.01203378.0,04.4801358.0405264.0803378.0,398.352013582.0305264.0503378.0321ddd则,故方案是最优决策方案.04.48}632.45,04.48,398.35max{*2d2a二、信息的价值当决策者关于自然状态的信息越缺乏时,那么决策过程中主观臆断的成分就越多。收集和提供相关信息有利减少决策问题的不确定性,提高决策的科学性。如果提供的信息能够完全消除不确定性,则这种信息称为完全信息。决策者常常通过进行试验和抽样获得更多的信息。在一般情况下,这些信息能够减少不确定性,但不能够完全消除不确定性,这种信息称为样本信息。完全信息期望值为EVPI(expectedvalueofperfectinformation),则EVPI=完全最大期望收益值-先验最大期望收益值即.}1|)(max{}1|)(max{jjjijjijmispqmispqEVPI例3一投资者考虑把他的一笔钱或者投放到房地产投资中去,或者购买证券.房地产投资有两种方案,所得到利润依赖于政府未来城区规划的政策,其前景分别为自然状态s1和s2.利润表如下表所示:s1s2(a1):房地产I(a2):房地产II(a3):证券1550001350001000003500085000100000投资者认为状态s1的概率为0.3,而状态s2的概率为0.7.试分别利用期望收益准则和期望损失准则确定最优决策方案,并给出完全信息的期望值。例4在例2中,决策者为了掌握更多的信息,决定花费1.5万元请咨询公司调查该厂彩电的市场占有情况,调查结果如表所示,在高需求状态下,销路好与不好的概率分别为0.8和0.2;在一般需求状态下,销路好与不好的概率各为0.5;在低需求状态下,销路好与不好的概率分别为0.3和0.7。高需求s1一般需求s2低需求s3销路好x1销路差x2p(x1|s1)=0.8p(x2|s1)=0.2p(x1|s2)=0.5p(x2|s2)=0.5p(x1|s3)=0.3p(x2|s3)=0.7样本信息期望值为EVSI(expectedvalueofsampledinformation),则EVSI=后验最大期望收益值-先验最大期望收益值即}1|)(max{.}]1|)|()[max{(jjijkjkjijkmispqmixspqspEVSI

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功