第三节常用决策方法一般将具有下列四个特征的问题称为决策问题。(1)有明确的目标;(2)每个问题都有几种自然状态;(3)每个问题都有一些行动方案;(4)每一种行动方案,在各种自然状态下的效应值(收益、损失、占有率、成功率…)都可以计算或预测出来。记效应值为:其中:(,)ijijefdS12ni(1,2,...,),,...,di1,2,...,mjSjnSSSS12m为状态变量,为状态集合;(=)为决策变量,D=d,d,...d为决策集合;ijijijmnedeS为行动方案在自然状态下的效应值,E=()为效应矩阵。决策问题的一般模型可用下列决策(表3-4)表示其中:P(Sj)(j=1,2,…,n)为自然状态Sj出现的概率一、确定型决策方法确定型决策问题:在决策问题中,只有一种自然状态的情况下、分析各个方案,从中选择最优的行动方案以获得最好的结果。求极值、优选法、网络技术、规划等问题都属于确定型决策的范畴。线性规划问题例1:某厂生产两种仪器,基础数据下。问如何安排生产,可使月销售利润最多?销售利润(元/台)装配检验甲1.00.6300.0乙4.01.2800.0月工总量(小时)=220=96仪器的工时消耗与销售利润仪器型号注:乙型仪器由于每台需外协件一只,每月产量不超过45台工时消耗定额(小时/台)解:设生产甲、乙型仪器的台数依次为,问题就是的何选择,使目标利润达到最大。目标函数为:极大化的约束条件为:12x,x12x,xZ12300800Zxx12122124220()0.6x+1.2x96()x45()x0x0()xx装配台时限制检验台时限制乙型仪器产量限制,产量不能为负值将以上各项写在一起,得到线性规划的数学模型为121212212max30080042200.6x+1.2x96x45x0x0Zxxxx目标函数约束条件,maxZ表示目标函数极大化,规划为线性的含意是目标函数与约束条件都是决策变量x1、x2的线性表达式。由图可见,例1的线性规划问题在可行域的交点C(100,30)处取得最优解,即当x1=100(台)、x2=30(台)时,取得月利润最大值为:max300100+80030=54000()Z=元图解法只使用于仅有两个决策变量的情况。1122b......nnxbxbXxb其中:为决策变量矩阵,=为资源矩阵12nij(,,...)anCCCCm为价值矩阵,A=()为技术系数矩阵maxminb0ZCXAXX目标函数(或)约束条件一般的线性规划数学模型用矩阵表示为二、风险型决策当自然状态有多种情况,且各自然状态出现的概率己知或可估计时,可用统计方法进行决策,称之为随机决策问题。这种问题对得出的最优决策无绝对把握,而是冒一定的风险,所以,又称为风险决策。(一)最大可能性法最大可能性法:按照可能性最大的那种自然状态来选取最优策略,即挑选一个概率最大自然状态进行决策,其它状态不予考虑。它是将一个风险型决策问题归结为一个相应的确定型问题。例2:某企业根据市场情况采取不同推销策略,其决策损益如下:自然状态企业收益行动方案P(S1)=0.3P(S2)=0.5P(S3)=0.2d1942d2573d3456S1(行情好)S2(行情一般)S3(行情差)推销决策损益表由于P(S2)=0.5最大,依据最大可能性法,只考虑在状态S2(行情一般)下的方案选择。显然,此时行动方案d2是决策的最佳选择,企业收益预计为7万元。需要指出,只有当自然状态集合S中的某个状态Sk(1kn)出现的概率P(Sk)特别大,且各状态下的效应值差别不是很大时,应用最大可能性法的效果才比较好。否则,可能导致严重失误。(二)期望值法期望值法是把每个行动方案的期望值求出来,然后根据期望值的大小确定最优方案。公式:决策最优方案为。niijii=1(d)e()i1,2EPS=(=,...,m)*i1in()max(min)(d)iEdE或*id对于例2,比较结果,选择d1做为最优决策方案。此时,企业可以获得的平均利润为6.1万元。自然状态企业收益行动方案P(S1)=0.3P(S2)=0.5P(S3)=0.2d1942d2573d3456S1(行情好)S2(行情一般)S3(行情差)推销决策损益表123d9d5d4EEE()=0.3+40.5+20.2=6.1()=0.3+70.5+30.2=5.6()=0.3+50.5+60.2=4.9(三)决策树法期望值决策方法又可用决策树进行分析。决策树由树杈(又称节点)和树枝构成。节点分为两类,一类是决策点,用小方框“ϓ”表示,另一类是状态点(又称机会点),用小圆圈“О”表示。树枝是由节点出发的线段,从决策点出发的是决策(或方案)枝,它表示决策人可能采取行动。从状态结点出发的是机会枝(或称概率枝),在其上标有自然状态及其概率。树梢处为结果点,用“△”表示,在其右侧标出结果或其价值。idjS()jPS状态点决策点方案枝概率枝结果点1324状态点决策点方案枝概率枝结果点942573456S1•P(S1)=0.3S2•P(S2)=0.5S3•P(S3)=0.2S1•P(S1)=0.3S2•P(S2)=0.5S3•P(S3)=0.2S1•P(S1)=0.3S2•P(S2)=0.5S3•P(S3)=0.26.15.64.9d1d2d36.1决策人从决策树根部(最初决策点)出发,向前至树梢。当决策人遇到决策点时,他必须从该点出发的树枝中择优向前;当遇到机会点时,则由概率枝自然选择其走向,各结点上方标上结点的期望值,决策树决策的过程为逆向运算期望值,正向选择方案枝。比较状态结点上标明的期望值,结点2的值最大,故选择方案作为最佳决策方案、用剪枝(打“×”)去掉方案并将最佳效应6.1万元标在决策点1上。决策树给人以直观明晰的感觉,很有实用价值。1d23dd、(四)贝叶斯决策前面讨论的期望值决策法,是根据自然状态及其概率来计算的,这些概率大多数是根据以往的经验得到的估计值。如果决策者通过调查或做试验等途径获得了更多信息,则根据贝叶斯公式算出试验概率,再作决策,就称为贝叶斯决策。jS()jPS12378910564100-302010100-302010100-302010(五)E-V判据在前面决策中,只考虑了各方案的期望值,而没有考虑能反映方案结果离散程度的方差。所谓E-V判据(即期望-方差准则)是用包含、的某种函数形成的值作为判断行动优劣的标准。常用的评价函数形式有a0:风险厌恶型;a=0:风险中立型;a0:风险追求型22(,)222()(,)=(,)=(,)=三、不确定型决策方法实际问题中,还会遇到有多个自然状态,但各自然状态出现的概率无法确定的情况。这是最差的情形,此时该如何决策呢?由于评判的标准不同,形成不同的决策方法。乐观法(好中求好决策准则)悲观法(坏中求好准则)乐观系数法(折衷法)等可能法后悔值法(一)乐观法(好中求好决策准则)乐观法的基本思想是:决策者对客观情况抱乐观态度,认为每个行动方案都会对应其最好的自然状态,取得最佳效应值。故先选出各行动方案对应的最好效应值(收益最大或损失最小),再从中选出最好效应值,它对应的行动方案为决策方案。计算公式为:**maxmax(,)minmin(,)ijiDjSijiDjSrfdSrfdS或例4:下列行军决策(表3-8)应如何决策可使行军成功率最大。自然状态成功率行动方案(收到袭击)(气候不好)(道路不畅)d10.90.40.1d20.50.30.7d30.60.80.2d40.50.50.5行军决策表S1S2S3*dmaxmax(,)max0.90.70.80.50.9ijiDjSifdS=,,,=解:(二)悲观法(坏中求好准则)悲观法的基本思想是:决策者对客观情况抱悲观态度,认为每个行动方案都会对应其最坏的自然状态。故先选出各行动方案对应的最坏状态效应值(收益最小或损失最大),再从中选出效应值最好者,它对应的行动方案为悲观决策方案。计算公式为:**maxmin(,)minmax(,)ijjSiDijiDjSrfdSrfdS或下列行军决策用悲观法应如何决策可使行军成功率最大?自然状态成功率行动方案(收到袭击)(气候不好)(道路不畅)d10.90.40.1d20.50.30.7d30.60.80.2d40.50.50.5行军决策表S1S2S3*dmaxmin(,)max0.10.30.20.50.5ijjSiDifdS=,,,=解:(三)、乐观系数法(折衷法)将乐观与悲观两种极端情况进行折衷,用权重表示其趋于冒险的程度,可确定乐观系数决策方案。计算公式为:1(0)**maxmax(,)(1)min(,)minmin(,)(1)max(,)ijijjSiDjSijijiDjSjSrfdSfdSrfdSfdS或权重称为乐观系数,它究竞在(0,1)区间内取何值,取决于决策者的态度。在决策者很难确定冒险点还是保守点好时,不妨取1/2下列行军决策用乐观系数法应如何决策可使行军成功率最大?自然状态成功率行动方案(收到袭击)(气候不好)(道路不畅)d10.90.40.1d20.50.30.7d30.60.80.2d40.50.50.5行军决策表S1S2S3解:*maxmax(,)(1)min(,)0.60.90.40.10.58ijijjSiDjSrfdSfdS=+=0.6a时0.4r*=0.5a时,(四)等可能法等可能法的基本思想是:因为无法确定各自然状态出现的概率,不妨认为它们是等可能出现的,于是每个方案的效应值可用期望值法进行计算,并从中选择平均效应值最佳的方案为决策方案。计算公式为:*11max(,)nijiDjrfdSn自然状态成功率行动方案乐观法悲观法乐观系数法a=0.4等可能法d10.90.40.10.90.10.420.47d20.50.30.70.70.30.460.5d30.60.80.20.80.20.440.53d40.50.50.50.50.50.50.5方法选取的效应值0.90.50.50.53决策方案d1d4d4d3行军决策表各方案确定的效应值S1S2S3(五)后悔值法后海值法的基本思想是:当未来出现某种自然状态时,若我们选择了这种自然状态下的最佳方案(效应值最大)则我们不会后悔;若我们选择了其它方案,则一定会产生后悔的感觉。后悔值法首先确定各自然状态下,每个行动方案可能产生的后悔值,得后悔值决策表。根据后悔值决策表,确定各行动方案可能产生的最大后悔值。从中再选择后悔值最小者,所对应的方案为后悔值决策万案。后悔值:某自然状态下,最佳效应值与采取方案效应值的差。用rij表示Sj状态下的di对应的后悔值,则再按悲观法进行决策:r*对应的方案即为后悔值法对应的决策方案d*。max(,)(,)1,2,...,1,2,...,ijijijirfdSfdSimjn*minmaxijiDjSrr自然状态损益值行动方案d100.40.60.6d20.40.500.5d30.300.50.5d40.40.30.20.40.4d4最大后悔值最小者决策方案行军决策表S1S2S3各方案最大后悔值练习:用乐观法,悲观法,乐观系数法(0.5)和后悔值法进行决策。需求小需求中需求大削减装备0.51.51.5维持现状02.02.5扩充装备-1.005.0作业:某公司要举行一个展销会,会址选在甲,乙,丙三地,资料如下表。试用决策树法与期望值法进行决策。S1(天气好)S2(天气一般)S3(天气坏)P(S1)=0.35P(S2)