八、风险型与不确定型决策王国华E-mail:g***ng@ntu.edu.cn目录概念不确定型决策风险型决策决策函数决策问题构成要素,为了表述决策问题收益函数、损失函数和效用函数统称为决策函数——记作f=F(a,θ)收益矩阵、损失矩阵和效用矩阵统称为决策矩阵——记作mnmmnnnmijooooooooooO212222111211)(收益函数把收益值作为决策方案的评价指标,最满意方案就是收益值最大的方案。设决策问题的收益值为q,状态变量为θ,决策变量(方案或策略)为a。当决策变量a和状态变量θ确定后,收益值q随之确定。收益值q是a和θ的函数,称为收益函数,记作q=Q(a,θ)收益函数如果决策变量和状态变量是离散的,即a=ai(i=1,2,…,m)θ=θj(j=1,2,…,n),则收益函数可以表示为:qij=Q(ai,θj),(i=1,2,…,m;j=1,2,…,n)收益矩阵mnmmnnnmijqqqqqqqqqqQ212222111211)(损失函数损失值又称为遗憾值,表示没有采取最满意方案或策略时所造成的损失。当决策变量a和状态变量θ确定后,损失值r是a和θ的函数,称为损失函数,记作r=R(a,θ)在离散情况下,损失值可以表示为rij=R(ai,θj)(i=1,2,…,m;j=1,2,…,n)损失函数损失函数可以表示为损失矩阵,即损失值可以通过收益值计算出来,计算公式为(i=1,2,…,m;j=1,2,…,n)mnmmnnnmijrrrrrrrrrrR212222111211)(ijkjmkijqqr1max损失函数损失值rij表示在状态θj的条件下,没有采取收益值最大方案,“舍优取劣”给决策带来的损失或遗憾。一般地,损失函数和收益函数有如下关系:),(),(max),('aQaQaRAa举例收益矩阵利用公式求解损失矩阵80300300504507502006001000)(33ijqQijkjmkijqqr1max03007003015025028000)(33ijrR效用(utility)在经济学中,效用是指商品和劳务满足人的欲望或需要的能力。在决策中,效用描述可行方案的各种结果值满足决策者愿望,实现决策者偏好程度的问题。效用因人、因时、因地而不相同。效用的定义设决策问题的各可行方案有多种可能的结果值o,依据决策者的主观愿望和价值倾向,每个结果值对决策者均有不同的值和作用。反映结果值o对决策者价值和作用大小的量值称为效用,记作u=u(o)效用定义的说明在决策理论中,效用是概念,反映决策方案的结果值满足和实现决策者愿望和倾向的程度。效用也是量值,可以用具体的方法测定,并作为决策分析的依据。决策表随机型决策分析存在两个或两个以上自然状态的决策问题,每一行动方案对应着多个不同的结果,概率分布可能是已知,也可能是未知。概率分布倘若已知,经过预测或估算可以被确定下来,则称为风险型决策。概率分布若未知,则称为不确定型决策。不确定型决策分析不确定型决策问题行动方案的结果值出现的概率无法估算,决策者根据自己的主观倾向进行决策,不同的主观态度建立不同的评价和决策准则。根据不同的决策准则,选出的最优方案也可能是不同的。目录概念不确定型决策风险型决策不确定型决策分析设决策问题的决策矩阵为这里,每种自然状态θj(j=1,2,3,…,n)出现的概率P(θj)是未知的。如何根据不同方案在各状态下的条件结果值oij,确定决策者最满意行动方案?下面介绍几种常用决策准则。mnnnmmoooooooooO212221212111 乐观准则(max-max准则)基本思路是:假设每个行动方案总是出现最好的条件结果,即条件收益值最大或条件损失值最小,那么最满意的行动方案就是所有oij中最好的条件结果对应的方案。具体步骤:根据决策矩阵选出每个方案的最优结果值在这些最优结果值中选择一个最优者,所对应的方案就是最优方案。乐观准则上述最优结果值是指最大收益值或最大效用值。在某些情况下,条件结果值是损失值,最优结果则是指最小损失值。设方案ai的最大收益值为则乐观准则的最满意方案a*应满足ijnjiqaqmax1)(ijnjmiimjqaqq111maxmax)()a*(max乐观准则实质持乐观准则的决策者在各方案可能出现的结果情况不明时,采取好中取好的乐观态度,选择最满意的决策方案。由于决策者过于乐观,一切从最好的情况考虑,难免冒较大的风险。乐观准则举例某企业拟定了三个生产方案,方案一(a1)为新建两条生产线,方案二(a2)为新建一条生产线,方案三(a3)为扩建原有生产线,改进老产品。在市场预测的基础上,估算了各个方案在市场需求的不同情况下的条件收益值如表(净现值,单位:万元),但市场不同需求状态的概率未能测定,试用乐观准则对此问题进行决策分析。例题——收益值表及决策矩阵下例解题步骤各方案的最优结果值为最满意方案a*满足a*=a1为最满意方案)()(max*)(131aqaqaqii悲观准则(max-min准则)悲观准则也称保守准则,其基本思路是假设各行动方案总是出现最坏的可能结果值,这些最坏结果中的最好者所对应的行动方案为最满意方案。具体步骤根据决策矩阵选出每个方案的最小条件结果值从这些最小值中挑一个最大者,所对应的方案就是最满意方案悲观准则设方案的最小收益值为悲观准则的最满意方案应满足ijnjiqaq1min)(ijnjmiimiqaqaq111minmax)(max)*(悲观准则实质持悲观准则的决策者往往经济实力单薄,当各状态出现的概率不清楚时,态度谨慎保守,充分考虑最坏的可能性,采取坏中取好的策略,以避免冒较大的风险。悲观准则举例上例中的决策问题用悲观准则进行决策分析。最满意方案a*满足即a*=a3为最满意方案折衷准则乐观准则和悲观准则对自然状态的假设都过于极端。折衷准则既非完全乐观,也非完全悲观。折衷准则基本思路是假设各行动方案既不会出现最好的条件结果值,也不会出现最坏的条件结果值,而是出现最好结果值与最坏结果值之间的某个折衷值,再从各方案的折衷值中选出一个最大者,对应的方案即为最满意方案。折衷准则的决策步骤取定乐观系数α(0≤α≤1),计算各方案的折衷值,方案ai的折衷值记为h(ai),即从各方案的折衷值中选出最大者,其对应的方案就是最满意方案,即折衷准则最满意方案满足乐观系数α由决策者主观估计而确定。当α=1时,就是乐观准则;当α=0时,就是悲观准则。折衷准则中的α一般假定为0α1。折衷准则举例上例中的决策问题用折衷准则进行决策分析。取乐观系数α=1/3,各方案的折衷值为最满意方案a*满足即a*=a2为最满意方案遗憾准则(min-max准则)遗憾准则也称为最小遗憾值准则或最小机会损失准则。遗憾准则的基本思路是,假设各方案总是出现遗憾值最大的情况,从中选择遗憾值最小的方案作为最满意方案。通常,人们在选择方案的过程中,如果舍优取劣,就会感到遗憾。遗憾值所谓遗憾值,就是在一定的自然状态下没有取到最好的方案而带来的机会损失。设在状态θj下选择了方案ai,这时得到条件收益值qij,则方案ai在状态θj下的遗憾值rij(或称收益值qij的遗憾值)为遗憾准则决策步骤计算在各方案在每种状态下的遗憾值rij(即机会损失值)找出各方案的最大遗憾值,即在各方案的最大遗憾值中取最小值,对应的方案为最满意方案。即最满意方案a*满足遗憾准则举例上例中的决策问题用遗憾准则进行决策分析。计算各方案在每种状态下的遗憾值,得遗憾值矩阵各方案的最大遗憾值如右:最满意方案a*满足即a*=a2为最满意方案等可能性准则(Laplace准则)19世纪数学家拉普拉斯(Laplace)提出来,因此又称为拉普拉斯准则。这个准则认为,在各自然状态发生的可能性不清楚的时候,只能认为各状态发生的概率相等,按相等的概率求出各方案条件收益的期望值(或期望效用值),最大期望值对应的方案即是最满意方案。等可能性准则决策步骤假定各自然状态出现的概率相等,即p(θ1)=p(θ2)=…=p(θn)=1/n求各方案条件收益期望值或期望效用值从各方案的条件收益期望值中找出最大者,或找出期望效用值最大者,所对应的a*为最满意方案,即a*满足等可能性准则举例上例中决策问题用等可能性准则进行决策。按等可能性准则,各状态发生的概率设为1/3各方案条件收益的期望值为:最满意方案a*满足即a*=a1为最满意方案不同的决策准则解题比较在应用多种方法分析之后,一般会发现某些方案一直未曾入选或被选中的频数相对较小,可将这样的方案先淘汰掉,再作进一步分析。例题中方案a3被选中的频数最低,淘汰。目录概念不确定型决策风险型决策风险型决策各自然状态的概率经过预测或估算被确定下来,在此基础之上的决策分析所得到的最满意方案就具有一定的稳定性。只要状态概率的测算切合实际,风险型决策方法相对于不确定型决策方法就更为可靠。风险型决策分析最主要的决策准则是期望值准则风险型决策一般条件存在着决策者希望达到的目标(如收益最大或损失最小)存在着两个或两个以上的方案可供选择存在着两个或两个以上不以决策者主观意志为转移的自然状态(如不同的市场条件)可以计算出不同的方案在不同自然状态下的损益值在可能出现的不同自然状态中,决策者不能肯定未来将出现哪种状态,但能确定每种状态出现的概率单目标风险型决策问题的表示设单目标风险型决策问题的可行方案为a1,a2,…,am,自然状态为θ1,θ2,…,θn,且θj的概率分布是已知的,p(θj)=pj(j=1,2,…,n),各可行方案在不同自然状态下的条件结果值为oij(i=1,2,…,m;j=1,2,…,n)。当方案的个数和状态的个数皆为有限数时,该问题可表示为决策表或决策矩阵mnnnmmnoooooooooaaappp...........................21222121211111121mnnnmmoooooooooO.....................212221212111期望值准则期望值准则是指根据各方案的条件结果值的期望值的大小进行决策。当条件结果值表示费用,应选期望值最小的方案,当条件结果值表示收益或效用,则应选期望值最大的方案。在实际应用中,风险型决策问题的期望值准则评价模型有三种情况。期望效用值评价模型经过效用标准测定法测算,得到决策者的效用函数为u=u(x)由决策矩阵可以求出各条件结果值的效用值uij=u(oij)(i=1,2,…,m;j=1,2,…,n)全部效用值构成效用值矩阵mnnnmmuuuuuuuuuU.....................212221212111期望效用值评价各方案的期望效用值记为期望效用值hi表示了各方案的优劣程度,hi越大,方案ai越令人满意,这种表示方案令人满意程度的指标,称为合意度。可行方案的优劣排序问题,就可以用各方案的合意度的大小来表示,求解决策问题,就是寻找合意度最大的方案。即jnjijipuh1jnjijmiimipuhh111maxmax期望结果值评价模型直接按条件结果期望值的排序来选择最满意方案,这就是期望结果值评价模型。当条件结果为条件收益时,条件结果期望值最大的方案就是最满意方案。当条件结果的条件损失时,则条件结果期望值最小的方案为最满意方案。jnjijmiimipqaqaq