第四章随机性决策问题的决策准则一、决策问题的表格表示及决策问题的分类决策问题除了可以用决策树来描述以外,还可以用表格表示,这种表格叫做决策表,也叫决策矩阵。如果决策问题的后果是用损失表示的,亦可称作损失矩阵。在随机性决策问题中,决策人采取任何行动后的结果不仅仅由行动本身而且由大量外部不确定因素所决定,这些外部因素是决策人无法控制的,通常用自然状态(或者简称状态)作为所有外部因素的全面描述。若决策人知道实际上出现的是哪一种自然状态,即知道外部因素的真实值,他就可以确定采取任何一种行动的后果;同时假设:虽然决策人并不知道自然界的真实状态,但他知道哪些状态可能出现。第四章随机性决策问题的决策准则为了简单起见,假设只有有限种互不相容的可能的状态,并记为},,,{21n;同时假设只有有限种可行的行动,即行动集},,,{21maaaA,决策人必须在这些行动中选一种也只能选一种;把采用行动ia,真实的状态为j时的后果记为ijx,就可以得到决策表。第四章随机性决策问题的决策准则表4.1决策表的一般形式状态行动12…j…n1a11x12x…jx1…nx12a21x22x…jx2…nx2┇┇┇…┇…┇ia1ix2ix…ijx…inx┇┇┇…┇…┇ma1mx2mxjmxmnx第四章随机性决策问题的决策准则jix是可能后果的完全而整体性的描述。若决策问题涉及货币型后果,jix可以是个数字;但也可以是文字描述,例如下雨带伞及Savage,1972的炒鸡蛋等例子的后果。无论决策问题的后果jix是什么形式,都假设决策人能够用实值效用函数u(或价值函数v)来评价jix。这时决策规则将如表4.2所示(在使用价值函数时用ijv取代iju)。第四章随机性决策问题的决策准则jix是可能后果的完全而整体性的描述。若决策问题涉及货币型后果,jix可以是个数字;但也可以是文字描述,例如下雨带伞及Savage,1972的炒鸡蛋等例子的后果。无论决策问题的后果jix是什么形式,都假设决策人能够用实值效用函数u(或价值函数v)来评价jix。这时决策规则将如表4.2所示(在使用价值函数时用ijv取代iju)。第四章随机性决策问题的决策准则决策问题的后果常常用损失描述,用损失描述后果的决策表称为损失矩阵。例如转置的损失矩阵如表4.3所示。表4.2以效用表示后果价值的决策表表4.3转置的损失矩阵状态行动12…j…n1a11u12u…ju1…nu1,2a21u22u…ju2…nu2┇┇┇…┇…┇ia1iu2iu…iju…inu┇┇┇…┇…┇ma1mu2mujmunmu在统计决策理论中,决策表通常采用表4.3所示的形式,其中的损失jil是效用iju的负值,即jil=-iju。行动状态1a,2a…ia…ma111l12l…il1…ml1221l22l…il2…ml2┇┇┇…┇…┇j1jl2jl…jil…jml┇┇┇…┇…┇n1nl2nlnilnml第四章随机性决策问题的决策准则2.决策问题的分类⑴确定型决策问题确定型决策问题的特点是决策人在进行选择之前了解真实的自然状态,即他可以确切地知道各种行动的后果。事实上,这就相当于假设n=1,这时决策表形如表4.4。表4.4确定型决策问题的决策表行动状态1a,2a…ia…ma111v12v…iv1…mv1这类问题的求解属运筹学中的纯量优化问题。第四章随机性决策问题的决策准则2.决策问题的分类⑴确定型决策问题确定型决策问题的特点是决策人在进行选择之前了解真实的自然状态,即他可以确切地知道各种行动的后果。事实上,这就相当于假设n=1,这时决策表形如表4.4。表4.4确定型决策问题的决策表行动状态1a,2a…ia…ma111v12v…iv1…mv1这类问题的求解属运筹学中的纯量优化问题。第四章随机性决策问题的决策准则⑵严格不确定型问题严格不确定型问题是指决策人只能知道有哪些自然状态可能出现,他无法以任何方式量化这种不确定性,即他只能给出各种可能状态n,,,21的列表,而对各种状态出现的可能性的大小一无所知,也就是说各种自然状态出现的概率无法估计。这一类决策问题的决策表形如表4.1到4.3所示。第四章随机性决策问题的决策准则⑶风险型决策在风险型决策问题中,决策人虽然无法确知将来的真实自然状态,但他不仅能给出各种可能出现的自然状态n,,,21,还可以给出各种状态出现的概率,通过设定概率分布)(,),(1n来量化不确性。这一类决策问题的决策表需要在表4.1到表4.2中增加一行)(,),(1n值(在表4.3中则增加一列)。风险型决策问题的求解方法是本课程研究的重点。3.决策准则与决策规则无论是不确定型问题还是风险型问题,都需要根据某种准则来选择决策规则δ,使结果最优(或满意),这种准则就叫决策准则,或称决策原则。例如贝叶斯分析的决策准则是使期望效用极大。第四章随机性决策问题的决策准则二、严格不确定型决策问题的决策规则本节要讨论在严格的不确定性情况下作决策的几种规则。严格不确定性的含义在前面作了介绍,是指决策问题可能出现的状态已知,但对各种自然状态发生的概率(可能性)的大小一无所知。下面所介绍的这些准则并不能产生特别令人满意的决策,只是舍此别无良策。用来求解严格不确定型问题的决策准则有4种可以,虽然单独的准则都合理而实用,但是,有些问题用不同的准则求解会导致不同的选择,因此这4种准则不可能都是指导作决策(选择)的完美准则,这4种准则中没有哪一种同时具备理想的准则应具备的一致性性质,进一步研究发现,不可能设计出一种同时具备这些性质的决策准则。这时我们面临两种选择,一是重新考虑这4种准则的合理性;二是我们判定严格不确定型决策问题本身无定解。我们的结论是后者。第四章随机性决策问题的决策准则4.2.1求解严格不确定型决策问题的四种主要决策准则1.悲观准则悲观准则亦称极小化极大准则,是Wald,1950提出的。它的思路是考察采取行动ia,mi,,2,1时可能出现的最坏后果,即最大的损失is,亦即:),(max1ijnjials决策人应选择行动ka使最大的损失is尽可能小,即选择ka使}{maxmin}{min111ijnjmiimiklss(4.1)第四章随机性决策问题的决策准则4.2.1求解严格不确定型决策问题的四种主要决策准则1.悲观准则根据式(4.1),这一准则称作极小化极大的理由是显而易见的。当决策表中的元素是效用值iju或价值函数ijv时,Wald的准则是使各行动的最小效用(价值)最大化,即极大化极小效用。即选择ka使}{minmax}{max11'1'ijnjmiimikuss(4.1’)采用该原则者极端保守,是悲观主义者,认为老天总跟自己作对,总是假设会发生最糟的情况并且被自己遇上。第四章随机性决策问题的决策准则2.乐观系数法与Wald的悲观主义方法相对立,可以形成一种乐观主义的准则:只考虑行动ia各种可能的后果中最好的(即损失最小的)后果,定义行动ia的乐观主义水平io为}{min1ijnjiloio是采用行动ia时可能导致的最佳后果,乐观主义的准则是使损失极小化极小,即选择ka使}{minmin}{min111ijnjmiimikloo(4.2)第四章随机性决策问题的决策准则由式(4.2),乐观主义准则亦称(使损失)极小化极小准则。这种准则的实质是在损失矩阵中找出损失最小的元素hkl,决策人选择hkl所对应的行动ka。当决策表中的元素是效用值iju或价值函数ijv时,乐观主义的准则是使各行动的最大效用(价值)最大化,称为(使效用值)极大化极大准则。即选择ka使}{maxmax}{max11'1'ijnjmiimikuoo(4.2’)Hurwitz,1951提出,在现实生活中很少有人像极小化极大准则所显示的那么悲观,也很少有人象极小化极小准则那么乐观。第四章随机性决策问题的决策准则一种折衷:决策人应根据这两种准则的加权平均值来排列行动的优劣次序,其中的权称为乐观系数。由决策者个人给定,并适用于他所面临的所有决策问题。Hurwitz介绍的决策规则是:选择ka使}minmax1{min}1{min)1(1111jinjjinjmiiimikkllosos(4.3)使用这种方法首先要确定。为此可让决策人对表4.5所示的简单的2×2决策矩阵进行判断。调整表中的损失值l(10l),直到决策人认为1a与2a两者无差别时,即可确定l1。一旦确定,可用它求解决策人所面临的其他决策问题。第四章随机性决策问题的决策准则表4.5确定乐观系数的决策表1a2a10l21lis1lio0lkkos)1()1(l当决策表中的元素是效用值iju或价值函数ijv时,乐观系数准则是选择ka使}maxmin1{max)1(111''jinjjinjmikkuuos(4.3’)第四章随机性决策问题的决策准则3.后悔值极小化极大Savage,1951认为,真实的自然状态是决策人所无法控制的,在用损失矩阵(ijl)mn来作决策时,决策人会把采用一种行动ia在某一自然状态j下的结果与同样的自然状态下采用不同的行动的结果ijl,mi,,1加以比较。因此Savage定义了一个后果的后悔值jir,它是采取行动ia状态j时的损失ijl与状态为j采用不同的行动的最佳结果(最小损失)jimil1min之差,即jimijijillr1min(4.4)第四章随机性决策问题的决策准则Savage认为,应该用由jir构成的后悔值表mnjir)(取代由ijl构成的决策表,再用Wald的悲观主义方法求解。他提出每种行动的优劣用最大后悔值ip作为指标来衡量。jinjirp1maxip即采取行动ia时的最大后悔值,然后再选择使ip极小化的行动。也就是说,选择ka,使}}{max{minmin111jinjmiimikrpp(4.5)第四章随机性决策问题的决策准则4.等概率准则Laplace指出:对真实的自然状态一无所知“等价于”所有自然状态具有相同的概率。因此不妨认为选择一种行动使损失的平均值极小化是有正当理由的。于是决策人面临不确定结果的期望值:njjinl11,他应选择ka使}{min11111jinjnnijknjnll(4.6)第四章随机性决策问题的决策准则5.四种决策准则的比较在比较这四种决策准则时,首先会觉得它们解决问题的思路完全不同,但是孤立地看,每种准则都有一定的道理。为了对这几种准则进行比较,Milnor,1954给出了一个有4种状态,4种行动的决策问题的例子。示例决策问题的损失矩阵如表4.6(a)示例决策问题的损失矩阵如表4.6(a)。表4.6(a)表4.6(b)1a2a3a4ajiilmin123432223010343443433443is4344io2301iios)1(4-2λ34-4λ4-3λjijln)1(2.753331a2a3a4a10121223013101140011ip2321第四章随机性决策问题的决策准则用悲观准则求解时,各行动最大损失is分别是各列中的最大值4、3、4和4,把它们列入上表中。其中最小的损失对应于行动2a,即决策人应该选择行动2a。用乐观系数法求解时,首先将io的值列入相应的行;计算iios)1(并列入上表。当25.0时2a最优;25.0时3a最优。用Laplace的等概率准则求解时,计算jjinl)(的值如上表最后一行。显然1a的损失最小,决策人应该选择行动1a。第四章随机性决策问题的决策准则用Savage的后悔值极小化极大准则求解时,首先在原始的损失矩阵最右侧添加一列jiilmin,按式(4.4),得后悔值矩阵如表4.6(b)。各行动的最大后悔值ip列入表4.6(b)。其中行动4a的最大后悔值最