贝叶斯讲义决策中的收益损失与效用

q578474621
0 ℃
2019-01-16

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

11贝叶斯统计经济学院统计系陈耀辉:CH4Madebycyh陈耀辉:CH4Madebycyh2第四章决策中的收益、损失与效用§4.1决策问题的三要素§4.2决策准则§4.3先验期望准则§4.4损失函数§4.5常用损失函数§4.6效用函数3§4.1决策问题的三要素决策就是对一件事要作决定.它与推断的差别在于是否涉及后果.统计学家在作推断时是按统计理论进行的,很少考虑结论在使用后的损失.可决策者在使用推断结果时必需与得失联系在一起,能带来利润的就会用,使他遭受损失的就不会被采用,度量得失的尺度就是损失函数.它是著名的统计学家A.Wald(1902-1950)在40年代引入的一个概念.从实际归纳出损失函数是决策的关键.贝叶斯决策:把损失函数加入贝叶斯推断就形成贝叶斯决策论,损失函数被称为贝叶斯统计中的第四种信息.一、决策的基本概念4例1设甲乙二人进行一种游戏,甲手中有三张牌,分别标以.乙手中也有三张牌,分别标以.游戏的规则是双方各自独立地出牌,按下表计算甲的得分与乙的得分.321,,321,,aaa甲的得分矩阵(乙的失分矩阵)1a2a3a1233-2014-3-4-12这是一个典型的双人博弈(赌博)问题.不少实际问题可归结为双人博弈问题.把上例中的乙方改为自然或社会,就形成人与自然(或社会)的博弈问题.5例2某农作物有两个品种:产量高但抗旱能力弱的品种和抗旱能力强但产量低的品种.在明年雨量不知的情况下,农民应选播哪个品种可使每亩平均收益最大?这是人与自然界的博弈.以明年600mm雨量为界来区分雨量充足和雨量不充足.写出收益矩阵(单位:元)1a2a121a2a121000200-2004006例3一位投资者有一笔资金要投资.有以下几个投资供他选择::购买股票,根据市场情况,可净赚5000元,但也可能亏损10000元;:存入银行,不管市场情况如何总可净赚1000元.1a2a这位投资者在与金融市场博弈.未来的金融市场也有二种情况:看涨与看跌.可写出投资者的收益矩阵121a2a1250001000-100001000投资者将依据此收益矩阵决定他的资金投向何方.这种人与自然(或社会)的博弈问题称为决策问题.7二、决策问题的三要素1.状态集,其中每个元素表示自然界(或社会)可能出现的一种状态,所有可能状态的全体组成状态集.（如例2中的两种状态：雨水充足和雨水不充足）}{2.行动集,其中a表示人对自然界可能采取的一个行动.注意：一般行动集有两个以上的行动供选择.若有两个行动无论对自然界的哪一个状态出现,总比收益高,则就没有存在的必要,可把它从行动集中去掉,使留在行动集中的行动总有可取之处.}{a1a2a2a83.收益函数。函数值表示当自然界处于状态,而人们选取行动时所得到的收益大小。),(aQijjiQaQ),(ija收益函数的值可正可负，其正表示赢利，负表示亏损，单位常用货币单位。收益函数的建立不是件容易的事，要对所研究的问题有全面的了解才能建立起来(P125例4)。收益矩阵nmnnmmQQQQQQQQQQ2122221112119§4.2决策准则一、行动的容许性二、决策准则1.乐观准则2.悲观准则3.折中准则10一、行动的容许性定义：在给定的决策问题中，A中的行动a1称为是容许的。假如在A中不存在满足如下两个条件的行动a2，1.对所有的θ∈Θ，有Q(θ,a2)≥Q(θ,a1)2.至少有一个θ,可使上式不等式严格成立。假如这样的a2存在的话,则称a1是非容许的;假如二个行动a1和a2的收益函数在Θ上处处相等,则称行动a1与a2是相等的。11两点说明：1.一般情况下，行动集中只存在容许行动。2.上面的讨论是对收益函数而言的，但我们还可以对支付函数（或亏损函数、成本函数）进行讨论，此时需要支付函数（或亏损函数、成本函数）越少越好。例5（P126）1213二、决策准则1.乐观准则(1)定义：乐观准则也称“好中求好”决策准则，或称“最大最大”决策准则。这种决策准则就是充分考虑可能出现的最大利益，在各最大利益中选取最大者，将其对应的方案作为最优方案。这种决策准则的客观基础就是所谓的天时、地利和人和，决策者感到前途乐观，有信心取得每一决策方案的最佳结果。14(2)乐观准则决策方法的一般步骤：①确定各种可行方案；②确定决策问题将面临的各种自然状态；③将各种方案在各种自然状态下的收益值列于决策矩阵表中(表4-1)；④求每一方案在各自状态下的最大收益值，将其填写在决策矩阵表的最后一列；⑤取中的最大值，所对应的方案为最佳决策方案。][maxijQj][maxmaxijaQji15自然状态行动方案θ1θ2…θna1a2…am决策mnmmnnQQQQQQQQQ212222111211][maxmaxijaQji][maxijQj“乐观准则”决策矩阵表表4-116(3)“乐观准则”决策方法的应用①假设某一决策问题的决策收益矩阵表如下，按乐观准则选取最优方案。8.728.078.258.727.398.077.198.256.966.086.138.727.24θ1θ2θ3决策a1a2a3自然状态行动方案][maxijQj][maxmaxijaQji17②假设某一决策问题的决策损失矩阵表如下，按乐观准则选取最优方案。][minminijaQji5576611885910711612109761210θ1θ2θ3θ4决策a1a2a3a4自然状态行动方案][minijQj182.悲观准则(1)定义：悲观准则又称“小中取大”决策准则或叫“坏中求好”决策准则。这种决策准则的客观依据是决策的系统功能欠佳，形势对决策者不利，所以，决策者没有理由希望获得最理想的结果。面对这种情况，决策者必须从每一方案的最坏处着想，从每个方案的最坏结果中选择一个最佳值，即在所有不利的收益中，选取一个收益最大的方案作为最优决策方案。19(2)悲观准则决策方法的一般步骤：若决策矩阵为收益矩阵，则先对每一行动选出最小的收益，再在所有选出的最小收益中选取最大值。此最大值对应的行动就是悲观准则下的最优行动；若决策矩阵为损失矩阵，则先对每一行动选出最大的损失，再在所有选出的最大损失中选取最小值。此最小值对应的行动就是悲观准则下的最优行动；20(3)“悲观准则”决策方法的应用①假设某一决策问题的决策收益矩阵表如下，按悲观准则选取最优方案。7.197.196.086.137.398.077.198.256.966.086.138.727.24θ1θ2θ3决策a1a2a3自然状态行动方案][minijQj][minmaxijaQji21②假设某一决策问题的决策损失矩阵表如下，按悲观准则选取最优方案。10111012121188591078612119761211θ1θ2θ3θ4决策a1a2a3a4自然状态行动方案][maxijQj][maxminijaQji223.折中准则(1)定义:折中准则又称α系数决策准则,是对悲观准则和乐观准则进行折中的一种决策准则.α是一个依决策者认定情况乐观还是悲观而定的系数,称为乐观系数.若认定情况完全乐观,则α=1,若认定情况完全悲观,则α=0;一般情况下,则0α1.23(2)折中准则的基本步骤第一步:确定系数α的值;第二步:对每一行动a计算:),(min)1(),(max)(aQaQaH),(maxaQ其中表示行动a的最大收益值,表示行动a的最小收益值),(minaQ第三步:取行动a0,使H(a0)达到最大,即此种a0就是这种准则下的最优行动.)(max)(0aHaHaA24(3)折中准则决策方法应用案例某工厂预备生产一种新型童车,根据市场需求分析和估计，产品销路可分为三种状态:θ1-销路好;θ2-销路一般;θ3-销路差.可供选择的行动方案也有三种:a1,大批量生产;a2,中批量生产;a3,小批量生产.根据产量多少和销售情况，工厂的盈利情况也有所不同,可能获利也可能亏损,将此数值称为损益值.获利时称为收益值,亏损时称为损失值，用负号表示.现调查得本月的损益值见下表.试用α系数法作出决策.25新型童车损益值表自然状态行动方案销路好θ1销路一般θ2销路差θ3大批量生产a13023-15中批量生产a225200小批量生产a312121226解:第一步,确定系数α的值α=0.6第二步,计算H(a)H(a1)=0.6[max(30,23,-15)]+0.4[min(30,23,-15)]=12(万元)H(a2)=0.6[max(25,20,0)]+0.4[min(25,20,0)]=15(万元)H(a3)=0.6[max(12,12,12)]+0.4[min(12,12,12)]=12(万元)第三步,计算收益中的最大者H(a0)=max(12,15,12)=15(万元)所以最佳方案应为中批量生产,即为a2.27§4.3先验期望准则一、先验期望准则(1)定义：对给定的决策问题，若在状态集Θ上有一个正常的先验分布π(θ)，则收益函数Q(θ,α)对π(θ)的期望与方差分别称为先验期望收益和收益的先验方差。使先验平均收益达到最大的行动a'称为先验期望准则下的最优行动。若此种最优行动不止一个，其中先验方差达到最小的行动称为二阶矩准则下的最优行动。22)],([)],([)],([)],([)(aQEaQEaQVaraQEaQ)(max)(aQaQAa28几点说明：1.定义中的先验分布只能用正常先验分布，而不能采用广义先验分布。2.如果在比较先验期望收益的大小时，有两个或两个以上的行动使先验期望收益达到最大，这时才需要比较先验方差的大小做出决策。3.使用合理的先验信息，按照先验期望准则和二阶矩准则进行决策，所得结果更加可信。29(2)案例分析状态方案较高θ1一般θ2较低θ3a1700250-200a2980-500-800a340090-30例1某厂准备开发一种新产品，有三种方案供选择：a1、a2和a3。预计一年后市场对该种产品的需求量可分为较高、一般和较低。且预计一年后市场需求量是高、中、低的主观概率为：π(θ1)=0.6,π(θ2)=0.3,π(θ3)=0.1,同时算得收益矩阵如下。试用先验期望准则确定最佳行动方案。30先验期望准则和其他准则的关系市场需求量Θ1高θ2中θ3低悲观准则下π1001乐观准则下π2100折中准则下π30.800.2先验期望准则下π0.60.30.131例2(P125例题4.4)例3一卖花姑娘每天从花市按每棵5元购进，而按每棵10元卖出，当天若卖不完则剩下的花只能当垃圾。问该姑娘每天购进多少花？出售量(棵/日)频数(日)频率1440.0815110.2216100.201770.141870.141960.122050.10累计501.0032二、两个性质定理4.1在先验分布不变的情况下，收益函数的线性变换不会改变先验期望准则下的最优行动。定理4.2设Θ1为状态集Θ的一个非空子集，假如在Θ1上的收益函数Q(θ,a)都加上一个常数c，而在Θ上的先验分布不变，则在先验期望准则下的最优行动不变。例4(P138例题4.11)33§4.4损失函数1.损失函数的含义这里的损失函数不是负的收益，也不是亏损。例如，某商店一个月的经营收益为-1000元，即亏1000元。这是对成本而言。我们不称为损失，而称其为亏损。我们讲的损失是指“该赚而没有赚到的钱”，例如该商店本可以赚2000元，但由于某种原因亏了1000元，那我们说该商店损失了3000元。用这种观点认识损失对提高决策意识是有好处的。按上述观点从收益函数可以很容易获得损失函数。34例5某公司购进某种货物可分大批、中批和小批三种行动，记为。未来市场需求量可分为高、中、低三种状态，记为。三个行动在不同市场的利润如下:321,,321,,aa