第10章-贝叶斯博弈与贝叶斯Nash均衡

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三部分:不完全信息静态博弈第十章贝叶斯博弈与贝叶斯Nash均衡主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释第十章贝叶斯博弈与贝叶斯Nash均衡ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng一、贝叶斯博弈•前面两部分我们讨论了完全信息博弈问题,但在现实生活中我们遇到更多的可能是不完全信息博弈问题。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例如•在“新产品开发”博弈中,企业对市场的需求可能并不清楚;•在连锁店博弈中,潜在的进入者可能并不知道连锁店在市场上的盈利情况,等等。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•将这种博弈开始时就存在事前不确定性的博弈问题是不完全信息博弈问题。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例如:“斗鸡博弈”•考察这样的情形:假设参与人可能有这样的两种性格特征(类型)——“强硬”(用s表示)或“软弱”(用w表示)。•所谓“强硬”的参与人是指那些喜欢争强好胜、不达目的誓不罢休的决斗者;•而“软弱”的参与人是指那些胆小怕事、遇事希望息事宁人的决斗者。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•显然,当具有不同性格特征的决斗者相遇时,所表现出来的博弈情形是不同的。•令U表示冲上去;D表示退下去,则每种情况下博弈情形如下图所示。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng当参与人都为强硬者时•博弈存在两个纯战略Nash均衡——(U,D)和(D,U)。-4,-42,-2-2,20,0UD21UDControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng当参与人1为强硬者参与人2为软弱者时•博弈存在唯一的Nash均衡——(U,D)。-4,-42,0-2,00,1UD21UDControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng当参与人1为软弱者参与人2为强硬者时•博弈存在唯一的Nash均衡——(D,U)。-4,-40,-20,21,0UD21UDControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng当参与人都为软弱者时•博弈存在唯一的Nash均衡——(D,D)。-4,-40,00,01,1UD21UDControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng-4,-42,-2-2,20,0UD21UD-4,-42,0-2,00,1UD21UD-4,-40,-20,21,0UD21UD-4,-40,00,01,1UD21UD(1)参与人都为强硬者(2)参与人1为强硬者参与人2为软弱者(3)参与人1为软弱者参与人2为强硬者(4)参与人都为软弱者ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都了解(知道)自己的性格特征,但对对手的性格特征往往不甚了解或了解不全。•在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈,但对决斗者来讲,仍存在着所谓的事前不确定性即博弈开始之前就不知道的信息。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对于“强硬”的参与人1来讲,虽然他看到了上面的战略式博弈,但他不知道对手是“强硬”的还是“软弱”的,所以博弈开始之前他无法确定博弈是根据(1)还是(2)进行。这意味着“强硬”的参与人1面临着事前无法确定的信息。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•同样,“软弱”的参与人1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对于不完全信息博弈问题,是不可能应用前面两部分介绍的方法进行求解的。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•这是因为给定参与人1为“强硬”的决斗者,如果对手是“软弱”的,那么博弈就只存在惟一的Nash均衡(U,D),参与人1有惟一的最优选择“冲上去”;如果对手是“强硬”的,则博弈就会出现两个Nash均衡(U,D)和(D,U),参与人1的最优选择取决于对手的选择。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•但由于参与人1不知道对手究竟是“强硬”的还是“软弱”的,因此,此时的参与人1就觉得自己似乎是在与两个决斗者进行决斗,一个是“强硬”的,另一个是“软弱”的。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•当一个参与人并不知道在与谁博弈时,博弈的规则是没有定义的,如何处理不完全信息?•Harsanyi提出了Harsanyi转换。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•为了分析,对“斗鸡博弈”进行简化。•假设参与人1是“强硬”的决斗者,参与人2可能是“强硬”的也可能是“软弱”的,参与人1不知道但参与人2清楚,而且这一假设为所有的参与人所知道。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfengHarsanyi转换•对于简化的“斗鸡博弈”,Harsanyi转换是这样处理的:在原博弈中引入一个“虚拟”参与人——“自然”(nature,用N表示),构造一个参与人为两个决斗者和“自然”的三人博弈。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfengHarsanyi转换-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1“自然”首先行动决定参与人2的性格特征(即选择参与人2是“强硬”的还是“软弱”的),“自然”的选择参与人1不知道,但参与人2知道。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng在“自然”选择后,参与人1和2再进行“斗鸡博弈”。-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1在新构造的三人博弈中,“自然”的支付不必考虑。参与人1和2的支付由“斗鸡博弈”决定。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1如果“自然”选择参与人2的性格特征是“强硬”的,则意味着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结x1,其支付(1)决定;ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1如果“自然”选择参与人2的性格特征是“软弱”的,则意味着参与人1与“软弱”的参与人2进行决斗,博弈进入决策结x2,其支付由(2)决定。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•Harsanyi通过引入“虚拟”参与人,将博弈的起始点由x1(或x2)提前至x0,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性(即参与人1不知道“自然”的选择)。这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法亦称Harsanyi转换。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng考察不完全信息博弈问题参与人的决策•用p1表示参与人1认为“自然”选择参与人2为“强硬”的概率,v1(U)和v1(D)分别表示参与人1认为自己选择行动U和D时所能得到的期望收益;用x表示“强硬”的决斗者2选择行动U的概率。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•当即时,对参与人1来讲,其最优选择是U(即“冲上去”)。•由于,所以当即参与人1认为参与人2是“强硬”决斗者的可能性不超过1/2时,就会选择“冲上去”。1111()42(1))2(1()26vUpxxpxp1111()20(1))0(12()vDpxxpxp11()()vUvD11/(2)xp1x11/2pControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•考察参与人2的选择。用q1表示参与人2关于“参与人1关于‘自然’选择的推断”的推断,即q1表示参与人2认为“参与人1认为参与人2是‘强硬’的”概率。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•由前面的分析可知:如果,则参与人2认为“U(即‘冲上去’)是参与人1的最优选择”;与此同时,如果,则参与人1的最优选择与参与人2的预测一致。•但是,如果而,则参与人1的最优选择就可能与参与人2的预测不一致。11/2q11/2p11/2p11/2qControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在Harsanyi转换中规定:参与人关于“自然”选择的推断为共同知识。•也就是说,两个决斗者不仅同时一起看到了“自然”随机选择参

1 / 144
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功