第三章-扩展式博弈与完全信息动态博弈

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章扩展式博弈与完全信息动态博弈主要内容:一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较一、扩展式博弈•所谓扩展式博弈(extensiveformgame)是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。研究博弈问题的具体进程必须弄清楚的两个问题(1)每个参与人在什么时候行动(决策);(2)每个参与人行动时,他所面临决策问题的结构。这包括参与人行动时可供他选择的行动方案,以及参与人行动时所了解的信息。扩展式博弈的定义:扩展式博弈包括以下要素:(1)参与人集合;(2)参与人的行动顺序,即每个参与人在何时行动;(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案以及他所了解的信息;(4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。{1,2,...,}n例子:“新产品开发博弈”•试用扩展式博弈对两个企业都知道市场需求,且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形即完全信息动态的“新产品开发博弈”进行建模。完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素:(1)参与人是企业1和2;(2)企业1先行动,企业2后行动;(3)企业1行动时有两种选择——“开发”和“不开发”,企业1行动时不知道企业2的行动;企业2行动时有两种选择——“开发”和“不开发”,但企业2行动时已经知道企业1的行动;(4)两个企业的支付如下:ab对手不开发,获利润800万元需求大对手开发,获利润300万元开发():投入2千万元资金对手不开发,获利润200万元企业需求小对手开发,赔400万元不开发():不投入资金,利润为0•例子中,用文字描述的方法给出了博弈问题的扩展式描述。•但可以想象,如果我们遇到的是更为复杂的博弈问题,文字描述可以?•十分直观的扩展式博弈的描述方式——博弈树。•所谓博弈树就是由结和有向枝构成的“有向树”。最上端的一个点(用空心圆表示),表示博弈的开始。将“企业1”标示在点x1上,表示博弈开始于企业1的选择。企业1的选择有“开发”和“不开发”,分别用标有“开发”和“不开发”的有向枝表示。表示博弈达到该点时企业的所得,其中,支付向量中的第一个数字表示企业1的所得,第二个数字表示企业2的所得。称为博弈树的结(node)决策结回过来再考察上图中的博弈树,可以得到这样的信息:(1)博弈中的参与人是企业1和企业2;(2)博弈中企业1先选择,企业2后选择;(3)企业1选择时有行动“开发”和“不开发”,企业2选择的行动有“开发”和“不开发”;(4)博弈中企业的支付。•也就是说,除了“企业2行动时是否观测到企业1的选择”这一点,暂时无法从上图中知道以外,完全信息动态的“新产品开发博弈”的扩展式描述所需要的信息(或要素),都可以从上图中得到。•如果还能够直接从博弈树中知道“企业2行动时是否观测到企业1的选择”,那么给出博弈树,就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。问题:•如何在博弈树中,将“企业2行动时是否观测到企业1的选择”这一信息表示出来?•在完全信息动态的“新产品开发博弈”中,企业2决策时,企业1已经做出选择。此时,企业2面临的决策情形就有以下两种:(1)企业2知道企业1的选择;(2)企业2不知道企业1的选择。•对于第一种情形,企业2知道企业1的选择,即知道企业1选择了“开发”还是“不开发”,因此,企业2知道博弈是从x1到了x2还是从x1到了x3。这就意味着当轮到企业2决策时,他知道自己是在点x2上还是在点x3上;•对于第二种情形,企业2不知道企业1的选择,即不知道博弈是从x1到了x2还是从x1到了x3。因此,当轮到企业2决策时,他不知道自己是在点x2上还是在点x3上。所以,“企业2行动时是否观测到企业1的选择”这一问题,实际上就等价于“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”。•为了将“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”这一点说清楚,需要引入“信息集”(informationset)的概念。•在博弈树中,参与人i的一个信息集(用Ii表示)是参与人i决策结的一个集合,它满足以下两个条件:(1)Ii中的每个决策结都是参与人i的决策结;(2)当博弈到达信息集Ii(即博弈到达Ii中某个决策结)时,参与人i知道自己是在信息集Ii中的决策结上,但不知道自己究竟在Ii中哪个决策结上。•因此,参与人i的信息集Ii可以用来描述:当轮到参与人i行动时,他所了解到的信息,即他知道什么(知道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。例如•在“新产品开发博弈”中,假设企业1先行动,企业2后行动,但企业2行动时不知道企业1的行动。企业2行动时,只知道博弈要么到达点x2,要么达到点x3,但具体在哪一点上,企业2不清楚。也就是说,企业2只知道自己位于决策结集合{x2,x3}上,但不知道位于{x2,x3}中哪一个决策结上。•设X为一决策结集合,用Ii(X)表示参与人的由决策结集X构成的一个信息集。•例如,I2({x2,x3})表示企业2的由决策结集{x2,x3}构成的信息集,I2({x2})和I2({x3})分别表示企业2的由决策结集{x2}和{x3}构成的信息集。•可以在博弈树中将同一信息集中的决策结用虚线连接起来。下图表示参与人3选择时,知道参与人1的选择,但不知道参与人2的选择的博弈情形。122LRLRLLRR3LRLLRR31x2x3x4x5x6x7x下图表示参与人3选择时,知道参与人2的选择,但不知道参与人1的选择的博弈情形。122LRLRLLRRLRLLRR1x2x3x4x5x6x7x33下图表示参与人3选择时,即不知道参与人2的选择,也不知道参与人1的选择的博弈情形。122LRLRLLRR3LRLLRR31x2x3x4x5x6x7x3下图表示参与人3选择时,即知道参与人2的选择,也知道参与人1的选择的博弈情形。122LRLRLLRRLRLLRR1x2x3x4x5x6x7x3333在以后的讨论中,我们假设博弈树中的博弈都是从上往下进行的,因此,在不引起歧义的情况下,我们都不标示出博弈树中枝的方向。例子:•考察“新产品开发博弈”。试用博弈树描述“两个企业都知道市场需求,且企业1先决策,企业2观测到企业1的选择后再进行选择”的博弈情形。当市场需求大时,“新产品开发博弈”的博弈树企业1企业2企业2开发不开发开发不开发300,300800,00,800开发不开发0,01x2x3x4x5x6x7x当市场需求小时,“新产品开发博弈”的博弈树企业1企业2企业2开发不开发开发不开发-400,-400200,00,200开发不开发0,01x2x3x4x5x6x7x•由于在博弈分析中,假设博弈的结构(或描述方式)为共同知识,因此,在以后的讨论中,如果给出博弈树,就意味着所有的参与人都同时一起看到了博弈树。•除了前面一再提到的博弈结构和参与人完全理性为共同知识外,对于多阶段的动态博弈问题,一般还假设参与人满足“完美记忆”(perfectrecall)要求,即假设参与人不会忘记以前知道或者做过的事情。•但在现实生活中,不满足“完美记忆”要求的情形比比皆是。例如,人们在玩扑克时,往往会忘记自己曾经出过什么牌或者对手曾经出过什么牌;在棋类比赛中,也会出现这种情况。•但是,在博弈分析中,如果没有“完美记忆”假设,各种博弈结果都有可能出现,那么我们也就无法对博弈进行预测。不满足“完美记忆”要求的博弈情形122LRLRLLRRLRLLRR1x2x3x4x5x6x7x111参与人1第二次行动时忘了他第一次行动时的选择。二、扩展式博弈的战略及其Nash均衡•提出一个问题:给定一个博弈问题的扩展式,该如何来求解博弈问题的解?•已知对于战略式博弈,可以用Nash均衡来描述博弈问题的解,对于博弈树所描述的扩展式博弈,是否同样可以用Nash均衡来描述博弈问题的解?•对于一个博弈问题,要给出其战略式描述,就必须定义清楚该博弈问题的三个要素:参与人、参与人的战略以及参与人在相应战略组合下的支付。•一个扩展式博弈实际上已定义了博弈的参与人及参与人的支付,因此,如果能定义一个扩展式博弈的战略,那么就意味着给出了一个扩展式博弈的战略式描述,同时也就意味着可以用Nash均衡来描述博弈的解。•所谓参与人的战略就是参与人在博弈中的行动规则,它规定了参与人在博弈中每一种轮到自己行动的情形下,应该采取的行动。•而在博弈树中,参与人在博弈中每一种轮到自己行动的情形又可以用一个信息集来表示,因此,参与人在扩展式博弈中的战略实际上就是参与人在每个信息集上的行动规则。•用Hi表示博弈树中参与人i的信息集的集合,即Hi=(Ii);用Ai(Ii)表示参与人i在信息集Ii上的行动集,Ai(Hi)表示参与人在所有信息集上的行动集合,即()()iiiiiiIHAHAI•参与人i的一个纯战略si就是从信息集集合Hi到行动集合Ai(Hi)的一个映射关系,即•其中,对:()iiiisHAH,()()iiiiiiIHsIAI•根据上述定义,参与人i的一个纯战略可以解释为参与人i在各个信息集上的行动组合。•因此,在以后的讨论中,可以用参与人i在每个信息集上的行动集Ai(Ii)的笛卡尔积来表示参与人i的战略集Si,即()iiiiiIHSAI例如:12EF3,01,2AB2,11x3x11,1CD2x4x5x6x7x•参与人2的信息集为I2({x2}),参与人2在I2({x2})上的行动集为{C,D}。所以,参与人2的战略集为{C,D};•参与人1的信息集为I1({x1})和I1({x3}),其中参与人1在I1({x1})上的行动集为{A,B},在I1({x3})上的行动集为{E,F}。所以,参与人1的战略集为{A,B}×{E,F},即{A,E}、{A,F}、{B,E}和{B,F}。•给定一个博弈问题的扩展式描述,可以得到参与人的战略以及参与人在各战略组合下的支付,所以,由一个博弈问题的扩展式描述可以得到该博弈问题的战略式描述。例如3,01,11,21,1212,12,12,12,1CD(,)AE(,)AF(,)BE(,)BF12EF3,01,2AB2,11x3x11,1CD2x4x5x6x7x扩展式描述战略式描述由左图可得前面所示的扩展式博弈的Nash均衡——((B,E),D)和((B,F),D)。3,01,11,21,1212,12,12,12,1CD(,)AE(,)AF(,)BE(,)BF三、两种博弈描述形式的比较1.战略式博弈从本质上来讲是一种静态模型•战略式博弈从本质上来讲是一种静态模型,它假设所有的参与人同时选择战略并得到博弈的结果,至于博弈中参与人何时行动、行动时又如何行动等等,战略式博弈并不考虑。•这种建模方式对于描述完全信息的静态博弈问题,如“囚徒困境”、“性别战”等非常适用,也很直观。虽然战略式博弈也可用来对动态博弈问题进行建模,但从所得到的模型中,我们却无法直观地看到博弈问题所具有的动态特性。2.扩展式博弈从本质上来讲是一种动态模型•扩展式博弈从本质上来讲是一种动态模型,它不仅直观地给出了博弈的结果,而且还对博弈的过程进行详尽的描述,如给出博弈中参与人的行动顺序,以及参与人行动时的决策环境和行动空间等等。•给出博弈问题的扩展式描述(如博弈树),我们就可得到博弈问题的战略式描述。•同样,在许多情况下,给出博弈问题的战略式描述,我们也能构造出博弈问题的扩展式描述。-4,-40,-6-6,0-1,-1小偷2小偷1抵赖坦白坦白抵赖小偷1小偷2-8,-80,-10-10

1 / 58
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功