完全信息动态博弈作者:朱怀念管理学院huainian258@163.com管理学院SchoolofManagement完全信息动态博弈-子博弈精炼纳什均衡一博弈扩展式表述二子博弈精练纳什均衡三应用举例在静态博弈中,所有参与人同时行动(或行动虽有先后,但没有人在自己行动之前观测到别人的行动);在动态博弈中,参与人的行动有先后顺序,且后行动者在自己行动之前能观测到先行动者的行动。正如博弈论专家习惯于用战略式表述描述和分析静态博弈一样,他们习惯于用扩展式表述来描述和分析动态博弈。回顾一下博弈的战略式表述包括三个要素:参与人集合每个参与人的战略集合由战略组合决定的每个参与人的支付博弈的扩展式表述所“扩展”的主要是参与人的战略空间。战略式表述简单地给出了参与人有些什么战略可以选择,而扩展式表述要给出每个战略的动态描述:谁在什么时候行动,每次行动时有些什么具体行动可供选择,以及知道些什么,简单的说,在扩展式表述中,战略对应于参与人的相机行动规则,即在什么情况下选择什么行动。具体来讲,博弈的扩展式表述包括以下要素:√1.参与人集合:i=1,…,n,此外,我们用N代表虚拟参与人“自然”;√2.参与人的行动顺序:谁在什么时候行动;√3.参与人的行动空间:在每次行动时,参与人有些什么选择;√4.参与人的信息集:每次行动时,参与人知道些什么;√5.参与人的支付函数:在行动结束之后,每个参与人得到些什么(支付是所有行动的函数);√6.外生事件(即自然的选择)的概率分布房地产开发博弈案例-房地产开发项目-假设有A、B两家开发商市场需求:可能大,也可能小投入:1亿假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价7千万;如果市场上只有一栋楼需求大时,可卖1.8亿需求小时,可卖1.1亿博弈战略式表述4,48,00,80,0不开发开发商A开发不开发开发-3,-31,00,10,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述一博弈扩展式表述例:市场进入阻挠博弈设进入成本为10。战略式表示扩展式表示进入者进入不进入(0,300)在位者市场进入阻挠博弈树不可置信威胁合作(40,50)斗争(-10,0)在位方B进入方A默许斗争进入(40,50)(-10,0)不进(0,300)(0,300)A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)参与人(A,B,N)战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结,决策结结,终点结枝结,初始结信息集一博弈扩展式表述的基本要素博弈的基本构造结:包括决策结和终点结两类;决策结是参与人行动的始点,终点结是决策人行动的终点.结满足传递性和反对称性x之前的所有结的集合,称为x的前列集P(x),x之后的所有结的集合称为x的后续集T(x)。枝:枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择.信息集:每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:1每个决策结都是同一个参与人的决策结;2该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结.A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B在决策时不确切地知道自然的选择;B的信息集由4个变为2个房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的选择;但不知道A的选择(或A、B同时决策)房地产开发博弈一博弈扩展式表述只包含一个决策结的信息集称为单结信息集,如果博弈树的所有信息都是单结的,该博弈称为完美信息博弈。自然总是假定是单结的,因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。不同的博弈树可以代表相同的博弈,但是有一个基本规则:一个参与人在决策之前知道的事情,必须出现在该参与人决策结之前。囚徒困境博弈的扩展式表述AB坦白抵赖BBAA坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵赖坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)囚徒困境博弈的扩展式表述5,14,49,-10,0等待小猪大猪按等待按案例2-智猪博弈智猪博弈的扩展式表述?完全信息动态博弈扩展式表示的练习练习:参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性为50%,支付函数为:如果两人都带伞,则下雨时两人的效用均为-2,不下雨时两人的效用均为-1;如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的效用为-3;不下雨时带伞的效用为-1,不带的效用为0;如两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展式及战略式表述:(1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策);(2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞;(3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策,妻子后决策;(4),同(3),但妻子先决策,丈夫后决策.一博弈扩展式表述二子博弈精练纳什均衡•扩展式表述博弈的纳什均衡•子博弈精练纳什均衡•用逆向归纳法求子搏弈精练纳什均衡•承诺行动与子搏弈精练纳什均衡•逆向归纳法与子搏弈精练纳什均衡的存在问题三应用举例目录导航泽尔腾(1965)关于完全信息动态博弈模型直接引用纳什均衡的困惑问题考虑下列问题:一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理?纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的,但是如果参与人的行动有先有后,后行动者的选择空间依赖于前行动者的选择,前行动者在选择时不可能不考虑自己的行动对后行动者的影响。子博弈精练纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。动态博弈中战略的表述战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。is在静态博弈中,战略和行动是相同的。作为一种行动规则,战略必须是完备的。是第i个参与人的特定战略iiSs12insssss(,,,,,)is代表第i个参与人所有可选择的战略集合如果n个参与人每人选择一个战略,n维向量称为一个战略组合表示第i个人选择的战略动态博弈战略的表述足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’男的战略:(足球,芭蕾)女方:选择足球?还是选择芭蕾?女方战略:{足球,芭蕾},{芭蕾,足球}{芭蕾,芭蕾},{足球,足球}1、追随策略:他选择什么,我就选择什么2、对抗策略:他选择什么,我就偏不选什么3、芭蕾策略:不管他选什么,我都选芭蕾;4、足球策略:不管他选什么,我都选足球。战略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里,参与人是相机行事,即“等待”博弈到达一个自己的信息集(包含一个或多个决策结后,再采取行动方案。o什么是动态博弈的战略?房地产博弈扩展式表述中的战略若A先行动,B在知道A的行动后行动,则A有一个信息集,两个可选择的行动,战略空间为:(开发,不开发);B有两个信息集,四个可选择的行动,B有四个纯战略:开发策略:不论A开发不开发,我开发;追随策略:A开发我开发,A不开发我不开发;对抗策略:A开发我不开发,A不开发我开发;不开发策略不论A开发不开发我不开发,简写为:{开发,开},{开发,不开发},{不开发,开发},{不开发,不开发},大括号内的第一个元素对应A选择“开发”时B的选择,第二个元素对应A选择“不开发”时B的选择。A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’什么是参与人的战略?扩展式-3,-3-3,-31,01,00,10,00,10,0{开发,开发}{开发,不开发}{不开发,开发}{不开发,不开发}开发不开发开发商B开发商A战略式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’纳什均衡与均衡结果:存在三个纯战略纳什均衡:(不开发,{开发,开发}),(开发,{不开发,开发},(开发,{不开发,不开发})两个均衡结果:(A开发,B不开发)(A不开发,B开发)注意:均衡不同于均衡结果扩展式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’路径在扩展式博弈中,所有n个参与人的一个纯战略组合决定了博弈树上的一个路径。(开发,{不开发,开发})决定了博弈的路径为A—开发—B—不开发--(1,0)(不开发,{开发,开发})决定了路径:?房地产开发博弈的战略组合—路径完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)战略是参与人行动规则的完备描述,它要告诉参与人在每一种可预见的情况下(即每一个决策结)上选择什么行动,即使这种情况实际上没有发生(甚至参与人并不预期它会发生)。因此,只有当一个战略规定的行动规则在所有可能的情况下都是最优的,它才是一个合理的可置信的战略,子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。扩展式-3,-3-3,-31,01,00,10,00,10,0{开发,开发}{开发,不开发}{不开发,开发}{不开发,不开发}开发不开发开发商B开发商A战略式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’存在三个纯战略纳什均衡:(不开发,{开发,开发}),(开发,{不开发,开发},(开发,{不开发,不开发})哪个纳什均衡更合理?(开发,{开发,不开发})哪个纳什均衡更合理?不可置信的威胁战略A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发(不开发,{开发,开发}),(开发,{不开发,开发}),(开发,{不开发,不开发})xx’对于(不开发,{开发,开发}),这个组合之所以构成纳什均衡,是因为B威胁不论A开发还是不开发,他都将选择开发,A相信了B的威胁,不开发是最优选择,但是A为什么要相信B的威胁呢?毕竟,如果A真开发,B选择开发得-3,不开发得0,所以B的最优选择是不开发。如果A知道B是理性的,A将选择开发,逼迫B选择不开发。自己得1,B得0,即纳什均衡(不开发,{开发,开发})是不可置信的。因为它依赖于B的一个不可置信的威胁。扩展式-3,-3-3,-31,01,00,10,00,10,0{开发,开发}{开发,不开发}{不开发,开发}{不开发,不开发}开发不开发开发商B开发商A战略式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’考虑:(开发,{不开发,不开发})之所以构成Nash均衡,是因为若A选择开发,则B选择不开发是最优选择;若给定B选择不开发,则A选择开发是最优的。尽管结果看起来是合理的,但战略组合包含有不合理的战略。当A选择不开发时,B为什么还要选择不开发?(开发,{不开发,不开发})战略组合包含有不可置信的战略不可置信(不合理)的战略扩展式-3,-3-3,-31,01,00,10,00,10,0{开发,开发}{开发,不开发}{不开发,开发}{不开发,不开发}开发不开发开发商B开发商A战略式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’考虑:(开发,{不开发,开发})首