第十二章子博弈与完美性主要学习问题:一、子博弈精炼纳什均衡二、重复博弈与无名氏定理(一)一个例证:从上的分析中可看出,一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪一个均衡更为合理,没有给出一个一般性的结论。最严重的是,纳什均衡假定每个参与人在选择自己的最优策略时假定所有其他参与人的策略选择是给定的。这样,纳什均衡就很难说是动态博弈的一个合理解,因为,在动态博弈中,参与人的选择有先有后,后行动者的选择空间依赖于先行动者的选择,而先行动者在选择自己的行动时不能不考虑自己的选择对后行动者的影响。而子博弈精炼纳什均衡(Selten,1965,1975)是对纳什均衡概念的第一个最重要的改进,其主要目的是把“合理纳什均衡”与“不合理纳什均衡”分开。中南财经政法大学经济学院仍以上面的房地产开发为例。复制图8-6。该博弈为一完美信息博弈,A先行动,B在知道A的选择后再行动。它有三个纳什均衡:(开发,{不开发,开发}),(开发,{不开发,不开发})和(不开发,{开发,开发})。(-3,-3)(1,0)(0,1)(0,0)开发不开发开发不开发BBA图8-6开发不开发x'x中南财经政法大学经济学院Ⅰ.对于(不开发,{开发,开发})。该组合构成一纳什均衡,是因为B威胁不论A是否选择开发,自己都将选择开发;A相信了B的威胁,不开发是其最优选择。类似地,B假定A将选不开发;给定该假定,{开发,开发}是B的最优策略。但A为什么要相信B的威胁呢?如果A真选开发,B的信息集为x,显然,B的最优选择为不开发。若A知道B是理性的,A将选开发,逼迫B选不开发,自己得支什1,而不是选不开发,让B开发,自己得0支付。因而(不开发,{开发,开发})是不可置信的。因为它依赖于B的一个不可置信的策略。Ⅱ.对于(开发,{不开发,不开发})。尽管该结果(A开发,B不开发)似乎是合理的,但均衡策略本身是不合理的。中南财经政法大学经济学院若A选开发,B的信息集是x,最优选择是不开发。但若A选不开发,B的信息集是x’,优选择是开发。故{不开发,不开发}不是B的合理策略,或它不是一个不可置信的策略。Ⅲ.对于(开发,{不开发,开发})。这是一个合理的均衡。因为构成该均衡的每个参与人的均衡策略都是合理的。若A选开发,B的最优选择是不开发;若A选不开发,B的最优选择是开发。A预测到自己的选择对B选择的影响,开发是A的最优选择。均衡结果是A选开发,B选不开发,支付为(1,0)。事实上,(开发,{不开发,开发})是该博弈唯一的子博弈精炼纳什均衡。中南财经政法大学经济学院(二)子博弈精炼纳什均衡定义“子博弈”:一个扩展式博弈G由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足下列条件:(1)x是一个单结信息集,即h(x)={x};(2)对于所有的,若,则。条件(1)指一个子博弈必须从一个单结信息集开始。即只有当决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结;若一个信息集包含两个以上的决策结,则无任何一个决策结可作为子博弈的初始结。显然,一个完美信息博弈的每一个决策结都开始一个子博弈。如图8-7,决策结x和它的后续结构成一个子博弈,同样x’和它的后续结也构成一个子博弈。但图8-8中,这两个决策结都不能作为子博弈的初始结。)('xTx)('''xhx)(''xTx中南财经政法大学经济学院(-3,-3)(1,0)(0,1)(0,0)开发不开发开发不开发BBA图8-7开发不开发x'x(a)原博弈(-3,-3)(1,0)开发不开发x(0,1)(0,0)开发不开发'x(b)子博弈Ⅰ(c)子博弈Ⅱ中南财经政法大学经济学院Z1Z2Z3Z4LRLR221图8-8UDx'x中南财经政法大学经济学院条件(2)是指,子博弈的信息集和支付向量都直接继承于原博弈,即只有当x’和x”在原博弈中属于同一信息集时,它们在子博弈中才属于同一信息集;子博弈的支付函数只是原博弈支付函数留存在子博弈上的部分。尤其是,条件(1)和条件(2)意味着子博弈不能切割原博弈的信息集。图8-9。参与人2的两个信息集都是单结的,但因参与人3的一个信息集包含三个决策结(另一个信息集是单结的),参与人2的信息集不能开始一个子博弈,因为这样参与人3的信息集将被切割。要求子博弈满足上述两个条件的目的是保证子博弈对应于原博弈中可能出现的情况。若条件不满足,参与人在原博弈中不知道的信息在子博弈中就变成知道的信息,从子博弈中得出的结论对原博弈就没有意义。如图8-9中,若从参与人2的左边开始一个子博弈,则:参与人3的信息集就由原来的3个决策结变成2个决策结,他在子博弈中的选择就不同于原博弈中的选择。1(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)lr3LLRRUD22图8-9lrrrll3中南财经政法大学经济学院定义子博弈精炼纳什均衡:扩展式博弈的策略组合是一个子博弈精炼纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。显然,若整个博弈是唯一的子博弈,则纳什均衡与子博弈精炼纳什均衡是相同的(图8-8和8-9);若有其他子博弈存在,有些纳什均衡可能不构成子博弈精炼纳什均衡。如何理解“在每一个子博弈上给出纳什均衡”?若一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,即“均衡路径”,博弈树上的其他路径称为“非均衡路径”。),,,,(***1*nissss中南财经政法大学经济学院如在图8-6中,“A→不开发→x’→B→开发(0,1)”是纳什均衡(不开发,{开发,开发})的均衡路径,其他路径都是该纳什均衡的非均衡路径。纳什均衡只要求均衡策略在均衡路径的决策结上是最优的。而“在每一个子博弈上给出纳什均衡”意味着,构成子博弈纳什均衡的策略不仅在均衡路径的决策结上是最优的,而且在非均衡路径的决策结上也是最优的。这是两者的本质区别。这里的要点是,只有当一个策略规定的行动规则在所有可能的情况下都是最优的时,它才是一个合理的、可置信的策略。子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下并不合理的行动规则。中南财经政法大学经济学院(-3,-3)(1,0)(0,1)(0,0)开发不开发开发不开发BBA图8-7开发不开发x'x(a)原博弈(-3,-3)(1,0)开发不开发x(0,1)(0,0)开发不开发'x(b)子博弈Ⅰ(c)子博弈Ⅱ中南财经政法大学经济学院以房地产开发为例说明子博弈精炼纳什均衡概念。如图8-7。该博弈有三个子博弈(原博弈、子博弈(b)和(c),后两个实际是单人博弈)。有三个纳什均衡:(开发,{不开发,开发}),(开发,{不开发,不开发})和(不开发,{开发,开发})。在子博弈(b),B的最优策略是不开发;在子博弈(c),B的最优策略是开发,。纳什均衡(不开发,{开发,开发})中B的均衡策略{开发,开发}在子博弈(c)上构成纳什均衡,但在子博弈(b)上不构成纳什均衡,因此,(不开发,{开发,开发})不是一个子博弈精炼纳什均衡。类似地,纳什均衡(开发,{不开发,不开发})也不是一个子博弈精炼纳什均衡。中南财经政法大学经济学院而纳什均衡(开发,{不开发,开发})中B的均衡策略{不开发,开发}无论是在子博弈(b)上还是在子博弈(c)上都构成纳什均衡(即若A开发,B不开发;若A不开发,B开发),因此,(开发,{不开发,开发})是该博弈的唯一子博弈精炼纳什均衡。也就有理由相信,“A开发B不开发”是这个博弈唯一合理的均衡结果。例:扩展式博弈如下表,要求:(1)写出该博弈的策略式表述;(2)找出该博弈的子博弈、纳什均衡以及子博弈精炼纳什均衡。中南财经政法大学经济学院(2,2)(3,1)(0,0)LR2UD1中南财经政法大学经济学院二、重复博弈与民间定理(无名氏定理)就是在博弈中一个博弈或者同样结构可以重复进行的博弈,其中的每次博弈被称为一个博弈阶段。重复博弈的基本特征:阶段性博弈之间没有物质上的联系、所有的参与人都能观察到G过去的历史、参与人的总支付使所有阶段博弈支付的贴现值之和或者加权平均值。重复波以及可以是完全信息博弈也可以是不完美信息博弈。影响重复博弈的主要因素:博弈重复的次数,即在博弈中长期利益和短期利益的权衡,信息的完备性,即博弈人可能会利用信息的不完全建立良好的声誉谋求长远利益。对于有限次的重复博弈如果有唯一的纳什均衡,重复博弈的唯一子博弈精炼纳什均衡结果是阶段性博弈的纳什均衡重复T次,即每个阶段博弈出现都是一次性博弈的均衡结果。对于无限次博弈纳什均衡为冷酷战略,又被称为触发战略,即任何参与人的一次性不合作行动,将会触发永远的不合作。(),()GTT民间定理在一个博弈中,假设存在一个一次性博弈均衡得益数组优于W,那么在该博弈的多次重复进行中,所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现。设贴现因子为(8,8)(0,10)(10,0)(1,1)220(8)(8)1(1)(1)8111或者囚犯A囚犯B坦白抵赖坦白抵赖