第十一章扩展式博弈与反向归纳法主要学习问题:一、扩展式博弈二、扩展式博弈与纳什均衡三、反向归纳法在静态博弈中,所有参与人同时行动(或行动虽有先后,但没有人在自己行动之前观测到别人的行动);在动态博弈中,参与人的行动有先后顺序,且后行动者在行动之前能观测到先行动者的行动。通常用扩展式表述分析动态博弈。博弈的扩展式表述“扩展”的主要是参与人的策略空间。策略式表述简单地给出参与人有些什么策略可供选择,而扩展式博弈要给出每个策略的动态描述:谁在什么时候行动,每次行动有些什么具体行动可供选择,以及知道些什么。中南财经政法大学经济学院博弈的扩展式表述包括以下要素:(1)参与人集合:i=1,2,…n;此外,将用N表示虚拟参与人“自然”。(2)参与人的行动顺序:谁在什么时候行动。(3)参与人的行动空间:每次行动时,参与人有些什么选择。(4)参与人的信息集:每次行动时,参与人知道些什么。(5)参与人的支付函数:行动结束后,参与人得到些什么(支付是所有行动的函数)。(6)外生事件(即自然的选择)的概率分布。中南财经政法大学经济学院如同两人有限策略博弈的策略式表述可用博弈矩阵表述一样,n人有限策略博弈的扩展式表述可用博弈树表示。以房地产开发为例。假定该博弈的行动顺序如下:(1)开发商A先行动,选开发或不开发;(2)在A决策后,自然选择市场需求的大小;(3)开发商B在观测到A的决策和市场需求后,决定开发或不开发。其博弈树如下表。博弈树给出了有限博弈的几乎所有信息,其基本构建包括:1.结(nodes):包括决策结(上面三个)和终点结(B的四个策结)。前者是参与人采取行动的时点,后者是博弈行动路径的终点。此例中,决策结包括1个空心圆和6个实心圆,终点结包括对应8个支付向量的点。中南财经政法大学经济学院A(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)开发不开发开发不开发开发不开发开发不开发BBBB大大小小开发不开发NN(1/2)(1/2)(1/2)(1/2)图8-1中南财经政法大学经济学院2.枝(branches):枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。如A有两个选择,用“开发”和“不开发”两个枝表示。3.信息集(informationsets)。博弈树上的所有决策结分割成不同的信息集。每个信息集是决策结集合的一个子集,该子集满足下列条件:(1)每个决策结都是同一参与人的决策结;(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。引入信息集的目的在于描述:当一个参与人要作出决策时,他可能并不知道之前发生的所有事件。中南财经政法大学经济学院情形1:图8-1中,假定B是在知道A和自然的选择后进行决策,此时,博弈树的7个决策结分割成7个信息集(每个信息集只包含一个决策结),意味着所有参与人在决策时准确地知道自己处于哪一个决策结。情形2:假定行动顺序如前,但B在决策时并不确切地知道自然的选择。此时,B的信息集由原来的4个变成2个,2个信息集分别对应着B的两个不同决策:若A开发,自己是否开发;若A不开发,B是否开发。用虚线将属于同一信息集的两个决策结连接起来(图8-2)。情形3:B知道自然的选择,但不知道A的选择(如B和A同时决策)。此时,B也有两个信息集,每个信息集包含两个决策结:两处信息集分别对应两种不同的决策:需求大是否开发和需求小是否开发(图8-3)。中南财经政法大学经济学院A(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)开发不开发开发不开发开发不开发开发不开发BBBB大大小小开发不开发NN(1/2)(1/2)(1/2)(1/2)图8-2中南财经政法大学经济学院(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)开发不开发开发不开发开发不开发开发不开发BBBB大大小小开发不开发NN(1/2)(1/2)(1/2)(1/2)图8-3A中南财经政法大学经济学院情形4:B知道N的选择但不知道A的选择,A不知道N的选择(图8-4)。(0,0)不开发N(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)开发不开发开发不开发开发不开发开发BBBB开发开发不开发大小AA(1/2)(1/2)不开发图8-4中南财经政法大学经济学院情形5:A既不知道N的选择也不知道B的选择,但B知道N的选择(图8-5)。N(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)开发不开发开发不开发开发不开发开发AAAA开发开发不开发大小BB(1/2)(1/2)不开发图8-5(0,0)中南财经政法大学经济学院一个信息集可能包括多个决策结,也可能只包括一个决策结,后者叫做单结信息集。若博弈树的所有信息都是单结的,该博弈称为完美信息博弈,它意味着博弈中没有任何两个参与人同时行动,且所有后行动者能确切地知道前行动者选择了什么行动,所有参与人观测到自然的行动。在博弈树上,完美信息意味着没有任何两个决策结是用虚线连起来的。另外,扩展式表述也可用来描述静态博弈。试写出囚徒困境博弈的扩展式表述。中南财经政法大学经济学院(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵赖坦白抵赖BBA坦白抵赖中南财经政法大学经济学院(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵赖坦白抵赖AAB坦白抵赖中南财经政法大学经济学院从扩展式表述构造策略式表述。以房地产开发博弈为例。假定博弈开始之前自然就选择了“低需求”,且已成为共同信息;A先决策,B在观测到A的选择后再决策。则博弈的扩展式表述如下图(8-6)。注意:A只有一个信息集,两个可选择的行动,因而A的行动(策略)空间为SA=(开发,不开发)。但B有两个信息集,四个纯策略,即①不论A是否开发,我开发;②A开发,我开发,A不开发,我不开发;③A开发,我不开发,A不开发,我开发;④无论A是否开发,我不开发。若将B的信息集从左到右排列,上述策略可写成:{开发,开发},{开发,不开发},{不开发,开发},{不开发,不开发}(如下表)。中南财经政法大学经济学院(-3,-3)(1,0)(0,1)(0,0)开发不开发开发不开发BBA图8-6开发不开发中南财经政法大学经济学院从策略式表述中,该博弈有三个纯策略纳什均衡:(开发,{不开发,开发}),(开发,{不开发,不开发})和(不开发,{开发,开发})。在每一个均衡,给定对方的策略,自己的策略是最优的。前两个均衡的结果是(A开发,B不开发);第三个均衡的结果是(A不开发,B开发)。注意:为什么第三列第二行不是纳什均衡?在扩展式表述博弈中,所有n个参与人的一个纯策略组合决定了博弈树上的一个路径。如,(开发,{不开发,开发})决定博弈的路径为A→开发→B不开发→(1,0)。),,(nisss中南财经政法大学经济学院开发商B{开发,开发}{开发,不开发}{不开发,开发}{不开发,不开发}开发商A开发-3,-3-3,-31,01,0不开发0,10,00,10,0表-1房地产开发博弈:策略式表述中南财经政法大学经济学院三、反向归纳法反向归纳是指从博弈的最终结局出发,游戏者总是选择对自己最有利的结果;一旦知道博弈的最终结果是什么,然后转向次结局的决策点,以同样的方式找出该点上的决策者会选择什么决策;然后回到次次结局的那个点→…→如此反复,直到博弈的初始点,在初始点上决策的那个游戏者决定博弈的最终结果。