第二章：完全信息动态博弈

六翼炽天使1984
0 ℃
2020-02-16

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第二章完全信息动态博弈本章内容：博弈的扩展式表述子博弈精炼纳什均衡子博弈精炼纳什均衡举例重复博弈和无名氏定理考虑下列问题：一个博弈可能有多个（甚至无穷多个）纳什均衡，究竟哪个更合理？纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的，但是如果参与人的行动有先有后，后行动者的选择空间依赖于前行动者的选择，前行动者在选择时不可能不考虑自己的行动对后行动者的影响。子博弈精练纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。市场进入阻挠博弈树特点：剔除博弈中包含的不可置信威胁。承诺行动-破釜沉舟-背水一战给定进入者进入，剔除（进入，斗争），（进入，默许）是唯一的子博弈精练纳什均衡-举例（结婚-反对）进入者进入不进入（0，300）在位者合作（40，50）斗争（-10，0）不可置信威胁支付函数行动第一节博弈的扩展式表述在静态博弈中，所有参与人同时行动（或行动虽有先后，但没有人在自己行动之前观测到别人到行动）；在动态博弈中，参与人的行动有先后顺序，且后行动者在自己行动之前能观测到先行动者的行动。博弈论专家习惯用战略式表述来描述和分析静态博弈，也习惯于用扩展式表述来描述和分析动态博弈。扩展式表述所“扩展”的主要是参与人的战略空间战略式表述简单地给出参与人有些什么战略可以选择，而扩展式表述要给出每个战略的动态描述：谁在什么时候行动，每次行动时有些什么具体行动方案可供选择，以及知道些什么此时的战略：如果你这样，我将怎样2.1-1扩展式表述包含的要素要素：参与人集合参与人的行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件(即“自然”的选择)的概率分布战略式表述(strategicformrepresentation)多用矩阵2,1-1,-1-1,-11,2女足巴足巴男扩展式表述(extensiveformrepresentation)多用博弈树战略式与扩展式男足球芭蕾女女芭蕾足球芭蕾(-1,-1)(2，1)（1，2)(-1,-1)xx’男的策略：{足球，芭蕾}，选择足球；还是选择芭蕾。女的策略：（足球，芭蕾），（芭蕾，足球）（芭蕾，芭蕾），（足球，足球）1、追随策略：他选择什么，我就选择什么2、对抗策略：他选择什么，我就偏不选什么3、芭蕾策略：不管他选什么，我都选芭蕾；4、足球策略：不管他选什么，我都选足球。策略即：如果他选择什么，我就怎样行动的相机行动方案。在扩展式博弈里，参与人是相机行事，即“等待”博弈到达一个自己的信息集（包含一个或多个决策结后，再采取行动方案。需求大，开发者利润8千万，不开发者利润0。需求大，两者都开发利润各为4千万。需求小，开发者利润1千万，不开发者利润0。需求小，两者都开发利润各为-3千万两者都不开发利润各为0。博弈树：房地产开发博弈IA开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4博弈树：不允许的情形-3，-3-3，-31，01，00，10，00，10，0AB（进入，进入）进入不进入（进入，不进入）（不进入，进入）（不进入，不进入）市场进入博弈的战略式进入不进入ABB进入不进入不进入进入收益：AB-3，-31，00，10，0市场进入的扩展式在市场进入博弈中：A有两个行动：“进入”、“不进入”。由于是先行动者，只有两个战略：选择“进入”或“不进入”。B有两个行动：“进入”、“不进入”。但是，有4个战略：(1)若A选择“进入”，B选择“进入”，若A选择“不进入”，B选择“进入”，即（进入，进入）(2)若A选择“进入”，B选择“进入”，若A选择“不进入”，B选择“不进入”，即（进入，不进入）(3)若A选择“进入”，B选择“不进入”，若A选择“不进入”，B选择“不进入”，即（不进入，进入）(4)若A选择“进入”，B选择“不进入”，若A选择“不进入”，B选择“不进入”，即（不进入，不进入）2.1-2博弈树的构成1．结(nodes)：结包括决策结(decitionnodes)和终点结(terminalnodes)两类。决策结是参与人采取行动的时点，终点结是博弈行动路径的终点。在博弈树中，“谁在什么时候行动”用在决策结旁边标注参与人的办法来表示。参与人的支付标注在博弈树终点结处。2．枝(branches)：在博弈树上，枝是从一个决策结到它的直接后续结的连线，每一个枝代表参与人的一个行动选择。3．信息集(informationsets)：博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集。该子集包括所有满足下列条件的决策结：(1)每一个决策结都是同一参与人的决策结；(2)该参与人知道博弈进入该集合的的某个决策结，但不知道自己究竟处于哪一个决策结。122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）结nodes信息集分单节信息集和多节信息集；如果用虚线匡起来表示2知道自己位于信息集内，但不知道是哪一点，因为他没能观察到对手的行动；如果博弈树的所有信息集都是单结的，称为完美信息博弈122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）完美信息（perfectinformation）与不完美信息(imperfectinformation)122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）不完美信息：2不能区分1是采用了L还是S完美信息：2能区分1是选择了L还是S完美信息博弈&不完美信息博弈一个信息集可能包含多个决策结，也可能只包含一个决策结。只包含一个决策结的信息集称为单结信息集；如果博弈树的所有信息集都是单结的，该博弈称为完美信息博弈(Gameofperfectinformation)；否则就是不完美信息博弈。信息集：房地产博弈IIA开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4信息集：房地产博弈IIIA开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4信息集：房地产博弈IVN大小开不开开不开开发不开发开不开开不开开不开(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)B1B2A1A2A3A4几个符号的意义第i个人的信息集为Hi，其中某特定信息集为hi，在hi的情况下会有A(hi)的行动。他的所有信息集所对应的所有行动A(hi)的集合为Ai，∪表示聚合)(iHhihAAiiiiiAHS:第i个人有信息H，乃有行动A此时的战略是S(而且是纯战略，以后用其他字母表示“不纯”战略)→mapsinto第二节子博弈精炼纳什均衡主要内容子博弈子博弈精炼纳什均衡求解方法：逆向归纳法承诺行动与子博弈精炼纳什均衡2.2-1子博弈（sub-game）子博弈由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成，它满足下列条件：(1)x是一个单结信息集；(2)子博弈不改变原博弈的信息集和支付向量条件1说的是一个子博弈必需从一个单结信息集开始。即：(1)当且仅当决策者在原博弈中确切地知道博弈进入一个特定的决策结时，该决策结才能作为一个子博弈的开始。(2)如果一个信息集包含两个以上决策结，没有任何一个决策结可以作为子博弈的初始结。A开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4A开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4条件2说的是，子博弈的信息集和支付向量都直接继承自原博弈，并不会发生任何变化。这意味着子博弈不能分割原博弈的信息集。A开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4进入不进入ABB进入不进入不进入进入收益：AB-3，-31，00，10，0抵赖坦白ABB抵赖坦白坦白抵赖-1，-1-9，00，-9-6，-6在市场进入博弈中，包含3个子博弈（包括原博弈）。而在囚徒博弈中，只有一个子博弈（？）2.2-2子博弈精炼纳什均衡扩展式博弈的战略组合s*=(s1*,…,si*,…,sn*)是一个子博弈精炼纳什均衡，如果：(1)它是原博弈的纳什均衡；(2)它在每一个子博弈上给出纳什均衡。一个战略组合是个子博弈精炼纳什均衡，当且仅当它在每一个子博弈上都构成一个纳什均衡如果整个博弈是唯一的子博弈，纳什均衡与子博弈纳什均衡是相同的；如果有其它子博弈存在，有些纳什均衡可能不构成子博弈纳什均衡。子博弈精炼纳什均衡均衡路径：如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，这条路径称为均衡路径。构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最优的，而且在非均衡路径上也是最优的。这是纳什均衡与子博弈精炼纳什均衡的实质区别只有当一个战略规定的行动规则在所有可能的情况下都是最优的时，它才是一个合理的、可置信的战略序贯理性：不论过去发生了什么，参与人应该在博弈的每一个时点上最优化自己的决策市场进入博弈的纳什均衡进入不进入ABB进入不进入不进入进入收益：AB-3，-31，00，10，0-3，-3-3，-31，01，00，10，00，10，0AB（进入，进入）进入不进入（进入，不进入）（不进入，进入）（不进入，不进入）该博弈中有三个纳什均衡：不进入，（进入，进入）；进入，（不进入，进入）；进入，（不进入，不进入）如果理论得到这样的结果，无助于预测博弈参与人的行为。此外，纳什均衡假定，每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应，即参与人并不考虑自己的选择对其他人选择的影响，因而纳什均衡很难说是动态博弈的合理解。市场进入博弈的纳什均衡必须在多个纳什均衡中剔除不合理的均衡解，即所谓“不可置信威胁”。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。正如纳什均衡是完全信息静态博弈解的基本慨念一样，子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。前边得到的三个纳什均衡中，均衡①意味着当A不进入时，B选择进入；而当A选择进入时，B仍选择进入（B威胁无论如何都要进入市场）。显然，当A选择进入时，B仍选择进入是不合理的，如果A进入市场，B选择“不进入”比选择“进入”收益要更大，理性的B不会选择进入，而A知道B是理性的，因此也不会把该战略视为B会选择的战略。因此，B的战略（进入，进入）是不可置信威胁。均衡③意味着当A进入时，B选择不进入；而当A选择不进入时，B仍选择不进入（B威胁无论如何都不进入市场）。显然，当A选择不进入时，B仍选择不进入是不合理的，B的战略是不可置信的。只有均衡②是合理的：如果A进入，B不进入；如果A不进入，B进入。因为A是先行动者，理性的A会选择“进入”（他知道B是理性的，B不会选择“进入”），而理性的B选择“不进入”。观察博弈树上的三个均衡中，B的不可置信战略中的反应，在第二阶段B开始行动的两个子博弈中不是最优；而合理的纳什均衡中，B的战略在所有子博弈中都是最优的，与A的第一阶段可能选择的行动构成该子博弈的纳什均衡。只有当一个战略规定的行动规则在所有可能的情况下都是最优的时，它才是一个合理的、可置信的战略。子博弈精炼纳什均衡就是要剔除掉那些只在特定情况下是合理的而在其他情况下并不合理的行动规则。子博弈精炼纳什均衡：如果参与者的战略在每一个子博弈中都构成了纳什均衡，则称纳什均衡是子博弈精练的(泽尔滕，1965)。为简单起见，假定博弈有两个阶段，第