工商管理学院School.BusiAdmin第4讲完全但不完美信息动态博弈本讲介绍信息不充分、不对称的博弈分析,本讲介绍的是不完美的动态博弈。对信息不充分、不对称情况下博弈问题的研究,也是研究信息价值的有效方法,是信息经济学的核心内容。信息不充分、不对称会使人们决策选择的难度增加,对博弈的结果和效率产生影响,也使博弈分析难度增加。主要以二手车交易模型为核心,介绍不完美信息动态博弈的完美贝叶斯均衡分析方法。1工商管理学院School.BusiAdmin有退款保证的双价二手车交易双价二手车交易单一价格二手车模型不完美信息动态博弈完美贝叶斯均衡2工商管理学院School.BusiAdmin完美信息:博弈中后面阶段的博弈方有关于前面阶段博弈进程的充分信息完美信息动态博弈:动态博弈中的所有博弈方都有完美信息的博弈完全信息:各博弈方对博弈结束时每个博弈方的得益是完全清楚的不完美信息动态博弈的基本特征之一是博弈方之间在信息方面是不对称的,如二手车市场4.1.1概念和例子4.1不完美信息动态博弈3工商管理学院School.BusiAdmin二手车问题第一阶段:原车主在你买之前可以选择如何使用车子(保养好或保养差)第二阶段:原车主作为卖方决定是否要卖,卖价可以只有一种,有高低两种,或者更多第三阶段:买者决定是否买下,假设买方要么接受卖方价格,要么不买,但不能讨价还价原车主对车子的好坏和愿意卖出的价格是清楚的,而买方是不清楚的,并且车子好坏是早已确定的(客观的)!4.1.1概念和例子V.S.完全信息动态博弈完全了解自己行为之前博弈进程的博弈方称为“完美信息的博弈方”,如果一个动态博弈中所有博弈方都是具有完美信息的,该博弈就为“完全信息动态博弈”。完全但不完美信息动态博弈由于故意保密或信息传递不灵等原因,许多动态博弈中后行为的某些博弈方无法看到在自己行为之前其他博弈方的选择,但博弈结束时每个博弈方的利益是完全清楚的,我们称“完全但不完美信息动态博弈”。4工商管理学院School.BusiAdmin多节点信息集扩展形表示01(-7000)(-10000)(-16000)(-10000)运输路线扩展形好天气(75%)坏天气(25%)4.1.2不完美信息动态博弈的表示5工商管理学院School.BusiAdmin设车况好时对买方来说该车值3千元,车况差时值1千元,卖方要价2千元。再假设差时卖方需要花费1千元才能将车伪装成状况良好的车。如果用净收益作为卖方的得益,用消费者剩余(价值减价格)作为买方的得益,则该博弈的双方得益如图中所示。各个得益数组的第一个数字为卖方的得益。显然当卖方在第二阶段选择卖而买方在第三阶段选择不买时,车况好、差对买方利益毫无影响,都是既没有收益也无损失,但对卖方来讲则影响巨大,因为当车况差时卖方想卖必须先花代价装扮,卖不出去就会白白损失这笔费用,即1千元的损失。二手车模型工商管理学院School.BusiAdmin72111好差卖买买卖不卖不买不卖不买2,10,01,-1-1,00,00,0二手车模型工商管理学院School.BusiAdmin根据上述得益情况,可见在卖方选择卖时,买方选择买既有赚钱的可能,也有亏的可能,因为车况有好有差,选择不买当然肯定不会吃亏,但也放弃了获得利益的机会,因此在各种选择中,没有一个选择绝是对比另一个好的。对卖方来说,车况好时卖不卖得出去都无损失,只有赢利的可能,因此选择卖肯定比不卖要好,但当车况差时能否卖得出去结果却完全不一样。卖得出会有利所得,卖不出却要亏损。因此要让买方下决心是否购买,买方还必须要有进一步的信息或判断,这些信息和判断就是在卖方选择的前提下车况好、车况差各自的概率。要让卖方在车况差时下决心是否卖也必须要有进一步的信息或判断,即买方会买下的概率究竟有多大。2111好差卖买买卖不卖不买不卖不买2,10,01,-1-1,00,00,0工商管理学院School.BusiAdmin有了这些信息或判断,买方或卖方就能对自己获利的机会、损失风险的大小程度心中有数,从而作出正确的判断和选择。在这个博弈中双方决策需要的信息或判断与双方的选择有关,两个博弈方的选择、信息和判断之间形成了一种复杂的交互决定关系。2111好差卖买买卖不卖不买不卖不买2,10,01,-1-1,00,00,0工商管理学院School.BusiAdmin4.1.2不完美信息动态博弈的表示完美信息的动态博弈可用逆推法求解,那么不完美信息动态博弈该如何求解呢?二手车问题的多节点信息集:2111好差卖买买卖不卖不买不卖不买2,10,01,-1-1,00,00,0——四种可能的结局此博弈最后的得益一定要有一个基本的前提:即有一个选择信息集中两个节点各自达到的概率的判断要让买方下决心决定是否买还必须要有进一步的信息或判断,实际上就是在卖方卖的前提下车况好、车况差各自的概率P(g|s),P(b|s)?要让卖方在后一种情况下下决心决定是否卖也必须有进一步的信息或判断,即买方会买下的概率究竟有多大。P(s|g),P(s|b)?10工商管理学院School.BusiAdmin4.1.3不完美信息动态博弈的子博弈不完美信息动态博弈的子博弈由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分。原博弈本身不会成为原博弈的后续阶段,因此子博弈不能从原博弈的第一个节点开始。包含所有跟在该子博弈初始节点之后的所有选择节点和终点,但不包含不跟在此初始节点之后的节点。不分割任何信息集。即如果一选择节点n是包含在一子博弈中的,则包含n的信息集中的所有节点都必须包含在该子博弈中。这实际上就是专对有多节点信息集的不完美信息动态博弈而言的。11工商管理学院School.BusiAdmin4.1.3不完美信息动态博弈的子博弈3221LRRLLLLRRR3221LRRLLLLRRR左方红色虚线框中的是子博弈吗?右方蓝色虚线框中的是子博弈吗?12工商管理学院School.BusiAdmin4.2完美贝叶斯均衡纳什均衡在完全信息静态博弈中,所求的解为纳什均衡子博弈完美纳什均衡在完全且完美信息动态博弈中,满足子博弈完美纳什均衡。其中引入子博弈、可信性概念,由此才可保证在一定的条件下解的存在性。对动态而言这种均衡策略组合必须有一定的可信性加以保证(确保其为均衡,某种最优性)。理想的均衡必须能够排除任何不可信的威胁和诺言。完美贝叶斯纳什均衡由于在完全但不完美信息动态博弈中存在多节点信息集,一些重要的选择及其后续阶段不构成子博弈。因此,只是要求子博弈完美性已无法完全排除不可信的威胁或诺言,必须发展和利用新的纳什均衡概念。13工商管理学院School.BusiAdmin贝叶斯法则在日常生活中,当面临不确定时,我们对某事件发生的可能性有一个判断,然后,会根据新的信息来修正这个判断。统计学上,修正之前的判断称为“先验概率”修正后的判断称为“后验概率”贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。工商管理学院School.BusiAdmin条件概率在事件A发生条件下,事件B发生的概率全概率公式贝叶斯公式(贝叶斯法则)15)|()()(1iniiABpApBpniiiiiiABPApABpApBAp1)|()()|()()|()()()|(ApABpABp工商管理学院School.BusiAdmin在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。要求4在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求3给定各博弈方的“判断”,他们的策略必须是“序列理性”的。即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益或期望得益最大。此处“后续策略”即相应的博弈方在所讨论信息集以后的阶段中,针对所有可能情况如何行为的完整计划。要求2在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中各节点的概率的“判断”。(非单节点上,相当于该信息集中各个节点可能性的一个概率分布,单节点判断到达该节点概率为1)要求1完美贝叶斯均衡的要求4.2完美贝叶斯均衡16工商管理学院School.BusiAdmin12L(p)M(1-p)UDUD(2,1)(0,0)(0,0)(0,1)R(1,3)4.2完美贝叶斯均衡若轮到博弈方2决策时,由于该信息集有两个节点,不知道博弈1选择L还是M到达,如果没有对这两条路径的一个“判断”,就不知道该选U还是D中哪一个策略合适?多节点信息集处的“判断”是决策的必要基础,也是均衡策略的基础。这也说明了要求1的必要性。要求1在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中各节点的概率的“判断”。(非单节点上,相当于该信息集中各个节点可能性的一个概率分布,单节点判断到达该节点概率为1)17工商管理学院School.BusiAdmin12L(p)M(1-p)UDUD(2,1)(0,0)(0,0)(0,1)R(1,3)4.2完美贝叶斯均衡当博弈方2在博弈方1第一阶段没有选R的情况下,“判断”博弈方1选L的概率p大于选M的概率1-p时,博弈方2必须选择U而非D。博弈方1在第一阶段选L,博弈方2在博弈方1第一阶段未选R的情况下选择U,加上博弈方2对博弈方1选L、M的概率判断p和1-p(p1-p),构成一个满足序列理性要求的策略组合。对于保证不完美信息动态博弈的均衡策略中没有不可信的威胁承诺具有关键作用。(第一个保证)注意:这里还没有称为完美贝叶斯均衡保证各个博弈方在单节点信息集和多节点信息集处都会按照最大利益原则选择。(这是第二个保证!)要求2给定各博弈方的“判断”,他们的策略必须是“序列理性”的。即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益或期望得益最大。18工商管理学院School.BusiAdmin12L(p)M(1-p)UDUD(2,1)(0,0)(0,0)(0,1)R(1,3)4.2完美贝叶斯均衡均衡策略组合是“博弈方1在第一阶段选择L,博弈方2在第二阶段选择U”。首先,要求3针对的就是博弈2在其两节点信息集处的“判断”。其次,两博弈方都是主动选择,不需要额外信息帮助“判断”。第三,博弈方2的判断是直接针对博弈方1的上期选择的,因此不存在条件概率问题,Bayes自动满足。第四,要求3要求博弈2对博弈方1的上期选择的“判断”,符合各博弈方的均衡策略,在这里就是符合博弈方1第一阶段的选择和博弈方2自己本阶段的选择。要求3在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定。19工商管理学院School.BusiAdmin12L(p)M(1-p)UDUD(2,1)(0,0)(0,0)(0,1)R(1,3)4.2完美贝叶斯均衡由于博弈方1的均衡策略在第一阶段选择的是L,因此只有博弈方2的“判断”是“博弈方1选择L的概率p=1”才与博弈方1的策略相符合,而且这种判断也与博弈方2自已在本阶段的选择U相符合,因此该“判断”正是博弈方2决策和双方策略均衡的稳定基础。在不完美信息博弈中,“判断”和均衡策略之间的相互依存关系,只有两者是一致、协调的,才可能是真正的均衡。这正是要求3的真实含义。要求3在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定。20工商管理学院School.BusiAdmin12L(p)M(1-p)UDUD(2,1)(0,0)(0,0)(0,1)R(1,3)4.2完美贝叶斯均衡先假定:均衡策略组合是“博弈方1在第一阶段选择L,博弈方2在第二阶段选择U”不存在“不在均衡路径上”的需要“判断”的信息集,因此要求4自动满足。再假定:均衡策略组合是“博弈方1在第一阶段选择R,博弈方2在第二阶段选择D”。该策略