第六章不完全信息动态博弈不完全信息动态博弈(或动态贝叶斯博弈)的基本特征是参与人的行动是序贯的,有先有后,与完全信息动态博弈相比,其中的私人信息可能表现在支付函数上,也可能表现在行动的选择上。前一个表现形成不完全信息,后—个表现形成不完美信息。象不完全信息静态博弈被转化成完全但不完美信息动态博弈进行分析一样。所有的不完全信息动态博弈都可以被转换成完全但不完美信息的动态博弈进行分析。正因为这样,我们把“不完全信息动态博弈”与“不完美信息动态博弈”混同使用。一、精炼贝叶斯纳什均衡(完美贝叶斯纳什均衡)用博弈树表示完全且完美信息的动态博弈,其中博弈树上的每个节点就是一个独立的决策节,表示参与人在该时点对此前的博弈过程有完全的了解。而在不完全信息动态博弈中,“自然”首先选择参与人的类型,相应的参与人知道自己的类型,其他参与人不知道;在自然的选择之后,参与人开始序贯行动,后行为者能观测到先行为者的行动,但无法观测到先行为者的类型,从而产生不完美信息,对此,我们在博弈树上用多节点的信息集来反映。(一)多节点信息集和不完美信息动态博弈的表示举例:二手车交易卖不卖买不买买者买者卖者卖者好坏买不买卖不卖卖者先是自然(N)决定二手车的类型:好车或差车。卖主(参与人1)知道自己的类型后选择卖或不卖,若卖主选择不卖,则博弈结束;若选择卖,则轮到顾客(参与人2)决定买还是不买。顾客在轮到决策的时点上,只能观测到卖主选择了卖的行动而不知道卖主的类型是好车还是差车(即顾客不知道自然的选择是好车还是差车)。(这是不完美信息)这个交易里有两个决策节点就形成一个多节点的信息集(用虚线连接)。多节点信息集特征:(1)在此信息集中的每一个节点都轮到该参与人行动;(2)当博弈的进行达到该信息集中的某个节点时,轮到行动的参与人并不知道实际到达了哪一个节点,而只知道到达了其中的某个节点的概率(先验概率或后验概率)。在不完全信息动态博弈中,“自然”首先选择参与人的类型,参与人自己知道自己的类型,其他参与人不知道;在自然选择之后,参与人开始行动,参与人的行动有先有后,后行动者能观测到先行动者的行动,但不能观测到先行动者的类型。但是,参与人的行动是类型依存的。每个参与人的行动都传递着有关自己类型的信息,后行动者可以通过观察先行动者所选择的行动来推断其类型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动;先行动者理性预测到自己的行动将被后行动者所利用,就会设法选择传递对自己有利的信息,避免传递对自己不利的信息。不完全信息动态博弈过程因此,该博弈过程的实质不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精炼纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。参与者1在3个行动中进行选择——L、M及R。如果参与者1选择R,则博弈结束。如果参与者1选择了L或M,则参与者2就会知道1没有选择R(但不清楚1是选择了L还是M),并在或L'或R'两个行动中进行选挥,博弈随之结束。考虑如下完全非完美信息动态博弈纳什均衡(L,L’)、和(R,R’),也是子博弈精炼纳什均衡。然而,(R,R’)却明显要依赖于一个不可信的威胁:如果博弈进入参与者2的信息集,L’严格优于R‘,选择R’不是序贯理性的;因此参与者1不会由于2威胁他将在其后的行动中选择R',而去选择R。(二)精炼贝叶斯纳什均衡对于不完全信息动态博弈,由于子博弈精炼均衡同样未能排除不可信的威胁和许诺,我们需要对其进一步强化(即加强对条件的要求),并把强化后的子博弈精炼纳什均衡称为精炼贝叶斯纳什均衡,简称为精炼(完美)贝叶斯均衡。因此,用更为广义的后续博弈的概念来代替子博弈的概念。前面我们已经定义过的子博弈必须开始于单节点信息集,并且不能分割信息集,与之不同的是“后续博弈”是指从任何信息集(不论是单节点的还是包含多节点的)开始的动态博弈的后续部分。对动态博弈进行分析,可信性问题始终是一个中心问题,一个理想的均衡必须是排除了所有不可信的威胁和许诺的。使均衡概念得到进一步强化,以排除上例中像(R,R’)的子博弈纳什均衡的方法之一,是附加以下两个要求。要求1:在每一个信息集上,轮到行动的参与人必须对博弈进行到该信息集中各个决策节点的可能性大小有一个推断(belief)。对于非单节点信息集,推断就是在信息集中关于不同决策节点的一个概率分布;对于单节点的信息集,参与者的推断就是博弈到达此单一决策节点的概率等于1。(每一个参与人的信息集上有一个概率分布)要求2:给定参与人的推断,参与人的策略必须满足序贯理性(sequentiallyrationally)的。即在每一信息集中,给定轮到行动的参与人在此信息集中的推断,以及其他参与人的后续策略(指从给定信息集开始的参与人在后续博弈中的完备的行动计划),该参与人的行动必须是最优的。(给定概率分布和其他参与人的选择,每个参与人的战略是最优的)精炼贝叶斯纳什均衡四条要求要求1意味着如果博弈的进行达到参与者2的非单节信息集,则参与者2必须对具体到达哪一个节(也就是参与者1选择了L还是R)有一个推断。这样的推断就表示为到达两个节的概率p和1-p用精炼贝叶斯均衡剔除不可置信威胁(R,R’)要求1:每一个参与人的信息集上各节点有一个推断(概率分布);要求2:给定参与人的推断,参与人的策略必须满足序贯理性。ppp11)1(0因此,这个博弈的唯一的精炼贝叶斯均衡是((L,L’;p=1)精炼贝叶斯纳什均衡四条要求要求3:在处于均衡路径之上的信息集中,推断由贝叶斯法则及参与人的均衡战略给出。(概率分布是使用贝叶斯法则从最优战略和观测到的行动得到的(在可能的情况下)贝叶斯法则贝叶斯法则:是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。现就市场进入一例进行分析,假设Ⅰ在打算进入之前对A的类型及分布概率一无所知,但Ⅰ知道,如果是高成本型则阻挠概率是20%,如果是低成本型则阻挠概率是100%,那么他将采取怎样的战略呢高成本A低成默许B阻挠20%默许阻挠100%Ⅰ进入40,50-10,030,100-10,140不进入0,3000,3000,4000,400例:市场进入博弈博弈开始时,Ⅰ认为Ⅱ属于高成本型的概率是70%。因此,Ⅰ认为自己在进入市场时受到阻挠的概率是:0.7×0.2+0.3×1=0.44当Ⅰ进入市场时,A确实阻挠,根据贝叶斯法则,Ⅰ认为Ⅱ属于高成本型的概率变为:(0.7×0.2)/0.44=0.32根据这一新概率,Ⅰ估计自己在进入市场是受到A阻挠的概率变为:0.32×0.2+0.68×1=0.744如果Ⅰ再次试探,Ⅱ又进行了阻挠,根据贝叶斯法则,Ⅰ认为属于高成本型的概率变为:(0.32×0.2)/0.744=0.086这样,随着一次次试探及阻挠,对A的判断逐渐变化,越来越倾向将Ⅱ判断为低成本型企业。Ⅱ1)P(A/B20)P(.A/B70)P(.A))P(P())P(P()P(AA/BAA/BB))P(A)/P(P())/P(P(A)P(A/BA/BBBB贝叶斯法则khahak)(khap1)(hkhaphaKkkkhKKhhhpappappapaob111)()|()()|()()|(}{Prhaha)(kP)(khaphakhhkkkhkhaobaobpapaobPrPr)()(),(PrhkaobPrhakKjjjhkkhhkkhhkpappapaobpapaob1)()|()()|(}{Pr)()|(}|{Pr代表这个后验概率,即给定的情况下,i属于类型的概率}|{Prhkaobhak(贝叶斯法则)贝叶斯法则精炼贝叶斯纳什均衡四条要求要求4:对处于均衡路径之外的信息集,推断由贝叶斯法则以及可能倩况下的参与者的均衡战略决定。(对精炼贝叶斯均衡再精炼)分析要求4的作用这是一个由三个参与人各行动一次构成的三阶段不完美信息动态博弈。参与人1在第一阶段在A和B中作出选择,如果他选择A,则博弈结束,如果他选择B,则轮到参与人2在第二阶段在C和D之间作出选择,在第三阶段由参与人3在E和F之间进行选择。其中参与人1的行动能被参与人2和3观测到,但参与人2的行动却不能被参与入3观测到。分别用P和(1一P)表示参与人3推断参与人2选择C和D的概率,那么参与人3选E的期望支付:P×1十(1一P)×2=2一P选F的期望支付:P×3十(1一P)×1=1十2P因此,当P<1/3时,他会选择E,当P>1/3时,他会选择F,当P=1/3时,他可选择E或F或混合策略。那么,他所推断的P究竟是这三种情况中的哪一种情况呢?这取决于他对参与人2的最优选择的判断。对参与人2来说,D是相对于C的严格下策,所以参与人2的合理选择必定是C,因此P=1>1/3,所以参与人3的选择是F。参与人1在第一阶段对第二阶段和第三阶段参与人2和3的决策思路是清楚的,所以他知道如果自己选择B的话,支付将是3,比选择A的支付2大,因此,他会选择B。这样,我们就得到一个策略组合(B,C,F)与参与人2的推断P=1.从上面的分析可知,(B,C,F;P=1)是完全符合要求1到要求3的,并且,由于该策略组合下不存在均衡路径之外的信息集,因此要求4也就自动满足,从而我们说(B,C,F;P=1)是该博弈的完美贝叶斯纳什均衡。下面考虑策略组合(A,C,E)及相应的推断P=0.首先,(A,C,E;P=0)是一个纳什均衡,因为任何一个参与人都不可能通过单独改变自己的策略使自己的支付得到改善;其次,用要求1到要求3来衡量它也是满足的。但是,它却不是子博弈完美的,因为该博弈只有惟一的子博弈,并且根据上面的分析,它的惟一的纳什均衡是(C,F),而不是(C,E)。产生这—矛盾的原因就在于要求4没有满足。在(A,C,E;P=0)下,均衡路径就是第一阶段参与人1选择A,博弈结束,参与人2和3的策略C和E及推断P=0都不在均衡路径上,即存在均衡路径之外的信息集,对于参与人3在该信息集上的推断P=0,要求1到要求3没有任何的限制,而根据要求4,参与人3的推断决定于参与人2的合理选择:如果参与人2选择C,则参与人3的推断必须是P=1,如果参与人2选择D,则参与人3的推断必须是P=0。纳什均衡(A,C,E;P=0)中,恰恰就是参与人3的推断P=0与参与人2的选择C不相符合。因此,以要求1来衡量,纳什均衡(A,C,E;P=0)是不合理的均衡(主要是推断不合理),应该予以剔除。上述四个要求中,要求2要求参与人在一个特定信息集上的行动依赖于参与人在该信息集的推断,而要求3或要求4又要求参与人的推断依赖于博弈树更上端的参与人的行动,但要求2又要求这些在博弈树上更上端的参与人的行动部分地依赖于随后参与人的行动。这样的循环依赖意味着通过博弈树进行逆推归纳求解,精炼贝叶斯纳什均衡将不像在完全且完美信息动态博弈中确定子博弈精炼纳什均衡那样顺利(—般情况而言)。事实上,要求1到要求4为我们提供了确定精炼叶斯纳什均衡的思路和方法,我们以这四个要求为依据和标准并结合具体的特点来分析确定精炼贝叶斯纳什均衡。要求1:在每一个信息集上,轮到行动的参与人必须对博弈进行到该信息集中各个决策节点的可能性大小有一个推断。要求2:给定参与人的推断和其他参与人的选择,每个参与人的战略是最优的要求3:在处于均衡路径之上的信息集中,推断由贝叶斯法则及参与人的均衡战略给出要求4:对处于均衡路径之外的信息集,推断由贝叶斯法则以及可能倩况下的参与者的均衡战略决定。二、信号博弈及其应用举例信号博弈(signalinggames)接收者战略1.如果发送者选择信号m1,选择行动a1;如果发送者选择信号m2,选择行动a1;2.如果发送者选择信号m1,选择行动a1;如果发送者选择信号m2,选择行动a2;3.如果发送者选择信号m1,选择行动a2;如果发送者选择信号m2,选择行动a1;4.如果发送者选择信号m1,选择行动a2;如果