第九章信号博弈与声誉模型9.1信号博弈由于不完全信息动态博弈中,前面阶段博弈方的行为常常具有反映、传递信息的作用,因此信号传递是不完全信息动态博弈研究的最主要内容之一。研究的内容包括信息在博弈方之间传递的可能性和条件,信息传递的程度,或者如何设计特定的机制获得更多信息(相当于一种机制设计)。这些研究分别构成声明博弈、信号博弈和重复信号等博弈模型。应用:Spence(1973)的劳动力市场模型Titole(1988)的产品定价模型Ross(1977)的企业资本结构模型在信号传递博弈中:有两个参与人,i=1,2;参与人1称为信号发送者(因为他发出信号);参与人2称为信号接收者(因为他接收信号);参与人1的类型是私人信息,参与人2的类型是公共信息(即只有一个类型)。博弈顺序(1)“自然”首先选择参与人1的类型是参与人1的类型空间,参与人1知道θ,但参与人2不知道,只知道1属于的θ先验概率p=p(θ),(注意,参与人1类型是私人信息,省略了表示参与人1的下标i)。(2)参与人1在观测到类型θ后选择发出信号m∈M,这里M={m1,…,mJ}是信号空间。}θθ{θk1,=,这里k1)p(k(3)参与人2在观测到1发出信号m(但不是类型θ),使用贝叶斯法则从先验概率p=p(θ)得到后验概率,然后选择行动a∈A,这里,A={a1,…,aH}是参与人2的行动空间。(4)支付函数分别为u1=(m,a,θ)和u2=(m,a,θ)。)(~mp图9.1是一个简单的信号传递博弈的扩展式表述,这里K=J=H=2,)(~~11mpp)(~~21mpq图9.1信号传递博2m发送者发送者自然1m2m(2,1)(0,0)(1,0)(1,2)[]q[1]q(0,1)0.50.51m12[]p(1,3)(4,0)[1]p(2,4)1a2a1a2a2a1a2a1a当参与人1发出信号时,他预测到参与人2将根据他发出的信号修正对自己类型的判断,因而选择一个最优的类型依存信号战略;同样,参与人2知道参与人1选择的是给定类型和考虑信息效应情况下的最优战略,因此使用贝叶斯法则修正对参与人1的类型的判断,选择自己的最优行动。例如市场进入博弈事实上就是一个信号传递博弈。这里,在位者是信号发送者,进入者是信号接受者。当在位者选择价格时,他知道进入者将根据自己选择的价格判断白已是高成本还是低成本的概率;进入者确实是在根据观测到的价格修正对在位者类型的判断,然后选择进入还是不进入。图9.1信号传递博弈中,发送者有四个纯战略:发送者战略1:如果自然赋予类型θ1,选择信号m1;如果自然赋予类型θ2,选择信号m1;发送者战略2:如果自然赋予类型θ1,选择信号m1;如果自然赋予类型θ2,选择信号m2;发送者战略3:如果自然赋予类型θ1,选择信号m2;如果自然赋予类型θ2,选择信号m1;发送者战略4:如果自然赋予类型θ1,选择信号m2;如果自然赋予类型θ2,选择信号m2。接受者也有四个纯战略:接收者战略1:如果发送者选择信号m1,选择行动a1;如果发送者选择信号m2,选择行动a1;接收者战略2:如果发送者选择信号m1,选择行动a1;如果发送者选择信号m2,选择行动a2;接收者战略3:如果发送者选择信号m1,选择行动a2;如果发送者选择信号m2,选择行动a1;接收者战略4:如果发送者选择信号m1,选择行动a2;如果发送者选择信号m2,选择行动a2。定义:信号传递博弈的精炼贝叶斯均衡是战略组合(m*(θ),a*(θ))和后验概率的结合,它满足:(1);(2);(3)是参与人2使用贝叶斯法则从先验概率p(θ)观测到信号m和参与人1的最优战略得到的m*(θ)(在最可能情况下)。*2()argmax()(,,)aampmuma**1()argmax(,(),)mmumam()pm()pm上述定义中,(1)、(2)等价于精练条件。(1)说的是,给定后验概率,参与人2对参与人发出信号的最优反应;(2)说的是预测到2的最优反应a*(m),参与人1选择自己的最优战略;(3)是贝叶斯法则的运用。)(~mp信号传递博弈的所有可能精炼贝叶斯均衡可以划分为三类:分离均衡、混同均衡和准分离均衡。分离均衡:不同类型的发送者以1的概率选择不同的信号,信号准确地揭示出类型。混同均衡:不同类型的发送者选择相同的信号,接收者不修正先验概率(发送者的选择没有信息量)。准分离均衡:一些类型的发送者随机地选择信号,另一类的发送者选择特定的信号。R发送者发送者自然LR(2,1)(0,0)(1,0)(1,2)[]q[1]q(0,1)0.50.5L1t2t[]p(1,3)(4,0)[1]p(2,4)ududdudu例1:求解下列信号博弈的PBNE解:该博弈可能存在的纯战略PBNE有:1、混同于行动L的PBNE——无论发送者的类型是t1和t2,发送者的战略都为(L,L)2、混同于行动R的PBNE——无论发送者的类型是t1和t2,发送者的战略都为(R,R)3、分离均衡——类型t1的发送者选择L,类型t2发送者选择R,发送者的战略都为(L,R)4、分离均衡——类型t1的发送者选择R,类型t2的发送者选择L,发送者的战略都为(R,L第1种情况:假设混同于行动L的PBNE要求R1:接受者对应于L的信息集h(左边信息集)处在均衡路径之上的推断(p,1-p)接受者对应于R的信息集h(右边信息集)处在均衡路径之外的推断(q,1-q)要求R2:给定这样的推断,接受者在观测到信号L之后,行动u和d的期望收益为:行动u的期望收益为:E(u)=3p+4(1-p)=4-p=3.5行动d的期望收益为:E(d)=0p+1(1-p)=1-p=0.5接受者看到L之后的S2*(L)=u,同时:U1*(t1,L)=1,U1*(t2,L)=2.R发送者发送者自然LR(2,1)(0,0)(1,0)(1,2)[]q[1]q(0,1)0.50.5L1t2t[]p(1,3)(4,0)[1]p(2,4)ududdudu那么:发送者的(L,L)是最优的吗?需要确定:如果发送者选择信号R,接受者的反应(选择)给两种类型的发送者所带来的收益小于他们选择信号L的收益。由于:①如果接受者对R的反应为u,则类型为t1的发送者选择R的收益为2,高于自己选择L的收益1,因此类型为t1的发送者不会选择L.(不可行)②如果接受者对R的反应为d,则类型为t1的发送者选择R的收益为0,低于自己选择L的收益1,因此类型为t1的发送者会选择L.类型为t2的发送者选择R的收益为1,低于自己选择L的收益2,因此类型为t2的发送者会选择L.(可行)因此,如果存在前面假设的混同均衡,其中发送者的策略为(L,L),则接受者对R的反应必须为d,于是接受者的战略必须为s2*|s1=L=u,s2*|s1=R=d要求R3:对信息集h(左边信息集)处在均衡路径之上的推断(p,1-p)的贝叶斯修正:1111122(|)*()(|)(|)*()(|)*()1*0.50.51*0.51*0.5pLtptpptLpLtptpLtptp要求R4::还需要考虑接受者在对应于R的信息集(右边信息集)中的推断推断(q,1-q),以及给定这一推断d是否是最优的?在R的信息集(右边信息集)上:行动u的期望收益为:E(u)=q+0(1-q)=q行动d的期望收益为:E(d)=0q+2(1-q)=2-2qd最优的条件:E(d)E(u),即q=2/3综上:混同于L的PBNE为:2(,),(,),0.5,03LLudpq第2种情况:假设混同于行动R的PBNE要求R1:接受者对应于L的信息集h(左边信息集)处在均衡路径之上的推断(p,1-p)接受者对应于R的信息集h(右边信息集)处在均衡路径之外的推断(q,1-q)要求R2:给定这样的推断,接受者在观测到信号R之后,行动u和d的期望收益为:行动u的期望收益为:E(u)=q+0(1-q)=q=0.5行动d的期望收益为:E(d)=0q+2(1-q)=2-2q=1接受者看到R之后的S2*(R)=d,即是:U1*(t1,R)=0,U1*(t2,R)=1.R发送者发送者自然LR(2,1)(0,0)(1,0)(1,2)[]q[1]q(0,1)0.50.5L1t2t[]p(1,3)(4,0)[1]p(2,4)ududdudu那么:发送者的(R,R)是最优的吗?需要确定:如果发送者选择信号L,接受者的反应(选择)给两种类型的发送者所带来的收益小于他们选择信号R的收益。由于:①如果接受者对L的反应为u,则类型为t1的发送者选择L的收益为1,高于自己选择R的收益0,因此类型为t1的发送者不会选择R.(不可行)②如果接受者对L的反应为d,则类型为t1的发送者选择L的收益为4,高于自己选择R的收益0,因此类型为t1的发送者会选择L.类型为t2的发送者选择L的收益为0,低于自己选择R的收益1,因此类型为t2的发送者会选择L.(不可行)综上:不满足R2,所以不存在混同于R的PBNE.第3种情况:假设存在(L,R)的分离均衡PBNE要求R1和要求3:接受者对应于L的信息集h(左边信息集)处在均衡路径之上的贝叶斯推断(1,0)接受者对应于R的信息集h(右边信息集)处在均衡路径之外的推断(0,1)要求R2:给定这样的推断,接受者在观测到信号(L,R)之后,接受者的最优反应s2*|s1=L=u,s2*|s1=R=d同时,发送者U1*(t1,L)=1,U1*(t2,R)=1.R发送者发送者自然LR(2,1)(0,0)(1,0)(1,2)[]q[1]q(0,1)0.50.5L1t2t[]p(1,3)(4,0)[1]p(2,4)ududdudu那么:发送者的(L,R)是最优的吗?需要确定:如果发送者选择信号(L,R),接受者的反应(选择)给两种类型的发送者所带来的收益小于他们选择信号(R,L)的收益。由于:①如果接受者类型为t1对R的反应为u,则发送者选择R的收益为2,高于自己选择L的收益1,因此类型为t1的发送者不会选择L.(不可行)②如果接受者对R的反应为d,则类型为t1的发送者选择R的收益为0,低于自己选择L的收益1,因此类型为t1的发送者会选择L.类型为t2的发送者选择L的收益为2,高于自己选择R的收益1,因此类型为t2的发送者会选择L.(不可行)综上:不满足R2,不存在(L,R)的分离均衡PBNE第4种情况:假设存在(R,L)的分离均衡PBNE要求R1和要求3:接受者对应于L的信息集h(左边信息集)处在均衡路径之上的贝叶斯推断(0,1)接受者对应于R的信息集h(右边信息集)处在均衡路径之外的推断(1,0)要求R2:给定这样的推断,接受者在观测到信号(R,L)之后,接受者的最优反应s2*|s1=R=u,s2*|s1=L=u同时,发送者U1*(t1,R)=0,U1*(t2,L)=2.R发送者发送者自然LR(2,1)(0,0)(1,0)(1,2)[]q[1]q(0,1)0.50.5L1t2t[]p(1,3)(4,0)[1]p(2,4)ududdudu那么:发送者的(R,L)是最优的吗?需要确定:如果发送者选择信号(R,L),接受者的反应(选择)给两种类型的发送者所带来的收益小于他们选择信号(L,R)的收益。由于:①如果接受者对类型t1的L的反应为d,则发送者选择L的收益为4,高于自己选择R的收益2,因此类型为t1的发送者不会选择R.(不可行)②如果接受者对类型t1的L的反应为u,则发送者选择L的收益为1,低于自己选择R的收益2,因此类型为t1的发送者不会选择L.如果接受者对类型t2的R的反应为u,则发送者选择R的收益为1,低于自己选择L的收益2,因此类型为t2的发送者不会选择R.(可行)因此,如果存在前面假