第三章:不完全信息静态博弈主要内容:一、不完全信息博弈和贝叶斯纳什均衡二、贝叶斯均衡的应用三、贝叶斯博弈与混合战略均衡四、机制设计理论与显示原理第一节不完全信息博弈和贝叶斯均衡一、贝叶斯博弈二、海萨尼转换三、贝叶斯博弈的战略式描述四、贝叶斯纳什均衡一、贝叶斯博弈•完全信息(completeinformation):每个参与人对其他参与人的支付函数有准确的了解;否则,为不完全信息(incompleteinformation)。•完美信息(perfectinformation):在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息(imperfectinformation)。•前面两章我们讨论了完全信息博弈问题,但在现实生活中我们遇到更多的可能是不完全信息博弈问题。•例如:•在企业的新产品开发过程中,企业对市场的需求可能并不清楚;•在连锁店博弈中,潜在的进入者可能并不知道连锁店在市场上的盈利情况,等等。•像这种博弈开始时就存在事前不确定性的博弈问题是不完全信息博弈问题。40,50-10,030,80-10,1000,3000,3000,4000,400高成本情况低成本情况默许斗争默许斗争进入不进入进入者在位者市场进入博弈:不完全信息•在位者的成本有两种类型,而进入者并不知道在位者的成本类型。•显然,在这种情形下,进入者有关在位者的成本信息是不完全的。•当在位者具有不同的成本时,所表现出来的博弈情形是不同的,对应的均衡也是不一样的。•高成本情形:(进入,默许)(不进入,斗争)•低成本情形:(不进入,斗争)斗鸡博弈•两个所谓的勇士举着长枪,准备从独木桥的两端冲上桥中央进行决斗。每位勇士都有两种选择:冲上去(用U表示),或退下来(用D表示)。若两人都冲上去,则两败俱伤;若一方上去而另一方退下来,冲上去者取得胜利(至少心理上是这样的),退下来的丢了面子;若两人都退下来,两人都丢面子。•存在两个纯战略Nash均衡——(U,D)和(D,U),也就是一个人冲上去,另一个就必须退下来。•当一个理性的参与人预测到对方将会冲上去时,明智的选择就是退下来;而当预测到对方将会选择退却时,就应该大胆地冲上去。-4,-42,-2-2,20,0UD21UD•现在考虑这样的情形:假设参与人可能有这样的两种性格特征(类型)——“强硬”(用s表示)或“软弱”(用w表示)。•所谓“强硬”的参与人是指那些喜欢争强好胜、不达目的誓不罢休的决斗者;而“软弱”的参与人是指那些胆小怕事、遇事希望息事宁人的决斗者。•可以想象,当具有不同性格特征的决斗者相遇时,表现出来的博弈情形将会不同。斗鸡博弈:不完全信息当参与人都为强硬者时•博弈存在两个纯战略Nash均衡——(U,D)和(D,U)。-4,-42,-2-2,20,0UD21UD当参与人1为强硬者参与人2为软弱者时•博弈存在唯一的Nash均衡——(U,D)。-4,-42,0-2,00,1UD21UD当参与人1为软弱者参与人2为强硬者时•博弈存在唯一的Nash均衡——(D,U)。-4,-40,-20,21,0UD21UD当参与人都为软弱者时•博弈存在唯一的Nash均衡——(D,D)。-4,-40,00,01,1UD21UD-4,-42,-2-2,20,0UD21UD-4,-42,0-2,00,1UD21UD-4,-40,-20,21,0UD21UD-4,-40,00,01,1UD21UD(1)参与人都为强硬者(2)参与人1为强硬者参与人2为软弱者(3)参与人1为软弱者参与人2为强硬者(4)参与人都为软弱者强硬软弱UDUD121,10,01,00,20,0-4,-40,-2-4,-40,1-2,00,0-2,22,0-4,-42,-2-4,-4UDUD强硬软弱斗鸡博弈:不完全信息•在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都知道自己的性格特征,但对对手的性格特征往往不甚了解。•在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈,但对决斗者来讲,仍存在着所谓的事前不确定性,即博弈开始之前就不知道的信息。•具体而言,这意味着当博弈真正开始的时候,对到底体现为哪一种博弈形势并不清楚。•对于“强硬”的参与人1来讲,虽然他看到了上面的战略式博弈,但他不知道对手是“强硬”的还是“软弱”的,所以博弈开始之前他无法确定博弈是根据(1)还是(2)进行。这意味着“强硬”的参与人1面临着事前无法确定的信息。•同样,“软弱”的参与人1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。•从这一例子来看,博弈的参与人均存在两种不同的类型,即强硬和软弱;•由于参与人1不知道对手究竟是“强硬”的还是“软弱”的,因此,此时参与人1就好像在与两个决斗者进行决斗,一个是“强硬”的,另一个是“软弱”的;•当一个参与人并不知道在与谁博弈时,博弈的规则是无法定义的,如何处理不完全信息导致的这一问题?•为了解决该问题,海萨尼提出了Harsanyi转换。•海萨尼指出,引入虚拟参与人——自然,由自然先决定参与人的不同类型,将不完全信息博弈转换为不完美信息博弈。二、海萨尼(Harsanyi)转换•为了解释Harsanyi转换的具体含义,我们对“斗鸡博弈”进行简化。•假设参与人1是“强硬”的决斗者,参与人2可能是“强硬”的也可能是“软弱”的,参与人1不知道参与人2的类型,但参与人2知道自己的类型,而且这一假设为所有的参与人所知道。Harsanyi转换•对于简化的“斗鸡博弈”,Harsanyi转换是这样处理的:在原博弈中引入一个“虚拟”的参与人——“自然”(nature,用N表示),构造一个参与人为两个决斗者和“自然”的三人博弈。Harsanyi转换-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1“自然”首先行动决定参与人2的性格特征(即选择参与人2是“强硬”的还是“软弱”的),“自然”的选择参与人1不知道,但参与人2知道。参与人2的特征在“自然”选择后,参与人1和2再进行“斗鸡博弈”。-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1在新构造的三人博弈中,“自然”的支付不必考虑。参与人1和2的支付由“斗鸡博弈”决定。-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1如果“自然”选择参与人2的性格特征是“强硬”的,则意味着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结x1,其支付由(1)决定;-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220x1x2xDDDDDUUUUU1如果“自然”选择参与人2的性格特征是“软弱”的,则意味着参与人1与“软弱”的参与人2进行决斗,博弈进入决策结x2,其支付由(2)决定。•海萨尼通过引入“虚拟”参与人,将博弈的起始点由x1或x2提前至x0,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性。•这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法称为Harsanyi转换。•在Harsanyi转换中规定:参与人关于“自然”选择的推断为共同知识。•也就是说,两个决斗者不仅同时一起看到了“自然”随机选择参与人2的性格特征,而且同时一起看到了“自然”以一定的概率分布随机选择参与人2的性格特征。在应用Harsanyi转换时,需要注意以下问题:1)“自然”的选择。在一般的不完全信息博弈问题中,Harsanyi转换规定“自然”选择的是参与人的类型(type)。除了根据参与人的支付来划分参与人的类型以外,还可以根据参与人的行动空间,甚至根据参与人掌握信息的多少(或程度)来划分参与人的类型。•用ti表示参与人i的一个特定的类型,Ti表示参与人i所有类型的集合(亦称类型空间,typespace),即,t=(t1,…,tn)表示所有参与人的类型组合,t-i=(t1,…,ti-1,…,tn)表示除参与人i之外其他参与人的类型组合。所以,t=(ti,t-i)。iitT•用表示参与人i在知道自己类型为ti的情况下,关于其他参与人类型的推断(即条件概率),则()iiiptt((,)(,))()(,)iiiiiiiiiiiitTttttptttttpppp2)参与人关于“自然”选择的推断:•用p(t1,…,tn)表示定义在参与人类型组合上的一个联合分布概率函数。•假设pss=0.2,psw=0.3,pws=0.25,pww=0.25。•其中,pss:决斗者1和决斗者2同时强硬的概率;psw:决斗者1强硬、决斗者2软弱的概率;pws:决斗者1软弱、决斗者2强硬的概率;pww:决斗者1软弱、决斗者2软弱的概率;•虽然决斗者1不知道决斗者2的类型,但由于决斗者1知道自己的类型,因此他可以根据贝叶斯公式推知决斗者2的类型分布。例如•根据贝叶斯规则,“强硬”的决斗者1可以推知:决斗者2是“强硬”的概率为决斗者2是“软弱”的概率为•“软弱”的决斗者1可以推知:决斗者2是“强硬”的概率为决斗者2是“软弱”的概率为1(0.2)0.40.20.3pss1(0.3)0.60.20.3pws1(0.25)0.50.250.25psw1(0.25)0.50.250.25pww•不完全信息博弈:完全信息博弈在不完全信息上的拓展,我们又将其称为贝叶斯博弈;•贝叶斯博弈:静态贝叶斯博弈和动态贝叶斯博弈;三、贝叶斯博弈的战略式描述贝叶斯博弈的定义•贝叶斯博弈包含以下五个要素:(1)参与人集合;(2)参与人的类型集合T1,…,T2;(3)参与人关于其他参与人类型的推断…,;(4)参与人类型相依的行动集A(t1),…,A(tn);(5)参与人类型相依的支付函数,…,。{1,2,...,}n111(),ptt()nnnptt112211((),(),,();)nnatatattu1122((),(),,();)nnnnatatattu贝叶斯博弈中的战略•在贝叶斯博弈中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti);•它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。{;();();(());((();))}iiiiiiGTpAtuatt•用表示给定其他参与人的战略,类型为ti的参与人i选择行动ai时的期望效用,则其中,对,为给定t-i时由s-i所确定的其他参与人的行动组合(,;)iiiivast111((),,(),(),,())iiinsssss(,;)()(,();)iiiiiiiiiiiiiitTvastpttuaattiitT()iiat111111()((),,(),(),,())iiiiiinnatatatatat贝叶斯博弈的时间顺序如下:(1)“自然”选择参与人的类型组合t=(t1,…,tn),其中,参与人i观测到“自然”关于自己类型ti的选择;虽然参与人i观测不到“自然”关于其他参与人类型t-i的选择,但参与人i具有关于其他参与人类型的推断;(2)参与人同时选择行动,每个参与人i从行动集Ai(ti)中选择行动ai(ti);(3)参与人i得到。()iiiptt1122((),(),,();)nniiatatattu“斗鸡博弈”的贝叶斯模型•参与人为决斗者1和2;•用s表示决斗者是“强硬”的,w表示决斗者是“软弱”的,所以T1=T2={s,w}。•用pxy表示“自然”选择类型组合(x,y)的概率,并假设pxy为共同知识,则决斗者1关于其对手类型的推断为p1(y|x)。•决斗者1关于类型相依的行动空间A1(x)={U,D},决斗者