1第十二章贝叶斯纳什均衡及其精炼前两章讨论的是完全信息条件下的博弈,给出了博弈的基本分析框架。本章将讨论不完全信息下的博弈行为,包括不完全信息静态博弈和不完全信息动态博弈。12.1不完全信息博弈与贝叶斯纳什均衡一、不完全信息博弈完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(commonknowledge)的博弈。反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。二、海萨尼(Harsanyi)转换在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。至于“类型”概念,以两个企业博弈的例子说明。假设参与人1为在位者企业,参与人2为进入者企业。2进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。但是进入者不知道在位者的成本是高还是低。因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。海萨尼提出通过引入“自然”概念解决这个问题。即由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。在本例中,通过自然选择在位者的成本类型,进入者再针对高成本或低成本进行是否进入的博弈决策。应当指出,通过自然选择类型的划分,不仅是针对支付函数而言的,其包括参与人所拥有的所有个人信息,如战略空间和信息集等等。通过上述分析可知道,不完全信息意味着,至少有一个参与人拥有多种类型,否则就成为完全信息博弈。用表示参与人的一个特定类型,表示参iθiiΘ与人所有可能类型的集合,,并假定iiiΘ∈θ取自某个客观的分布函数。nii1}{=θ),,(1nPθθL3为简化起见,假定只有参与人本人观察到自i己的类型,其他人都不能察到。但依据海萨尼iθiθ公理,我们假定分布函数是所有参与),,(1nPθθL人的共同知识,就是说,在博弈开始时,所有参与人关于自然行动的信念是相同的。用表示除之),,,,,(111niiiθθθθθLL+−−=i外的所有参与人的类型组合,这样,。),(),,(1iin−==θθθθθL定义为参与人的条件概率即给定)(iiipθθ−i参与人属于类型的条件下,其他参与人属于iiθ的概率。i−θ根据条件概率规则:(12.1)∑−Θ∈−−−−−==iiiiiiiiiiiiiiiipppppθθθθθθθθθθ),(),()(),()(这里,是边缘概率。)(iipθ如果类型的分布是独立的,。)()(iiiiipp−−=θθθ4三、战略表达式不完全信息静态博弈又称静态贝叶斯博弈。如同在完全信息静态博弈中一样,静态贝叶斯博弈的所有参与人同时行动,参与人的战略空间i等同于他的行动空间。所不同的是,参与人iSiA的行动空间可能依赖于他的类型,即行动空iiAiθ间是类型依存的。比如一个企业能选择什么产量依赖于它的成本函数,等等。用表示参与人的类型依存行动空间,)(iiAθi表示的一个特定行动。)()(iiiiAaθθ∈i类似地,参与人的支付函数也是类型依存的。i用表示参与人的效用函数。于是,),,(iiiiaauθ−i可以用下列战略式表述代表静态贝叶斯博弈。其定义为:人静态贝叶斯博弈的战略式表述包括:n参与人的类型空间,nΘΘ,,1L条件概率,npp,,1L类型依存战略空间)(.),(11nnAAθθL类型依存支付函数);,,(,),;,,(1111nnnnaauaauθθLLL参与人知道自己的类型,条件概率iiiΘ∈θ描述给定自己属于的情况下,)(iiiippθθ−=iθ5参与人有关其他参与人类型的不确定iii−−Θ∈θ性。我们用},,;,,;,,;.,{1111nnnnuuppAAGLLLLθθ=代表这个博弈。静态贝叶斯博弈的时间顺序如下:(1)自然选择类型向量,其),,(1nθθθL=中,参与人观测到,但参与人iiΘ∈θiiθ)(ij≠只知道,观测不到。)(jjjpθθ−iθ(2)个参与人同时选择行动n,其中。),,(1naaaL=iiAa∈(3)参与人得到。i);,,(1iniaauθL给出四点讨论(1)如果所有参与人的类型空间只包含一个元素,即对于所有的,,不完全信息静i}{iθ=Θ态博弈就退化为完全信息静态博弈,所以后者是前者的一个特例。(2)我们给出参与人类型相互独立的意义在于其保证不完全信息的存在。(3)准确地说,其他参与人不知道参与人i的支付函数是指,其不知道参与人的支付函数是i,还是,这里);,,(1iniaauθL);,,(1iniaauθ′L,,。iiΘ∈θiiΘ∈′θiiθθ≠′6(4)参与人的期望效用函数为:i(12.2)),);(),(()(iiiiiiiiiiiaaupvi−−−−∑−=θθθθθθθ四、贝叶斯纳什均衡通过上述讨论,可以给出贝叶斯纳什均衡的定义:人不完全信息静态博弈n},,;,,;,,;.,{1111nnnnuuppAAGLLLLθθ=的纯战略贝叶斯纳什均衡是一个类型依存战略组合,其中每个参与人在给定自己的类niiia1)}({=∗θi型和其他参与人类型依存战略的情况iθ)(iia−∗−θ下最大化自己的期望效用函数。iv换言之,战略组合是一个贝叶斯纳什均))(,),((11nnaaaθθ∗∗∗=L衡,如果对于所有的,,有:i)(iiiAaθ∈(12.3)),);(),(()(maxarg)(iiiiiiiiiiaiiaaupai−−∗−−∗⋅∈∑θθθθθθθ混合战略的贝叶斯纳什均衡概念可以类似定义。均衡的存在性定理是纳什均衡存在性定理的7一个直接推广。五、一个例子:不完全信息古诺模型①1.基本假定参与人的类型是成本函数,假定逆需求函数为,令为企业的成本,那么企业21qqaP−−=ici的利润函数为:(12.4)2,1)(21=−−−=icqqaqiiiπ假定企业1只有一种类型,企业2有两种类型,企业1的单位成本是共同知识,企业2的单位成1c本是私人信息。企业2知道自己的真实成本类型,而企业1只知道的概率为,的概率为Lcc22=µHcc22=;是共同知识。)1(µ−µ为了简化讨论,进一步假定,,2=a11=c,,。432=Lc452=Hc21=µ2.均衡求解给定企业2知道企业1的成本,企业2将选择以最大化利润函数:2q(12.5))(2122qqtq−−=∗π①关于古诺模型的传统分析框架,可以参考7.3“寡头垄断与垄断竞争市场”。8其中或,依4543=−=at4345=−=at赖于企业2的实际成本。由一阶条件,得到企业2的反应函数为:(12.6))(21);(112qttqq−=∗这意味着,企业2的最优产量不仅依赖于企业1的产量,而且依赖于自己的成本(或类型)。为时企业2的最优产量,Lq245=t为时企业2的最优产量。Hq243=t那么,,)45(2112qqL−=(12.7))43(2112qqH−=企业1不知道企业2的真实成本,进而无法判断企业2的反应函数是还是,因此企业1将Lq2Hq2选择最大化下面的期望效用函数:1q(12.8))1(21)1(212112111HLqqqqqqE−−+−−=π解最优化的一阶条件,得到企业1的反应函数为:9(12.9))1(21)21211(212221EqqqqHL−=−−=∗其中,,是企业1关于企业2)(21222HLqqEq+=产量的期望值。均衡意味着两个反应函数同时成立,解两个反应函数得到贝叶斯均衡为:;,311=∗q24112=∗Lq2452=∗Hq3.结论比较不完全信息下贝叶斯均衡与完全信息下的纳什均衡,会有助于我们对二者区别与联系的理解。完全信息下,如果企业2的成本是,432=c而且企业1知道,则反应函数分别为:432=c(12.10))45(21)1(211221qqqq−=−=∗∗纳什均衡产量为:,,其中411=NELq212=NELq下标中的表示企业2为低成本的情况。L类似可以得到,当时,纳什均衡产量452=c10为:,。1251=NEHq612=NEHq因此,我们有:,314111==∗qqNEL24112122==∗LNELqq,3112511==∗qqNEH2456122==∗HNEHqq就是说,与完全信息下相比,在不完全信息情况下,低成本企业的产量相对较低,而高成本企业的产量却相对较高。其原因在于,不完全信息情况下,企业1不知道企业2的真实类型,因此只能生产预期的最优产量,追求期望效用函数的最大化。图12—1对上述讨论给出了一个直观的表示。111212.2精炼贝叶斯纳什均衡一、基本思想在不完全信息动态博弈(dynamicgameofincompleteinformation)中,“自然”首先选择参与人的类型,参与人自己知道,而其他参与人不知道。在自然选择之后,参与人开始行动,参与人的行动有先后顺序,后行动者能够观察到先行动者的行动,但是不能观察到先行动者的类型。然而,因为参与人的行动是类型依存的,每个参与人的行动都包含了自己类型的某种信息,后行动者可以通过观察先行动者的行动来推断其类型或修正对其类型的先验信息(概率分布),然后选择自己的最优行动。先行动者预测到后行动者会利用自己的行动,因此会设法传递对自己最有利的信息,避免传递对自己不利的信息。因此博弈的过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔腾(Selten)的完全信息动态博弈子博弈精炼纳什均衡和海萨尼(Harsanyi)的不完全信息静态博弈贝叶斯均衡的结合。13精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人类型的信念。精炼贝叶斯均衡(perfectBayesianequilibrium)是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断的结合。它要求:(1)在每一个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);(2)给定该信息集上的概率分布和其他参与人的后续战略(subsequentstrategy),参与人的行动必须是最优的;(3)每一个参与人根据贝叶斯法则和均衡战略修正后验概率。二、贝叶斯法则贝叶斯法则对理解精炼贝叶斯均衡概念是至关重要的。当面临不确定性时,在任何一个时点上,我们对事情的发生的可能性都有一个判断,并且会随着时间推移,用新的信息来修正已有的判断。在统计学上,这种修正之前的判断称为“先验14概率”(priorprobability),修正之后的判断称为“后验概率”(posteriorprobability)。贝叶斯法则正是根据新的信息从先验概率得到后验概率的基本方法。下面以不完全信息博弈为例说明贝叶斯法则。首先假定参与人的类型是独立分布的,有iK个可能的类型,有个可能的行动。H用和分别代表一个特定的类型和一个特kθha定的行动,因为只考虑一个参与人,因此可以将下标省略。i假定属于类型的先验概率是,ikθ0)(≥kpθ;给定属于,选择的条件概1)(1=∑=Kkkpθikθiha率为,。)(khapθ1)(=∑hkhapθ那么选择的边缘概率为:iha∑==++=KkkkhKKhhhpappappapaob111)()()11.12()()(,,)()(}{PrθθθθθθL15即参与人选择行动的“总”概率是每一种选ihai择的条件概率的加权平均,权数是他ha)(khapθ属于每种类型的先验概率。kθ)(kpθ如果观察到选择了,那么属于类型的ihaikθ后验概率可以记为,表示给定}{Prhkaobθha的情况下属于类型的概率。ikθ根据概率公式:(12.12)}{Pr}{Pr)()(},{Prhhkkkhkhaobaobpapaobθθθθ≡≡即属于并选择的联合概率等于属于的ikθhaikθ先验概率乘以类型的参与人选择的概率,或kθha等于选择的总概率乘以给定的情况下属于ihahai的后验概率。kθ因此,我们有:16(