第十二章贝叶斯纳什均衡及其精炼第一节不完全信息博弈与贝叶斯纳什均衡第二节精炼贝叶斯纳什均衡第三节信号传递博弈2第一节不完全信息博弈与贝叶斯纳什均衡一、不完全信息博弈完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(commonknowledge)的博弈。反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。3二、海萨尼转换在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。至于“类型”概念,以两个企业博弈的例子说明。假设参与人1为在位者企业,参与人2为进入者企业。进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。但是进入者不知道在位者的成本是高还是低。因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。海萨尼提出通过引入“自然”概念解决这个问题。由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。4不完全信息意味着,至少有一个参与人拥有多种类型。用i表示参与人i的一个特定类型,i表示参与人i所有可能类型的集合,ii,并假定nii1}{取自某个客观的分布函数),,(1nP。为简化假定只有参与人i本人观察到自己的类型i,其他人都不能察到i。我们假定分布函数),,(1nP是所有参与人的共同知识,在博弈开始时,所有参与人关于自然行动的信念是相同的。我们用),,,,,(111niii表示除i之外的所有参与人的类型组合,这样,),(),,(1iin。定义)(iiip为参与人i的条件概率即给定参与人i属于类型i的条件下,其他参与人属于i的概率。5根据条件概率规则:iiiiiiiiiiiiiiiippppp),(),()(),()((12.1)这里,)(iip是边缘概率。如果类型的分布是独立的,)()(iiiiipp。6三、战略表达式不完全信息静态博弈又称静态贝叶斯博弈。如同在完全信息静态博弈中一样,静态贝叶斯博弈的所有参与人同时行动,参与人i的战略空间iS等同于他的行动空间iA。所不同的是,参与人i的行动空间iA可能依赖于他的类型i,即行动空间是类型依存的。用)(iiA表示参与人i的类型依存行动空间,)()(iiiiAa表示i的一个特定行动。类似地,参与人i的支付函数也是类型依存的。我们用),,(iiiiaau表示参与人i的效用函数。于是,可以用下列战略式表述静态贝叶斯博弈。其定义为:7n人静态贝叶斯博弈的战略式表述包括:参与人的类型空间n,,1,条件概率npp,,1,类型依存战略空间)(.),(11nnAA,和类型依存支付函数);,,(,),;,,(1111nnnnaauaau。参与人i知道自己的类型ii,条件概率)(iiiipp描述给定自己属于i的情况下,参与人i有关其他参与人类型ii的不确定性。},,;,,;,,;.,{1111nnnnuuppAAG代表这个博弈。静态贝叶斯博弈的时间顺序如下:(1)自然选择类型向量),,(1n,其中ii,参与人i观测到i,但参与人)(ij只知道)(jjjp,观测不到i。(2)n个参与人同时选择行动),,(1naaa,其中iiAa。(3)参与人i得到);,,(1iniaau。8给出四点讨论(1)如果所有参与人的类型空间只包含一个元素,即对于所有的i,}{i,不完全信息静态博弈就退化为完全信息静态博弈,所以后者是前者的一个特例。(2)我们给出参与人类型相互独立的意义在于其保证不完全信息的存在。(3)准确地说,其他参与人不知道参与人i的支付函数是指,其不知道参与人i的支付函数是);,,(1iniaau,还是);,,(1iniaau,这里ii,ii,ii。(4)参与人i的期望效用函数为:),);(),(()(iiiiiiiiiiiaaupvi)9四、贝叶斯纳什均衡n人不完全信息静态博弈},,;,,;,,;.,{1111nnnnuuppAAG的纯战略贝叶斯纳什均衡是一个类型依存战略组合niiia1)}({,其中每个参与人i在给定自己类型i和其他参与人类型依存战略)(iia的情况下最大化自己的期望效用函数iv。换言之,战略组合))(,),((11nnaaa是一个贝叶斯纳什均衡,如果对于所有的i,)(iiiAa,有:),);(),(()(maxarg)(iiiiiiiiiiaiiaaupai(12.3)10五、一个例子:不完全信息古诺模型1.基本假定。参与人的类型是成本函数,假定逆需求函数为21qqaP,令ic为企业i的单位成本,那么企业的利润函数为:)(21iiicqqaq,2,1i(12.4)假定企业1只有一种类型,企业2有两种类型,企业1的单位成本1c是共同知识,企业2的单位成本是私人信息。企业2知道自己的真实成本类型,而企业1只知道Lcc22的概率为,Hcc22的概率为)1(;是共同知识。为了简化讨论,进一步假定2a,11c,432Lc,452Hc,21。112.均衡求解。给定企业2知道企业1的成本,企业2将选择2q以最大化利润函数:)(2122qqtq,其中4543at或4345at,依赖于企业2的实际成本。由一阶条件,得到企业2的反应函数为:)(21);(112qttqq(12.6)这意味着,企业2的最优产量不仅依赖于企业1的产量,而且依赖于自己的成本(或类型)。Lq2为45t时企业2的最优产量,Hq2为43t时企业2的最优产量。那么,)45(2112qqL,)43(2112qqH(12.7)12企业1不知道企业2的真实成本,进而无法判断企业2的反应函数是Lq2还是Hq2,因此企业1将选择1q最大化下面的期望效用函数:)1(21)1(212112111HLqqqqqqE(12.8)解最优化的一阶条件,得到企业1的反应函数为:)1(21)21211(212221EqqqqHL(12.9)均衡意味着两个反应函数同时成立,解两个反应函数得到贝叶斯均衡为:311q;24112Lq,2452Hq133.结论。比较不完全信息下贝叶斯均衡与完全信息下的纳什均衡,会有助于我们对二者区别与联系的理解。完全信息下,如果企业2的成本是432c,而且企业1知道432c,则反应函数分别为:)45(21)1(211221qqqq(12.10)纳什均衡产量为:411NELq,212NELq,其中下标中的L表示企业2为低成本的情况。14类似可以得到,当452c时,纳什均衡产量为:1251NEHq,612NEHq。因此,我们有:314111qqNEL,24112122LNELqq3112511qqNEH,2456122HNEHqq在不完全信息情况下,低成本企业的产量相对较低,而高成本企业的产量却相对较高。其原因在于,企业1不知道企业2的真实类型,因此只能生产预期的最优产量,追求期望效用函数的最大化。图12—1对上述讨论给出了一个直观的表示。1516第二节精炼贝叶斯纳什均衡一、基本思想精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔腾的完全信息动态博弈子博弈精炼纳什均衡和海萨尼的不完全信息静态博弈贝叶斯均衡的结合。精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人类型的信念。精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断的结合。它要求:(1)在每一个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);(2)给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;(3)每一个参与人根据贝叶斯法则和均衡战略修正后验概率。17二、贝叶斯法则贝叶斯法则正是根据新的信息从先验概率得到后验概率的基本方法。首先假定参与人的类型是独立分布的,i有K个可能的类型,有H个可能的行动。k和ha分别代表一个特定的类型和一个特定的行动,假定i属于类型k的先验概率是0)(kp,1)(1Kkkp;给定i属于k,i选择ha的条件概率为)(khap,1)(hkhap。那么i选择ha的边缘概率为:18KkkkhKKhhhpappappapaob111)()()()(,,)()(}{Pr(12.11)即参与人i选择行动ha的“总”概率是每一种i选择ha的条件概率)(khap的加权平均,权数是他属于每种类型k的先验概率)(kp。如果观察到i选择了ha,那么i属于类型k的后验概率可以记为}{Prhkaob,表示给定ha的情况下i属于类型k的概率。根据概率公式:}{Pr}{Pr)()(},{Prhhkkkhkhaobaobpapaob(12.12)19即i属于k并选择ha的联合概率等于i属于k的先验概率乘以k类型的参与人选择ha的概率,或等于i选择ha的总概率乘以给定ha的情况下i属于k的后验概率。Kjjjhkkhhkkhhkpappapaobpapaob1)()()()(}{Pr)()(}{Pr(12.13)精炼贝叶斯均衡假定参与人根据贝叶斯法则修正先验概率。不过贝叶斯法则要求0Prhaob,即参与人i必须以正的概率选择ha,否则后验概率没有定义。如果0Prhaob,我们允许在[0,1]区间取任何值,只要该取值与均衡战略相容。在动态博弈中,0Prhaob对应着非均衡路径上的信息集。20三、精炼贝叶斯均衡假定有n个参与人,参与人i的类型是ii,i是私人信息,)(iiip是属于类型i的参与人i认为其他1n个参与人属于类型),,,,,(111niii的先验概率。令iS是参与人i的战略空间,iiSs是一个依赖于类型i的特定的战略。),,,,,(111hnhihihhiaaaaa是在第h个信息集i观察到其他1n个参与人的行动组合,它是战略组合),,,,,(111niiisssss所规定的行动的一部分。)(~hiiiap是在观察到hia的情况下,参与人i认为其他1n个参与人属于类型),,,,,(111niii的后验概率。ip~是所有后验概率)(~hiiiap的集合,),,(iiiissu表示参与人i的效用函数。于是,精炼贝叶斯均衡可以定义如下:21精炼贝叶斯均衡是一个战略组合))(,),(()(11nnsss和一个后验概率组合)~,,~(~1nppp,满足:(P)对于所有参与人i,在每一个信息集h,);,()(~maxarg),(iiiihiiisiiissuapssii(B))(~hiiiap是使用贝叶斯法则从先验概率)(iiip,观测到的hia和最优战略)(is得到的(在可能的情况下)。对上述定义给出五点讨论(1)(P)是精炼条件。即给定其他参与人的战略),,,,,(111niiisssss和参与人i的后验概率)(~hiiiap,每个参与人i的战略在所有从信息集h开始的后续博弈上都是最优的,或者说所有参与人都是序贯理性的。22(2)(B)对应的是贝叶斯法则的应用。如果参与人是多次行动的,修正概