第八章博弈论228第八章博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。本章讨论这个问题,建立复杂环境下的决策理论。开展这种研究的的理论叫做博弈论,也称为对策论(GameTheory)。最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。大部分经济行为都可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。第一节博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。博弈论推广了标准的一人决策理论。在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。下面来举例说明。例1.便士匹配(MatchingPennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。当甲和乙都作出选择时,博弈的局势就确定了。显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。每个局中人的收益都取决于所有局中人的决策,也就是说,局中人的收益是博弈局势的函数。本例中,甲的收益函数f为:1)(,正正f,1)(,反正f,1)(,正反f,1)(,反反f;乙的收益函数g为:1)(,正正g,1)(,反正g,1)(,正反g,1)(,反反g。局中人的收益函数也可用表格或矩阵加以表示,并称其为收益表或收益矩阵。表2中,甲的收益列在左边,乙的收益列在右边。表1:便士匹配博弈局势表乙甲正面反面正面(正,正)(正,反)反面(反,正)(反,反)表2:甲和乙的收益表乙甲正面反面正面1,11,1反面1,11,1第八章博弈论229该博弈的特点在于每个局中人的收益都是另一个局中人的付出,即甲和乙的收益之和为零,收支发生在局内,不涉及任何局外人。这种博弈就是所谓的二人零和博弈。习惯上,人们喜欢把二人博弈的第一个局中人甲叫做“列”,第二个局中人乙叫做“行”,而且总是把列的收益写在前面(即左边),行的收益写在后面(即右边)。例2.囚徒难题(Prisoner'sDelimma)(二人变和博弈)有两个狂徒甲和乙因共同参与了一起犯罪活动而被囚禁收审。他们可以选择合作,拒绝供出任何犯罪事实;也可以选择背叛,供出对方的犯罪行径。这就是所谓的囚徒博弈,也叫做囚徒难题。博弈的局中人甲和乙都有两种可选择的策略:合作与背叛。囚徒博弈的意义在于它可以解释寡头垄断厂商的行为,关键是赋予合作与背叛具体的经济含义。比如在双头垄断的情况下,合作可以解释为“保持索要一个高价”,背叛可解释为“降价以争夺对手的市场”。右表给出了囚徒博弈的局势表。局中人可以事先讨论这局博弈,但实际决策必须独立地做出。如果甲采取合作策略,不供出乙的犯罪事实,那么乙就能得到3000元的收益。同样,如果乙采取合作策略,那么甲就能得到3000元的收益。可见,如果甲乙双方都采取合作策略,双方各得3000元收益。但是,审讯者用1000元奖赏来鼓励局中人采取背叛策略。这样,只要局中人选择背叛,他就会得到1000元鼓励,而不管另一个局中人会采取什么策略。需要注意的是,囚徒博弈中的货币支付来自第三方——局外人,这正是囚徒博弈同便士匹配博弈的不同之处。奥曼(Aumann)1987年对囚徒博弈给出了一个特别简单的描述:每个局中人都可以对仲裁人简单地宣告“给我1000元”或“给对方3000元”。简单分析一下就会发现,如果一个局中人采取合作策略,而另一个局中人采取背叛策略,那么采取合作策略的局中人的收益为零,而采取背叛策略的局中人的收益为4000元(3000元收益再加上1000元的背叛鼓励)。如果双方都采取背叛策略,则双方的收益各为1000元。表4列出了甲乙双方的收益情况。从收益表可以看出,甲乙双方的收益之和不为零,而且收益和是变化的。因此,囚徒博弈是一种变和博弈。直觉上看,甲和乙都应采取合作策略(互不供出对方的犯罪事实),各得3000元收益。但从收益表可以得出这样的结论:如果一个局中人认为另一个局中人将合作,从而他将得到3000元收益,那么他若采取背叛策略,就将总共能获得4000元的收益;如果他认为另一个局中人为了得到1000元鼓励而将背叛,那么他也就只好为了自己也取得1000元鼓励而采取背叛策略(否则,他将一无所获)。总之,在收益最大化动机的驱使下,局中人的最优选择是背叛。这样一来,甲乙双方都采取背叛策略,各得1000元收益;而不是都采取合作策略,各得3000元。这是一个典型的博弈悖论,问题的关键在于每个局中人都有背叛的鼓励,而不管其他局中人将做什么。例3.古诺博弈(双头垄断:产量较量)法国经济学家古诺(Cournot)于1838年以天然矿泉井为例,首次建立了简单的双头垄断博弈模型,其特点是,垄断厂商双方都天真地以为对方不会改变原有产量水平,双方都追求各自利润最大化。古诺假定:①有两个天然矿泉在一起,分别为厂商甲和乙占有;②两个矿泉都为自流井,生产成本为零,边际成本也为零;③甲和乙面对相同的需求曲线,采用相同的价格;④双方都以为对方的产量水平不会改变。在这些假设前提下,甲和乙各自独立决定自己的产量水平,表3:囚徒博弈局势表乙甲合作背叛合作(合作,合作)(合作,背叛)背叛(背叛,合作)(背叛,背叛)表4:甲和乙的收益表乙甲合作背叛合作3000,30000,4000背叛4000,01000,1000第八章博弈论230以求利润最大化。设)(QP是甲乙双方共同面临的反需求函数。当甲的矿泉水产量为1Q,乙的产量为2Q时,矿泉水的市场价格为)(21QQP,甲的利润11PQ,乙的利润为22PQ。在这个博弈中,甲乙双方的策略都表现为选择产量水平,局中人的收益即为厂商的利润。当甲的产量为1Q时,乙以为甲不会改变这一产量,而选择一个合适的产量水平2Q以使自己的利润2达到最大。同样,当乙的产量水平为2Q时,甲以为乙不会改变这一产量,而选择一个合适的产量水平1Q以使自己的利润1达到最大。为了说明这个博弈的结果,假设甲乙双方面临的反需求函数kQPQP0)(。用1Q表示这局博弈中甲选择的最优产量,2Q表示乙选择的最优产量水平,则甲乙各自的收益分别为12101))((QQQkP和22102))((QQQkP。由于实现了利润最大化,因此0,02211QQ解之得:当乙的产量水平为2Q时,甲决定的产量水平为2)(201QQQ(这是甲对乙的反应函数);当甲的产量水平为1Q时,乙决定的产量水平为2)(102QQQ(这是乙对甲的反应函数)。其中,kPQ00表示矿泉水市场容量(即价格为零时的矿泉水需求量)。进一步求解可得:3021QQQ,即博弈的结果是双方最终各占据矿泉市场的三分之一。反应函数说明,古诺博弈中每个局中人的决策(选定的产量水平)不但依赖于其他局中人的决策,而且与市场的容量有关。例4.贝特兰博弈(双头垄断:价格较量)古诺博弈模型描述了双头垄断厂商之间展开的产量较量。实际上厂商之间的产量较量并不如价格较量那么普遍,寡头之间应该有激烈的价格竞争。不论市场价格如何,只要某一厂商降低价格,而其他竞争对手保持原价格不变,那么降价厂商就能占有全部市场。这就是说,我们假定消费者只从最低价格厂商那里购买产品。为此,法国经济学家贝特兰(Bertrand)于1883年提出了以价格为选择策略的贝特兰博弈模型,反对古诺关于产量的博弈模型。还以矿泉水为例,在贝特兰博弈模型中各厂商都预期对手不会改变价格,从而将自己的价格确定在利润最大化的水平之上。这就是说,贝特兰博弈的构建同古诺博弈相似,所不同的是贝特兰博弈中局中人的策略是选择价格,而古诺博弈局中人的策略是选择产量水平。贝特兰博弈中两个局中人甲和乙也是面临相同的市场需求函数,不过现在价格是自变量,产量为因变量(古诺模型正好相反)。设市场需求函数为)(PDQ,为了分析上简单起见,进一步设bPQQ0(这里,kPQ00,kb1,即与古诺模型中的市场需求相同)。局中人的收益仍是他所获得的利润。如果甲和乙不相互勾结串通,当乙采取了价格水平2P时,甲认为乙不会改变这一价格水平,从而为了占领市场而要采取低于乙的价格水平2P的价格1P,于是甲的利润为)(111PDP,乙的利润为零;同样,当甲采取了价格水平1P时,乙认为甲不会改变这一价格水平,从而为了占领市场而要采取低于甲的价格水平1P的价格2P,于是乙的利润为)(222PDP,甲的利润为零。如果甲和乙相互勾结串通起来,采取相同的价格策略,即21PP,那么甲和乙就能索要一个垄断价格,并且每人可收取一半的垄断利润。由此可见,甲和乙的利润函数分别为:时当时当时当212121,0,2)(),(),(11112111PPPPPPPDPPDPPP,时当时当时当212121,0,2)(),(),(22222122PPPPPPPDPPDPPP第八章博弈论231如果甲和乙勾结串通,合作起来,那么双方就能按照最大利润价格)2(0bQP获得垄断价格,并且各得最大利润的一半。这里,利润最大化价格是按照02)(00bPQbPQPPP确定的。但是,占领市场的诱惑对每个局中人都存在,只要他稍微降价,他就能获得全部市场。假如甲先进入该矿泉市场,那么甲就按照利润最大化价格$P_1=Q_o/(2b)$获取最大利润。继而乙进入这个市场,且乙认为甲不会改变他的价格$P_1$,于是乙为了夺取市场而采取低于甲的价格水平1P的一个价格2P()12PP。由于乙夺走了市场,甲同样又会采取低于乙的价格水平2P的价格3P,以夺回市场。这样不断往复下去,直至最后甲乙双方都把价格水平定为零时才可达到均衡,此时双方的收益为零,市场各占一半(即甲的销售量1Q和乙的销售量2Q相等,且2021QQQ)。这就是甲乙双方不合作的结果,双方都变得更差。以上分析表明:把贝特兰博弈与古诺博弈作比较,对同一市场来说,由于选择了不同的策略集合(一个以产量作为策略,另一个以定价作为策略),得出了不同的博弈结果,贝特兰博弈的均衡价格、均衡产量和均衡利润都呈完全竞争状态(超额利润为零),而古诺博弈的结果不是这样;再把贝特兰博弈同囚徒难题博弈作比较,二者具有相似的结构,即局中人合作会取得最好的结果,但利益的诱惑促使他们采取不合作的行动,致使双方博弈的结局都变得更差。贝特兰博弈也可用囚徒博以来解释:合作是指两个厂商的勾结,背叛是指两个厂商独立行动,没有勾结。合作,可以索要一个高的垄断价格;背叛,则导致市场价格为零,双方利润为零。可见,双方合作起来,对两个厂商都有利,似乎应该合作。但博弈的最终结果是双方都采取背叛策略,导致谁也得不到利润。本节所举的这些事例说明,寡头垄断厂商之间展开的竞争与较量完全可以用博弈加以描述和研究。实际上,经济学中大部分经济现象都可以作为博弈的特殊情形进行研究,比如历史上解决竞争均衡的存在性这一经济学基本问题时