1研究领域:微观经济学/行为经济学有限理性下的均衡分析范式:随机最优反应均衡那艺1贺京同2南开大学经济研究所天津3000712005年7月23日本文受到教育部人文社会科学规划项目(项目批准号02JA790034)、南开大学文科创新基金研究项目(NKC04012)的基金支持。1那艺,男,1979年生,南开大学经济研究所研究生。2贺京同,男,1961年生,南开大学经济研究所教授、博士生导师。2有限理性下的均衡分析范式:随机最优反应均衡内容提要:博弈论所研究的一个重要问题是博弈中的均衡问题。纳什均衡作为传统博弈论的核心概念,所基于的理性假定过于严格,因此是一个十分脆弱的均衡,在实际中极易遭到违背。随机最优反应均衡是行为博弈论的核心概念之一,是通过修正参与者的行为方式而发展起来的基于有限理性的均衡范式,是对经济学均衡分析思想的发展。本文系统描述了随机最优反应均衡的分析框架,以及它更为精确的预测功能。为了展示该均衡比传统均衡更优越的分析能力,本文根据该均衡的基本思想重新研究了寡头竞争市场,并对现实中为何存在追求产量而不追求利润最大化的厂商、以及行业中为何可能产生垄断做出了新的解释。本文最后指出,未来的经济学分析将越来越多地置于“有限理性均衡”框架之下。关键词:随机最优反应均衡;行为博弈论;有限理性;学习一、引言经济学所涉及的一个重要问题是对均衡的分析,即通过证明和寻找均衡来对经济现象进行解释和预测,这种思想最早可追溯到亚当·斯密(1776)。在18世纪的欧洲,由牛顿所奠定的经典力学体系日趋完善,该体系中对物理状态的均衡分析给斯密留下了深刻印象,这促使他试图在经济学中也发展出一套均衡分析方法。在经典力学体系中,导致均衡产生的一个基本因素是“重力”的存在。相似地,斯密认为,经济学的均衡分析也应建立在一个基本因素之上,他称之为人类的“自利”。斯密相信,正是由于这种“自利”,使得经济秩序服从一种内在的逻辑,从而使人们在一只“看不见的手”的指引下去达到某种确定的目标状态,这就是所谓的均衡。其后,约翰·穆勒通过对斯密的思想进行形式化处理,正式地提出了理性经济人的假说。而在边际革命之后,这种假说被更为抽象化与极端化,即假定经济人能根据自身处境和自身利益而做出近乎正确的判断,并经过精密计算和仔细权衡,来使自己所追求的利益尽可能最大化。在这个假说基础上,演绎出了整个西方主流经济学的均衡分析体系,而该假说也逐渐成为经济学的基本假定和理论基石。上世纪40年代发展起来的博弈论为经济学分析提供了一套更为严谨的逻辑方法。该理论不但继承了对行为人的理性假定,即认为每个决策个体都能经过精密计算和仔细权衡来最大化其效用;而且还继承了经济学的均衡分析传统,即认为找到了均衡也就意味着预测出了参与者在博弈中的策略选择。因此博弈论中绝大多数的理论都是研究博弈中的均衡问题,并且在理性的假定前提下,运用严密的逻辑方法演绎出了著名的纳什均衡。纳什均衡的出现使得博弈论中对均衡的讨论比传统经济学更进了一步。在传统经济学中,行为人的决策就是在给定价格和收入的条件下最大化其效用,他的效用函数只依赖自己的选择,而不依赖其他人的选择。而博弈论所研究的则是决策个体之间的互动行为,即个人的选择要受到其他人选择的影响,个人的最优选择是其他人选择的函数。因此说,纳什均衡比传统经济学的均衡概念包含了更多信息。纳什均衡的意义在于说明,在有限博弈中,存在一种可以自我强化的均衡点,在该点上每个参与者的策略选择都是对其他参与者策略选择的最优反应,或者说是对其他所有参与者策略选择组合的最优反应,并且任何参与者都没有偏离该点的动机(Nash,1950)。然而所产生的一个问题就是,参与者是否真地会在博弈中选择纳什均衡?对这个问题的传统回答是肯定的,因为纳什均衡被认为是在博弈的规则、参与者的理性及其支付函数都是共同知识的前提下,由参与者的分析和自省而得出的结果。然而随着实验经济学的研究手段日趋成熟,人们在实施了大量的实验后却发现,参与者在博弈中的实际选择总是偏离纳什均衡,并且这种偏离是系统性3的(Crawford,1997)。我们可以先看一下图1。该图显示了在若干次实验中,由纳什均衡所推断的各策略选择概率(横轴)与每次实验中实际选择各策略的相对频率(纵轴)之间的对应关系。我们发现,在实际选择与纳什均衡之间有显著的偏离,并且还存在这样一个轻微的趋势,即纳什均衡中本应以较低概率被选择的策略却被选择得更多(或是说,那些永不应该被选择的策略实际上有5%的机会被选择),而本应以较高概率被选择的策略却没有得到足够的选择。针对这个现象,许多学者开始对纳什均衡提出质疑并认为,传统博弈论采用了一种建立在完全理性和贝叶斯决策原则之上的模式,这种模式过于僵化和脱离实际,因此所演绎出的纳什均衡在实际中也极易遭到违背,从而成为一种脆弱的均衡。为了修正传统博弈论在解释与预测方面的局限性,在西方经济学界逐渐形成了一个新的研究领域——行为博弈论(BehavioralGameTheory)。行为博弈论可以视为行为经济学的重要理论组成部分,它将行为和实验经济学与传统博弈论相融合,并通过大量的博弈实验,来考察理论推断与实际结果之间的差异;它通过加入行为因素来改进传统博弈论的基本假定,以使理论和实际的不一致得到修正,其最终目的是更准确地解读人类的决策行为(Camerer,2003)。在对理性假定的探讨上,行为博弈论吸收了西蒙的有限理性学说(Simon,1955),认为行为人在进行决策时,获取信息和处理信息的认知能力是有限的,因此他无法像传统理性假定的那样最大化其目标函数,而是不得不在现实中采取其他一些规则来选择自己满意的或是自...........己认为的最优策略........,但他追求理性的努力并不会停止。3对于如何理解实际选择与纳什均衡之间的偏离,行为博弈论认为,纳什均衡的推导立足于严格的理性假定,这对于一般的参与者来说是一个过高的要求。更现实的情形是,参与者在内心深处具有追求理性的动机,但有限理性的约束使他们难以做到传统假定下的最优化选择,因此对纳什均衡的追求“心有余而力不足”,故他们只是处于向纳什均衡收敛的过程之中,他们的选择很难达到、或者说至少在短期内很难达到纳什均衡(FudenbergandLevine,1998)。既然参与者只是处于向纳什均衡收敛的过程之中,那么一个自然的问题就是,参与者究竟是如何收敛的?研究这个问题有助于人们更深刻地理解纳什均衡产生的过程。在传统博弈论中,纳什均衡产生的过程就是参与者经过严密的逻辑运算而得到一个最优化的结果。而在行为博弈论中,参与者由于受到有限理性的约束,因此在现实中很难按传统方法求得纳什均衡,但是他们追求理性的努力并不会停止,而是会用其他一些未知的、甚至是非逻辑的方法来不断提高自己的理性程度,从而逐渐摸索出纳什均衡。这个追求理性的过程实际上是一种认知或学习过程,纳什均衡是慢慢“学”出来的,因此具有长期性。为了研究参与者的具体学习过程,在行为博弈论中又派生出了系列的博弈学习理论。这些理论并没有否定纳什均衡的意义,但却为均衡产生的方式提出了新的思索,并具有比传统理论更为优良的解释与预测能力。然而遗憾的是,绝大多数的博弈学习理论都是把纳什均3西蒙对有限理性理论的定义是“研究如何以有限的认知能力在无限复杂的世界中生存的理论”,但是西蒙本人并未指出人们究竟是如何在“有限”与“无限”之间折衷的。行为博弈论的研究在一定程度上填补了这个空白,并使西蒙的有限理性思想更富有现实意义。纳什均衡推测图1由纳什均衡所推断的各策略选择概率与实际选择的频率。资料来源:BehavioralGameTheory,Camerer(2003)。4衡作为基准均衡并与新理论相比较,但并未提出比纳什均衡更强的均衡概念,也就是说,如何使经济学的均衡分析从完全理性向更符合实际的有限理性转变是一个问题。本文所要介绍的随机最优反应均衡(QuantalResponseEquilibrium,以下采用其英文简写形式QRE)填补了这方面的空白。QRE是在博弈学习理论体系下发展起来的一个新的均衡概念,由Mckelvey和Palfrey(1995)首先在博弈实验分析中使用。由于行为博弈论在国内的研究尚未深入开展,因此QRE作为其核心概念,在国内也未有深入的介绍和探讨,只是在若干有关实验经济学的著述上略有提及。4QRE是在纳什均衡的基础上,对均衡概念所做的进一步发展。该理论的基本思想同样可以纳入有限理性的范畴,认为参与者在“信念中”是追求理性的,但是在计算每个策略的预期效用时会不可避免地出错,这是由人天生的有限认知能力所决定的,因而在实际情形中,纳什意义下的最优选择并不以概率1出现。然而,参与者尽管是有限理性的,但他们仍能将自身的选择落在一个类似纳什均衡的均衡之上。这个均衡点与纳什均衡处于不同的位置,但是却具有与纳什均衡相似的基本特征,即每个参与者的策略选择都是对其他参与者策略选择的“最优反应”。但需要指出的是,这只是他自己认为的“最优反应”,5他会不断考虑和修正自己的看法,因此当引入时间变量,比如在进行重复博弈时,这个均衡点在每阶段将发生变动,并不断向纳什均衡收敛,而促发这种变动的力量就是参与者内生的学习能力:只有通过学习才能使参与者不断提高他们的认知能力,进而调整他们业已达到的均衡点。6故该理论所提出的一个重要观点就是,参与者的实际选择与纳什均衡之间的偏离关系,不是非均衡选择与均衡选择的关系,而是其他均衡与纳什均衡的关系,同时这种偏离关系不是一成不变的,在长期下有减少偏离的趋势。故我们认为,QRE是一个具有内生变动性的均衡。该理论进一步推断,参与者通过学习,可以使QRE不断逼近纳什均衡,纳什均衡是QRE的极限状态。从这个意义上说,QRE是参与者所选择的一种“不精确”的“纳什均衡”,而纳什均衡则成为参与者“信念中的均衡”。QRE理论的意义在于,它是学者们在对人类决策时所受到的内生影响因素进行重新思考后,通过修正参与者的行为方式而发展出的一个并非基于完全理性的均衡范式。QRE理论使得经济学的均衡分析法又向前推进了一步。它并不是像传统经济学那样把完全理性假定作为推导均衡的立论基础,而是更注重对有限理性思想的继承,并在此基础上演绎均衡。7这个均衡比纳什均衡具有更丰富的内涵:它能够反映出人们随时间推移在长期下摸索最优化结果的过程,因此它具有某种内生的变动性,是一个富含动态信息的均衡。由于其优良的解释和预测能力,QRE已逐渐成为行为博弈论的核心概念之一,同时它的基本模型简洁易用,因此越来越受到经济学家的青睐。本文的剩余部分分工如下:第二节是对QRE均衡分析框架的回顾;第三节通过一种参数化的形式来展示了QRE的具体求解过程,以及它在解释实际数据中的应用;第四节是对有限理性如何改进传统均衡分析法的展示,我们重新研究了寡头竞争市场,并提出一个新的均衡概念“古诺QRE”,对现实中为何存在只追求产量而不追求利润最大化的厂商、以及行业中为何可能产生垄断提出了新的解释;第五节是结论与启示。4Mckelvey和Palfrey(1995)在他们的文章中提到,这个新的均衡概念是由生物学、药理学等学科中广泛应用的一种统计学模型发展而来,因此国内有学者把它译成“可数性反应均衡”。5在后文中将看到,这里的“最优”不是纳什意义下的最优,而是在受到随机误差的干扰后所达到的一种“最优”,故我们将该均衡的中文名称译为“随机最优反应均衡”,以期与读者商榷。实际上,相对于纳什均衡来说,QRE只是一种“较优”的均衡。6只有当参与者的学习停滞时,QRE才可能不再变动,但参与者追求理性的努力使之不可能停止学习,因此从这个意义上说,QRE在长期下发生变动几乎是必然的。7近二十年来,行为经济学逐渐淡化了它早期浓厚的心理学色彩,并逐步通过有限理性建模而进入主流经济学的前沿。行为博弈论作为行为经济学的组成部分,也在试图通过有限理性思想修正传统的博弈理论(Camerer,2003),并在此基础上推动对传统均衡分析的发展。5二、QRE的均衡分析框架本节将回顾QRE理论的一般分析框架,以及它作为有限理性范畴下的均衡