北京邮电大学本科选修课程《信息经济学》高丛1HUA1SHIJIE100@VIP.SINA.COM混合策略纳什均衡第三章混合策略纳什均衡(下)3—5多重纳什均衡及其甄别许多博弈往往有不止一个纳什均衡,有时候甚至有无穷多个纳什均衡。当这种情况出现时,哪个纳什均衡最有可能成为最终的博弈结果?这往往取决于某种能使局中人产生一致性预测的机制或判断标准。2013年11月4日2新浪微博:一花一世界economics本节初步介绍一些甄别多重纳什均衡的机制或判别标准(一)帕累托优势标准(二)风险优势标准(三)帕累托标准与风险优势的关系(四)聚点均衡(五)相关均衡(六)抗共谋均衡(七)颤抖手精炼均衡2013年11月4日3新浪微博:一花一世界economics(一)帕累托优势标准虽然有些博弈存在多个纳什均衡,但这些纳什均衡之间很可能存在明显的优劣差异,造成所有局中人都偏好同一个纳什均衡的可能。一种情况是,博弈的某一个纳什均衡给所有局中人带来的得益,都大于其他纳什均衡给他们带来的得益。在这种情况下,局中人不会面临任何进一步选择的困难,因为所有局中人对于纳什均衡的理性选择倾向,都表现出一致。2013年11月4日4新浪微博:一花一世界economics哈萨尼(JohnC.Harsanyi)泽尔滕(ReinhardSelten)按照长期合作研究的两位博弈论大师美国的哈萨尼教授和德国的泽尔滕教授的说法,这种按照支付大小筛选出来的纳什均衡,比其他纳什均衡具有帕累托优势。这种按照支付大小筛选纳什均衡的标准,称为帕累托优势标准。2013年11月4日5新浪微博:一花一世界economics帕累托优势均衡的例子很多:猎人博弈1010400444乙甲猎鹿打兔猎鹿打兔2013年11月4日6新浪微博:一花一世界economics帕累托(VilfredoPareto,1848-1923)法国巴黎出生的意大利经济学家。自从现代经济学主要关注社会资源的配置以来,经济学家求同存异,逐渐撇开一般效率评价的许多分歧,倾向于接受以帕累托命名的所谓帕累托效率标准。经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。要想再改善任何人的境况都必须损害别的人的利益了,这时候就说一个经济已经实现了帕累托效率。2013年11月4日7新浪微博:一花一世界economics(二)风险优势标准如果按照支付标准或者说帕累托优势标准,难以确定局中人将采用两个或多个纳什均衡中的哪一个纳什均衡规定的策略的时候,可以考虑不同纳什均衡之间的风险状况,风险小的优先。2013年11月4日8新浪微博:一花一世界economics风险优势标准99800877乙甲左右上下2013年11月4日9新浪微博:一花一世界economics风险优势标准:具体方法期望赢利比较法偏离损失比较法2013年11月4日10新浪微博:一花一世界economics偏离损失比较法6(A)650054(B)4乙左右甲上下2013年11月4日11新浪微博:一花一世界economics风险偏离损失乘积比较法0M/20(B)M0(A)M-m0M-m乙LR甲UD2013年11月4日12新浪微博:一花一世界economics(三)帕累托标准与风险优势的关系如果在一个博弈中,按照帕累托效率的标准筛选出的纳什均衡,与按照风险优势标准筛选出来的纳什均衡不一致时,我们应当选择哪一个呢?2013年11月4日13新浪微博:一花一世界economics帕累托标准与风险优势的关系6(A)65-1000-100054(B)4乙左右甲上下2013年11月4日14新浪微博:一花一世界economics范丹墨(E.vanDamme)维布尔(J.W.Weibull)《斯堪的纳维亚经济学杂志》(ScandinavianJournalofEconomics)1995年第一期,荷兰范丹墨教授和瑞典维布尔教授合写的文章。“在帕累托标准和风险标准之间,理论给帕累托优势以优先权,而风险优势只有在局中人面临不知道选哪个均衡好的不确定性的时候,才变得重要。当一个均衡具有帕累托优势的时候,局中人一定选择这个均衡,不确定性就不存在了。”2013年11月4日15新浪微博:一花一世界economics另外的思考:经济学形成有限理性的理念(boundedrationality)进入行为经济学的天地(behavioraleconomics)2013年11月4日16新浪微博:一花一世界economics(四)聚点均衡萨林(Schelling,1960)在现实生活中,局中人可能会使用某些被博弈模型抽象掉的信息来达到一个均衡。事实上,对于一些既不存在帕累托优劣关系,也不存在风险优劣关系的博弈,人们往往都是利用聚点均衡的思想来指导自己的决策行动。2013年11月4日17新浪微博:一花一世界economics张维迎教授《博弈论与信息经济学》情侣博弈的聚点均衡:生日“提名博弈”2013年11月4日18新浪微博:一花一世界economics习俗和默契靠右行驶中国、美国、俄国靠左行驶英国、澳大利亚、日本聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性,往往受博弈双方文化背景中的习惯或规范的影响,很难总结出能够形成条条杠杠具有普遍性的规律,只能具体问题具体分析地讨论。2013年11月4日19新浪微博:一花一世界economics(五)相关均衡(correlatedequilibrium)奥蒙,1974局中人通过一个大家都能观测到的共同信号来选择行动,由此确定博弈的最终结局。相关均衡往往可能是局中人事前磋商的结果。相关均衡是局中人主动设计某种形式的选择机制形成制度安排从而确定对局结果的一种均衡选择。2013年11月4日20新浪微博:一花一世界economics相关均衡15004451乙甲左右上下2013年11月4日21新浪微博:一花一世界economics这个博弈存在三个纳什均衡:(上,左)、(下,右)和一个混合策略:每个局中人以相同的概率选择两种纯策略,各得2.5的期望支付。假定局中人双方事前同意根据到达集合地点的先后顺序采取行动(“甲先到,走甲上乙左均衡;乙先到,走甲下乙右均衡”)。2013年11月4日22新浪微博:一花一世界economics奥蒙还证明,如果能在局中人当中设计出一种机制,使得每个局中人收到不同的但相关的信号,则每个局中人还可以获得更高的期望支付。例如:以相同的可能性(各1/3)发出A、B、C三种信号;局中人甲只能观察到信号是否是A,局中人乙只能观察到信号是否是C。2013年11月4日23新浪微博:一花一世界economics可以验证:甲收到信号A采用策略“上”,否则采用策略“下”;乙收到信号C则采用策略“右”,否则采用策略“左”,是一个纳什均衡。但是,相关均衡在现实生活中的可操作性如何?是谁?“以相同的可能性发出A、B、C三种信号。”2013年11月4日24新浪微博:一花一世界economics(六)抗共谋均衡(coalition-proofequilibrium)经济学家本海姆(B.DouglasBernheim)、别列葛(BezalelPeleg)、温斯顿(MichaelD.Whinston)在1987年的两篇论文中提出了抗共谋纳什均衡的概念。2013年11月4日25新浪微博:一花一世界economics抗共谋均衡:矩阵A0,0,10-5,-5,0-5,-5,01,1,-5乙甲LRUD2013年11月4日26新浪微博:一花一世界economics抗共谋均衡:矩阵B-2,-2,0-5,-5,0-5,-5,0-1,-1,5乙甲LRUD2013年11月4日27新浪微博:一花一世界economics集体偏离有两种:一种是能够利益维持的,就是若干局中人合伙偏离以后,在其他局中人的策略选择仍然不变的条件下,他们不会散伙。另外一种是不能利益维持的集体偏离,就是若干局中人合伙偏离以后,哪怕其他局中人的策略选择继续保持不变,原来合伙偏离的局中人之中,有人因为利益驱使,还要再改变策略选择。2013年11月4日28新浪微博:一花一世界economics通俗地说抗共谋纳什均衡的概念,不仅要求“单独偏离”没有好处,而且要求“不散伙的合伙偏离”也没有好处。事实上,在排除了共谋的影响后,多人博弈与二人博弈之间的区别,就不那么明显了,从而我们在前面介绍的筛选多重纳什均衡的分析方法,就都可以使用了。2013年11月4日29新浪微博:一花一世界economics抗共谋均衡仍然是关于非合作博弈的均衡概念抗共谋均衡讨论中局中人之间的共谋行为,都是没有强制力的,完全是建立在各局中人自觉自愿的利益基础上,它与后面合作博弈中谈到的各局中人之间允许用协议的方式强制执行的合作行为并不是一码事。2013年11月4日30新浪微博:一花一世界economics从学术发展的历史脉络讲,强均衡与抗共谋均衡是不同的概念。抗共谋均衡的概念是奥蒙提出的“强均衡”(strongequilibrium)概念条件的放宽。(Aumann,1959)强均衡要求,在其他局中人的策略选择给定的条件下,不存在局中人集合的任意一个子集所构成的联盟,能够通过联合偏离当前的策略选择而增加联盟中所有成员的支付。强均衡一定是抗共谋均衡,但是抗共谋均衡未必是强均衡。例如上例博弈中,不存在强均衡策略组合。2013年11月4日31新浪微博:一花一世界economics富登博格和梯若尔《博弈论》(DrewFudenbergandJeanTirole,GameTheory,TheMITPress,1991)抗联盟均衡的定义依联盟的规模归纳地给出。首先,它要求没有单局中人联盟会偏离,也就是说,所论的策略组合是一个纳什均衡。接着,它要求没有双局中人的联盟会偏离,条件是在这样的偏离发生以后,合伙偏离的局中人之中的任何一个(而不是任何其他人),都可以再次自由偏离。这就是说,在其他局中人的策略选择不变而导出的二人博弈中,所论的二人合伙偏离必须是这个二人博弈的纳什均衡。这样归纳地做下去,直至所有局中人的联盟。2013年11月4日32新浪微博:一花一世界economics抗共谋均衡已经成为判别一个纳什均衡是否稳健(robust)的重要标准。直到1994年格罗斯曼(Grossman,G..M.)和赫朴曼(HelpmanE.)在AmericanEconomicReview上发表了一篇关于贸易保护的文章,以“抗共谋均衡”的概念作为他们的理论依据,直接把本海姆等人的理论结果搬到贸易行为的分析中,才引起经济学界对这个概念的重视。自此之后,抗共谋均衡的概念在经济学的各个领域得到广泛的使用。Dixit、Grossman和Helpman还对抗共谋均衡的理论结果作了进一步的发展。2013年11月4日33新浪微博:一花一世界economics(七)颤抖手精炼均衡人们的“理性行为”,是几十年来现代经济学讨论的基本假设。但是现实生活中人们的行为模式,很难符合理性行为的假设或者说理性人的假设。泽尔滕在1975年的一篇论文把这一思想引入到博弈论的研究中,提出了颤抖手精炼均衡(trembling-handperfectequilibrium)或者简称颤抖手均衡的概念,进一步精炼纳什均衡。2013年11月4日34新浪微博:一花一世界economics泽尔滕的基本思想是:在任何一个博弈中,每一个局中人都有一定的犯错误的可能性。泽尔滕将局中人发生错误选择(即偏离均衡策略)的情况形象地说成是“颤抖手”,当某个局中人突然发现一个理性条件下不该发生的事件发生时,他把这个不该发生的事件归结为某一个别的局中人的非蓄意的失误。2013年11月4日35新浪微博:一花一世界economics原博弈的均衡,可以理解为被“颤抖”扰动后的博弈的均衡的极限。由于局中人的“手”(策略选择)可能“颤抖”(偏离纳什均衡的要求),致使他们的策略集