微观经济学第十章博弈论南开大学西方经济学课程组管理資料下載2博弈论用来分析所观察到的决策主体相互影响时的现象,在给定的条件下寻求最优的解决办法。本章主要介绍非合作博弈,非合作博弈可分成四种情况:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。本章分析的重点在完全信息静态博弈和完全信息动态博弈,分别给出纳什均衡和子博弈精炼纳什均衡的详细讲解。微观经济学第十章博弈论南开大学西方经济学课程组第一节博弈论概述博弈论:用来分析所观察到的决策主体相互影响时的现象,在给定的条件下寻求最优的解决办法。一、博弈论的发展20世纪40年代博弈论思想体系初步建立,经过50年代的理论发展,博弈论在60年代逐步走向成熟。20世纪70年代中后期以后,随着博弈论在经济分析领域内的广泛和成功应用,博弈论也逐步进入主流经济学的体系。微观经济学第十章博弈论南开大学西方经济学课程组⒈博弈论的发展1944年,由冯•诺依曼和摩根斯坦恩合著的《博弈论和经济行为》一书的出版标志着现代博弈论作为一种系统理论的创立。20世纪50年代,纳什创立了公理化的讨价还价理论,证明纳什讨价还价解的存在性,逐渐形成了以纳什非合作博弈理论为核心的现代博弈论体系。20世纪60年代以后,泽尔滕在纳什的研究基础上引入动态分析,海萨尼则把不完全信息引入到博弈论中。20世纪70年代以后,经济学家开始强调个人理性。微观经济学第十章博弈论南开大学西方经济学课程组⒉博弈论与主流经济学博弈论进入主流经济学,反映了经济学发展的以下几个趋势:①经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定;②经济学越来越转向人与人之间竞争与合作的研究,特别是经济学注意到理性人的个人理性行为可能导致的集体非理性;③经济学越来越重视对信息的研究。博弈可以划分为合作博弈和非合作博弈。合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议。如果能,就是合作博弈;反之,则是非合作博弈。微观经济学第十章博弈论南开大学西方经济学课程组二、博弈分析举例⒈沙滩上的饮料销售商为了争取更多的游客,两家销售商的销售位置又会开始向中点移动,最终都将销售位置定在了中点处。图10-1博弈分析举例:沙滩上的饮料销售商Ⅰ两家销售商的初始位置AB1/43/41/21/2Ⅱ销售商A的位置移动AB3/83/49/167/161/29/16Ⅲ销售商B的位置移动AB3/85/81/21/21/2Ⅳ两家销售商的最终位置A、B1×1/21/2微观经济学第十章博弈论南开大学西方经济学课程组⒉掷币游戏A、B两个小孩玩掷币游戏,两人各拿出一枚硬币抛掷在地面上,要么正面朝上,要么反面朝上。①都同为正面或反面朝上,A赢得B一枚硬币;②一正面一反面朝上,A输给B一枚硬币。这个例子中,两个小孩各自得到的结果(赢得一枚硬币或者输掉一枚硬币),不仅取决于自己掷币的后果,也取决于对手掷币的后果,双方决策的互相影响构成博弈。在这个博弈中,一方所得正是其他方所失,这种博弈称为零和博弈。微观经济学第十章博弈论南开大学西方经济学课程组⒊囚徒困境囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。表10-1给出了囚徒困境模型的表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。表10-1囚徒困境-3,-3-10,0抵赖0,-10-8,-8坦白囚徒A抵赖坦白囚徒B微观经济学第十章博弈论南开大学西方经济学课程组三、博弈的要素博弈的要素包括参与人、行动、信息、策略、支付、结果和均衡,其中,参与人、策略和支付是描述一个博弈所需要的最基本的要素,参与人、行动和结果统称为博弈规则。①参与人:指一个博弈中的决策主体在囚徒困境模型中,有两个参与人,即“囚徒A”和“囚徒B”。②行动:是参与人在博弈的某个时点的决策变量。在囚徒困境模型中,囚徒A、B都只有两种行动可供选择,即“坦白”和“抵赖”。微观经济学第十章博弈论南开大学西方经济学课程组③信息是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。在囚徒困境模型中,两囚徒的信息是都知道自己和另一囚徒在选择坦白和抵赖的不同组合时面对的处罚。④策略:是参与人在拥有既定信息情况下的行动规则,它规定参与人在什么时候选择什么行动。一个参与人的所有可选择的策略的集合就是这个参与人的策略空间。如果每个参与人选择一个策略,就构成一个策略组合。⑤支付:在博弈论中指一个特定策略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用微观经济学第十章博弈论南开大学西方经济学课程组水平。支付是博弈参与人真正关心的东西。在一个策略组合下,所有参与者的支付就构成了一个支付组合。在囚徒困境模型中,如果两囚徒的策略组合为(抵赖,坦白),那么囚徒A的支付为-10,囚徒B的支付为0,两囚徒的支付组合为(-10,0);如果两囚徒的策略组合为(坦白,坦白),那么囚徒A和囚徒B的支付均为-8,两囚徒的支付组合为(-8,-8)。⑥结果:是博弈分析者感兴趣的所有东西,如均衡策略组合、均衡支付组合等。⑦均衡:是所有参与人的最优策略的组合。微观经济学第十章博弈论南开大学西方经济学课程组四、博弈的分类表10-2博弈的分类及对应的均衡概念不完全信息动态博弈精炼贝叶斯纳什均衡不完全信息静态博弈贝叶斯纳什均衡不完全信息完全信息动态博弈子博弈精炼纳什均衡完全信息静态博弈纳什均衡完全信息动态静态行动顺序信息微观经济学第十章博弈论南开大学西方经济学课程组第二节完全信息静态博弈每一个参与人对所有其他参与人(对手)的特征、策略空间及支付函数有准确的知识,而且博弈的参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动,这种情况下参与人的决策就是完全信息静态博弈。纳什对非合作博弈的主要贡献是在一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在,这一均衡就被称为“纳什均衡”。微观经济学第十章博弈论南开大学西方经济学课程组博弈可以采用两种不同的方式来表述,一种是策略式表述,一种是扩展式表述。从理论上讲,这两种表述形式几乎是完全等价的,但策略式表述更适合于分析静态博弈,扩展式表述更适合于分析动态博弈。一、博弈的策略式表述⒈策略式表述n个参与人;说明每个参与人都有哪些策略;每个参与人都选定一种策略时,每个参与人的支付水平(获得的效用)是多少。根据上面给出的三要素,策略式表述的博弈就是:微观经济学第十章博弈论南开大学西方经济学课程组n1n1uuSS,,;,,G在双头垄断的产量博弈中,两个寡头厂商A、B是参与人,两者的产量qA、qB的范围是其策略空间,获得利润πA、πB是其支付,策略式表述的博弈可写为:BABBAABAqqqq0q0q,,,;,G微观经济学第十章博弈论南开大学西方经济学课程组,-1-1,1反面-1,11,-1正面小孩A反面正面小孩B⒉策略式表述的博弈举例在掷币游戏中,每个参与人的支付直接用其赢得或输掉的硬币数量来表示:赢得一枚硬币的支付为1,输掉一枚硬币的支付为-1。掷币游戏的支付矩阵见表10-3所示。微观经济学第十章博弈论南开大学西方经济学课程组,-10,2撤退2,0-3,-3进攻公鸡A撤退进攻公鸡B再如下面的斗鸡博弈。试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是进攻,一是撤退。如果一只公鸡撤退,一只公鸡进攻,则进攻的公鸡获得胜利,撤退的公鸡很丢面子;如果两只公鸡都撤退则打个平手;如果两只公鸡都进攻,那么两败俱伤。设其支付矩阵见表10-4所示。微观经济学第十章博弈论南开大学西方经济学课程组二、纳什均衡⒈占优策略均衡不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为占优策略。在“囚徒困境”的例子中,每个囚徒都有两种可选择的策略:坦白或抵赖。但是,不论另一囚徒选择什么策略,每个囚徒的最优策略是“坦白”。所有参与人占优策略的组合称为占优策略均衡。微观经济学第十章博弈论南开大学西方经济学课程组⒉重复剔除的占优均衡考虑“智猪博弈”例子。猪圈里围着两头猪,一头大猪,一头小猪。猪圈的一头有一个猪槽,另一头安装了一个按钮,控制着猪食的供应。按下一按钮会有8个单位的猪食进槽,但按下按钮的猪需要付出2个单位的成本。若大猪先到,大猪吃到7个单位,小猪只能吃1个单位;若同时到,大猪吃5个单位,小猪吃3个单位;若小猪先到,大猪和小猪各吃4个单位。表10-5的Ⅰ表列出对应不同策略组合的支付水平,如第一格表示两头猪同时按下按钮,就会同时走到猪食槽,大猪吃5个单位,小猪吃3个,扣除2个单位的成本,支付水平分别为3和1。微观经济学第十章博弈论南开大学西方经济学课程组,07,-1等待2,43,1按大猪A等待按小猪BⅠ智猪博弈的支付矩阵0,0等待2,4按大猪A等待小猪BⅡ剔出小猪劣策略的支付矩阵2,4按大猪A等待小猪BⅢ再剔出大猪劣策略的支付矩阵微观经济学第十章博弈论南开大学西方经济学课程组⒊纳什均衡如果重复剔除劣策略后剩下的策略组合是唯一的,那么该博弈才是重复剔除占优可解的。但很多博弈是无法使用重复剔除劣策略的方法找到均衡解的。例如性别之战的例子。一男一女谈恋爱,周末安排业余活动,要么看足球比赛,要么看舞蹈演出。男的爱好足球,女的更喜欢舞蹈,但他们宁愿在一起而不愿分开。支付矩阵见表10-6所示。表10-6性别之战2,30,0舞蹈1,13,2足球男舞蹈足球女微观经济学第十章博弈论南开大学西方经济学课程组一个参与人的纳什均衡策略是面对其他参与人的均衡策略时的最优选择。在囚徒困境中,(坦白,坦白)是一个纳什均衡,而(抵赖,抵赖)不是一个纳什均衡,因为给定同伙选择抵赖,自己选择抵赖时得到-3,选择坦白时得到0,因而抵赖不是自己的最优策略;同样,(坦白,抵赖)和(抵赖,坦白)也不是纳什均衡。在性别之战中,(足球,足球)是一个纳什均衡,因为一旦形成这个策略组合的结果,任何一方的偏离都会造成自己支付的减少,例如女的此时去看舞蹈将把自己的支付从2降到1;同样,(舞蹈,舞蹈)也是一个纳什均衡,其他策略组合都不是纳什均衡。微观经济学第十章博弈论南开大学西方经济学课程组⒋寻求纳什均衡首先考虑A的策略,对于B的每一个给定策略,找出A的最优策略,在其对应的支付下划一横线,再用类似的方法找出B的最优策略。完成这个过程后,如果某个支付组合的两个数字下都有线,这个支付组合所对应的策略组合就是一个纳什均衡。表10-7寻