数据、模型与决策第九讲博弈论主讲:邓旭东教授教学内容博弈论的产生和发展1博弈论的基本概念与博弈的分类2博弈论的经典模型3Nash均衡解的求解方法4合作博弈5学习目标了解博弈论的产生和发展情况掌握博弈及博弈论的概念、博弈论的分类了解和掌握博弈论的经典模型掌握纯策略和混合策略Nash均衡解的求解方法掌握联盟博弈及夏普利值的概念,会求解两人联盟和三人联盟情况下的夏普利值培养应用博弈论于经济与管理实践的意识博弈论、纳什均衡及核的概念博弈论(GameTheory)是一门关于决策者在对决策结果没有完全信息和互动条件下做出理性决策的理论。所谓“互动”是指这样一种情况,任何决策者决策的结果不仅取决于其自身采取的策略,还取决于其他人采取的策略。纳什均衡指两人或多人互动的结果:当其他人所选策略不变时,没有任何人可以通过单方面改变其策略而取得更好的结果。核指两个或多个联盟互动的结果:当其他联盟的策略不变时,没有任何联盟可以通过单方面改变其策略而取得对该联盟所有成员更好的结果。一、博弈论的产生和发展20世纪50年代,合作博弈发展到全盛期,非合作博弈论也开始创立;20世纪60年代后,非合作博弈得到进一步发展;几十年来,众多的博弈论学者花费了无穷的精力,研究博弈论里博弈的结构,发展纳什均衡点的定义,并探讨其实际应用的可能性。现代博弈理论诞生的标志:冯·诺依曼和摩根斯坦1944年出版的巨著《博弈论与经济行为》(TheTheoryofGamesandEconomicBehavior)1994年诺贝尔经济学奖:纳什、哈萨尼、泽尔腾1996年诺贝尔经济学奖:莫里斯、维克瑞2001年诺贝尔经济学奖:阿克尔洛夫、斯彭斯、斯蒂格利茨2005年诺贝尔经济学奖:奥曼、谢林博弈论的产生博弈论的产生和发展博弈论的发展1994年诺贝尔经济学奖1994年的诺贝尔经济学奖,授予了三位对博弈论做出奠基性贡献的学者,他们是美国普林斯顿大学数学系的纳什(JohnNash)教授、美国伯克利加州大学商学院的哈萨尼(JohnHarsanyi)教授和德国波恩大学经济学系的泽尔腾(ReinhardSelten)教授。纳什对博弈论的贡献有两个方面:①合作博弈理论中的讨价还价模型,称为纳什讨价还价解;②非合作博弈论方面,这也是他的主要贡献所在。纳什对非合作博弈论的主要贡献是他在1950年和1951年的两篇论文中在非常一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在,由此奠定了非合作博弈论的基础。1996年诺贝尔经济学奖1996年的诺贝尔经济学奖授予了英国剑桥大学的詹姆斯·莫里斯(JamesA.Mirrlees)教授和美国哥伦比亚大学的威廉姆·维克瑞(WilliamVickrey)教授,表彰他们对信息经济学的贡献。这两位经济学家分别在20世纪60年代和70年代揭示了不对称信息对交易所带来的影响,并提出了相应的对策。信息经济学是研究信息不对称条件下交易关系和契约安排的理论。从本质上讲,信息经济学是不对称博弈论在经济学上的应用。不对称信息指的是某些参与人拥有另一些参与人不拥有的信息。博弈论是方法论导向的,它研究的是给定信息结构后,寻找最可能的均衡结果;信息经济学是以问题导向的,它研究的是给定信息结构后,进行最优的契约安排。由于信息经济学研究什么是不对称信息情况下的最优交易契约,故又称为契约理论,或机制设计理论。正因为信息不对称,不同的制度安排对应不同的经济效率,现在经常讨论的国有企业委托人—代理人问题、激励机制问题、产权问题等,都是信息经济学的问题。2001年诺贝尔经济学奖2001年的诺贝尔经济学奖授予了三位美国经济学家,他们是伯克利加州大学经济系的乔治·阿克尔洛夫(GeorgeAkerlof)教授、斯坦福大学商学院的迈克尔·斯彭斯(MichaelSpence)教授和哥伦比亚大学经济系、商学院及国际关系学院的约瑟夫·斯蒂格利茨(JosephStiglitz)教授。早在20世纪70年代,他们就揭示了当代信息经济的核心,认为信息是有价值的。其应用价值对中国目前的改革也有着一定的指导意义。1970年,阿克尔洛夫对传统经济学理论提出了挑战,他从分析旧车市场入手,发现在旧车交易中,卖者显然比买者对车辆拥有更多的信息,而因为这种信息不对称,买车的人难以完全信任卖车人提供的信息,因而试图通过低价来弥补其信息上的损失。由于买者出价过低,卖者又不愿提供好的产品,从而导致次货的泛滥,其最终的结果是旧车市场的萎缩。阿克尔洛夫就此得出结论:市场放开并不能解决所有问题,信息是有价值的。斯彭斯则在1973年通过剖析人才市场盛行的造假行为,指出人才市场同样存在用人单位与应聘者之间信息不对称的问题,并由此造成了人才市场上“劣币”驱逐“良币”的现象。斯蒂格利茨则将信息不对称这一理论应用到保险和金融市场。2001年诺贝尔经济学奖这三个人从不同领域探讨了信息不对称问题,指出市场体制需要完善、设计,设计里有最优。这是对传统经济学的重大突破。Akerlof,G.(1970)”TheMarketforLemons:QualityUncertaintyandMarketMechanism”,QuarterlyJournalofEconomics,84:488-599.Spence,M.(1973),”JobMarketSignaling”,QuarterlyJournalofEconomics,87.Rothschild,M.andStiglitz,J.(1976),”EquilibriuminCompetitiveInsuranceMarket”,QuarterlyJournalofEconomics90:629-49.2005年诺贝尔经济学奖奥曼(RobertJ.Aumann)提出了无限次的重复博弈的理论,谢林(ThomasC.Schelling)提出了对抗状态下的“可置信威胁”等概念,深刻地分析了行为选择的条件对博弈均衡结果的影响。奥曼率先提出的“重复博弈”分析,目前成为所有社会科学的主流分支,并已应用于政治冲突、灌溉系统、国际条约乃至公司相互勾结等各种各样的问题。奥曼对冲突与合作策略思想的贡献在于,他运用了逻辑学和数学来理解,当人们每天都面对相同对手或竞争者时,他们所能作出的选择。当策略情形大量重复出现时,即便个体间有直接的利益冲突,达成合作的机率也会上升,因为每个个体在未来时间内,都会与另一方反复打交道。谢林于20世纪60年代出版《冲突的策略》,着力阐述了在双方处于僵持时,采取一些策略性手段的重要性。这些手段包括:事先承诺、边缘政策和有威慑力的威胁。例如,通过限定你自己的选择范围,你就可以使对手清楚地知道,你将对他们的行动作出何种反应——不管他们采取什么行动,这也就加大了他们作出让步的可能性。在地缘政治领域之外,谢林还发现,人通常都是愿意合作的,但当他们在一个团队中完全依理性行事时,则不那么容易合作。二、博弈论的基本概念与博弈的分类博弈论的基本概念包括参与人、行动、信息、策略、支付、结果和均衡。其中,参与人、策略和支付是描述一个博弈所需要的最少的要素,而行动和信息是其“积木”。参与人、行动和结果统称为“博弈规则”。博弈分析的目的是使用博弈规则预测均衡。参与人——是指在一个博弈中能够选择自己的行动方案从而使自身的利益最大化的决策主体,即有决策权的参加者。个人或组织团体,参与人是理性的。行动——是参与人在博弈的某个时点的决策变量。当参与人的行动存在先后次序时,后行动者就可以通过观察先行动者的行动选择来获取信息,再决定行动方案。信息——是参与人有关博弈的知识,特别是有关自然状况、其他参与人的特征、偏好和行动等方面的知识。“理性”是共同知识,各参与人的偏好也可能是共同知识。博弈论的基本概念策略——是参与人在给定信息集的情况下的行动规则,它规定了参与人在何时何种情况下选择何种行动,是完整的行动方案。各参与人在各自的策略集中选择一个特定的策略所构成的策略组合称为一个局势。支付——是指在博弈论中,对应一个确定的自然状况,参与人各选择一个特定的策略所形成的局势下参与人得到的效用。当自然状况不确定或参与人随机选择其策略时,参与人关心的是期望效用。结果——是一个博弈各种可能的最终后果,如各参与人的最优策略、最优策略下的效用等。均衡——是各参与人最优策略所形成的局势,在该局势下,没有参与人愿意选择其他的策略。博弈的分类通过事前交流协商达成有约束力的协议称为合作。根据参与人之间是否存在合作,博弈可划分为合作博弈和非合作博弈。合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议。如果有,就是合作博弈;反之,则是非合作博弈。合作博弈强调的是团体理性,强调的是效率、公正、公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。根据参与人行动的先后顺序,博弈可以划分为静态博弈和动态博弈。静态博弈指的是博弈中,参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动;动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。博弈的分类根据参与人对博弈的整体环境(即自然状况及其他参与人的特征、偏好和策略)是否有全面而准确的知识,博弈可划分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与人(对手)的特征、策略空间及支付函数有全面而准确的知识;否则,就是不完全信息。行动顺序信息静态动态完全信息完全信息静态博弈;纳什均衡;纳什(1950,1951)完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾(1965)不完全信息不完全信息静态博弈;贝叶斯纳什均衡;哈萨尼(1967-1968)不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾(1975),Kreps和Wilson(1982),Fudenberg和Tirole(1991)博弈的分类博弈论的讨论基于两条:①参与人都是理性的,他的目标非常明确,就是使自己的效用达到最大;②博弈论中的例子是简单而很不实际的,但是它比一些具体实际的复杂的例子更能揭示实质,使得很多人即使不去学习博弈论的理论,也能理解这些例子中提出的问题和分析的方法,这是有指导意义的。所以我们在学习博弈论的知识时,要注意这些简单而典型的例子,学习分析问题,提出概念,解决问题的过程。三、博弈论的经典模型博弈的分类乙坦白抵赖坦白甲抵赖有两个人因为涉嫌犯罪而被捕,被警方分别关在两个房间内审讯。他们面临的情况是:如果两个人都坦白罪行,那么将各被判处六年有期徒刑;如果一方坦白另一方抵赖,那么坦白者从宽,判处一年徒刑,抗拒者从严,判处八年徒刑;如果两个人均抵赖,则各被判处两年徒刑。这样,两个囚徒面临的博弈格局如上图所示,每个格子中左边的数字是甲的支付(盈利或得益),右边是乙的支付(盈利或得益)。1.囚徒困境(theprisoner’sdilemma)-6,-6-1,-8-8,-1-2,-2博弈的分类①划线法解囚徒困境乙坦白抵赖坦白甲抵赖(坦白,坦白):严格优势策略(抵赖,抵赖):严格劣势策略实例思考:价格大战、广告大战、优惠大战合作:“双赢对局”1.囚徒困境(theprisoner’sdilemma)-6,-6-1,-8-8,-1-2,-2博弈的分类②可口可乐与百事可乐的价格大战(单位:亿美元)百事可乐低价高价低价可口可乐高价(低价,低价):严格优势策略(高价,高价):严格劣势策略多数情形是非合作博弈卡特尔——几个大企业联手或勾结形成对行业的垄断,谋求最大利润而结成的联盟。卡特尔不稳定。OPEC——石油输出国组织1.囚徒困境(theprisoner’sdilemma)-3,-30,-5-5,0-1,-1博弈的分类③箭头法解囚徒困境乙坦白抵赖坦白甲抵赖1.囚徒困境(theprisoner’sdilemma)-6,-6-1,-8-8,-1-2,-2博弈的分类纳什均衡状态是市场力量相互作用的稳定的结局。AA’B’B0¼½¾1杂货铺定位:设想有一个小居民点,居民住宅沿着一条公路均匀地排开。现在有两家杂货