主要内容•§1.博弈论概述•§2.完全信息静态博弈•§3.完全信息动态博弈一博弈论概述•保罗·萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”•人们在日常生活中进行着博弈,与配偶,朋友,陌生人,老板/员工,教授等。•类似的博弈也在商业活动、政治和外交事务、战争中进行着——在任何一种情况下,人们相互影响以达成彼此有利的协议或者解决争端。•博弈论为众多学科提供了分析的概念和方法:经济学和商学,政治科学,生物学,心理学和哲学。1与传统微观经济学的比较•传统经济学涉及的个人决策,是在给定价格参数和收入的条件下,追求效用最大化的决策(消费者均衡或生产者均衡);个人效用只依赖于自己的选择,而外在于他人的选择;个人最优选择只是价格和收入的函数而不包含其他人选择的函数。•在博弈论看来,个人效用不仅依赖于自己的选择,而且依赖于他人的选择;个人的最优选择是其他人选择的函数。1.1与传统微观经济学的比较•一致性利益最大化原则均衡原则•不一致人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性信息不完全-委托-代理理论、信号传递与信息筛选模型1.2博弈论的发展简史•博弈思想最早产生于我国古代。•早在两千多年的春秋时期,孙武在《孙子兵法》中论述的军事思想和治国策略,就蕴育了丰富和深刻的对策论思想。孙武的后代孙膑,为田忌谋划,巧胜齐王,这个著名的“田忌赛马”,就是典型的对策思想的成功运用。1.2博弈论的发展简史•一、起源•法国经济学家奥古斯丁·古诺(AugustinCournot1838)——古诺模型•英国经济学家弗朗西斯·埃奇沃斯(FrancisEdgeworth1881)•伯川德(Bertrand)和斯坦克伯格(Stackelberg)•二、早期突破•E·策墨罗(E·Zermelo)于1913年对于象棋游戏的研究。证明了象棋游戏总是有解,即在棋盘的任何一种状态,两个参与者中的一个有赢的策略。开创了求解一类博弈的技巧,即后退归纳法•三、近代•(1)约翰·冯·诺依曼(JohnvonNeumann)于1928发表的论文•(2)1944年,科学家冯·诺伊曼和经济学家奥斯卡·摩根斯坦合著《博弈与经济行为的理论》(ThetheoryofGamesandEconomicBehaviour)被公认为是博弈论的开山之作。•以往的数学是在物理学的基础上发展起来的,描述的是客观世界行为,而经济学研究的对象更像是一场游戏中的参与者,相互之间预期对方的行动,因此,描述、观察研究对象就需要一系列的数学工具,这一套新的数学工具,被他们命名为博弈论。奥斯卡·摩根斯坦(OskarMorgenstern)•1902-1977,生于西里西亚的戈尔利策。1944年加入美国籍。热心于将数学应用于人类的各种战略问题(不管是商业、战争,还是科学研究),以便获得最大利益和尽可能地减少损失。他认为这些原理也同样适用于哪怕简单得象抛掷硬币这样的游戏,因而提出了对策论(博弈论)。约翰·冯·诺依曼(JohnVonNeumann)•1903-1957,美藉匈牙利人。18岁与老师合作发表第一篇数学论文,22岁获数学博士学位。1927年一1929年冯·诺依曼相继在柏林大学和汉堡大学担任数学讲师。1931年成为美国普林斯顿大学的第一批终身教授。1933年转到该校的高级研究所,成为最初六位教授之一,并在那里工作了一生.冯·诺依曼是普林斯顿大学、宾夕法尼亚大学、哈佛大学、伊斯坦堡大学、马里兰大学、哥伦比亚大学和慕尼黑高等技术学院等校的荣誉博士.是美国国家科学院、秘鲁国立自然科学院和意大利国立林且学院等院的院士.1954年任美国原子能委员会委员;1951年至1953年任美国数学会主席。“计算机之父”“博弈论之父”。冯·诺依曼和摩根斯坦的贡献•1,提出博弈的概念;•2,对效用理论给予公理依据;•3,零和博弈(Zero-sumGames)的最优解;•4,引进博弈论的一种形式,即合作博弈(cooperativeGames)博弈论的发展简史•四、发展•1、纳什均衡(Nash-Equilibrium)•1950年,约翰·纳什(JohnNash)引入均衡(解)的概念,即纳什均衡,将博弈论从零和博弈推进到非零和博弈(即参与人会出现双赢或双输的情况)•合作博弈中的讨价还价模型•定义非合作博弈及证明均衡解的存在•纳什获得1994年诺贝尔经济学奖•2、子博弈完美纳什均衡和贝叶斯纳什均衡(Subgame-PerfectNash-Equilibrium;Bayes-NashEquilibrium)•1965年和1975年兰哈德·泽尔藤(ReinhardSelten)把纳什均衡推广到动态博弈,并提出子博弈完美纳什均衡;•1967-1968年间,约翰·海萨尼(JohnHarsanyi)把纳什思想推广到不完全信息模型,提出贝叶斯均衡;•他们与纳什一起分享1994年诺贝尔经济学奖•3、不对称信息条件下交易的对策•1996年诺贝尔经济学奖获得者詹姆斯·莫里斯教授和威廉姆·维克瑞教授在20世纪60、70年代提示不对称信息对交易带来的影响,并提出相应对策。•4、信息经济•2001年诺贝尔经济学奖授予美国乔治·阿克尔洛夫教授、迈克尔·斯彭斯教授、约瑟夫·斯蒂格利茨教授。20世纪70年代他们提示当代信息经济的核心,信息是有价值的。•1970年阿克尔洛夫提出旧车市场模型并提出:市场不能解决所有问题,信息是有价值的•1973年斯彭斯通过剖析人才市场盛行的造假行为指出人才市场存在用人单位与应聘者之间的信息不对称,造成“劣币”驱逐“良币”现象•斯蒂格利茨将信息不对称理论应用于保险和金融市场•5•2005年,以色列经济学家罗伯特-奥曼和美国经济学家托马斯-谢林,因“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。三、博弈论与诺贝尔经济学奖获得者1994年诺贝尔经济学奖获得者美国人约翰-海萨尼(JohnC.Harsanyi)和美国人约翰-纳什(JohnF.NashJr.)以及德国人莱因哈德-泽尔腾(ReinhardSelten)获奖理由:在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰·纳什1928年生于美国约翰·海萨尼1920年生于美国莱因哈德·泽尔腾,1930年生于德国1996年诺贝尔经济学奖获得者英国人詹姆斯·莫里斯(JamesA.Mirrlees)和美国人威廉-维克瑞(WilliamVickrey)获奖理由:前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。詹姆斯·莫里斯1936年生于英国威廉·维克瑞,1914-1996,生于美国2001年诺贝尔经济学奖获得者三位美国学者乔治-阿克尔洛夫(GeorgeA.Akerlof)、迈克尔-斯彭斯(A.MichaelSpence)和约瑟夫-斯蒂格利茨(JosephE.Stiglitz)获奖理由:在“对充满不对称信息市场进行分析”领域做出了重要贡献。约瑟夫·斯蒂格利茨,1943年生于美国的印第安纳州,1967年获美国麻省理工学院博士头衔,曾担任世界银行的首席经济学家,现任美国哥伦比亚大学经济学教授乔治·阿克尔洛夫1940年生于美国的纽黑文,1966年获美国麻省理工学院博士头衔,现为美国加利福尼亚州大学经济学教授。迈克尔·斯彭斯1948年生于美国的新泽西,1972年获美国哈佛大学博士头衔,现兼任美国哈佛和斯坦福两所大学的教授。2005年诺贝尔经济学奖获得者以罗伯特·奥曼色列经济学家罗伯特-奥曼(RobertJ.Aumann)和美国经济学家托马斯·谢林(ThomasC.Schelling)获奖原因:“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。罗伯特·奥曼托马斯·谢林•1.博弈论在经济学领域中应用最广泛,最成功;博弈论的许多成果也是借助于经济学的例子来发展引申的;•2.经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈后,例如克瑞普斯,威尔逊都是经济学家;•3.最根本性的原因是经济学和博弈论的研究模式是一样的,都强调个人理性,即追求给定条件下效用最大化。博弈专家之所以获经济学奖,原因大致有三点:★博弈论的基本概念博弈是指一些个人、团队或组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自从中取得相应结果的过程。博弈论就是描述在这种形势下各方理性地选择自己的行动所实现的结果,分析各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。例:房地产开发•1、AB两个开发商,投资1亿;•2、如果市场上有两栋房出售,需求大,每栋:1.4亿;需求小,每栋:7千万;•如果市场上有一栋房出售,需求大,每栋:1.8亿;需求小,每栋:1.1亿;•3、开发与不开发。•8种可能的结果•1、需求大,A开发,B不开发,则A的利润8千万,B的利润为0;•2、需求大,A开发,B开发,则A的利润4千万,B的利润4千万;•3、需求大,A不开发,B开发,则A的利润0,B的利润为8千万;•4、需求大,A不开发,B不开发,利润各为0•5、需求小,A开发,B不开发,则A的利润1千万,B的利润为0;•6、需求小,A开发,B开发,则A的利润-3千万,B的利润-3千万;•7、需求小,A不开发,B开发,则A的利润0,B的利润为1千万;•8、需求小,A不开发,B不开发,利润各为0★博弈三要素、信息及博弈均衡•(1)局中人(player):指参加博弈的各个决策个体,既可以是自然人,也可以是团体。局中人都是“理性”的,即他清楚地了解自己的目标或利益所在,在决策时考虑自己的知识(信息)以及对其他局中人策略的期望,总是采取最佳行动(或策略)以实现其支付的最大化。•虚拟局中人:自然,是外部随机变量,对所有利益主体都无差异。•一般用i=1…,n代表参与人,N代表自然•(2)行动与战略(actionsorstrategies)。行动是局中人在博弈的某个时点的决策变量;每一个局中人的所有可能选择的行动的集合称这该局中人的行动空间(actionspace);所有局中人的行动的一个有序集合称为该博弈的一个行动组合(actionprofile);•ai表示第i个参与人的一个特定行动;•Ai={ai}表示可供i选择的所有行动的集合;•在n人博弈中,n个参与人的行动的有序集a=(a1,….,ai,…..an)称为行动组合•(2)战略(strategies)是局中人在所有给定信息集(信息集是局中人在特定时刻进行决策时所面对的集合)下的行动规则,他规定局中人在什么时候选择什么行动。•si表示第i个参与人的一个特定战略;•Si={si}表示可供i选择的所有可选择的战略集合;•在n人博弈中,n个参与人每人选择一个战略,n维向量s=(s1,….,si,…..sn)称为一个战略组合•(3)信息(information):是局中人有关博弈的知识,特别是有关其他局中人的特征(如策略空间、支付函数等等)和行动的知识。信息集(informationsets)是局中人在特定时刻进行决策时,所面对的信息变量值的集合。共同知识(commonknowledge)是指“所有局中人知道,所有局中人知道所有局人知道,……”(或信息)。如果局中人的策略选择、支付函数等都是共同知识,则称之为完全信息(completeinformation),否则就是不完全信息(incompleteinformation)•(4)支付(payoff):指在一个特定的策略组合下,局中人得到的效用水平或期望效用水平。一个局中人的支付是所有局中人的策略选择的函数,它不仅取决于自己的策略选择,而且还取决于(他所设想的)所有其他局中人的策略选择,任何一个局中人改变自己的策略都将影响其他局中人的支付水平,即,局中人之间的利益是相互牵制的和制约的。所有局中人的支付的一个有序集合称为博弈的一个支付组合(payoffprofile。•Ui=Ui(