博弈论(GameTheory)前言本课程的教学安排本课程的主要内容博弈论概述本课程的教学目的讲课及考核方式学时/学分:32/2预修课程:微观经济学考核方式作业:30分答卷:70分共计:100分预期时间安排时间安排:4月27日开始每周四节课时:32学时教材及参考书教材:谢识予,经济博弈论,复旦大学出版社主要参考书:1.张维迎,博弈论与信息经济学,上海三联书店,上海人民出版社.1996.2.JeanTirole,博弈论,中国人民大学出版社博弈论与经济学1.1经济学(新古典经济学)(1)研究内容:稀缺资源的有效配置的;人的经济行为。(2)理性人(3)研究对象:价格制度(4)两个基本假定:市场参与者的数量足够多从而市场是竞争性的;参与人之间不存在信息不对称问题。第一章导论第一章导论1.2博弈论现实环境往往不能满足上述两个基本假定。不完全竞争市场和信息不对称使得博弈论逐渐成为经济学的基石。第一章导论1.2.1博弈论的发展历史(1)一般认为,博弈论始于1944年冯.诺依曼(VonNeumann)和摩根斯坦恩(Morgenstern)的《博弈论和经济行为》;(2)50年代,合作博弈发展到顶峰,代表性的研究成果是Nash(1950)和Shapley(1953)的“讨价还价”模型;(3)Nash在1950年和1951年发表的两篇文章代表着非合作博弈的兴起。其间Tucker(1950)定义了“囚徒困境”(prisoners’dilemma);(4)泽尔腾(selten)(1965)提出了“子博弈精炼纳什均衡”概念,把动态分析方法应用于博弈论中;第一章导论(5)海萨尼(Harsanyi)(1967-1968)把不完全信息的概念引入博弈论的研究;(6)80年代动态不完全信息博弈的发展。1.2.2博弈论在经济学中的应用Nash、泽尔腾、海萨尼分享了1994年诺贝尔经济学奖。在经济学的个体研究、信息问题、时序问题等方面,博弈论得到了最广泛的应用。第一章导论博弈论(gametheory)定义:研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡。开始于-冯.诺曼(VonNeumann)与摩根斯坦(Morgenstern)在1944年合作的《博弈论与经济行为》(TheTheoryofGamesandEconomicBehaciour)第一章导论注意两点:1、是两个或两个以上参与者之间的对策论当鲁滨逊遇到了“星期五”石匠的决策与拳击手的决策的区别第一章导论2、理性人假设理性人是指一个很好定义的偏好,在面临定的约束条件下最大化自己的偏好。博弈论说起来有些绕嘴,但理解起来很好理解,那就是每个对弈者在决定采取哪种行动时,不但要根据自身的利益的利益和目的行事,而且要考虑到他的决策行为对其他人可能的影响,通过选择最佳行动计划,来寻求收益或效用的最大化。囚徒困境第一章导论-囚徒困境案例1-囚徒困境-纳什均衡-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵赖坦白抵赖-8大于-100大于-1(坦白,坦白)是纳什均衡第一章导论-囚徒困境设定:(1)每个局中人都知道博弈规则和博弈结果的支付矩阵;(2)每个局中人都是理性的(个人理性和个人最优决策);(3)不能“串通”第一章导论-囚徒困境通俗地讲:纳什均衡的含义是:给定别人战略情况下,没有任何单个参与人有积极性选择其他战略,从而没有人有积极性打破这种均衡。第一章导论-囚徒困境一只河蚌正张开壳晒太阳,不料,飞来了一只鸟,张嘴去啄他的肉,河蚌连忙合起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今天不下雨,明天不下雨,就会有死蚌肉。”河蚌说:“今天不放你,明天不放你,就会有死鸟。”谁也不肯松口,有一个渔夫看见了,便过来把他们一起捉走了。第一章导论-囚徒困境两个寡头企业选择产量的博弈:如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小于卡特而产量下的利润。请举几个囚徒困境的例子第一章导论-囚徒困境同样的情形发生在:公共产品的供给美苏军备竞赛经济改革中小学生减负……第一章导论-囚徒困境囚徒困境的性质:个人理性和集体理性的矛盾;个人的“最优策略”使整个“系统”处于不利的状态。思考:为什么会造成囚徒困境是否由于“通讯”问题造成了囚徒困境?“要害”是否在于“利己主义”即“个人理性”?是否囚徒困境的结果就一定不利?第一章导论-囚徒困境亚当斯密在1776年发表的经典之作《原富》中认为:我们的晚餐不是来自屠夫、酿酒的商人或面包师傅的仁慈之心,而是因为他们对自己的利益特别关注。。。每个人都会尽其所能,运用自己的资本争取最大的利益,一般而言,他不会有意图为公众服务,也不自知对社会有什么贡献,他关心的仅仅是自己的安全、自己的利益,但如此一来,他就好象被一只无形的手引领,在不知不觉中对社会改进尽力而为。。。第一章导论-囚徒困境人类自私的天性,使他们陷入“囚徒困境”,难以自拔。解决囚徒困境问题的“出路”“解决个人理性和集体理性之间冲突的办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性”;“一种制度安排,要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立”。囚徒困境的效果在不同情况下对社会而言可能是“负面”的,也可能是“正面”的。第一章导论-智猪博弈5,14,49,-10,0等待小猪大猪按等待按4大于10大于-1案例2-智猪博弈纳什均衡:大猪按,小猪等待各得四个单位(4,4)多劳者不多得第一章导论-智猪博弈请举类似的例子第一章导论-智猪博弈大猪小猪博弈股份公司中大股东小股东监督纳什均衡:大股东担当监督经理的责任,小股东搭便车村中的富人穷人修路纳什均衡:大户修路改革中得到好处多的少的改革股市的大户小户炒股纳什均衡:大户搜集信息,小户跟大户第一章导论-性别战2,10,00,01,2芭蕾女男足球芭蕾足球案例3-性别战纳什均衡:足球,足球;芭蕾,芭蕾先动优势第一章导论-斗鸡博弈案例4-斗鸡博弈-3,-32,00,20,0退BA进退进独木桥纳什均衡:A进,B退;A退,B进第一章导论-斗鸡博弈村子里有两户富户,有两种可能:一家修,另一家就不修;一家不修,另一家就得修。冷战期间美苏抢占地盘:一方抢占一块地盘,另一方就占另一块。夫妻吵架,一方厉害,另一方就出去躲躲。注意:在混合战略纳什均衡条件下,也可能两败俱伤。第一章导论-斗鸡博弈案例5-市场进入阻挠40,50-10,00,3000,300斗争在位者进入者进入不进入默许纳什均衡:进入,默许;不进入,斗争第一章导论人生是永不停歇的博弈过程,博弈意略达到合意的结果。作为博弈者,最佳策略是最大限度地利用游戏规则,最大化自己的利益;作为社会最佳策略,是通过规则使社会整体福利增加。第一章导论-基本概念博弈论的基本概念包括:参与人:博弈论中选择行动以最大化自己效用的决策主体;行动:参与人的决策变量战略:参与人选择行动的规则信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识支付函数:参与人从博弈中获得的效用水平结果:博弈分析真正感兴趣的要素的集合均衡:所有参与人的最优战略的组合参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。第一章导论-博弈的划分博弈的划分:从参与人行动的先后顺序:静态博弈和动态博弈静态博弈:参与人同时选择行动或非同时行动但后行动者并不知道前行动者采取了什么具体行动;动态博弈:参与人行动有先后顺序,且后行动者能够观察先行动者选择的行动。第一章导论-博弈的划分参与人对其他参与人(对手)的特征、战略空间及支付函数的知识:完全信息博弈和不完全信息博弈。完全信息:每一个参与人对所有其他参与人的(对手)的特征、战略空间及支付函数有准确的知识,否则为不完全信息。第一章导论-基本概念博弈的划分:行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精练纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精练贝叶斯纳什均衡泽尔腾(1965)Kreps和Wilson(1982)Fudenberg和Tirole(1991)博弈的表述形式1.博弈的标准型表述标准型表述三个要素:参与人每个参与人可选择的战略支付函数适用于3个以下参与人的静态博弈博弈的表述形式1.博弈的扩展型表述标准型表述五个要素:参与人每个参与人选择行动的时点每个参与人在每次行动是可选择的战略集每个参与人在每次行动时有关对手过去行动选择的信息支付函数适用于多个参与人的动态博弈完全信息动态博弈-子博弈精练纳什均衡(举例)泽尔腾(1965)进入者进入不进入(0,300)在位者合作(40,50)斗争(-10,0)市场进入阻挠博弈树特点:剔除博弈中包含的不可置信威胁;承诺行动-破釜沉舟给定进入者进入,剔除(进入,斗争),(进入,默许)是唯一的子博弈精练纳什均衡-举例(结婚-反对)不可置信威胁支付函数行动不完全信息静态博弈-贝叶斯纳什均衡海萨尼(1967-1968)100,100-50,00,00,0不接受求爱博弈:品德优良者求爱求爱者求爱不求爱接受100,-100-50,00,00,0不接受你求爱者求爱不求爱接受求爱博弈:品德恶劣者求爱你100x+(-100)(1-x)=0当x大于1/2时,接受求爱不完全信息动态博弈-精练贝叶斯纳什均衡泽尔腾(1965)成语故事:黔之驴-驴虎博弈老虎通过不断试探来修正对毛驴的看法,每一步行动都是给定它的信念下最优的。最终将毛驴吃掉。完全信息与完美信息完全信息是指博弈方都完全了结所有博弈方在各种情况下的得益。是静态的概念;完美信息是指博弈方在轮到行为时对博弈的进程完全了解。是动态的概念。问题:什么叫“完全而不完美信息博弈”?第二章完全信息静态博弈一博弈的基本概念及战略表述二占优战略(上策)均衡三重复剔除的占优均衡(严格下策反复消去法)四划线法五箭头法六纳什均衡完全信息静态博弈完全信息:每个参与人对所有其他参与人的特征(包括战略空间、支付函数等)完全了解静态:所有参与人同时选择行动且只选择一次。同时:只要每个参与人在选择自己的行动时不知道其他参与人的选择,就是同时行动博弈分析的目的是预测均衡结果一博弈的基本概念及战略表述案例-房地产开发项目-假设有A、B两家开发商市场需求:可能大,也可能小投入:1亿假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价7千万;如果市场上只有一栋楼需求大时,可卖1.8亿需求小时,可卖1.1亿一、博弈的基本概念及战略表述4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述一、博弈的基本概念及战略表述博弈论的基本概念包括:参与人:博弈论中选择行动以最大化自己效用的决策主体;行动:参与人的决策变量战略:参与人选择行动的规则信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识支付函数:参与人从博弈中获得的效用水平结果:博弈分析真正感兴趣的要素的集合均衡:所有参与人的最优战略的组合一、博弈的基本概念及战略表述代表自然代表参与人博弈的参与人集合:Nini),,2,1(,参与人:博弈论中选择行动以最大化自己效用的决策主体。可以是自然人,也可以是团体,如企业、国家甚至由若干国家组成的集团(OPEC、欧盟等)。虚拟参与人:“自然”作为虚拟参与人自然:指决定外生的随机变量的机制为分析方便引入,自然作为虚拟参与人没有自己的支付和目标函数(即所有结果对它是无差异的)参与人决策的后果依赖于自然的选择。在不完全