博弈思维与竞争策略博弈论(gametheory)是由美国数学家冯·诺依曼(Von.Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。1994年,三位博弈论专家即数学家纳什(Nash,他的故事被好莱坞拍成电影《美丽心灵》,该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖。1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。专家预计,近几年还会有更多的博弈论专家可能获得诺贝尔经济学奖。为什么博弈论在经济学领域会产生如此大的影响呢?这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。博弈论是一门十分有趣但理论上又是十分艰深的学问,我今天打算用一些大家能够凭直观或简单分析就能把握的例子为大家介绍博弈论的基本概念及应用,以引起大家对这门目前已成为热门科学的兴趣和获得初步的了解。这些例子也是我们在日常生活中经常所遇到的问题或观察到的现象,通过博弈论,我们能够更加深刻地理解它们。6什么是博弈扑克牌,猜拳,象棋,围棋,足球,乒乓球,等等。博弈:行为主体选择策略并相互影响的过程博弈论:研究决策主体的行为发生直接相互作用时候的决策,以及这种决策的均衡问题。7什么情况下适宜用博弈模型适用标准意识到其行动将相互影响的决策者们的行为例如:上海大众和北京现代决定其价格水平时,会意识到自己的销售情况受对方影响,又同时影响对方,他们是一个博弈的参与者。这两个企业是否与购买其商品的消费者进行博弈?为什么?不适用的情况制定决策时不考虑别人的反应,或者将其视为非人格化的市场力量时,博弈论无法应用。8什么情况下适宜用博弈模型适宜情况石油输出国组织成员国选择其年产量家装市场上装修公司之间的竞争联合国改革中的中国和日本美国与前苏联的军备竞赛不适宜情况联通招募新员工联想公司决定裁员一家电力公司在估计了未来10年对电力的需求后决定是否购买一套新的发电机组9什么情况下适宜用博弈模型博弈举例妈妈与小孩教师与学生聂卫平与常昊丈夫与妻子诸葛亮和司马懿齐王与田忌赛马联想和戴尔地方政府之间路遇抢劫的同一车乘客迎面骑车的两个人制度比人性重要.ppt10如何描述一个博弈博弈的构成要素参与人(players):做决策的个体行动(actions)或(策略strategies):所能做的某一选择信息(information):参与人的特征收益(payoffs):均衡(equilibria)或结果(outcome):11博弈论合作博弈非合作博弈参与人达成有约束力的协议参与人之间没有有约束力的协议一般来说,教课书中的博弈论指的是非合作博弈本课程讲的也是非合作博弈博弈分类(一)12博弈分类(二)行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精炼纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾(1975)Kreps&Wilson(1982),Fudenberg&Tirole(1991)一、什么是博弈论:从“囚徒困境”谈起1.囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。表1囚徒困境博弈乙招不招招甲不招(问题1:甲、乙如何选择?)-8,-80,-10-10,0-1,-1表1囚徒困境博弈乙招不招招甲不招-8,-80,-10-10,0-1,-1甲和乙都不会选择劣战略“不招”,称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。我们可以利用这个道理来分析日常生活中的许多不合作现象。唐人妙用博弈论.ppt2.生活中的“囚徒困境”例子例子1商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,这在发达国家是不可思议的。但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的。例子2为什么政府要负责修建公共设施,因为私人没有积极性出资修建公共设施设想有两户相居为邻的农家,十分需要有一条好路从居住地通往公路。修一条路的成本为4,每个农家从修好的好路上获得的好处为3。如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处(支付)为3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为3-4=-1(亏损),“搭便车”不出资但仍然可以使用修好的路的另一户人家获得支付3-0=3,见表2。表2修路博弈乙修不修修甲不修1,1-1,33,-10,0我们看到,对甲和乙两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,私人一般没有积极性承担这方面服务的积极性和能力。例子3苏格兰的草地为什么消失了?公共资源经常被过度利用的原因。在18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧。草地属于“可再生资源”,如果限制放牧的数量,没有被牛羊吃掉的剩余草皮还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,草场就会消失。由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民都会如此盘算:如果其他牧民不约束自己的放牧规模,让自己的牛羊过多地到草地上吃草,那么,我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的,不会使草场免于破坏;相反,我也加入过度放牧的行列,至少在草场消失之前还会获得一部分短期的收益。如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧场,但自己却获得了高额的收益。因此,任何一位牧民的结论都会是:无论其他牧民是否过度放牧,我选择“约束自己的放牧规模”都是劣战略,从而被剔除。大家最终都会选择过度放牧,结果导致草地消失,生态破坏。类似的例子还有:渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。例子4为什么在城市中心道路上禁止汽车鸣喇叭?禁鸣喇叭一方面是为了控制城市噪声污染,另一方面是基于以下的博弈论原因。见表3,当汽车司机可以鸣喇叭时,可能为汽车超速抢行提供条件。但当大家都抢行时,城市交通拥挤加重,反而都难以顺利通行,获得低支付(2,2)。表3交通博弈司机2缓行抢行缓行司机1抢行8,81,99,12,2但当对方缓行时,自己抢行会占便宜,获得支付9。这个博弈中,“缓行”是劣战略,剔除后得到“剔除劣战略后的占优战略均衡”(抢行,抢行),这不是一个好的均衡。当禁止鸣喇叭时,司机为了避免造成交通事故,只得缓行,从而得到好的结果(缓行,缓行)。32情侣博弈参与者:一对恋人面临的情况:安排本周末的活动,两人的爱好不同,男孩喜欢看足球比赛,女孩想去看芭蕾舞行动(策略):足球,芭蕾收益函数两人一起看足球赛,则男孩效用2,女孩1两人一起看芭蕾舞,则男孩效用1,女孩2如果两人各自去做自己喜欢的事,则效用都是033此博弈的战略式表述足球足球芭蕾芭蕾2,10,01,20,0女孩男孩情侣博弈34分析足球足球芭蕾芭蕾2,10,01,20,0女孩男孩情侣博弈35情侣博弈如果男孩选择了足球,则女孩会选择足球如果女孩选择了芭蕾,则男孩会选择芭蕾这个例子中有两个纳什均衡应用:例如产品的供给和需求,企业甲供应某种产品,作为企业乙的主要原料,有两种型号A,B,甲倾向于生产A,乙倾向于使用B,此时就是一个“情侣博弈”36情侣博弈在情侣博弈的对局中,男女都没有上策,他们的最优策略依赖于对方的选择。在这个对局中同时出现了两个均衡。这种均衡叫做纳什均衡。纳什均衡是指在对手的策略是既定的情况下,各个对局者所选择的策略都是最好的。讨价还价博弈.ppt37斗鸡博弈参与者:两个小孩,东尼和吉米面临的情况:两个孩子被伙伴们鼓动要做一场勇气的博弈,两人分别从一个独木桥的两端冲向对方,谁先胆怯退下让路,谁就是小鸡。小鸡代表胆小鬼行动(策略):退怯,勇进收益函数吉米退,东尼进,则吉米得益2,东尼4吉米进,东尼退,则吉米得益4,东尼2二人同时进,则二人得益都为0二人同时退,则二人得益都为338此博弈的战略式表述退怯退怯勇进勇进3,32,40,04,2东尼吉米斗鸡博弈39分析退怯退怯勇进勇进3,32,40,04,2东尼吉米斗鸡博弈40斗鸡博弈应用公共产品的供给两军对抗商业竞争:占领市场1.智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。表4给出这个博弈的支付矩阵。二、智猪博弈:对诸多经济现象的解释表4智猪博弈小猪按等待按大猪等待5,14,49,-10,0这个博弈没有“剔除劣战略均衡”,因为大猪没有劣战略。但是,小猪有一个劣战略“按”,因为无论大猪作何选择,小猪选择“等待”是比选择“按”更好一些的战略。所以,小猪会剔除“按”,而选择“等待”;大猪知道小猪会选择“等待”,从而自己选择“按”,所以,可以预料博弈的结果是(按,等待)。这称为“重复剔除劣战略的占优战略均衡”,其中小猪的战略“等待”占优于战略“按”,而给定小猪剔除了劣战略“按”后,大猪的战略“按”又占优于战略“等待”。2.例子在经济生活中,有许多“智猪博弈”的例子。例子6股市博弈在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。他们不会花成本去进行技