博弈论PPT

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

中国浦东干部学院中国浦东干部学院博弈思维与策略行为陈元志博士、副教授Email:yzchen@celap.org.cn中国浦东干部学院中国浦东干部学院“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”——保罗·萨缪尔森中国浦东干部学院课堂实验†纸币拍卖•骑虎难下的博弈与协和谬误中国浦东干部学院基本框架静态博弈重复博弈博弈论导论合作博弈非合作博弈动态博弈中国浦东干部学院博弈论导论—现代博弈论简单发展史•起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的《博弈论与经济行为》中国浦东干部学院博弈论导论—博弈论和诺贝尔经济学奖•1994:纳什(Nash)、海萨尼(J.Harsanyi)、泽尔腾(R.Selten)†1996莫里斯(JamesA.Mirrlees)和维克瑞(WilliamVickrey)纳什的基本贡献是证明了非合作博弈均衡解及其存在性,建立了作为博弈论基础的“纳什均衡”概念;海萨尼则把不完全信息纳入到博弈论方法体系中;泽尔腾的贡献在于将博弈论由静态向动态的扩展,建立了“子博弈精练纳什均衡”的概念。这两位经济学家的贡献集中于运用博弈论对现实经济问题的解释。•2001:阿克洛夫(Akerlof)、斯宾塞(Spence)、斯蒂格利茨(Stiglitz)这三位作为不对称信息市场理论的奠基人被授予诺贝尔经济学奖,以表彰他们分别在柠檬品市场等不对称信息理论研究领域做出的基础性贡献。这些贡献发展了博弈论的方法体系,拓宽了其经济解释范围。中国浦东干部学院博弈论导论—博弈论和诺贝尔经济学奖†2002:弗农史密斯(Smith)†2005:奥曼(Aumann)、谢林(Schelling)贡献主要在于通过实验室实验来测试根据经济学理论而做出预测的未知或不确定性。是对以博弈论为基础构建的理论模型进行实证证伪工作的一大创举。他们通过博弈理论分析增加了世人对合作与冲突的理解。其理论模型应用在解释社会中不同性质的冲突、贸易纠纷、价格之争以及寻求长期合作的模式等经济学和其他社会科学领域。†2007:赫维克兹(LeonidHurwicz)、马斯金(EricS.Maskin)、梅尔森(RogerB.Myerson)他们应用博弈理论于信息经济学领域,提出“机制设计理论”,最早由赫维克兹在1960年提出,并由马斯金和梅尔森进一步发展,他们的研究有助解释经济交易时的机制和决策过程。该理论可应用于多方面,包括劳工问题谈判、拍卖政府债券,以至最新的网上市场。中国浦东干部学院博弈论导论†标准式博弈与扩展式博弈:矩阵树形†非合作博弈与合作博弈:个体理性与集体理性的不同†同步博弈与序列博弈:每个参与方不知对方决策情况下作出决策;参与方先观察对方行动,自己再行动†静态博弈与动态博弈:参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取什么行动;参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动†一次博弈与重复博弈:基本博弈只进行一次;基本博弈重复进行,包括有限重复和无限重复中国浦东干部学院博弈论导论博弈论的精髓在于基于系统思维基础上的理性换位思考,即在选择你的行动时还是考虑你的得益,但是你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。中国浦东干部学院博弈思维的基本法则•寻找占优策略检查一下你是否存在占优策略,如果有,就选择占优策略•剔除劣势策略检查一下你是否存在劣势策略,如果有,请剔除•站在对手的位置上思考问题如果你没有占优策略,那么从你对手角度考虑博弈。如果对手有占优策略,预期他将按占优策略行动•纳什均衡我所做的是:给定你所做的,我所做的是最好的;你所做的是:给定我所做的,你所做的是最好的中国浦东干部学院博弈策略的案例•飞行常客的里程数(价格优惠与里程优惠)•“上面出政策,下面出票子”的现象•农信社改革的注资博弈•华为公司与劳动合同法•伊丽莎白女王的难题中国浦东干部学院基本框架静态博弈重复博弈合作博弈博弈论导论非合作博弈动态博弈中国浦东干部学院静态博弈的应用•彩电价格大战伯特兰德寡头垄断(同质产品,价格竞争)海信策略低价高价低价0,03,-1高价-1,31,1长虹纳什均衡•海运竞争中的“负运价”现象•旅行社产品的低价竞争中国浦东干部学院•囚徒困境z囚徒困境对古典经济学的冲击策略囚徒B坦白拒不交待囚徒A坦白拒不交待无期,无期释放,死刑一年,一年死刑,释放纳什均衡中国浦东干部学院•军备竞赛•招商引资的政策博弈•宏观调控的“黄灯”效应•应试教育与素质教育中国浦东干部学院•哈丁公用地的悲剧设想一个向全体公众开放的牧场。不难预计,每一个放牧者一定希望在这片公用土地饲养尽可能多的牲畜……这就是悲剧所在--加利福尼亚生物学家加勒特·哈丁(GarrettHarding)•太湖蓝藻现象、过度捕捞、不可再生资源的消耗问题•廷·巴特尔战风沙、建绿洲、保生态的事迹•公用秘书的故事•公共产品的供给中国浦东干部学院•《中共中央纪委关于严格禁止利用职务上的便利谋取不正当利益的若干规定》2007年5月30日,中央纪委制定颁布这个《规定》,并在印发《通知》中强调,“本规定发布后三十日内主动说清问题的可考虑从宽处理”的政策。中国浦东干部学院•如何利用囚徒困境•沃伦·巴菲特提出的政治策略一位怪里怪气的富翁提出一项对竞选活动融资的法案,他承诺,如果这一法案立法不成,他会向最有力支持这一法案的政党提供10亿美元。策略支持不支持支持法案通过法案不通过,共和党拿到10亿美元不支持法案不通过,民主党拿到10亿美元法案不通过民主党共和党中国浦东干部学院•如何走出囚徒困境•报复与惩罚(黑手党组织)•“人质”方案(可信的抵押,如秦始皇、燕太子丹、赵长安君都曾为盟国人质)•忠诚文化(江湖义气、军队中的忠诚观念)•建立长期关系,进行重复博弈中国浦东干部学院•长滩博弈ABAB01/41/23/41z商业布点、政治选举、杂志电视中国浦东干部学院•智猪博弈纳什均衡按等待按5,14,4等待9,-10,0小猪大猪猪圈中有一头大猪一头小猪,猪圈一端有个按钮,每按一下猪圈另一端食槽中会有10个单位猪食进槽,但按一下会耗去相当于2单位猪食的成本。如果大猪先到食槽,大猪吃到9单位食物,小猪只能吃到1单位;如小猪先到,小猪吃4单位而大猪吃6单位;如果同时按并同时到食槽,则大猪吃7单位而小猪吃3单位食物。中国浦东干部学院尽管大家同乘一条船,可一些人是划船,另一些人只是坐船。——[瑞士]阿尔弗雷德·莫勒尔(AlfredMohler)《玩世箴言》中国浦东干部学院策略提示•处于强势的参与者为维护自己利益采取某种决策时,为其他弱势参与者提供了搭便车的机会•改革与制度锁定•股市中的机构大户与散户•新产品研发与中小企业•小酒馆紧靠大酒店的广告便车•员工的搭便车(先进员工vs懈怠员工)•大智若愚中的智慧•贫困县的教育拨款中国浦东干部学院•斗鸡博弈纳什均衡司机乙转向向前转向1,10,2向前2,0-2,-2司机甲左舷右舷原速直行偏右慢让左舷右舷z船舶海上避让规则中国浦东干部学院•波音与空中客车的博弈空中客车波音生产不生产生产-10,-10100,0不生产0,1000,0纳什均衡1、公司自行竞争的情况空中客车波音生产不生产生产10,10120,0不生产0,1200,02、政府补贴20亿的情况纳什均衡•运十飞机,ARJ-21支线飞机中国浦东干部学院•协调博弈足球韩剧足球2,10,0韩剧0,01,2z情侣博弈女男策略旁观报警旁观0,010,7报警7,107,7李四此协调博弈有两个纳什均衡z市民责任的博弈张三中国浦东干部学院策略提示•不是所有的博弈都涉及到利益冲突.•沟通能够帮助解决协调问题.•顺序行动能够帮助解决协调问题.•先动优势的作用中国浦东干部学院•关于混合策略的博弈--大规模协调博弈的案例z吉诺维斯谋杀案--市民责任的博弈1964年纽约市(皇后区的Kew花园),一个叫吉诺维斯的妇女被歹徒杀害,残忍的袭击持续了半个多小时,她一直在尖叫,很多人听到了她的尖叫,超过30人在命案现场,但没有人帮助她,也没有人报警。李四张三纳什均衡旁观报警旁观0,010,7报警7,107,7中国浦东干部学院•关于混合策略的博弈李四张三旁观报警旁观0,010,7报警7,107,7P1-Pq1-q各参与人在各策略下的预期赢利为:张三旁观的预期收益是:0×q+10×(1-q)=10-10q(1)报警的预期收益是:7×q+7×(1-q)=7(2)纳什均衡满足李四选择q使得张三在各策略之间的预期收益无差异,则使式(1)=式(2),解得q=0.3,这是李四旁观的概率。李四旁观的预期收益是:0×p+10×(1-p)=10-10q(3)报警的预期收益是:7×p+7×(1-p)=7(4)同样,令式(3)=式(4),解得p=0.3,这是张三旁观的概率。中国浦东干部学院•关于混合策略的博弈z吉诺维斯谋杀案--市民责任博弈有时候人们以随机的方式选择自己的行动,例如在本案例中张三和李四都会以0.3的概率选择旁观,以0.7的概率选择报警。由此可以计算各种情况的概率:两个人都报警的概率为0.7×0.7=0.49张三报警李四旁观的概率为0.7×0.3=0.21李四报警张三旁观的概率为0.3×0.7=0.21两个人都旁观的概率为0.3×0.3=0.09因此,警方最终得到报警的概率是:0.49+0.21+0.21=0.91中国浦东干部学院•关于混合策略的博弈z吉诺维斯谋杀案--市民责任博弈现在博弈的参与者不是两个人,而是很多人假设为N个人:若张三选择旁观,则无人报警时张三收益0,有人报警张三不报警,张三的收益为10;若张三选择报警,则无论其他人报警与否张三的收益都为7。假设张三认为其他人旁观的概率为q,则:张三选择旁观的收益为:0×qN-1+10(1-qN-1)=10-10qN-1张三选择报警的收益为:7×qN-1+7(1-qN-1)=7那么,均衡状态下张三的最优混合策略应使得上面两式相等:10-10qN-1=7→q*=0.31/(N-1)在吉诺维斯谋杀案中,N=38的情况下,每个人都将以0.97(即就是0.31/(38-1))的概率选择袖手旁观,那么无人报警的概率就是0.29(即就是0.9738)。中国浦东干部学院策略提示•在博弈中,有时需要以某种概率随机地选择自己的行动,即采取混合策略.•有时候,混合策略的后果是低效率的,尤其是大群体需要协调行动的时候.中国浦东干部学院起初他们追杀共产主义者,我没有说话,因为我不是共产主义者;接着他们追杀犹太人,我没有说话,因为我不是犹太人;后来他们追杀工会成员,我没有说话,因为我不是工会成员;此后,他们追杀天主教徒,我没有说话,因为我不是新教教徒;最后他们奔我而来,却再没有人站起来为我说话了。——马丁·尼莫拉(德国新教教士,此诗铭刻于波士顿犹太人屠杀纪念碑)中国浦东干部学院基本框架静态博弈重复博弈合作博弈博弈论导论非合作博弈动态博弈中国浦东干部学院重复博弈--广告博弈•博弈的参与者是:凯洛格和通用面粉•策略是广告活动•博弈的类型有:(1)静态博弈(同步一次博弈)(2)无限重复博弈(3)有限重复博弈中国浦东干部学院一次广告博弈通用面粉策略无广告中等强度高强度无广告12,121,20-1,15中等强度20,16,60,9高强度15,-19,02,2凯洛格中国浦东干部学院一次广告博弈的均衡„劣策略:不管其他参与人采取什么策略,都能导致最低收益的策略„理性参与人永远不会选择劣策略„许多博弈中参与者都没有占优策略,但仍可能通过劣策略的重复剔除进行分析,这种方法称劣策略重复剔除法通用面粉纳什均衡策略无广告中等强度高强度无广告12,121,20-1,15中等强度20,16,60,9高强度15,-19,02,2凯洛格中国浦东干部学院无限重复博弈如果企业每年都进行这种一次博弈,并且永远进行下去,这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下,共谋起作用吗?•密歇根大学爱克斯罗德教授的计算机模拟他首先邀请全世界的学者递交自认为最优的策略程序,然后将这些策略相互之间交替进行不特定次数的“重复囚徒博弈”,根据最终排名来

1 / 74
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功