8.陈元志：博弈论与策略行为(选修课20110520)

yfm19861118
1 ℃
2020-03-18

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

中国浦东干部学院中国浦东干部学院博弈思维与策略行为陈元志博士、副教授Email:yzchen@celap.org.cn中国浦东干部学院中国浦东干部学院“要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解”——保罗·萨缪尔森中国浦东干部学院基本框架静态博弈重复博弈动态博弈博弈论导论合作博弈非合作博弈中国浦东干部学院博弈论导论—现代博弈论简单发展史•起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的《博弈论与经济行为》中国浦东干部学院博弈论导论—博弈论和诺贝尔经济学奖1994：纳什（Nash）、海萨尼（J.Harsanyi）、泽尔腾（R.Selten）1996莫里斯（JamesA.Mirrlees）和维克瑞（WilliamVickrey）纳什的基本贡献是证明了非合作博弈均衡解及其存在性，建立了作为博弈论基础的“纳什均衡”概念；海萨尼则把不完全信息纳入到博弈论方法体系中；泽尔腾的贡献在于将博弈论由静态向动态的扩展，建立了“子博弈精练纳什均衡”的概念。这两位经济学家的贡献集中于运用博弈论对现实经济问题的解释。2001：阿克洛夫（Akerlof）、斯宾塞（Spence）、斯蒂格利茨（Stiglitz）这三位作为不对称信息市场理论的奠基人被授予诺贝尔经济学奖，以表彰他们分别在柠檬品市场等不对称信息理论研究领域做出的基础性贡献。这些贡献发展了博弈论的方法体系，拓宽了其经济解释范围。中国浦东干部学院博弈论导论—博弈论和诺贝尔经济学奖2002：弗农史密斯（Smith）2005：奥曼（Aumann）、谢林（Schelling）贡献主要在于通过实验室实验来测试根据经济学理论而做出预测的未知或不确定性。是对以博弈论为基础构建的理论模型进行实证证伪工作的一大创举。他们通过博弈理论分析增加了世人对合作与冲突的理解。其理论模型应用在解释社会中不同性质的冲突、贸易纠纷、价格之争以及寻求长期合作的模式等经济学和其他社会科学领域。中国浦东干部学院博弈论导论—博弈论和诺贝尔经济学奖2007：赫维克兹(LeonidHurwicz)、马斯金(EricS.Maskin)、梅尔森(RogerB.Myerson)他们应用博弈理论于信息经济学领域，提出“机制设计理论”，最早由赫维克兹在1960年提出，并由马斯金和梅尔森进一步发展，他们的研究有助解释经济交易时的机制和决策过程。该理论可应用于多方面，包括劳工问题谈判、拍卖政府债券，以至最新的网上市场。2009：奥斯特罗姆(ElinorOstrom)、威廉姆森(OliverE.Williamson）奥斯特罗姆在分析公共资源管理问题时发现，资源使用者常能针对各类利益冲突开发复杂的决策和执行机制。她在研究中归纳出良好机制所具备的特征。威廉姆森则对市场和以垂直权力架构为特征的企业展开研究，发现这两种治理结构在化解利益冲突时具有不同特征，也各有缺陷。中国浦东干部学院博弈论导论标准式博弈与扩展式博弈:矩阵树形非合作博弈与合作博弈：个体理性与集体理性的不同静态博弈与动态博弈:参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取什么行动;参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动一次博弈与重复博弈:基本博弈只进行一次;基本博弈重复进行，包括有限重复和无限重复中国浦东干部学院博弈论导论博弈论的精髓在于基于系统思维基础上的理性换位思考，即在选择你的行动时还是考虑你的得益，但是你应当用他人的得益去推测他人的行动，从而选择最有利于自己的行动。中国浦东干部学院博弈策略的案例•“上面出政策，下面出票子”的现象•股权分置改革•农信社改革的注资博弈•华为公司与劳动合同法•阿提哥油轮油污损害赔偿案vs中石油漏油事件•《船舶油污损害赔偿基金征收和使用管理办法》，每吨持久性油征收0.3元的摊款标准？•全球第一能源消费国？（22.52：21.7：21.32）•住宅销售价格统计调查方案（企业自行填报VS网签数据）•全国GDPvs地方GDP•沈阳三甲医院打击医闹的新招中国浦东干部学院基本框架静态博弈重复博弈动态博弈博弈论导论合作博弈非合作博弈中国浦东干部学院•囚徒困境策略囚徒B囚徒A坦白拒不交待坦白拒不交待无期，无期死刑，释放释放，死刑一年，一年中国浦东干部学院•囚徒困境囚徒困境对古典经济学的冲击策略囚徒B囚徒A坦白拒不交待坦白拒不交待无期，无期死刑，释放释放，死刑一年，一年纳什均衡中国浦东干部学院•军备竞赛•招商引资的政策博弈•宏观调控的“黄灯”效应•应试教育与素质教育中国浦东干部学院•哈丁公用地的悲剧设想一个向全体公众开放的牧场。不难预计，每一个放牧者一定希望在这片公用土地饲养尽可能多的牲畜……这就是悲剧所在－－加利福尼亚生物学家加勒特·哈丁（GarrettHarding）•太湖蓝藻现象、过度捕捞、不可再生资源的消耗问题•廷·巴特尔战风沙、建绿洲、保生态的事迹•公用秘书的故事•朋友之间AA制•公共产品的供给中国浦东干部学院•智猪博弈猪圈中有一头大猪一头小猪，猪圈一端有个按钮，每按一下猪圈另一端食槽中会有10个单位猪食进槽，但按一下会耗去相当于2单位猪食的成本。如果大猪先到食槽，大猪吃到9单位食物，小猪只能吃到1单位；如小猪先到，小猪吃4单位而大猪吃6单位；如果同时按并同时到食槽，则大猪吃7单位而小猪吃3单位食物。策略按等待按5，14，4等待9，-10，0小猪大猪中国浦东干部学院•智猪博弈猪圈中有一头大猪一头小猪，猪圈一端有个按钮，每按一下猪圈另一端食槽中会有10个单位猪食进槽，但按一下会耗去相当于2单位猪食的成本。如果大猪先到食槽，大猪吃到9单位食物，小猪只能吃到1单位；如小猪先到，小猪吃4单位而大猪吃6单位；如果同时按并同时到食槽，则大猪吃7单位而小猪吃3单位食物。策略按等待按5，14，4等待9，-10，0小猪大猪纳什均衡中国浦东干部学院尽管大家同乘一条船，可一些人是划船，另一些人只是坐船。——［瑞士］阿尔弗雷德·莫勒尔（AlfredMohler）《玩世箴言》中国浦东干部学院策略提示•处于强势的参与者为维护自己利益采取某种决策时，为其他弱势参与者提供了搭便车的机会•改革与制度锁定•股市中的机构大户与散户•新产品研发与中小企业•小酒馆紧靠大酒店的广告便车•员工的搭便车（先进员工vs懈怠员工）•大智若愚中的智慧•贫困县的教育拨款中国浦东干部学院中国浦东干部学院博弈思维与策略行为课间休息陈元志中国浦东干部学院教研部中国浦东干部学院•关于混合策略的博弈－－大规模协调博弈的案例据美国《侨报》报道，2010年5月16日晚，赴美仅两个月的23岁中国女留学生姚宇在皇后区法拉盛繁忙街区被一名墨西哥裔男子施暴，并被一根金属管狠狠敲打头部至脑死亡。监控录像显示，该女生在遇袭时，一旁有人围观、路过，但无人援手相救。该女生在18日被宣告脑死后，21日征得家人的同意拔除呼吸管，正式宣告死亡。据了解，报住艾姆赫斯特92街与35大道的克鲁斯为墨西哥裔非法移民，平时在各工地打杂维持生计，无正当职业，也无犯罪前科。闹市受残害路人视而不见，姚宇案折射冷漠心态中国浦东干部学院•关于混合策略的博弈－－大规模协调博弈的案例吉诺维斯谋杀案－－市民责任的博弈1964年纽约市（皇后区的Kew花园），一个叫吉诺维斯的妇女被歹徒杀害，残忍的袭击持续了半个多小时，她一直在尖叫，很多人听到了她的尖叫，超过30人在命案现场，但没有人帮助她，也没有人报警。李四张三纳什均衡旁观报警旁观0，010，7报警7，107，7•中国女留学生中国浦东干部学院基本框架静态博弈重复博弈动态博弈博弈论导论合作博弈非合作博弈中国浦东干部学院重复博弈--广告博弈•博弈的参与者是：凯洛格和通用面粉•策略是广告活动•博弈的类型有：（1）静态博弈（同步一次博弈）（2）无限重复博弈（3）有限重复博弈中国浦东干部学院一次广告博弈通用面粉凯洛格策略无广告中等强度高强度无广告12，121，20-1，15中等强度20，16，60，9高强度15，-19，02，2中国浦东干部学院一次广告博弈的均衡纳什均衡通用面粉凯洛格策略无广告中等强度高强度无广告12，121，20-1，15中等强度20，16，60，9高强度15，-19，02，2劣策略：不管其他参与人采取什么策略，都能导致最低收益的策略理性参与人永远不会选择劣策略许多博弈中参与者都没有占优策略，但仍可能通过劣策略的重复剔除进行分析，这种方法称劣策略重复剔除法中国浦东干部学院如果企业每年都进行这种一次博弈，并且永远进行下去，这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下，共谋起作用吗？•密歇根大学爱克斯罗德教授的计算机模拟他首先邀请全世界的学者递交自认为最优的策略程序，然后将这些策略相互之间交替进行不特定次数的“重复囚徒博弈”，根据最终排名来判定优劣。第一轮14个程序之间的竞赛结果显示，“一报还一报”的简单策略获得第一。之后，又有63位科学家递交了改进的程序，进行第二轮竞赛，其中包括多个以“一报还一报”策略为基础的改良品种。令人惊异的是，第二轮比赛的优胜者仍然是“一报还一报”。•触发策略–“如果对手在过去没有做过广告，我就不做；一旦对手作广告，自此以后，我就用高强度的广告活动来惩罚他”•事实上，只要对手在过去没有过“欺骗”行为，各个企业都会同意“合作”。因为欺骗行为会引发以后所有时期的惩罚无限重复博弈中国浦东干部学院假设通用面粉采用了这种触发策略，凯洛格的利润是多少呢?合作=12+12/(1+i)+12/(1+i)2+12/(1+i)3+…=12+12/i相当于每年年底得到￥12的永久年金欺骗=20+2/(1+i)+2/(1+i)2+2/(1+i)3+=20+2/i通用面粉凯洛格策略无广告中等强度高强度无广告12，121，20-1，15中等强度20，16，60，9高强度15，-19，02，2中国浦东干部学院凯洛格从欺骗行为中获得的好处:•欺骗-合作=20+2/i-(12+12/i)=8-10/i–假设i=.05•欺骗-合作=8-10/.05=8-200=-192•欺骗没有好处.–在无限次重复博弈中共谋是纳什均衡!通用面粉凯洛格策略无广告中等强度高强度无广告12，121，20-1，15中等强度20，16，60，9高强度15，-19，02，2中国浦东干部学院策略提示•当博弈无限重复没有确定的“终结之日”时，共谋作为纳什均衡就能够维持下去•相应条件:–有能力监督对手的行动–有惩罚叛徒的能力和名声–低利率–在未来进行博弈的机会多中国浦东干部学院共谋在现实世界中的例子•石油输出国组织•窜货（共谋合作失败的例子）中国浦东干部学院•如果博弈有限重复进行，共谋起作用吗?有限重复博弈•假设广告博弈被重复两次通用面粉凯洛格策略无广告中等强度高强度无广告12，121，20-1，15中等强度20，16，60，9高强度15，-19，02，2纳什均衡中国浦东干部学院逆向归纳法•在第二阶段，博弈是一次博弈，因此在这最后阶段，均衡是高强度的广告活动.•由于每个人都知道第二阶段的结果，因此，第一阶段就变成了最后阶段.•两个企业在两个时期的均衡策略都是高强度的广告活动.•如果博弈重复已知的有限次数，同样的结果依然成立中国浦东干部学院有限重复博弈的例子•59岁现象•虚假广告•火车站和旅游点的商贩•旅游中的零团费现象•预算基数的博弈中国浦东干部学院预算基数的博弈•机制设计的目的：实话实说•换马思维引导讲实话上级确定任务额：超额奖励；完不成受罚自报完成任务数：低报罚金；高报受损•联合确定预算基数中国浦东干部学院基本框架静态博弈重复博弈动态博弈博弈论导论合作博弈非合作博弈中国浦东干部学院基本框架静态博弈重复博弈动态博弈博弈论导论合作博弈非合作博弈中国浦东干部学院合作概念在博弈论中是重要的，然而又多少有些难以捉摸……我们需要那种不放弃博弈论的个人决策论基础的合作行为模型。——2007年诺贝尔经济学奖得主罗杰·梅尔森(RogerB.Myerson)中国浦东干部学院合作博弈--班扎夫权力指数班扎夫（John.F.Banzhaf）权利指数