博弈论与信息经济学(GameTheoryandInformationEconomics)第2章:完全信息静态博弈Chapter2:StaticGameofCompleteInformation完全信息静态博弈静态博弈(同时行动博弈)所有参与人同时选择行动,而且只选择一次“同时”是一个信息概念,而不一定与日历上的时间一致如,罚点球时,守门员和对方射手必须同时决策在博弈中,如果参与者在不知道对手如何选择的情况下行动,该博弈就是静态的。完全信息静态博弈信息决策需要信息,但是几乎所有需要决策的场合,我们都只掌握着有限信息,这使得现实中往往是有限信息博弈。完全信息:每个参与人对其他参与人的支付函数有完全的了解。不完全信息:每个参与人对其他参与人的支付函数不完全的了解。40,50-10,00,3000,30030,80-10,1000,4000,400斗争进入者进入不进入默许在位者在位者低成本市场进入博弈若进入者知道在位者是高成本还是低成本——完全信息若进入者不知道在位者是高成本还是低成本——不完全信息进入者决定是否进入一个新的产业,在位者选择斗争或默许,但不知道在位企业的成本函数是高还是低,也不知道各种战略组合下的利润水平。在位者高成本斗争进入者进入不进入默许在位者1完全信息静态博弈囚徒困境与占优均衡智猪博弈与重复剔除的占优均衡纳什均衡多重均衡与协调纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性1囚徒困境与占优战略均衡两个小偷行窃未果被抓,隔离审讯。“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。坦白否?囚徒困境(Prisoners’Dilemma)(塔克,1950)1囚徒困境与占优战略均衡-8,-80,-10-10,0-1,-1囚徒A坦白抵赖坦白抵赖囚徒B基于收益矩阵的模型描述:参与人囚徒B的支付囚徒B的可选策略囚徒A的支付连续策略1囚徒困境与占优战略均衡离散型策略另一些博弈中,在其他博弈中,每个参与者的纯策略可以是来自一个连续范围的一个数。如厂商定价博弈中参与人只拥有有限个离散型的纯战略供其选择。如篮球比赛中的运球、过人和投篮离散型策略静态博弈通常用支付表来表示——博弈的战略式表述1囚徒困境与占优战略均衡占优战略/优势策略/上策(dominantstrategy)无论其他局中人如何行动,总是(严格地)优于其他战略的战略,称为(严格)占优战略。而被(严格地)占优的战略称为(严格)劣战略。从一方的角度看,选择“坦白”比选择“抵赖”好,无论他关于对方的选择持有何等信念。我们就说,对于囚徒而言,“坦白”的策略是一个占优策略,或者说“抵赖”的策略是一个劣策略。以不变应万变1囚徒困境与占优战略均衡参与人是理性的囚徒A应选择坦白,同样的逻辑适用于囚徒B的选择——他也应选择坦白。因而,(坦白,坦白)就是该博弈可预测的结果,也是一个均衡(甚至是唯一的)。占优均衡若所有参与人都有自己的占优战略,则由占优战略组成的战略组合为占优均衡。占优均衡并不常见,因为很多时候不存在占优战略1囚徒困境与占优战略均衡博弈双方都遵循常规智慧选择占优策略,但是这种均衡结果所产生的支付比两人合作、都选择自己的劣战略时要低。两个囚徒双双选择坦白是博弈的最坏结果“困境”囚徒困境反映了个人理性与集体理性的冲突反之,彼此达成合作是最好的“利己策略”,但合作必须符合黄金定律:“己所不欲,勿施于人”(前提是“人所不欲,勿施于我”)。囚犯两人都从利己目的出发,最终导致结果损人不利己,合作没有产生。囚徒困境是典型的非合作博弈的范例1囚徒困境与占优战略均衡现实生活中诸多的问题和现象,都是囚徒困境问题的翻版。实际上,“囚徒困境”是现实生活中许多现象的一个抽象概括,有着广泛而深刻的意义。当我们面临需要加以解析的经济现象时,首先要做的事就是看该现象的发生机制是否可归于某种已知的博弈模型。如可以,就可立即知道现象的本质和发生机制,并预测结果。如不能,则很可能为博弈论经济学做出创造性贡献。NE:(不提供,不提供)提供不提供提供不提供1,1-1,33,-10,0BA1囚徒困境与占优战略均衡公共品的理解?集体行动的障碍:个人最优选择从社会整体的角度看并不是最优的。社会最优结果是(提供,提供)——“大家的事情反而无人管”(英国历史学家麦考莱)公共品(publicgoods)的供给1囚徒困境与占优战略均衡0,0-100,8080,-100-50,-50不降价降价不降价降价BA价格战市场中常见现象,如旅游、机票、家电。中国的几个生产彩电的寡头厂商于2000年合谋成立“彩电厂家自律联盟”以求将彩电价格维持高位。彩电价格能维持高位吗?双方合作制定较高的价格,那么都可获得较高利润。但是这些联盟处于利益驱动的“囚徒困境”中,双赢成为泡影。企业之间五花八门的价格联盟总是非常短命,道理也就在于此1囚徒困境与占优战略均衡假设团队中10名员工,每人选择“努力”都要承担成本1元,同时为团队的预期产出增加2元;每人偷懒则无须付出成本,也不会增加团队预期产出。如果其他人努力,自己偷懒可以获得好处;若别人偷懒,则自己更应该偷懒,因为自己努力付出成本1元,但为团队增加的2元产出中自己得到1/10元。团队生产中的偷懒所以,无论其他人是否努力地工作,我自己的最优选择都是偷懒。——偷懒是每个人的占优战略1囚徒困境与占优战略均衡“减负”之后,家长们恐怕孩子学业荒废,纷纷请家教。给定其他孩子“减负”好耍,我家孩子在家苦读,将来考上个北大清华什么的,那些“减负”好耍的孩子只能垫底了!给定其他孩子也在家苦读,我家孩子则更需要加倍苦学了,否则不就会在将来的高考中为别人垫底了吗!于是,当每个家长都如此盘算时,孩子们却倒了霉。小学生减负政府“减负”政策:减少小学生的某些课时内容和家庭作业。但“减负”后学生反而更累了!1囚徒困境与占优战略均衡曾经威胁世界整个甚至人类的军备竞赛公共资源过度开采/公共品供给短缺大学扩招、研究生扩招、大学贷款基建年年都有的评优评先活动各种资格考试广泛盛行备受批评却日益严重的应试教育现实生活中其他囚徒困境的例子1囚徒困境与占优战略均衡如何走出囚徒困境?可信的(由第三方实施的)报复和惩罚历史上的“人质”或“通婚”方案,以克服信任问题若两囚徒是意大利黑手党成员,结果会如何?人质方案的例子:秦始皇的父亲子楚“如果每个人都相信对方不会坦白,且每个人都相信对方相信自己不会坦白,每个人都相信每个人都相信对方相信自己不会坦白……”,则合作抵赖的结果会出现。——合作的关键是相互的信任,以及相互信任的信任……——如何克服信任问题?1囚徒困境与占优战略均衡长期关系,即博弈必须重复“多次”,人们可能为了长远的将来利益而牺牲眼前利益,从而达成合作。相互忠诚的文化或者规范:“江湖义气”/部队的“同生共死”组织中团队生产面临的囚徒困境问题的轻重程度不同。——不同的企业文化组织克服囚徒困境的途径之一是企业文化电视剧《亮剑》委托-代理关系中被设计的囚徒困境1囚徒困境与占优战略均衡囚徒困境对于人们来说是糟糕的,是应当竭力避免的?在一些委托-代理关系中,故意创造出代理人之间的囚徒困境有时对委托人有好处。这样的囚徒困境反而促进效率。委托-代理关系:通常指委托人请代理人代理某件事情。其中的关键问题是二者利益不一致,并且委托人与代理人之间存在信息不对称。为此,需要设计一种制度(system)或机制(mechanism),使代理人追求自己利益的同时也最大化委托人的利益,如何设计这样的制度就是信息经济学研究的问题。经理与审计师之间可能合谋,隐瞒不良信息股东解决这一问题的一种做法是双头审计,请两位审计师进行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告问题的审计师以更多的报酬。5,5-1,66,-10,0审计师A隐瞒实报隐瞒实报审计师B如果都谎报,得奖金0,但分享贿金1万如果都诚实,则得到0如一个诚实一个谎报,则诚实者奖励0.6万,对谎报者罚款1.1万,但谎报者得到1万贿金1囚徒困境与占优战略均衡预防审计合谋—双头审计1囚徒困境与占优战略均衡假设:两供应商成本都为6元/件,报价都为10元/件。策略:如果二者报价都为10元/件或8.5元/件,则从每家订购50件;若一家报价10元/件而另一家报价8.5元/件,则从价低者订购100件。125,125250,00,250200,200供应商A8.5108.510供应商B利用囚徒困境压低供应商价格2智猪博弈与重复剔除劣战略均衡一头大猪和一只小猪生活在同一猪圈里,共用一食槽。食槽的一端有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假定按一下会掉下8个包子,而跑去按开关的猪会耗费2个包子的能量。智猪博弈(BoxedPigs)如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪吃掉7个包子,小猪只能吃到1个;若大猪按,按完后跑过来,大、小猪各吃掉4个包子;若同时按,则大猪吃5个,小猪吃3个。如果都不去按开关,就会一起饿死。2智猪博弈与重复剔除劣战略均衡3,12,47,-10,0按等小猪“按”是小猪的劣战略,理性的小猪是不会选择按。大猪知道小猪是理性的,意即知道小猪不会选择“按”小猪有占优战略——“等”但大猪无占优战略——因为大猪战略将随小猪战略改变而改变。按小猪大猪按等等按小猪3,12,47,-10,0大猪按等等按小猪2智猪博弈与重复剔除劣战略均衡2,40,03,12,40,07,-1按等按等小猪大猪小猪按等等大猪排除劣策略减少了博弈的规模,得到的“新”博弈有可能又有了其他的(对自己或对手的)劣势策略,又可以被排除。按为小猪劣战略等为大猪劣战略2智猪博弈与重复剔除劣战略均衡重复剔除严格劣战略严格劣战略:不管其他参与人如何选择,参与人从选择战略A得到的支付,严格小于选择策略B给得到的支付称策略A是相对于B的“严格劣战略”,或者称策略A严格劣于策略B称策略B是相对于策略A的“严格占优战略”,或者称策略B严格占优于策略A在求解均衡过程中,可以剔除局中人的严格劣战略以简化博弈,因为严格劣战略肯定不会被实施。2智猪博弈与重复剔除劣战略均衡“重复剔除严格劣战略”的思路首先找出博弈参与人的劣战略(dominatedstrategy)(假定存在的话),把这个劣战略剔除后,剩下的是一个不包含已剔除劣战略的新的博弈;然后再剔除这个新的博弈中的劣战略;继续这个过程,直到没有劣战略存在。如果剩下唯一的策略组合,那么该策略组合称为“重复剔除的占优均衡”2,00,10,30,11,21,0LRMUDBA知道B是理性的AU0,30,11,21,0LMDBA1,21,0LMUBAB知道A是理性的,且B知道A知道B是理性的2智猪博弈与重复剔除劣战略均衡剩下唯一的策略组合(U,M)——重复剔除的占优均衡例2智猪博弈与重复剔除劣战略均衡0,01,11,11,11UDLM2对于某些参与者而言,无论其他参与者选择什么,如果A策略至少和B策略一样好,而且至少在某些时候严格更好,就称策略A为相对于策略B的弱占优策略,或称弱占优于策略B,反之称策略B为相对于策略B的弱劣策略,或称弱劣于策略B对1而言,U不是D的严格劣战略对2而言,L不是M的严格劣战略警告:逐次剔除弱劣势策略可能去掉了某些纳什均衡。例2智猪博弈与重复剔除劣战略均衡占优战略均衡与重复剔除的占优均衡中的区别:占优均衡中,占优策略严格优于其他所有策略选择法在用重复剔除方法寻找均衡时,一个战略是占优战略或劣战略只是相对于另一个特定的战略而言,而非相对于战略空间中的其他所有战略排除法占优均衡仅要求每个参与人是理性的重复剔除则要求理性是“共同知识”对理性要求更高1,01,30,10,40,22,0左中右上下参与人2参与人1练习:用重复剔除严格劣战略求以下博弈的均衡2智猪博弈与重复剔除劣战略均衡智猪博弈背后的哲理反映生活中的搭便车现象小猪角度:自己不能努力,即使努力劳动成果也会被大猪侵占,所以最优选择是