博弈论与策略思维清华大学人文社会科学学院战略与政策研究中心执行主任刘涛雄博士、副教授2011.3大纲1、什么是博弈2、同时行动博弈3、先后行动博弈4、信息不对称和激励5、公共知识1.什么是博弈?你将如何面对以下问题:I.你是一位市长,现在你们市和国外一个城市竞争一个价值1千万的投资项目,投资者提出希望从所投资城市得到一笔200万的补贴,如果只有一个城市答应这笔补贴,投资者将只在该市投资1千万。如何两个城市都不答应这笔补贴,或者都答应这笔补贴,投资者只好在两市各投资500万元,你将是否答应给予这笔补贴?II.你和你的丈夫一直感情不错,但现在在一个问题上发生了分歧:他准备资助5万元给他父母来购买一套住房,但你坚决不同意并警告他说,如果他这样做了,你马上和他离婚。你认为你的丈夫将如何选择?III.当公司效益不好,需要降低人力成本时,你是选择开除部分雇员还是普遍减薪?IV.在你选择到清华来上培训班的时候,发现北大有一个名字完全一样的培训班,但价格便宜不少,你将选择哪一个?什么是博弈你做出一个选择所导致的结果不仅仅依赖于你的选择,同时依赖于别人的选择;同样别人选择所导致的结果不仅仅依赖于他的选择,同时依赖于你的选择。博弈的分类同时行动博弈与先后行动博弈对称信息博弈与不对称信息博弈2.同时行动博弈案例:囚徒困境两个共同作案的小偷被带进警察局,警察对他们进行单独关押审理。现有如下几种可能性:(1)如果一个抵赖(合作),另一个小偷招供(背叛),抵赖者将被重判10年,招供者无罪释放;(2)如果两人都招供则各判5年;(3)两人都抵赖,因无证据关押3个月放人;假设为一锤子买卖,如果你是小偷之一,你将如何选择?2.1囚徒困境甲乙合作背叛合作(3月,3月)(10年,0)背叛(0,10年)(5年,5年)博弈(game)中的基本要素局中人(参与人):小偷甲、乙策略(战略):抵赖(合作)、招供(背叛)回报:关押时间。一个人的收益不但取决于自己的策略而且取决于对方的策略。理性假设:局中人是理性的(追求自身收益最大化,不在意他人的收益)纳什均衡纳什均衡:给定其他人的策略,每一个人的策略都是最好的甲乙合作背叛合作(3月,3月)(10年,0)背叛(0,10年)(5年,5年)对纳什均衡的理解纳什均衡:给定其他人的策略,每一个人的策略都是最好的。自我实施:给定其他人的策略,每个人的策略都是最有利于自己的。稳定性:给定其他人的策略,没有一个人会单方面偏离自己的策略。现实最可能≠集体最优案例贷款竞争局中人:两个城市策略:补贴与否回报:如只有一个城市补贴,他得到全部投资,如两市都不补贴或都补贴,则各得到一半投资。其他为什么你觉得你的员工总喜欢偷懒?为什么你们单位的公共开支总是居高不下?为什么讨厌腐败的人或者有能力的人也送礼?策略思维原理之一:策略思维原理之一:当你在向某一种好的局面努力时,一定要反思一下,在那种局面下,是否每一个人的行为都是他所乐意的(即自我实施的,给定别人的行为)。理解集体行动的困难。个人最优并不必然带来总体最优。只要大家都努力,就会提高部门的业绩。但大家会都努力吗?很多企业常常乐意于建立很多看起来很好的制度,但是大家会遵守吗?如何建立有效的合作机制?第三方监督与惩罚(合同机制;组织机制)把一锤子买卖变成重复博弈,强化声誉机制(重复囚徒困境)触发策略:(1)开始时选择合作(2)选择合作直到有一方选择了背叛,然后永远选择背叛。针锋相对策略:(1)选择合作(2)一旦对方背叛,在下一次开始选择背叛,直到对方连续选择合作(若干次),然后重新选择合作。重复囚徒困境试验得分排在前面的程序有三个特点:第一,从不首先背叛,即“善良的”;第二,对于对方的背叛行为一定要报复,不能总是合作,即“可激怒的”;第三,不能人家一次背叛,你就没完没了地报复,以后人家只要改为合作,你也要合作,即“宽容性”。2.2斗鸡博弈(淹死,淹死)(过河,退回)(退回,过河)(退回,退回)进退进退两只公鸡分别从河的两边出发经过独木桥并在河上相遇,他们该怎么办?斗鸡博弈的关键:抢得先机,造成既成事实。案例:竞聘新岗位单位进入新的业务领域。策略思维原理之二:当退让符合后发者利益,且一旦其退让你就可以获益时,你应该先发制人。2.3智猪博弈局中人:两只猪,大猪身体强壮;小猪体格虚弱;策略:都想吃一个树上的苹果,但需要抱着苹果树使劲摇。大家选择摇或不摇。回报:大猪摇树可掉下9个苹果,小猪摇树可掉下3个。掉下来的苹果大猪抢得2/3;小猪抢得1/3;摇树的成本相当于4个苹果。大小摇不摇摇(4,0)(2,3)不摇(2,-3)(0,0)智猪博弈中要搞清楚你是搭便车的一方,还是让人搭便车的一方。如果你是搭便车的一方,搞清楚是否有人愿意开车;以及别人能否阻止你搭便车。案例:ATM机网点建设中的大银行和小银行学会搭领导的便车你是否应该成为改革创新者?家里谁打扫卫生:丈夫还是妻子炒股跟机构策略思维原理之三策略思维原理之三:当成本主要由先行者承担,且其无法阻止你搭便车时,你不妨坐享其成。例:开拓新业务:要区分是“斗鸡博弈”还是“智猪博弈”,而采取不同的策略。3.先后行动博弈家庭博弈假如你和你的丈夫一直感情不错,但现在在一个问题上发生了分歧:他准备资助5万元给他父母来购买一套住房,但你坚决不同意并警告他说,如果他这样做了,你马上和他离婚。你认为你的丈夫将如何选择?A.坚持资助父母买房B.听你的,算了。买房还是离婚?若买房即离婚不离婚买房(尽孝+家破,家破+损失5万)(尽孝,损失5万)不买房(0,0)(0,0)妻子先生两个纳什均衡买房还是离婚?妻子买房不买离婚不离(尽孝+家破,家破+损失5万)(尽孝,损失5万)(0,0)只有一个均衡:(买房,不离)因此,妻子的威胁是不值得相信的,这种威胁称之为不可置信威胁先生台湾问题动态博弈美攻打不攻介入不介入(失败,受损)(成功,0)(0,0)只有一个均衡:(进攻,不介入)中3.1不可置信威胁或承诺不可置信威胁是这样一种威胁——在某种情况下会采取某种行动:当这种情况实际发生时,该行动并不是当事人的最佳选择。(类似的承诺同样是不可置信承诺)策略思维原理之四:只害怕可信的威胁,只相信可信的承诺:案例:商业银行坏帐3.2如何使威胁或承诺变得可信?博弈论告诉你,对很多威胁或承诺应该置之不理,同时博弈论又提供了很多方法来提高威胁或承诺的可信程度:承诺行动:一个参与人可以通过减少自己的选择机会使自己收益。放弃控制权。(当情况1出现,将采取A行动;放弃对其他行动的选择权。)断绝后路项羽破釜沉舟策略思维原理之五:当年你希望别人相信你的承诺时,主动减少自己的选择机会,能使你处于更有利地位.3.3路径依赖与沉没成本在多阶段博弈中,当过去已经发生的成本对今后选择的优先顺序没有影响时,这就是沉没成本;当这些成本对今后选择的优先顺序产生影响时,你就陷入了路径依赖。案例职业发展的不同阶段,专用人力资本软件采购专用投资信用卡积分;飞机里程数积累婚恋的不同阶段,男士的不同态度。策略思维原理之六:不要让沉没成本影响你的选择;而对可能产生路径依赖的行动要早做打算。4、信息不对称与激励罪犯运输问题一七七○年,英国J库克船长带领船队来到了澳洲,随即英国政府宣布澳洲为它的领地。开发澳洲的事业开始了。谁来开发这个不毛之地呢?当地的土著居民人数不多,且尚未开化,只有靠移民。当时英国人主要向美国移民。于是,政府决定把判了刑的罪犯向澳洲运送,既解决了英国监狱人满为患的问题,又给澳洲送去了丰富的劳动力。并认为,用轮船运送罪犯的工作不应由政府包办,应由私人船主承包。但移民活动开始后,私人船主为了降低成本,船上装载人数过多,拥挤不堪,营养与卫生条件极差,死亡率高,有的船甚至高达百分之三十七。这么高的死亡率不仅经济上损失巨大,而且在道义上引起社会强烈的谴责。如何解决这个问题呢?分财产问题一对夫妻因感情不合离婚了,在婚后财产的分配上产生了争论,总觉得自己拿到的太少,你有什么办法来帮助他们公平的分配财产?激励机制的重要性人的行为是激励的结果中国农村自留地激励与博弈激励问题是一个动态博弈制订制度当事人选择行为结果局中人:制度制定者+制度接受者(委托人)(代理人)罪犯运送问题,分财产问题激励问题广泛存在于管理、制度和政策之中妇女保护政策劳动合同法信息不对称与激励激励为什么是一个问题?如果信息完全:激励机制==奖优罚劣如果信息不对称?当存在信息不对称时激励问题更为关键信息不对称:局中人拥有不同的信息。我们生活在信息不对称的世界。企业管理、家庭生活、商品市场、金融市场。信息不对称使得有效的激励变得困难,也使如何建立有效的激励机制更为重要。1.道德风险(委托代理问题)2.逆向选择案例:结婚的条件漂亮的小林追求者众多,她对男朋友说需要满足一个条件才能结婚:结婚后要努力干家务和努力工作。男朋友说:没问题,我答应。1、小林能相信她的男朋友吗?2、如果小林准备和男朋友签一个结婚合同,应如何设计合同保证小林的条件?4.1道德风险(委托代理理论)当你希望别人按照你的意愿办事时,你就变成了委托人,对方就变成了代理人。可是委托又无法对代理人的行为给予完全的监督,代理人很可能不是按照最有利于委托人的方式干活,道德风险就产生了。委托代理理论:委托人如何让代理人更加卖力地为他干活?动态博弈:委托代理理论框架报酬体系工作绩效代理人代理人委托人提出协议接受努力绩效好报酬1不努力绩效差报酬2不接受或接受其他协议报酬3把激励搞对好的激励机制应满足两个基本要求:1、自觉努力要求:代理人会自觉的选择努力工作:努力工作的所得不努力工作的所得2、参与要求:保证你所希望的代理人愿意为你工作工作的所得机会成本委托人代理人道德风险股东经理是否努力工作经理员工是否努力工作厂家代理商是否工作努力,隐藏利润保险公司投保人是否做好防盗措施银行贷款企业是否努力经营常见的激励机制错误1.报酬时间错配:当代理人的行为和绩效很容易监督时,将报酬发生的时间后移,并和代理人的行为或绩效挂钩。报酬体系工作绩效代理人代理人委托人提出协议接受努力工作绩效好报酬1不努力绩效差报酬2不接受或接受其他协议报酬32.衡量对象错配把监督重点的重点放在一个难以衡量的对象上。(努力或贡献、绩效(个人、团队、整体))衡量对象和最终目标的关系个人绩效和团队绩效3.唯结果论当努力和绩效的联系不够紧密时,过于强调绩效(结果)可会导致代理人放弃努力:绩效(努力,机遇,条件)两类工作的报酬体系设计努力和绩效的相关性强——更强调绩效报酬努力和绩效的相关性弱——更强调基本报酬4.避免“棘轮效应”(鞭打快牛)衡量方法:绝对测量、相对测量5.过度激励刺激投机和冒险行为内部紧张和冲突6.赶走被激励者策略思维原理之七:让别人努力工作的诀窍是让他意识到其实是在为自己工作,站在代理人的角度考虑,如果他的最佳选择是努力工作,激励有效,否则无效。案例:结婚的条件漂亮的小林追求者众多,她对男朋友说需要满足两个条件才能结婚:一、结婚后要努力干家务和努力工作。二、你爱的是我的内心而不是外貌。男朋友说:没问题,我答应。1、小林能相信她的男朋友吗?2、如果小林准备和男朋友签一个结婚合同,应如何设计合同保证小林的条件?协议后信息不对称:道德风险协议前信息不对称:逆向选择4.2逆向选择案例:假定你负责为单位某一岗位招聘一位员工,最后只剩下两位各方面都不错的候选人,但你无法区分哪一位能力更强,他们给你的印象差不多,唯一的区别在于,其中一位对于获得该岗位态度更加积极,另一位对工资要求更高一些,如现在你必须马上决定,你将聘用谁?逆向选择指的是这样一些情况:在缺乏关于对象的必要信息的条件下,你要做出选择;而你最想得到的东西,却往往不是最想被你得到的东西,或者说最想被你得到的却不是你最想得到的。关键问题:如何区分哪些是你所希望的?逆向选择分析框架情况1合同1合同2情况2合同1合同2被选择方选择方被选择方接受拒绝接受