第四章动态博弈与承诺张维迎北京大学光华管理学院动态博弈•行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做出昀优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的昀优选择?•如下棋博弈树(gametree)ABB进入不进入进入不进入进入不进入(-1,-1)(1,0)(0,1)(0,0)动态博弈中的战略•战略是一个完备的行动计划:在博弈开始之前就规定出每一个决策点上的选择,即使这个决策点实际上不会出现。•考虑老师与学生之间考试之后的一个博弈:老师先行动(判分),学生后行动(在不同分数下如何应对)。假定学生的实际成绩是不及格。战略表式下的纳什均衡及格不及格老师学生A,FF,AA,AF,F-1,1-10,-10-1,1-10,-10-10,-101,-11,-1-10,-10三个纳什均衡•(及格;A,F);(不及格;F,A);(不及格;A,A)•问题:哪一个会出现呢?不可置信的威胁(noncrediblethreat)•在(及格;A,F)和(不及格;F,A)中,学生“报复(F)”的威胁是不可信的:无论老师判“及格”还是“不及格”,“报复”不是学生的昀优选择;•事前(exante)和事后(expost):一种战略所规定的行动在事前看来是昀优的,但事后看并不是当事人的昀优选择,这种行动就不可置信,该战略就不是一个合理的战略。精炼纳什均衡(PerfectNE)•不包含不可置信的行动的战略所组成的纳什均衡被称为“精炼纳什均衡”;也就是说,不论过去发生了什么,构成精炼纳什均衡的战略,其所规定的行动在每一个决策点上都是昀优的。所以,又称为“序惯均衡”(sequentialequilibrium);•首先必须是“纳什均衡”,但并非所有纳什均衡都是合理的;只有其战略不包含不可置信行动的纳什均衡才是合理的。子博弈(subgame)•由原博弈中某个决策点(信息集)开始的部分构成一个子博弈。12323原博弈子博弈I子博弈II子博弈精炼纳什均衡•精炼纳什均衡:(1)在原博弈是一个纳什均衡;(2)在每一个子博弈上都是纳什均衡。•考试博弈:–(及格;A,F)在第二个子博弈上不构成纳什均衡;–(不及格;F,A)在第一个子博弈不构成纳什均衡;–(不及格;A,A)在所有子博弈上都构成纳什均衡。老师学生学生及格不及格报复接受报复接受(-10,-10)(-1,1)(-10,-10)(1,-1)考试博弈逆向归纳法(backwardinduction)•在有限博弈中,我们可以用逆向归纳法求解精炼纳什均衡:从昀后一个决策点开始,找出该子博弈的纳什均衡;然后再倒回到倒数第二个决策点,找出决策者的昀优决策(假定昀后一个决策者的决策是昀优的);如此一直到初始决策点,所有子博弈上的昀优选择就是精炼纳什均衡。又称“rollback”.举例121(2,0)(5,0)(4,2)(1,1)UDRLU’D’均衡路径与非均衡路径•精炼纳什均衡下所经过的决策点和昀优选择构成的路径,称为均衡路径(equilibriumpath);•其他的路径是非均衡路径(off-equilibriumpath);•均衡结果依赖于非均衡路径上的选择:1之所以一开始就选择U,是因为他预期如果选择D的话,2将选择L;而2只所以选择L,是因为她预期如果选择R的话,1将选择U’。精炼均衡与理性共识•逆向归纳的过程实际上就是重复剔除劣战略的过程,其前提是博弈规则和理性共识:每个人是理性的,每个人知道每个人是理性的,如此等等。•因此,精炼纳什均衡的合理性取决于理性共识的合理性。后面再讨论。先动优势与后动优势•在动态博弈中,行动总有先后顺序。有些博弈具有先动优势(first-moveradvantage),但有些博弈具有后动优势(second-moveradvantage).•产量竞争具有先动优势,而价格竞争可能是后动优势;•开会发言?•在不完全信息下,顺序更重要。•但有些博弈既没有先动优势,也没有后动优势,如抓阄。练习:数30博弈•数30游戏:–两个人,交替选择数字,每次只能选择一个或两个数字。–每次可以选择1-3个数字呢?不可置信威胁•精炼纳什均衡剔除了不可置信的威胁,使得我们可以更合理地对博弈中参与人行为的预测;•不可置信威胁的根源是事前昀优与事后昀优不同,导致许多帕累托效率无法实现;•劫机事件为什么会发生?•管教孩子为什么困难?•家族企业为什么难以实行制度化管理?•大企业为什么效率低?(TBTF)•研究生录取中的问题;承诺•承诺是将不可置信的威胁变成可置信的威胁的行动:威胁不仅是事前昀优的,也是事后昀优的。•承诺意味着限制自己的自由:选择少反而对自己好。•如“破釜沉舟”的故事。•围城战略。举例:如果1承诺不选择U’121(2,0)(5,0)(4,2)(1,1)UDRLU’D’承诺举例•婚姻中的承诺:彩礼、昂贵的婚礼可以理解为一种对婚姻的承诺;•订金、抵押物做为对交易的承诺;•“安营扎寨”;•固定资产投资可以作为承诺;•所有权的承诺作用;昀惠条款•生产耐用品的企业经常被“降价预期”所困扰:如果消费者预期企业将降价,他们将会等待,结果,企业只能降价。如汽车行业面临的问题;•昀惠条款可以起到承诺的作用:企业不会降价了。例子产量价格收入1234100804030100160120120假定企业一开始定价80,如果前两个消费者购买了,企业将有积极性在50的价格下向第三个顾客出售。预期到这一点,前两个顾客将不会购买。如果企业向顾客保证,任何降价的差额将返还顾客,前两个顾客将会购买。因为企业事实上不会降价了。大学改革:不升即走(up-or-out)•没有这样的制度,人才就可能得不到公正的评价;•“不升即走”是大学对教员的承诺:不会压制优秀人才。Up-or-out博弈教员学校学校努力不努力提升不提升提升不提升(4,4)(1,7)(3,3)(2,4)(4,4)(x,0)(3,3)(y,0)老制度新制度画家和政府的苦恼•名画的价值取决于数量,画家常为无法承诺而苦恼:谁相信他不会再画呢?这可能是为什么已故画家的画昀值钱。•政府也有类似的问题。政府经常缺乏承诺:给定投资者进入的情况下,多征税是昀优的;但投资者预期到这一点,将不愿意进入。•中国许多地方支付有严重的机会主义行为。•“坦白从宽,抗拒从严”面临的问题也如此。作为承诺的法律•法律改变事后的选择空间或选择成本,所以可以起到承诺的作用;•合同的承诺作用(违约的成本增加,使得遵守合同更可能是事后昀优的选择);•刑法:为什么不能商量?为什么对严重犯罪要执行死刑?•台湾问题:立法还是政府随机应变?•“法治”(ruleoflaw)是政府的承诺;有限政府(limitedgovernment)•市场要求有限政府:政府不仅要保护个人的基本权利不受其他人的侵犯,而且要把尊重这些权利作为对政府行为的限制。如果政府的自由裁量权过大,政府官员为所欲为,政府本身会受到损害;•这里的关键是:老百姓与政府之间的博弈。光荣革命与英国政府的财政•年份总收入总支出总国债•1668-16881.92.12.0•16954.16.28.4•16973.37.916.7•17206.35.654.0•177011.410.5130.6•178012.522.6167.2•179017.016.8244.002468101214161816201630164516601670168016911697主权债模型LDGLLHRP(a)P(a)政府的举债能力•假定政府借D的债务,利息率是r,贷款人对政府所能实施的昀大可信惩罚是P,那么,如果D(1+r)P(a),政府将还钱,否则政府将不还钱。所以政府的举债能力为DP(a)/(1+r)。•英国光荣革命通过制度变迁(改变a)提高了国王违约时面临的昀大可能惩罚P(a)。英国光荣革命•光荣革命前,国王可以随意单方面修改借款条款,拖延甚至拒绝支付;利用外国商人瓦解债权人之间的联盟。所以债权人不愿意向政府贷款;•光荣革命后:决定国债的权力在议会,议会主要由潜在债权人组成,可以推翻国王;BANKOFENGLAND统一协调债权的行动,因为对通过优先权的规定限制了政府“离间”债权人的可能。违约的惩罚变大了,政府举债的能力提高了。逆向归纳的问题:ABBDUDUDU(2,-1)(1,2)(4,1)(3,4)(6,3)ADUCounterfactualProblem•犯错误的可能(tremblinghand);•参与人是非理性的(automationassumption);•假装非理性;•理性非共识人们为什么会受骗?•如房地产;•政治运动;Theultimatumgame•两人之间分配一笔钱,其中一个人提出方案,另一个人可以接受,也可以拒绝;如果接受,每人得到方案规定的份额;如果拒绝,没有人得到任何东西。•什么是这个博弈的精练纳什均衡?•实验结果:1.同班同学总数给对方昀低接受104.93.3910048.1735.641000463.08363.45100004537.433595.132.北京大学同学总数给对方昀低接受104.573.7410043.2637.721000409.26370.17100003880.783539.683.陌生人总数给对方昀低接受104.094.0510035.4135.041000343.11342.67100003134.373127.78