第二章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四应用举例•斯坦克尔伯的寡头竞争模型•轮流出价的讨价还价模型•囚徒的救赎•旅行者困境五重复博弈第二节完全信息动态搏弈-子博弈精炼纳什均衡斯坦克尔伯的寡头竞争模型企业1企业2参与人:企业1、企业2;行动顺序:企业1先选择产量q1,企业2观测到q1,然后选择自己的产量q2。支付:利润,利润是两个企业产量的函数斯坦克尔伯的寡头竞争模型qi:第i个企业的产量C:代表单位不变成本假定逆需求函数为:第i个企业的利润函数为:企业1企业22,1),)((),(21icQPqqqii)()(21qqaQP斯坦克尔伯的寡头竞争模型用逆向归纳法求解,首先考虑给定q1的情况下,企业2的最优选择。企业2的问题是:)(),(212212cqqaqqqMax最优化一阶条件意味着:)(21)(1122cqaqSq因为企业1预测到企业2将根据S2(q1)来选择q2,企业1在第1阶段的问题是:))(())(,(111211cqSqaqqSqMax)(21*1caq)(41*2caq垄断情况下库诺特寡头竞争模型斯坦克尔伯寡头竞争模型产量A:A:B:B:总产量利润A:A:B:B:总利润)(21ca)(31ca)(31ca2)(91ca2)(91ca)(21ca)(41ca2)(81ca2)(161ca2)(41ca)(21ca2)(41ca)(32ca)(43ca2)(92ca2)(163ca斯坦克尔伯的寡头竞争模型均衡结果比较斯坦克尔伯的寡头竞争模型从上述计算可以看出:斯坦克尔伯的均衡总产量大于库诺特均衡总产量,企业1的斯坦克尔伯的均衡产量大于库诺特均衡产量,企业2的斯坦克尔伯的均衡产量小于库诺特均衡产量。同样,企业1在斯坦克尔伯博弈中的利润大于在库诺特博弈中的利润,企业2的利润却有所下降,这就是所谓的“先动优势”。若企业的战略选择是价格,则博弈具有“后动优势”。拥有信息优势可能使参与人处于劣势。企业1先行动的承诺价值:企业1之所以获得斯坦克尔伯利润而不是库诺特利润,是因为它的产品一旦生产出来就变成了一种积淀成本,无法改变,从而使企业2不得不承认它的威胁是可置信的。而假如企业1只是宣布了它将生产,企业2是不会相信它的威胁的。因为如果企业2选择斯坦伯格参量(a-c)/4,企业的最优产量是3(a-c)/8,最终唯一的纳什均衡是双方都选择库诺特产量。)(21ca宏观经济政策的动态一致性货币政策模型政府政策的动态一致性:一个政策不仅在制定阶段应该是最优的(从政府角度),而且在制定之后的执行阶段也是最优的,假设没有任何新的信息出现。动态不一致是因政府没积极性真正实施这项政策;自然国民也就不信这一政策。货币政策模型(KydlandandPrescott1977)(1)参与人:政府和私人部门;(2)博弈过程:私人部门选择预期的通货膨胀率,政府在给定预期通货膨胀率下选择实际通货膨胀率。政府面临的问题是给定私人部门通货膨胀率预期下选择货币政策:最优化上述最优化问题得政府短期最优通货膨胀率(政府的反应函数):若私人部门有理性预期即预期的通胀率等于政府的最优通胀率,则均衡通胀率:货币政策模型22(,)(),0,1..(),0eMaxMycykyckstyy*21()((1))1eckyk可理解为市场扭曲程度。*1(1)ecky政府面临的问题是给定私人部门通货膨胀率预期下选择货币政策:最优化上述最优化问题得政府短期最优通货膨胀率(政府的反应函数):若私人部门有理性预期即预期的通胀率等于政府的最优通胀率,则均衡通胀率:货币政策模型22(,)(),0,1..(),0eMaxMycykyckstyy*21()((1))1eckyk可理解为市场扭曲程度。*1(1)ecky货币政策模型由均衡通货膨胀率(S)可得政府短期效用水平:而零通胀率(P)对应政府效用:零通胀率不是一个子博弈精炼纳什均衡,因在私人部门轻信政府零通胀率情况下,政府的最优通胀率及效用水平分别是:2212(1)(1),0,0,1SMkycck*21221(0)()(1)[(1)]()efckyMckyc22(1)PMky第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四应用举例•斯坦克尔伯的寡头竞争模型•轮流出价的讨价还价模型•囚徒的救赎•旅行者困境五重复博弈轮流出价的讨价还价模型(1)分蛋糕的动态博弈(如果参与人在接受和拒绝之间无差异时假定接受。)游戏规则:第一轮由第一个参与人小鹃提出条件,第二个参与人小明可以接受,从而游戏结束,也可以不接受,则游戏进入第二轮;小明提出条件,小鹃可以接受,从而结束游戏,也可以不接受,从而进入第三轮;蛋糕融化呈线性,游戏结束,蛋糕融化……第一种情况:假设博弈只有一步,小鹃提出分配方案,如果小明同意,两个人按照约定分蛋糕,如果小明不同意,两人什么也得不到。结果会怎样?轮流出价的讨价还价模型(1)第二种情况:桌上放了一个冰淇淋蛋糕,但两轮谈判过后,蛋糕将完全融化。博弈结果如何?第三种情况:桌上的冰淇淋蛋糕在三轮谈判后将完全融化,结果又如何?第四种情况:桌上的冰淇淋蛋糕在四轮谈判后将完全融化,或者在五轮谈判、六轮……,100轮谈判后将完全融化,结果又如何?参与人1、2轮流出价分割一块蛋糕,两人获得的份额和折现率分别为如果参与人在接受和拒绝之间无差异时假定接受。轮流出价的讨价还价模型(2)1212,;,.xx1122111211.1(1)2.1.(1)12ttiixxxxtxxior参与人参与人2参与人出价(参与人2出价)若博弈次数T有限,则有下述子博弈精炼纳什均衡:子博弈精炼纳什均衡与贴现因子之间关系:轮流出价的讨价还价模型12122212112121211112121121212:1,1;0,11.3:1(1),1(1);,11;1,10.4:1(1(1(1))),1(1(1(1)));TxxxxTxxxxxxTxx1212212120,1;0,0,1;0,=0,1;1,1,3,5:1;2,4,6:0.()xxxTxTx后动优势一般来说,如果均衡结果不仅依赖于贴现因子的相对比率,而且依赖于博弈时间长度T和谁在最后阶段出价。然而这种依存关系随T的变大而变小;当T趋于无穷大时,我们得到“先动优势”:即如果唯一的均衡是定理(Rubinstein1982):在无限期轮流出价博弈中,唯一的子博弈精炼纳什均衡结果是:轮流出价的讨价还价模型01,1,2ii121(1).x**2121211()11xifx作业强盗分赃(向前展望,倒后推理)有5个强盗抢得100枚金币,在如何分赃上争论不休,于是他们决定:(1)抽签决定个人的号码(1,2,3,4,5)(2)由1号提出分配方案,然后5人表决,如果方案超过半数同意就通过,否则他被扔进大海喂鲨鱼;(3)1号死后,2号提方案,4人表决,当且仅当超过半数同意时方案通过,否则2号被扔进大海;(4)依次类推,知道找到一个每个人都接受的方案(当然,如果只剩5号,他独吞)结果会如何?作业强盗1234501001000098011970120970102逆向归纳法:第五阶段:强盗五分给自己100枚;第四阶段:强盗四需要获得五的赞同才不会被喂鲨鱼,因此他将分给五不少于100枚,此时五仍然可以否决四,让四葬身海底自己独得100枚;第三阶段:三分给四0枚,四会同意(这样不必担喂鲨鱼的风险),三自己也会同意,因此其任何方案都会被通过,因此三将分自己100枚,其他人0枚;第二阶段:二清楚地知道,要使自己的方案通过必须争取到四、五(争取三是不可能的),因此他可以分给四、五各1枚,三0枚,自己98枚;第一阶段:显然,一首先可以争取到三,给三1枚,三将投赞成票,以自己也有一张赞成票,因此只需在四、五中间再争取到一张赞成票——给四2枚或给五2枚。博弈结果:(97,0,1,2,0)或(97,0,1,0,2)如果投票在方案提供者之外的强盗间进行,结果会怎样?逆向归纳法:第五阶段:强盗五分给自己100枚;第四阶段:强盗四需要获得五的赞同才不会被喂鲨鱼,因此他将分给五不少于100枚,此时五仍然可以否决四,让四葬身海底自己独得100枚;第三阶段:只要分给五少于100枚,五必反对,则无论四赞同与否三的方案都不会通过,因此三分给五100枚。此时四为确保性命安全会投赞成票;五可赞成可反对——即三仍有性命之忧;旅行者困境-做人不要太精明哈佛大学巴罗教授:两个旅行者从一个以生产细瓷花瓶闻名的地方旅行回来,在提取行李的时候,发现花瓶被摔坏了,就向航空公司索赔。航空公司知道花瓶的价格大概八、九十元,但不知道他们购买的确切价格。因此航空公司请两位旅客在2--100元以内写出花瓶的价格,如果两个人写得一样,就按照写的数额赔偿,如果不一样,原则上按照低的价格赔偿,并认为该旅客讲了真话,奖励2元,而讲假话的罚款2元。这个博弈的最终结果将是什么?10099989796955432100100,10097,10196,10095,9994,9893,97……3,72,61,50,499101,9799,9996,10095,9994,9893,97……3,72,61,50,498100,96100,9698,9895,9994,9893,97……3,72,61,50,49799,9599,9599,9597,9794,9893,97……3,72,61,50,49698,9498,9498,9498,9496,9693,97……3,72,61,50,49597,9397,9397,9397,9397,9395,95……3,72,61,50,4…………………………………………………….…………57,37,37,37,37,37,35,52,61,50,446,26,26,26,26,26,2……6,24,41,50,435,15,15,15,15,15,1……5,15,13,30,424,04,04,04,04,04,0……4,04,04,022,典型的旅行者困境收益矩阵(仅考虑整数)乞丐酬金的困境一位富翁的狗在散步时跑丢了,于是他急匆匆到电视台发了一则启示:有狗丢失,归还者得酬金1万元,并附有狗的彩照。一个乞丐看到广告后,第二天一大早就报着狗准备去领酬金,当他经过一家大商店的墙体屏幕时,发现酬金涨到了3万元,乞丐又折回住处,把狗重新栓在那里,在接下来的几天里,乞丐从来没有离开过这只大屏幕,当酬金涨到使全市居民感到惊讶时,乞丐返回他的住处,可是那只狗已经死了。