博弈理论

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1重复博弈简介张琥经济学院2博弈的分类及对应的均衡概念静态动态完全信息纳什提出纳什均衡Selten提出精炼的子博弈完美均衡概念重复博弈与无名氏定理不完全信息Harsarnyi提出贝叶斯纳什均衡Kreps与Wilson提出序贯均衡等理论3选择硬币——动态的概念•美国某个小镇曾经出现过一件怪事:•一个成绩优异的男孩却被邻居们视为傻瓜,因为每当别人拿一枚1角硬币和5分硬币让他选的时候,他总是选5分的。•小镇上的成年人们以此为乐,常来戏弄他,让他选择。而这个男孩总是选择5分硬币,之后人们会在欢笑中得到满足。•有一个人觉得奇怪,就问他:“为什么你不拿1角钱的?难道你这么多次还分不清哪个数字更大吗??”•男孩小声回答:“假若我拿了1角钱的硬币,下次他们就不会拿钱让我选了。”•这个男孩就是美国第九任总统,威廉·哈里逊。4选择硬币(单期博弈)村民小孩逗1角5分(0,0)不逗(5,5)(-10,10)5策略组合•男孩的策略:•如果我从没有选过1角钱,那么就在有选择机会的时候选择5分钱;否则就选择1角钱。•村民的策略:•如果男孩从没有选过1角钱,那么就逗他玩;否则不跟他玩选硬币的游戏。6现实中的重复博弈•RonLuciano:NooneIworkedwithevertookadvantageofthesituation.7现实中的重复博弈相信(-1,1)裁判坦白球员不信(-2,-1)(0,-1)相信说谎不信(-2,0)8重复博弈g(t)g(t+1)g(t+2)第t期第t+1期第t+2期信息更多信息9重复博弈中的长期收益与短期收益(难点)•假设所有人贴现因子相同,那么在第t时,博弈参与者只关心从此以后各个时期的总收益,而不会关心以前的境况。所以[当期与未来收益权衡]()(1)()(1)iiivtgtvt22()()(1)(2)...()[(1)(2)...]()(1)iiiiiiiiiVtgtgtgtgtgtgtgtVt2()()()()...1iiiivtvtvtvt10思考:为什么要贴现?•1、通胀、利率等因素作怪;•2、消费者偏好使然;•3、个体存在于市场的概率。11定价问题厂商1低价高价低价高价厂商210,10100,-5050,50-50,10012定价问题厂商1低价格高价格低价格高价格厂商210,10100,-5050,50-50,100•触发策略:如果有人背离合作,则永远进行单期纳什均衡的博弈。•重复博弈中,–如果双方都采取触发策略,可以保证双方都选择高价格。1314老字号与囚徒困境15老字号与囚徒困境•全聚德是一家老字号的饭店,但是它的客户主要是游客。因此消费烤鸭实际上可以看做是一次性的短期行为。•假设每一交易时期只有一个消费者需要买烤鸭。•一个交易时期分为两个阶段进行。在第一阶段,消费者决定是否购买。如果消费者选择不购买,则博弈结束;如果选择购买,他将付给全聚德烤鸭店一笔餐费。•此后,全聚德烤鸭店的决策者有两种选择,即选择提供高质量或者低质量烤鸭。•如果要提供高质量的烤鸭,全聚德需要付出的成本为100;如果提供低质量的烤鸭,需要付出成本为50。•高质量的烤鸭对每个消费者的价值都是300,低质量的烤鸭对每个消费者的价值只有150。全聚德一只烤鸭的价格固定为200。•如果消费者选择不买,由于没有交易进行,他与全聚德烤鸭店的支付都得0。如果消费者选择购买,且全聚德选择提供高质量的烤鸭,那么消费者得到的支付是:300-200=100,全聚德得到的支付是200-100=100。•如果消费者选择购买,但全聚德选择提供低质量的烤鸭,那么消费者得到的支付是:150-200=-50,全聚德得到的支付是:200-50=150。•通过上面的分析,我们可以得到这个博弈的单期扩展形式(ExtensiveForm)。16老字号与囚徒困境(单期博弈)消费者全聚德烤鸭店购买低质量高质量(0,0)不买(100,100)(-50,150)17老字号与囚徒困境•如果历史上全聚德提供烤鸭的质量是一个公共信息,即它虽然不能被当期的消费者观察到却可以被后来的消费这观察到,那么可以得到一个均衡:•顾客的策略:如果历史上全聚德提供过低质量的烤鸭,那么就不买他家的烤鸭;否则就买。•全聚德的策略:如果历史上提供过低质量的烤鸭,就在客户购买时提供低质量烤鸭;否则在客户购买时提供高质量的烤鸭。18思考下面的策略组合是否也是纳什均衡?•顾客的策略:始终不买全聚德的烤鸭。•全聚德的策略:在客户购买时始终提供低质量的烤鸭。•重复博弈并没有剔除低效率的纳什均衡,只是创造了高效率的纳什均衡。•在这个重复博弈中,均衡有无穷多个(混合策略),但通常我们只关注最有效的均衡结果。19例子——所有混合策略的支付结果努力偷懒努力1,1-1,2偷懒2,-10,0甲乙20支付集合•乙的支付(-1,2)•(1,1)••(0,0)(2,-1)甲的支付21重复博弈重要概念之一可行支付集合(thesetoffeasiblepayoffs)。它是由所有参与者采取各种行动可以形成的所有支付组合构成的。这个集合中的很多支付形式是由单期的混合行动而不仅仅是由纯行动实现的,纯行动实现的支付只是这个集合的边界点。22你abcdA0,0-6,-1-8,05,40B-2,18,5-7,-11,20C-1,-2-7,-1-5,01,-4D-2,30-10,71,01,-2仇人23仇人abcdA0,0-6,-1-8,05,40B-2,18,5-7,-11,20C-1,-2-7,-1-5,01,-4D-2,30-10,71,01,-2你24合伙人例子:最大惩罚力度努力偷懒努力1,1-1,2偷懒2,-10,0甲乙25重复博弈重要概念之二最小最大支付(minmaxpayoff)。在单期博弈中,针对某个参与者,所有其他的参与者通过选择各自的策略,使得该参与者在选择最优反应(bestresponse)后得到的支付最小。这个值是惩罚该参与者的最大力度,因为一个理性的被惩罚者,总是有办法选择得到不小于这个值的支付。在上面的合伙例子中,两个参与人的最小最大支付都是0,也就是本例中单期博弈的纳什均衡形成的支付。26例子:重复博弈中,不可能由均衡实现的平均支付组合努力偷懒努力1,1-1,2偷懒2,-10,0(2,1)(1,1/2)23(,)2327重复博弈重要概念之三个体理性可行支付集合(thesetoffeasible,individuallyrationalpayoffs)。它是可行集合的一个子集,是由可行集合内所有严格大于最小最大支付的支付组合构成的。也就是说,该集合内的每一个向量元素的数值都严格大于相对应的最小最大支付。这样一来,理性的被惩罚者在接受惩罚时,他得到当期所得支付肯定小于他在个体理性支付集合中得到的合作性支付。因此,如果当事人有足够的耐心,为了避免未来受到惩罚,每个参与者都可能会放弃一定的当期利益,通过合作来实现个人总体利益的最大化。28支付集合•乙的支付(-1,2)•(1,1)••(0,0)(2,-1)甲的支付29无名氏定理(FolkTheorem)•在一个有限支付的博弈当中,当贴现因子足够接近于1时,即博弈参与者足够有耐心时,所有合作性的支付组合都可以由纳什均衡来实现。30无名氏定理(FolkTheorem)每个人的策略:如果没有人背离合作策略组合,那么继续合作;一旦有一个人背离合作策略组合,那么就选择各自策略,让背离者在今后每一期都得到他的最小最大值;其它情况下(如两个人或者更多人背离或者在处罚背离者过程中出现新的背离者等),则忽略不追究。iiii0i()(1)()(1)(1)maxvtgtvtgv

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功