第28章博弈论及其应用П第28章博弈论及其应用П•教学目的:掌握博弈的几种重要类型。•主要内容:1、协调博弈2、竞争博弈3、共存博弈4、承诺博弈5、讨价还价博弈第28章博弈论及其应用П1、协调博弈•什么是协调博弈?在协调博弈中,当参与人能够协调他们之间的策略时,他们的收益就会实现最大化。实际中的问题是要创建一种能够实现这种协调的机制。•协调博弈的例子性别战囚徒困境保证博弈(军备竞赛)懦夫博弈第28章博弈论及其应用П囚徒困境收益矩阵参与人B坦白抵赖参与人A坦白-3,-30,-6抵赖-6,0-1,-1第28章博弈论及其应用П•囚徒困境中实现协调的途径无限重复博弈;缔结合约。第28章博弈论及其应用П收益矩阵苏联不生产生产美国不生产4,41,3生产3,12,2保证博弈(军备竞赛)第28章博弈论及其应用П•保证博弈(军备竞赛)中实现协调的途径其中一方参与人先采取行动,做出可以令对手信服的保证。第28章博弈论及其应用П2、竞争博弈•什么是“竞争博弈”?又称“零和博弈”,在这种博弈中,博弈一方的收益等于另一方的损失。第28章博弈论及其应用П收益矩阵列参与人扑向左方扑向右方行参与人踢向左方50,-5080,-80踢向右方90,-9020,-20足球赛中的发点球得分此时,虽然不存在“纯策略纳什均衡”,但存在“混合策略纳什均衡”这一博弈的“混合策略纳什均衡”为:行参与人以0.7的概率选择“踢向左方”,以0.3的概率选择“踢向右方”;列参与人以0.6的概率选择“扑向左方”,以0.4的概率选择“扑向右方”。第28章博弈论及其应用П行参与人的“最优反应”qp0.60.6第28章博弈论及其应用П列参与人的“最优反应”qp0.70.7第28章博弈论及其应用Пqp0.7纳什均衡0.6第28章博弈论及其应用П3、共存博弈•鹰-鸽博弈第28章博弈论及其应用П鹰-鸽博弈列鹰派鸽派行鹰派-2,-24,0鸽派0,42,2注意,双方都采取鹰派策略或者双方都采取鸽派策略都不是均衡。因此,均衡状态下一定存在鹰派和鸽派这两种类型的某个混合比例。可以证明,存在如下“混合策略纳什均衡”:行参与人和列参与人都以50%的概率选择鹰派策略。第28章博弈论及其应用П•现在从生物学角度对上述博弈进行重新解释:假定一个动物种群中“鹰派”的比例为p;于是,一个鹰派遇见另一个鹰派的概率是p,而遇见一个鸽派的概率是1-p,所以鹰派的期望收益为H=-2p+4(1-p);同理,鸽派的期望收益为D=2(1-p);假定具有较高收益的类型的繁殖速度更快一些,而且鹰派或鸽派的倾向会遗传给后代。所以,当HD,种群中鹰派的比例将上升;如果HD,种群中鸽派的比例将上升;均衡状态下,一定有H=D,即…-2p+4(1-p)=2(1-p)第28章博弈论及其应用П•现在从生物学角度对上述博弈进行重新解释:由均衡条件可解出均衡时p=1/2;这是一个“稳定”的均衡吗?是的;这一均衡又被称为“进化稳定策略(ESS)均衡”;可以证明,ESS就是一个纳什均衡,这为纳什均衡为何如此重要提供了另一个注解。第28章博弈论及其应用ПH=-2p+4(1-p)D=2(1-p)第28章博弈论及其应用П4、承诺博弈•如果参与人行动有先后次序,那么其中一方可以通过做出“可信的”(不可撤销和可观察的)承诺、或者设法让对方做出“可信的”承诺来提高自己(甚至是双方)的收益。•举例:青蛙和蝎子绑架博弈智猪博弈储蓄和社会保障敲竹杠第28章博弈论及其应用П青蛙和蝎子青蛙选择背不背蝎子选择5,30,0蛰不蛰-10,5一只聪明的青蛙能够想出某种办法,使得蝎子做出不蛰的承诺。无论什么办法,关键是使得蝎子蜇的成本更高而不蛰时获得的奖励更多,从而改变蝎子的收益。第28章博弈论及其应用П青蛙和蝎子青蛙选择背不背蝎子选择5,30,0蛰不蛰-10,2第28章博弈论及其应用П储蓄和社会保障老年人选择挥霍储蓄3,-12,-11,0赡养不赡养年轻人选择赡养不赡养-2,-2许多国家都建立了社会保障计划,以此强迫每一代人都进行储蓄。第28章博弈论及其应用П敲竹杠承包商选择敲竹杠按实际成本要价客户选择0,-1000,1300让步找一个油漆工1300,0第28章博弈论及其应用П•怎么避免敲竹杠?缔结合同(承诺);重复博弈下的声誉机制。第28章博弈论及其应用П5、讨价还价•经典的讨价还价问题:两个参与人想分配1美元,他们应该怎么做?•两个讨价还价模型纳什讨价还价模型;鲁宾斯坦讨价还价模型。第28章博弈论及其应用П•鲁宾斯坦讨价还价模型两个参与人A和B考虑分配1美元;他们同意最多用3天时间协商分配问题;第1天,A提议一种分配方案;B决定接受还是拒绝A的方案,如果他拒绝,博弈进入第2天;第2天,B提出一个新的分配方案;A决定接受还是拒绝B的方案,如果拒绝,博弈进入第3天;第3天,A提出最终方案,如果B依然拒绝,双方都将一无所获。第28章博弈论及其应用П•鲁宾斯坦讨价还价模型假定参与人具有不同的耐性,A的贴现因子为α,B的贴现因子为β;假设如果一方在两个方案之间无差异,他将选择对方最偏好的方案;第28章博弈论及其应用П•鲁宾斯坦讨价还价模型可以证明,存在唯一的子博弈精炼纳什均衡;如果博弈持续到第3天,A会提议如下方案:自己得1,B得0;预计到上述结果后,B在第2天会提出如下方案:A得α,自己得1-α;预计到B在第2天提出的方案,A在第1天会提出如下方案:自己得1-β(1-α),B得β(1-α)。B将会接受此方案。第28章博弈论及其应用П•鲁宾斯坦讨价还价模型两个变形:(1)无限期;(2)最后通牒博弈。第28章博弈论及其应用П•无限期鲁宾斯坦讨价还价模型可以证明子博弈精炼纳什均衡为:A获得,B获得1-1-1-1-第28章博弈论及其应用П•最后通牒博弈A提出一个分配方案,如果B接受,就按照此方案进行分配;如果B不接受,双方都将一无所获。按照理论分析,A几乎得到全部(例如99美分),而B几乎得不到什么(例如只得到1美分)。但B可能非常厌恶微不足道的1美分,从而拒绝A的报价,这会使得A一无所获。考虑到这一可能性后,A会给出一个更有吸引力的报价。在大多数实验中,B的份额要比上述理论分析的结果多得多。对此,有两种可能的解释:一是社会行为准则;二是针对不公平对待采取的报复行为所带来的效用(满足)。A获得,B获得