博弈论ch3完全且完美信息动态博弈

兽面人心
2 ℃
2020-01-04

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

2020/1/41第三章完全且完美信息动态博弈完全－得益完美－过程动态－先后请考虑以下问题：–（1）是不是信息越多越有利？–（2）过程是否重要？–（3）动态博弈与静态博弈有哪些异同之处？–（4）人们对已经过去的博弈是更注重结果还是更注重过程？其意义何在？2020/1/42本章分六节3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论2020/1/433.1动态博弈的表示法和特点3.1.1阶段和扩展性表示3.1.2动态博弈的基本特点2020/1/443.1.1阶段和扩展性表示阶段：动态博弈中一个博弈方的一次选择行为例子：仿冒和反仿冒博弈ABBA不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒注：并不是所有的动态博弈都可以用扩展形来表示，如下棋。2020/1/453.1.2动态博弈的基本特点1.动态博弈的策略和结果策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合，构成一条路径得益对应每条路径，而不是对应每步选择、行为2、与静态博弈不同的基本特点1）策略不同。每个博弈方的策略是指在整个博弈过程中在每个阶段作出相应选择和行为的完整计划。2）结果不同。博弈的结果是指每个博弈方的策略组成的策略组合、实现博弈的路径及各个博弈方的得益。3）地位不对称6完全信息静态博弈模型的表述（回顾）图3.2市场进入的动态博弈A进入不进入进入不进入进入不进入(–1,–1)(1,0)(0,1)(0,0)BB扩展式（博弈树）B进入不进入进入不进入进入不进入(–1,–1)(1,0)(0,1)(0,0)AAB进入不进入A进入–1,–11,0不进入0,10,0标准（战略）式A先行动B先行动图3.1市场进入的静态博弈完全信息静态博弈模型的表述(等价)动态博弈的标准式表示图3.2市场进入的动态博弈A进入不进入进入不进入进入不进入(–1,–1)(1,0)(0,1)(0,0)BB扩展式（博弈树）标准（战略）式A先行动该博弈有三个纳什均衡：1.（进入，（不进入，不进入））；2.（不进入，（进入，进入））；3.（进入，（不进入，进入））。博弈的最终结局应出现哪个均衡，需要分析在三个均衡的合理性。B{进入，进入}{进入，不进入}{不进入，进入}{不进入，不进入}A进入–1,–1–1,–11,01,0不进入0,10,00,10,0『1.含有不可信的承诺』『2.含有不可信的威胁』3.合理的纳什均衡完全信息静态博弈模型的表述(等价)静态博弈的博弈树表示图3.1市场进入的静态博弈A进入不进入进入不进入进入不进入(–1,–1)(1,0)(0,1)(0,0)BB扩展式（博弈树）标准（战略）式A先行动B决策时不知道A的选择B进入不进入A进入–1,–11,0不进入0,10,0A进入不进入进入不进入进入不进入(–1,–1)(1,0)(0,1)(0,0)BB2020/1/493.2可信性和纳什均衡的问题3.2.1相机选择和策略中的可信性问题3.2.2纳什均衡的问题3.2.3逆推归纳法2020/1/4103.2可信性和纳什均衡的问题在动态博弈中，由于博弈方策略的实施是一个过程,所以过程十分重要，类似于对未来过程的了解，它本身依赖于其它博弈方的行为。那么就存在一个对其博弈方所可能采取策略的可信性问题。博弈方在博弈过程中存在着改变计划的情况,这种问题称为相机选择问题.可信性：动态博弈中先行为的博弈方是否应该相信后行为博弈方会采取某种策略或行为。后行为博弈方将来采取对先行为博弈方有利的行为为“许诺”，采取对先行方不利的行为为“威胁”。2020/1/4113.2.1相机选择和策略中的可信性问题1.开金矿博弈条件：甲去开采一价值4万元的金矿，缺1万元，乙恰好有1万元可以投资。甲向乙借1万元可以可开金矿，并“许诺”成功后与对半分成。问题：乙是否该给甲投资？（1，0）乙甲投不投分不分（2，2）（0，4）2020/1/4123.2.1相机选择和策略中的可信性问题1.开金矿博弈可能性即甲可能成功之后不与乙分钱（分当然好），则乙损失1万元。由此，乙决策的关键在于他是否相信甲的“许诺”，而结局取决于甲是否遵守他的“许诺”。接下来乙可采取一些方法以使甲尽可能兑现他的许诺－－打官司。（1，0）乙甲投不投分不分（2，2）（0，4）2020/1/4133.2.1相机选择和策略中的可信性问题1.开金矿博弈根据自身利益最大化原则，甲在轮到行为时的唯一选择是不分，而乙清楚甲的行为准则，则选择不借。对乙来讲，本博弈中甲有一个不可信的肯定不会信守的许诺。怎样使甲的许诺变为可信的呢？关键在于必须增加一些对甲行为的约束。（1，0）乙甲投不投分不分（2，2）（0，4）2020/1/4143.2.1相机选择和策略中的可信性问题2.法律保障的开金矿博弈若乙采取法律手段，即打官司保护自己的利益，则博弈进程如下图所示。（1，0）乙甲乙投不投分不分（2，2）（0，4）不打打（0，4）（1，0）2020/1/4153.2.1相机选择和策略中的可信性问题2.法律保障的开金矿博弈在本博弈中，乙的唯一选择是打官司，对甲来讲，乙打官司的威胁是可信的，是肯定会信守的，他最理智的选择就是分。即，乙的策略是在第一阶段借，如甲在第二阶段选择不分，则第三阶段选择打；甲的策略是如乙在第一阶段选择借，则他在第二阶段选择分。在双方这样的策略组合下，本博弈的路径是（借，分），双方得益为（2，2），实现有效率的理想的结果。不投乙甲乙投不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的开金矿博弈2020/1/4163.2.1相机选择和策略中的可信性问题3.法律保障不足的开金矿博弈乙甲乙打（2，2）不分分不投投（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈根据纳什均衡的定义可以判断，乙的策略是第一阶段选择“借”，若第二阶段甲选择“不分”，第三阶段选择“打”，甲的策略是第二阶段选择“分”。实际结果是：乙在第一阶段不会选择“借”，甲在第二阶段也不会选择“分”，乙在第三阶段也不会选择“打”。结果相反的原因是第三阶段的“打”是不可信的威胁。如果乙的选择打官司的得益是-1，即所谓赢了官司输了钱。即法律保障不足的开金矿博弈2020/1/417乙甲乙打（2，2）不分分不投投（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈3.2.1相机选择和策略中的可信性问题3.法律保障不足的开金矿博弈法律制度必须满足两方面的要求：一是对人们的正当权益保护力度足够大；二是对侵害他人利益者有足够的震慑作用，否则作用有限甚至完全无效。乙打官司的威胁不可信，于是甲“分”钱的许诺就不可信。最后结果乙选择“不借”2020/1/4183.2.1相机选择和策略中的可信性问题乙甲乙打（2，2）不分分不投投（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈（不可信的威胁；均衡：不借）不投乙甲乙投不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的开金矿博弈（可信的威胁；均衡：（借，分））（1，0）乙甲投不投分不分（2，2）（0，4）结论：在动态博弈中，各个博弈方的选择和博弈结果，与各个博弈方在各个阶段选择各种行为的可信程度有很大关系。2020/1/4193.2.1相机选择和策略中的可信性问题先来后到博弈在此博弈中，后进入者博弈方1要决定是否进入市场竞争，而先进入市场的博弈方2有打击和不打击两种选择。12进不进打击不打击（0，10）（－3，6）（5，5）2020/1/4203.2.1相机选择和策略中的可信性问题先来后到博弈根据利润最大化原则，博弈方2的唯一选择是无情打击对手，这时博弈方2的打击的威胁是可信的。了解博弈方2决策原则的博弈方1在第一阶段只会选择不进。该博弈的结果为（0，10），即先占领市场者独享利润。12进不进打击不打击（0，10）（－3，6）（5，5）2020/1/4213.2.1相机选择和策略中的可信性问题先来后到博弈当得益变成右图情况以后，博弈方2的打击的威胁就不再是可信的了。这样，博弈方1在第一阶段的合理选择当然只有进。博弈的结果选择路径为（进，不打击），双方得益为（5，8）。后进者信息多，但利润不如先进入者。后来者不一定总是从前者利益中分出一部分，而可能创造更大的总利益，而先进入者的损失也不一定很大。12进不进打击不打击（0，10）（－3，6）（5，8）2020/1/422第三种开金矿博弈中，（不借-不打，不分）和（借-打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题。3.2.2纳什均衡的问题乙甲乙打（2，2）不分分不借借（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈2020/1/4233.2.3逆推归纳法在动态博弈中如何求解？动态博弈的特点是：在采取某一种决策时必须对其后可能进行的子博弈有充分的了解，这样才能很好的进行博弈并得到合理的结果（基于理性和可信性，相当于对后博弈行为的合理假设）。由此，对于完全且完美信息的动态博弈其基本求解方法可由最后阶段的子博弈逆推来决定采取合适的策略－逆推归纳法。2020/1/4243.2.3逆推归纳法定义：逆推归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始，逐步向前倒推以求解动态博弈的方法。例（1，0）乙甲借不借分不分（2，2）（1，0）开金矿（信守）－逆推第一步乙借不借（2，2）（1，0）开金矿（信守）－逆推第二步2020/1/4253.2.3逆推归纳法逆推归纳法是动态博弈分析最重要、基本的方法。乙不借借（1，0）甲不分分（0，4）（2，2）乙甲乙打（2，2）不分分不借借（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈乙不借借（1，0）（0，4）2020/1/4263.2.3逆推归纳法－分金币案例：5个海盗抢到了100颗宝石，每一颗都一样的大小和价值连城。他们决定这么分：1.抽签决定自己的号码（1，2，3，4，5）2.首先，由1号提出分配方案，然后大家5人进行表决，当且仅当超过半数的人同意时，按照他的提案进行分配，否则将被扔进大海喂鲨鱼。3.如果1号死后，再由2号提出分配方案，然后大家4人进行表决，当且仅当超过半数的人同意时，按照他的提案进行分配，否则将被扔入大海喂鲨鱼。4.以次类推……条件：每个海盗都是很聪明的人，都能很理智的判断得失，从而做出选择问题：第一个海盗提出怎样的分配方案才能够使自己的收益最大化2020/1/4273.2.3逆推归纳法－分金币逆推过程：1234501002：099102：1970213：19701023：2结果:(97,0,1,0,2)2020/1/4283.3子博弈和子博弈完美纳什均衡3.3.1子博弈3.3.2子博弈完美纳什均衡2020/1/4293.3.1动态博弈中的子博弈定义：子博弈即能够自成一个博弈的某个动态博弈的从其某个阶段开始的后续阶段，它必须有一个初始信息集，且具备进行博弈所需的各种信息。（1，0）乙甲乙借不借分不分（2，2）不打打（0，4）（1，0）开金矿（信守）－－子博弈2020/1/4303.3.1动态博弈中的子博弈注意：–原博弈的初始节点开始的博弈为原博弈本身，不称它为原博弈的子博弈；–第五章将说明在不完美信息博弈中有其它的不作为子博弈的起始信息集的节点。2020/1/4313.3.2子博弈完美纳什均衡在动态博弈中由于博弈过程是逐步深入的，这一过程由每个阶段所采取的策略构成，由此引出“路径”的概念。路径：从第一阶段开始通过每阶段一个行为，最后达到博弈结束的一个终端各博弈方的行为组合。找到了路径也就找到了一个分阶段的策略组合，这一策略组