不完全信息动态博弈(精)

yumaojie
2 ℃
2020-02-11

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第七讲不完全信息动态博弈不完全信息动态博弈(或动态贝叶斯博弈)的基本特征是参与人的行动是序贯的，有先有后，与完全信息动态博弈相比，其中的私人信息可能表现在支付函数上，也可能表现在行动的选择上。一、完美贝叶斯一纳什均衡(一)、多节点信息集和不完美信息动态博弈的表示用博弈树表示完全且完美信息的动态博弈，其中博弈树上的每个节点就是一个独立的决策节，表示参与人在该时点对此前的博弈过程有完全的了解。而在不完全信息动态博弈中，“自然”首先选择参与人的类型，相应的参与人知道自己的类型，其他参与人不知道；在自然的选择之后，参与人开始序贯行动，后行为者能观测到先行为者的行动，但无法观测到先行为者的类型，从而产生不完美信息，对此，我们在博弈树上用多节点的信息集来反映。二手车交易博弈二手车交易博弈1、二手车交易看成这样一个动态博弈先是自然(N)决定二手车的类型：好车或差车。卖主(参与人1)知道自己的类型后选择卖或不卖，若卖主选择不卖，则博弈结束；若选择卖，则轮到顾客(参与人2)决定买还是不买。顾客在轮到决策的时点上，只能观测到卖主选择了卖的行动而不知道卖主的类型是好车还是差车(即顾客不知道自然的选择是好车还是差车)。（这是不完美信息）这个交易里有两个决策节点就形成一个多节点的信息集（用椭圆圈出）。2、多节点信息集有如下特征：（1）在此信息集中的每一个节点都轮到该参与人行动，（2）当博弈的进行达到该信息集中的某个节点时，轮到行动的参与人并不知道实际到达了哪一个节点，而只知道到达了其中的某个节点的概率(先验概率或后验概率)。（二）完美贝叶斯一纳什均衡对动态博弈进行分析，可信性问题始终是一个中心问题，一个理想的均衡必须是排除了所有不可信的威胁和许诺的。在动态博弈中，行动有先后次序，后行动者可以通过观察先行动者的行动获得有关后者偏好、战略空间等方面的信息，修正自己的判断。对应于不完全信息动态博弈的均衡概念是“精炼贝叶斯均衡”。这个概念是完全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。在完全信息动态博弈中，鉴于纳什均衡本身无法排除不可信的威胁和许诺，我们加上了子博弈完美这一要求(即要求策略组合在每一个子博弈中都能构成纳什均衡)，并称这样的纳什均衡为子博弈完美纳什均衡.对于不完全信息动态博弈，由于贝叶斯纳什均衡同样未能排除不可信的威胁和许诺，我们需要对贝叶斯纳什均衡进一步强化（即加强对条件的要求），并把强化后的贝叶斯纳什均衡称为精练(完美)贝叶斯纳什均衡，简称为精练(完美)贝叶斯均衡。精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为来修正自己有关后者类型的“信念”(主观概率)．并由此选择自己的行动。精炼贝叶斯均衡是所有参与人战略和信念的一种结合，它满足如下条件：(1)给定每个人有关其他人类型的信念的情况下，他的战略选择是最优的；(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的。因此，用更为广义的后续博弈的概念来代替子博弈的概念。前面我们已经定义过的子博弈必须开始于单节点信息集，并且不能分割信息集，与之不同的是“后续博弈”是指从任何信息集（不论是单节点的还是包含多节点的）开始的动态博弈的后续部分。精练贝叶斯纳什均衡的理解在不完全信息动态博弈中，“自然”首先选择参与人的类型，参与人自己知道，其他参与人不知道；在“自然”选择之后，参与人开始行动，参与人的行动有先有后，后行动者能观测到先行动者的行动，但不能观测到先行动者的类型。因为参与人的行动是类型依存的，每个参与人的行动都传递着自己类型的某种信息，后行动者可以通过观察先行动者所选择的行动来推断其类型或修正对其类型的先验信念（概率分布），然后选择自己的最优行动。先行动者理性预测到自己的行动将被后行动者所利用，就会设法选择传递对自己有利的信息，避免传递对自己不利的信息。因此，该博弈过程的实质不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。不完全信息动态博弈的精炼贝叶斯均衡应用及分析你与张三不完全信息动态博弈黔驴之技不完全信息动态博弈市场进入不完全信息动态博弈二信号博弈1、什么是信号博弈信号博弈是一类比较简单但有着广泛应用的不完全信息动态博弈。在这种博弈中，有两个参与人，双方各自都只行动一次，后行动的参与人具有不完全信息，但他能够从先行动的参与人所采取的行动中获得部分信息，因此，先行动的参与人的行动对后行动的参与入来讲就好像是某种反应其支付函数的信号，因此，这种博弈被称为“信号博弈”，其中，先行动的参与人就被称为信号发送者，后行动的参与人被称为信号接收者。信号博弈可以划分为三类；混同策略、半分离策略和分离策略。各自的意义如下：（1）混同策略混同策略这类策略中，信号发送者在不同类型下部发出相同的信号。因而，信号接收者无法从观测到的信号中得到新的信息，也就无法对先验概率进行修正。（2）．半分离策略指信号发送者对某些类型选择特定的信号，而对另—些类型则随机地选择信号。这时，信号接收者观测到某些信号能够准确地判断出发送者的类型，而观测到另外某些信号时尽管不能完全判断出发送者的类型，但是能够据以修正自己的先验概率。（3）．分离策略指信号发送者针对不同的类型完全选择不同的信号。这类策略中，信号准确地表现类型，接收者可以通过所观测到的信号准确地判断出发送者的类型。三序贯均衡1、序贯均衡的概念是由克瑞普斯和威尔逊(1982)首先提出的。它的原理与完美贝叶斯一纳什均衡相似，也应用于动态贝叶斯博弈，但更着重强调非均衡路径上后验概率的形成，对局中人随着博弈的进行修正自己信念的方式作了更加严格的要求，认为局中人的行动必须由对行动历史的信念合理化决定。2、序贯均衡对非均衡路径上后验概率的处理是：首先假定在每个信息集上，局中人选择严格混合策略(即以严格正的概率选择每一个行动)，从而博弈到达每一个信息集的概率严格为正，这样贝叶斯公式在每一个信息集上都可以适用而不会出现后验概率任意取位的情况；然后，将均衡作为这种严格混合策略和相应后验概率的序列的极限，而能够成为这种极限的均衡就是序均衡。四颤抖手均衡1、其基本思想是：在任何一个博弈中，每一个局中人均有可能犯错误，如同一个人抓东西时因手的颤抖使其发生偏差而抓不住一样(这种均衡概念的名称即来源于此)，这样局中人在选择策略时就需要考虑到其他局中人犯错误的可能性，这样的均衡比纳什均衡概念更为合理。2、泽尔滕将非均衡事件的发生解释为局中人策略选择时的“颤抖”，当局中人发现博弈偏离均衡时，他将这一事件归结为某一个其他局中人的非蓄意错误。在发生颤抖的博弈中．局中人要针对这些颤抖作出最佳反应，从而构成了纳什均衡。当颤抖的幅度缩小时，被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖手均衡要求均衡策略不仅是对对手策略的最佳反应，而且是当对手策略发生微小(或无限小)颤抖时的最佳反应；3、缺陷：这样定义的颤抖手均衡仍然有缺陷，将它应用到动态博弈对应的策略型描述时，就会出现颤抖手均衡不是子博弈完美均衡的情况。这是由于动态博弈的策略型描述中，同一局中人在动态博弈不同阶段的错误(颤抖)具有相关性，从而不能剔除子博奔完美均衡概念所揭示的不合理的均衡。于是，在经济学上，为了排除局中人犯错误时的动态相关性，泽尔滕引人了“代理人一策略型表述”，也就是将原来的局中人作为委托人、他在不同信息集上雇佣了不同的代理人，授权后者进行决策：代理人的支付函数与委托人相同，按委托人的利益行动，但是各代理人间彼此独立行动，这样犯错误的可能性就是独立的，从们消除了颤抖的动态相关性。通过这种方法就改进了颤抖手均衡的概念，与子博弈完美均衡不再矛盾。4、颤抖手均衡与序贯均衡的关系是：颤抖手均衡一定是序贯均衡，而序贯均衡却不一定是颤抖手均衡。