第10讲合作博弈论

blueq
5 ℃
2020-04-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

决策理论与方法之：静态合作博弈合作博弈的含义•前面介绍的各种博弈模型，都是非合作博弈模型;•这些（非合作博弈）模型的一个共同特点是强调“个体理性(individualrationality)”;•合作博弈则强调群体理性(grouprationality);•群体理性的含义是：从一个群体整体角度，研究策略的选择，使得整体效用最大.•与非合作博弈相比，需要一个描述集体理性的效用函数;合作博弈•一般来说，博弈论可以分为合作博弈（cooperativegames）与非合作博弈（non-cooperativegames），现代大多经济学家谈到的博弈论往往指的是非合作博弈论，很少提到合作博弈论，甚至很多博弈论教材也未曾提到合作博弈。实际上，合作博弈的出现和研究比非合作博弈要早，早在1881年，Edgeworth在他的《数学心理学》一书中就已经体现了合作博弈的思想。•合作博弈的运用研究主要涉及企业、城市、区域经济以及国家之间的合作等多个方面问题。•虽然这些分析所针对的合作问题类型不同，研究重点或在于阐明合作的内在逻辑，或在于揭示合作的动因，但是研究结果则有助于加强企业的相互联系、完善城市的合作模式、推动区域经济合作实践、促进国家之间的经济交往。•这里，我们首先介绍静态合作的基本概念，然后再介绍各种静态合作博弈的不同解法，包括核心（core）与稳定集（stablesets）、夏普利值（Shapleyvalue）、谈判集（negotiationsets）、内核（kernel）与核仁（nucleolus），最后再举出静态合作在现实的经济方面的各种解法的应用例子。导论先回忆一下囚徒困境的例子：在囚徒困境中，还有另外一个策略组合抵抗，抵抗，该组合为参与人带来的支付是-1,-1。由-8,-8到-1,-1，每个参与人的支付都增加了，即得到一个帕累托改进。坦白抵抗坦白-8，-80，-10抵抗-10，0-1，-1抵抗，抵抗构不成一个均衡是基于参与人的个人理性。在参与人选择抵抗的情况下，每个参与人都有动机偏离这个组合，通过投机行为谋取超额收益1。如果两个参与人在博弈之前，签署了一个协议：两个人都承诺选择抵抗，为保证承诺的实现，参与人双方向第三方支付价值大于1的保证金；如果谁违背了这个协议，则放弃保证金。有了这样一个协议，抵抗，抵抗就称为一个均衡，每个人的收益都得到改善。上述分析表明，通过一个有约束力的协议，原来不能实现的合作方案现在可以实现。这就是合作博弈与非合作博弈的区别。二者的主要区别在于人们的行为相互作用时,当事人是否达成一个具有约束力的协议。如果有,就是合作博弈；反之,则是非合作博弈。因此，博弈可以划分为合作博弈与非合作博弈。第一节合作博弈的基本概念合作博弈是指参与者能够联合达成一个具有约束力且可强制执行的协议的博弈类型。合作博弈强调的是集体理性,强调效率、公正、公平。合作博弈最重要的两个概念是联盟和分配。每个参与者从联盟中分配的收益正好是各种联盟形式的最大总收益。每个参与者从联盟中分配到的收益不小于单独经营所得收益。合作博弈的基本形式是联盟博弈,它隐含的假设是存在一个在参与者之间可以自由流动的交换媒介(如货币),每个参与者的效用与它是线性相关的。这些博弈被称为“单边支付”博弈,或可转移效用(TransferableUtility,TU)博弈。例子：自行车交易博弈非合作博弈解100，80200，010，170110，90乔伊米奇出让保留出让保留合作博弈解两人达成一致，结成联盟，从而实现双赢。每人都比非合作博弈时增加10单位的收益。100，80200，010，170110，90乔伊米奇出让保留出让保留（1）旁支付在合作博弈中，买卖双方的转让支付是与协议联系在一起的，联盟成员用支付货币的方式弥补参与者放弃单人联盟或其他联盟形式的损失，此种货币支付叫做旁支付（sidepayment）。以是否与货币联系在一起为标准，分为转移效用与不存在转移效用两类。旁支付的概念来自于赌博。上例中的合作博弈解依靠协议达成，因此各自的旁支付为110和90。（2）解集即允许旁支付的情况下，在保证每个参与者至少获得非合作博弈收益的基础上，使总收益达到最大值的所有合作博弈联盟。1501005001501005080乔伊的收益米奇的收益解集解集：在存在两种或两种以上有效配置方案时，所有的有效解的集合。可行解范围的影响因素：(1)来自其他潜在交易者的竞争压力；(2)公平性；(3)讨价还价能力。（3）可信的承诺承诺不可信→协议不能达成→非合作博弈解;承诺可信→协议能达成→联盟→合作博弈解.合作博弈的结果必须是一个帕累托改进，博弈双方的利益都有所增加，或者至少是一方的利益增加，而另一方的利益不受损害。合作博弈研究人们达成合作时如何分配合作得到的收益，即收益分配问题。合作博弈采取的是一种合作的方式，合作之所以能够增进双方的利益，就是因为合作博弈能够产生一种合作剩余。至于合作剩余在博弈各方之间如何分配，取决于博弈各方的力量对比和制度设计。因此，合作剩余的分配既是合作的结果，又是达成合作的条件。合作博弈的核心问题是参与人如何结盟以及如何重新分配结盟的得益。下面首先分析联盟的概念，与联盟相关联的是特征函数。•在1950年到1953年间，纳什发表了四篇有关博弈论的重要文献（纳什，1950a，1950b，1951，1953），文献中很清楚地对合作博弈与非合作博弈进行了界定，他所用的界定条件就是博弈者之间是否具有约束力的协议。他认为如果一个博弈当中的博弈者能够作出具有约束力的协议，那么此博弈便是一个合作博弈，反之，则称为一个非合作博弈。•根据纳什的这一界定条件，由于合作博弈中存在具有约束力的协议，因此，每位博弈者都能够按自己的利益与其他部分的博弈者组成一个小集团，彼此合作以谋求更大的总支付。我们称这些小集团为联盟（coalition），而由所有博弈者组成的联盟则称为总联盟（grandcoalition）。因此，对有n个局中人参与的博弈，即，我们称集合N的任何一个子集S为一个联盟。},,2,1{nN•定义1.1设博弈的局中人集合为，则对于任意，我们称为的一个联盟（coalition）。这里，允许取和两种特殊情况，我们把称为一个大联盟。•若，则中联盟个数为。正式的合作博弈的定义是以特征函数（characteristicfunctionform）的形式给出的，简称博弈的特征性，也称联盟型。NNS},,2,1{nNSNSnNnnnnnCCC221vN,SNSN•定义1.2给定一个有限的参与人集合，合作博弈的特征型是有序数对,其中特征函数是从到实数集的映射，即，且。•是中的联盟和博弈时S的最大效用，称为联盟S的特征函数（characteristicfunction),•表示联盟中参与人相互合作所能获得的得益（支付）。•之所以称为特征函数，是因为这个合作博弈的性质基本由决定。由此可见对合作博弈的重要性。•特征函数是研究联盟博弈的基础，确定特征函数的过程实际上就是一个建立合作博弈的过程。NvN,v}|{2NSSNNRNNRvN2:,0)(vNS)(Sv},|{SiNiiSN)(Sv)(Sv)(Sv合作博弈的特征函数例1.设有一个3人合作对策，每个参与人各有两个纯策略。当三人不合作时，其支付见下表。假设采用最稳妥策略，即最坏情况下选择最好，求合作博弈的支付函数.解：用表示一个联盟，表示联盟中参与人的个数。当＝0，自然，有。当＝1，有3个，以为例。当，则。的策略集合，策略组合。与进行如下矩阵对策：SSSSSSSS()0v2S2S1,3NS,ABNS(,),(,),(,),(,)AAABBABBNS上述矩阵对策没有纯策略，的混合策略是，的混合策略是。的均衡值是。故。同理，可以求出。当＝2，有3个，以为例。当，则。的策略集合,策略组合。与进行如下矩阵对策：S31,44NS13,0,0,44S141(2)4v(1)1,(3)1vvSS1,2S1,2S3NSS(,),(,),(,),(,)AAABBABBNS,ABSNS上述矩阵对策有纯策略，的均衡值是。故。同理，可以求出。当＝3，有1个，，最大的联盟。的策略空间。有。至此特征函数的值已全部求出。S3(1,2)3v(1,3)1,(2,3)1vvSSSSN,3AB()max2,0,4,2,2,1,3,24vN•显然，合作博弈的特征函数(characteristicfunction)是指，对于每一个联盟(coalition)S(S为N的任意一个子集)，指定一个函数v(S)，用以描述联盟S无需求助于S之外的参与人(N\S)所能得到的可传递效用的总量。•在合作博弈中，支付可能是收益，也可能是成本（负效应）。如果这总得益是可以被瓜分的，我们则称它为可转移的（transferable）；反之，则称为不可转移的（non-transferable）。合作博弈的特征函数合作对策的分类主要是根据特征函数的性质。下面根据特征函数的性质介绍几类特殊的合作对策。1.如果仅与的个数有关，则称作对称博弈。2.如果，则称作常和博弈。3.如果，则称作简单博弈。例如,在投票博弈中，每个参与人的权重，•如果，则称作凸博弈。)(SvS),(vN),(vN),(vN),(vN()()()vSvNSvN0()1SivSSN(),1iiwwQin0()1iiSiiSwQvSwQ()()()()vSvTvSTvST可传递效用(transferableutility)•为描述n人合作博弈，通常假设合作博弈具有可传递效用;•简单地说，该效用就像货币一样，可以在各参与人之间自由转让.•定义1.3一个支付可转移的联盟型博弈是由一个有限的博弈者集合和一个定义在集合的函数所组成的，而这函数对集合当中的每一个可能的非空子集都会进行赋值，其值为一个实数，我们用来表示合作博弈，而函数为每一个集合所赋的值则称为S的联盟值。•vNSvN,NNv••为了确保每位博弈者都愿意组成总联盟，合作博弈论一般要求支付可转移的联盟型博弈为有结合力的：•定义1.4一个支付可以转移的联盟型博弈是有结合力的，当且仅当，对于集合的每个分割物，即•，且，以下的关系式都成立：••vN,N},,{21mSSSjmjS1mjjSvNv1)()(•根据上述定义，我们可以得知，在一个具有结合力的支付可转移的联盟型博弈中，如果我们把总联盟分成m个不相交的小联盟，那么，这m个小联盟的得益的总数是绝不会大于总联盟的得益。由于这些博弈中的支付都是可转移的，因此，总联盟型的情况必定是帕累托最优的。N•在很多情况下，为了使得每位博弈者有更大的愿望组成总联盟，合作博弈论更会要求博弈具有可超加性或是超可加的：定义1.5在一个支付可转移的联盟型博弈中，如果对于任意的，且，有，那么，我们称该合作博弈是超可加的；如果对于任意的，且，有，那么，我们称该合作博弈是次可加的；如果对于任意的，且，有，vN,NTS2,TS)()()(TSvTvSvvN,NTS2,TS)()()(TSvTvSvvN,)()()(TSvTvSvNTS2,TS那么，我们称该合作博弈是可加的。定义1.6在合作博弈中，若对于任意的，满足以下条件：则称特征函数具有凸性，相对应的博弈称为凸博弈。从上述定义中可以看出，参与人对某个联盟的边际贡献随着联盟规模的扩大而增加。也就是说，在凸博弈中，合作是规模报酬递增的。显然，特征函数满足凸性的一定满足超可加性。特征函数的凸性表示联盟越大，新成员的实际贡献就越大。vN,vN,NTS2,)()()()(TSvTSvTvSvv上式说明，特征函数只有满足超可加性，才有形成新联盟的必要性。否则，如果一个合作博