第五章-博弈与竞争策略(苏东水)

春天秋天
2 ℃
2020-04-17

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第五章博弈与竞争策略•博弈论的基本概念•博弈的类型•竞争策略本章要求：•理解博弈论的基本概念•了解博弈的类型•了解有几种竞争策略模型第一节博弈论的基本概念一、市场竞争中的博弈•在现实经济生活中，许多产业市场是寡头断市场。寡头垄断市场是指少数几家大厂商生产一个产业中的全部或大部分产品，从而形成对一个产业的控制的产业市场。•在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略及其相互作用纳入到经济模型中，这就是一种博弈分析。•“博弈”分析实际就是“对策”分析二、现代经济学与博弈论•从现代观点看，经济学在某种意义上是研究人的决策行为的学问。•经济学中的理性人是指有一个很好定义的偏好，在面临给定的约束条件下能最大化自己偏好的人。理性的主要意思就是，从不同的备选对象集合作出的选择之间应该满足的一致性条件”。而每一次选择中，决策者对自己的各种可能的选择所导致的各种结果都有一个偏好排序，这种偏好排序体现了决策者的效用，在数学上可以表达为决策者最大化其效用函数。G＝｛P，A，S，I，U｝•价格理论有两个基本假定，即：第一，市场参与人的数量足够多，从而市场是竞争性的；第二，参与人之间不存在信息不对称问题。然而在现实生活中，这两个假设在许多情况下是不能被满足的，特别是在寡头垄断的市场上。寻求竞争与合作良性动态均衡效果的对策－博弈－始终伴随着决策者。•1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼，这是对博弈论在经济学发展中的贡献和作用的充分肯定，确立了博弈论在现代主流经济学中的地位。三、博弈论的基本概念(一)博弈论的定义博弈论（gametheory），又译为对策论，就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。实际上，博弈是一种日常现象。在经济学中，博弈论是研究当某一经济主体的决策受到其他经济主体决策的影响，同时，该经济主体的相应决策又反过来影响其他经济主体选择时的决策问题和均衡问题。•一些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。•博弈论是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。•博弈论作为分析和解决冲突和合作的工具，在管理科学、国际政治、生态学等领域得到广泛的应用。(二)博弈的组成要素一个博弈一般由以下几个要素组成：参与人、行动、信息、策略、得益、结果、均衡等。（博弈是决策者求其最大化效用函数G＝｛P，A，S，I，U｝的过程）1、参与人，又称局中人，指博弈中选择行动以自身利益最大化的决策主体（可以是个人，也可以是团体，如厂商、政府、国家）。2、行为，指参与人的决策（变量），如消费者效用最大化决策中的各种商品的购买量；厂商利润最大化决策中的产量、价格等。3、策略，又称战略，指参与人选择其行为的规制，即参与人应该在什么条件下选择什么样的行动，以保证自身利益最大化。4、信息，指参与人在博弈过程中的知识，特别是有关其他参与人（对手）的特征和行动的知识。即该参与人所掌握的其他参与人的、对其决策有影响的所有知识。5、收益，是指参与人从博弈中获得的利益水平，它是所有参与人策略或行为的函数，是每个参与人真正关心的东西，如消费者最终所获得的效用、厂商最终所获得的利润。6、结果，指博弈分析者感兴趣的要素集合。7、均衡(equilibrium)是指所有参与人的最优策略或行动的组合。这里的“均衡”是特指博弈中的均衡，一般称之谓“纳什均衡”。上述要素中，参与人、行动、结果统称为博弈规则，博弈分析的目的就是使用博弈规则来决定均衡。(三)博弈的分类1、根据参与人的多少，可将博弈分为两人博弈或多人博弈；2、根据参与人是否合作，可将博弈分为合作博弈或非合作博弈；根据博弈结果的不同，又可分为零和博弈、常和博弈与变和博弈。博弈论运用“二个囚犯，二种选择”的博弈模型从理论上深刻揭示了竞争与竞合为博弈双方带来的迥然相异的结局：•零和博弈。在这种博弈中，一方的赢必然伴随着另一方的输，不管各博弈方如何进行决策，各博弈方得益之和都为零。•常和博弈。在这种博弈中，各种结果下的各博弈方得益之和总是等于一个非零常数。与零和博弈一样，常和博弈各方的利益关系也是对立的，一方多占有一点利益，另一方必然会少占有一点。•变和博弈。即意味着在不同策略组合下各博弈方的得益之和是不同的。倘若博弈各方之间相互配合，则可能争取到总得益和个人得益均较大的理想结局；反之则社会总得益和个人得益均较小。3、从行动的先后次序来分，博弈可以分为静态博弈和动态博弈。•静态博弈指在博弈中，参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动；•动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。4、从参与人对其他参与人的各种特征信息的获得差异来分，博弈可分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息。☞将上述角度的划分结合起来，我们就得到四种不同类型的博弈，这就是：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈表5-1博弈的分类和均衡表行动次序信息静态动态完全信息纳什均衡纳什子博弈精练纳什均衡泽尔腾不完全信息贝叶斯均衡海萨尼精炼贝叶斯均衡泽尔腾等第二节博弈的种类一、完全信息静态博弈(一)完全信息静态博弈定义•所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么，且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。(二)博弈的策略式表达在博弈论中，一个博弈可以用两种不同的方式表达：一是策略式表达，又称为标准式表达，另一种是扩展式表达。•所有参与人同时选择自己的策略，所有参与人选择的策略一起决定每个参与人的得益。值得强调的是，这里参与人同时选择的是“策略”，而不是“行动”。当然在静态博弈中,由于参与人只选择一次，所以策略就等同于行动了。而在动态博弈中，策略是参与人在各个阶段的行动的全面计划。•策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。(三)博弈的得益矩阵表示•一个博弈被称为有限博弈，如果：第一，参与人的个数是有限的；第二，每个参人可选择的策略个数是有限的。两人有限博弈的策略式表达及其求解可以方便地用得益矩阵直观地给出。著名的“囚徒困境”的例子•警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判l年徒刑；如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪，则他们将被各判8年监禁，问两个罪犯会如何选择（即是坦白还是抵赖）表5-2囚徒困境囚犯B囚犯A坦白抵赖坦白-8-80-10抵赖-100-1-1(四)纳什均衡1、占优策略均衡•一般来说，由于每个参与人的得益是博弈中所有参与人的策略的函数，因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中，一个参与人的最优策略可能可以不依赖于其他参与人的策略选择•不论其他参与人选择什么策略，他的最优策略是唯一的，这样的最优策略被称为“占优策略”。•如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。•在一个博弈里，如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人会选择劣策略。所以在囚徒困境博弈里，{坦白，坦白}是占优策略均衡。•囚徒困境反映了一个深刻问题，即个人理性与团体理性的冲突。这给我们一个启示，我们学习博弈论，也许更应该研究的是怎样设计一种制度，在满足个人理性的同时，去争取达到“集体理性”2、严格劣策略的重复剔除重复剔除“严格劣策略”的思路如下：•首先找出某个参与人的严格劣策略(假定其存在)，把这个劣策略剔除掉，重新构造一个不包含已剔除策略的新的博弈；•所谓“严格劣策略”是指：在博弈中，不论其他参与人采取什么策略，某一参与人可能采取的策略中，对自己严格不利的策略。•重复这个过程，直到只剩下一个唯一的策略组合为止。•这个唯一剩下的策略组合就是这个博弈的均衡解，称为“重复剔除的占优均衡”。注意，上述表述中强调了“唯一”这个词。也就是说，如果重复剔除后剩下的策略组合不唯一，那么该博弈就不是可通过重复剔除劣策略求解的。例如，在股份公司中，股东都承担着监督经理的职能，但是，大小股东从监督中获得的收益大小不一样。在监督成本相同的情况下，大股东从监督中获得的收益明显大于小股东。•因此，小股东往往不会象大股东那样去监督经理人员，而大股东也明确无误地知道小股东会选择不监督（这是小股东的占优策略），大股东明知道小股东要搭大股东的便车，但是大股东别无选择。•大股东选择监督经理的责任、独自承担监督成本是在小股东占优选择的前提下必须选择的最优策略。3、纳什均衡•纳什均衡是完全信息静态博弈解的一般概念，构成纳什均衡的策略一定是重复剔除严格劣策略过程中（留下的）不能被剔除的策略，即没有任何一个策略严格优于纳什均衡策略。当然，逆定理是不存在的。•纳什均衡是指在均衡中，每个博弈参与人都确信，在给定其他参与人选择的策略的情况下，该参与人选择了最优策略以回应对手的策略。•占优策略均衡一定是纳什均衡纳什均衡的正式（数学）定义自己看书理解。现实生活中，有相当多的博弈，我们无法使用占优策略均衡或重复剔除的策略均衡的方法找出均衡解。例如：•在房地产开发博弈中，假定市场需求有限，Ａ、Ｂ两个开发商都想开发一定规模的房地产，但是市场对房地产的需求只能满足一个房地产的开发量，而且，每个房地产商必须一次性开发这一定规模的房地产才能获利。•在这种情况下，无论是对开发商Ａ还是开发商Ｂ，都不存在一种策略优于另一种策略，也不存在严格劣策略：如果Ａ选择开发，则Ｂ的最优策略是不开发；如果Ａ选择不开发，则Ｂ的最优策略是开发；类似地，如果Ｂ选择开发，则Ａ的最优策略是不开发；如果Ｂ选择不开发，则Ａ的最优策略是开发。(五)纳什均衡的多重性•一个博弈可能有多个纳什均衡，而具体哪个均衡会实现，纳什均衡本身不能给出回答,任何有限博弈都存在至少一个纳什均衡，若是无限博弈则不一定。二、完全信息动态博弈(一)完全信息动态博弈定义•完全信息动态博弈指的是各博弈方先后行动，后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。•在动态博弈中,策略并不简单地等于行动。•动态博弈中我们把一个参与人的一次行动称为一个“阶段”，因此一个动态博弈就会有多个甚至无限个博弈阶段。(二)博弈的扩展式表达1、博弈的策略式表达包括三个要素：参与人集合；每个与人的策略集合；由所有参与人的策略组合决定的每个参与人的得益。总结一个动态博弈的扩展式表达应包含以下要素：(1)参与人集合：I＝1，…，n；此外我们以后将用N“代表虚拟的参与人——“自然”；(2)参与人的行动顺序：谁在什么时候行动；(3)参与人的行动空间：在每次行动时，参与人有些什么行动可供选择；(4)参与人的信息集：每次行动时，参与人知道些什么；(5)参与人的得益函数：在博弈结束后，每个参与人得到些什么；(6)外生事件(即“自然”的选择)的概率分布。2、博弈树通常用“博弈树”来表述n个人有限策略动态博弈的上述全部要素。①结：结包括决策结和终点结。②枝：博弈树上，枝是从一个决策结到其直接后续结的连线，每一个枝代表参与人的一个行动选择。在每一个枝旁标注该具体行动的代号。一般地，每个决策结下有多个枝，给出每次行动时参与人的行动空间，即此时有哪些行动可供选择。③信息集：将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集。博弈的扩展模型包括五个要素：参与者、决策时点、策略空间、信息和收益函数。在简单的博弈中，扩展模型可以用博弈树表示。如上