博弈论-纳什均衡(非合作博弈均衡)

supall2001
2 ℃
2020-01-04

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

完全理性：理性指一种行为方式，它适合实现指定目标，而且在给定条件和约束的限度之内。在不同的学科领域，理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人，他具有纵向和横向方面完备的知识。在纵向方面，他可以预测未来；在横向方面，他通晓资源、交易伙伴和环境等情况。具体而言，行为人的完全理性包括以下隐含内容。(1)不存在不确定性，即使存在不确定性，也可以预知不确定性的概率分布。也就是说，对于具有完全理性的行为人来说，一切信息都是确定的。(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数)，同时行为人具有同质性以及一致性的偏好体系。(3)选择结果具有描述不变性、程序不变性和前后关系独立性。描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项，也就是说如果行为人经过再三思考，将两种描述视为同一问题的同义表达，那么它们必定导致相同的选择——即这种思考不存在异处；程序不变性要求不同方式的等价学说揭露相同的偏好次序；前后关系独立性指一项选择与其他替代方案互为独立的原则，它要求在给定Z而不提供有关X或Y的新的信息的情况下，X与Y的优先权顺序不应该依赖于Z是否有效。(4)行为人具备完备的计算和推理能力，可以像计算机一样在数秒内从事无穷尽的计算步骤，同时也不存在感性因素对选择的干扰。(5)选择意味着在各种方案或选择集中进行比较和挑选，因此完全理性的行为人可以设计出所有的被选方案，以及各项方案所产生的全部后果。(6)一个确定的报酬函数，即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。(7)确定性的结果，也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。在上述条件下，建立在完全理性假设的基础上的主流经济学的方法论，即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。行为人在选择过程中，可以遵循确定性原则、极大极小法则、边际原理以及概率法则(也就是主观期望原则)。主流经济学的选择理论建立得如此简洁和完美，使得诸多该领域的学者为之倾倒。并且，这种理论可以使我们不用站起身来实际观察人类行为，便能坐在椅子里预测它们(正确或错误的预见)。正如主流经济学的典型代表弗里德曼的著名论断所述“彻底的‘现实主义’显然无法实现；看一个理论是否‘足够’现实，只能看它就眼下意图而言，是否能做出充分好的预见，或做出比其他理论更好的预见”。主流经济学的完全理性假设致使其形成令人称赞的完美体系和预测能力，但是这种完美只是抽象上的理想模式和方法，不仅经不起经济学内部的逻辑推敲，也经不起实践和现实的考验。完全信息（CompleteInformation）完全信息（CompleteInformation），是指市场参与者拥有的对于某种经济环境状态的全部知识。在现实经济中，没有人能够拥有各个方面经济环境状态的全部知识，完全信息博弈完全信息博弈是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。关于完全信息博弈的最早结果出现在1950年代，但确切出自何人之手却无从得知，这就是所谓的“佚名定理”（theFolkTheorem）。该定理认为，重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致，这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。或者可以说，只要行为人有足够的耐心，任何满足个体理性的可行支付都可以通过一个特定的子博弈精炼均衡达到。然而，虽然所有可行的个体理性结局确实代表了合作博弈的解观点，但是它不能够提供相关信息，并且是相当模糊的。奥曼认为该理论本身没有多少新东西，他指出，完全信息的重复博弈论与人们之间相互作用的基本形式的演化是相关的。演化博弈理论（EvolutionaryGameTheory）演化博弈理论的概述：在传统博弈理论中，常常假定参与人是完全理性的，且参与人在完全信息条件下进行的，但在现实的经济生活中的参与人来讲，参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中，参与人之间是有差别的，经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。与传统博弈理论不同，演化博弈理论并不要求参与人是完全理性的，也不要求完全信息的条件。有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的，它是指人的行为只能是“意欲合理，但只能有限达到”。完全理性的人根本就不可能存在。演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上，它不同于博弈论将重点放在静态均衡和比较静态均衡上，强调的是一种动态的均衡。演化博弈理论源于生物进化论，它曾相当成功地解释了生物进化过程中的某些现象。如今，经济学家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程，也取得了令人瞩目的成绩。演化博弈论目前成为演化经济学的一个重要分析手段，并逐渐发展成一个经济学的新领域。演化博弈理论的特征:一般的演化博弈理论具有如下特征：它的研究对象是随着时间变化的某一群体，理论探索的目的是为了理解群体演化的动态过程，并解释说明为何群体将达到目前的这一状态以及如何达到。影响群体变化的因素既具有一定的随机性和扰动现象(突变)，又有通过演化过程中的选择机制而呈现出来的规律性。大部分演化博弈理论的预测或解释能力在于群体的选择过程，通常群体的选择过程具有一定的惯性，同时这个过程也潜伏着突变的动力，从而不断地产生新变种或新特征。一般的演化博弈模型的建立主要基于两个方面：选择(Selection)和突变(Mutation)。选择是指能够获得较高支付的策略在以后将被更多的参与者采用；突变是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的策略，也可能是获得较低支付的策略)。突变其实也是一种选择，但只有好的策略才能生存下来。突变是一种不断试错的过程，也是一种学习与模仿的过程，这个过程是适应性且是不断改进的。不具备这两个方面的模型不能称为演化博弈模型。比如，艾格则等(Agiza，Hegazi&Elsadany，2001)提出了一个动态演化的博弈模型，它在有限理性的企业都采取一定的行为规则(产量调整机制)下研究企业重复博弈是否可以达到纳什均衡。这个模型虽然研究的是有限理性个体和动态演化过程，但不属于演化博弈模型，因为没有包含选择和突变的过程。如果把这个模型作如下修改，便可以看作演化博弈模型：假设企业有许多不同的行为规则，而采用某些行为规则的企业比那些不采用这些行为规则的企业获益更大；随着时间的推移，采用这些行为规则的企业生存下来，而不采用这些行为规则的企业被淘汰。这样修改后的模型既有选择过程又有突变过程，便成为一个演化博弈模型。总之，演化博弈模型有如下几个特征：第一，以参与人群体为研究对象，分析动态的演化过程，解释群体为何达到以及如何达到目前的这一状态；第二，群体的演化既有选择过程也有突变过程；第三，经群体选择下来的行为具有一定的惯性。博弈论、纳什均衡(Nashequilibrium)纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。博弈论或称为赛局理论，数学的一个分支,目前在生物学，经济学，计算机科学和其他很多学科都有广泛的应用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论的创始人是冯·诺伊曼。具有竞争或对抗性质的行为成为对策行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。对策论就是研究对策行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。一个著名的例子就是囚徒困境，囚徒困境是一个非零和博弈。大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果两人均不招供，将被判刑1年；如果你招供，而对方不招供，则你将被判刑3个月，而对方将被判刑10年；如果两人均招供，将均被判刑5年。于是，两人同时陷入招供还是不招供的两难处境。两个囚犯合理的选择是招供，原本对双方都有利的策略不招供和结局被判刑１年就不会出现。这样两人都选择坦白的策略以及因此被判５年的结局被称为“纳什均衡”，也叫非合作均衡。