(完整版)博弈论知识点总结

佑赫hammer
1 ℃
2020-07-05

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

博弈论知识总结博弈论概述：1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设：1、决策主体是理性的，最大化自己的收益。2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别：3、博弈论与传统决策的区别：1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P,I)，其中P为市场价格，I为消费者可支配收入。2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。1、参与人集合：2、每位参与人非空的战略集Si3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn).扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素：1、参与人集合{1,2,...,}n{1,2,...,}n11(,...,,...,)niinissss2、参与人的行动顺序，即每个参与人在何时行动；3、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息；4、参与人的支付函数。比较：1、战略式博弈从本质上来讲是一种静态模型。2、扩展式博弈从本质上来讲是一种动态模型。5、博弈论分类：按决策主体的行为相互作用时，当事人能否达成一个具有约束力的协议可分为：1、合作博弈（强调团体理性、团体最优决策、效率）2、非合作博弈（强调个人理性，个人最优决策）按参与人行动先后顺序可分为：1、静态博弈：博弈中参与人同时行动，或者虽然不是同时行动，但是在行动前不知道其他参与人所选择的行动。2、动态博弈：参与人的行动有先后顺序，后行动者获得先行动者的行动信息。按参与人对信息的掌握程度可分为：1、完全信息：每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解，博弈开始时不存在不确定性因素。2、不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。按决策主体对信息的掌握程度和行动的先后顺序，博弈可以分为：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。静态动态完全信息完全信息静态博弈均衡：纳什均衡完全信息动态博弈均衡：子博弈精炼纳什均衡不完全信息不完全信息静态博弈均衡：贝叶斯纳什均衡不完全信息动态博弈均衡：精炼贝叶斯纳什均衡6、根据所学这四种博弈的特点对这四种博弈做一个对比分析：类型信息和行动特点均衡均衡类型特别均衡求解方法学过的例子性质完全信息静态博弈每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解，博弈开始时不存在不确定性因素，参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。纳什均衡纯战略纳什均衡(PNE)占优战略纳什均衡（DSE）箭头法划线法Hotelling价格竞争库诺特价格竞争多重性和存在性重复剔除的占有均衡(IFDE)不断剔除劣战略（弱劣战略的剔除顺序会影响均衡结果一般一个博弈中存在参与者有多个行动时可以先考虑能否剔除弱战略简化博弈混合战略纳什均衡(MNE)聚点均衡支付最大化法支付等值法社会福利博弈小偷－守卫博弈完全信息动态博弈在博弈开始之前参与人之间的信息不存在不确定性，但是参与人行动存在先后顺序。在完全信息动态博弈中，为了表示参与人之间的信息掌握关系，引入了信息及的概念。子博弈精炼纳什均衡子博弈精炼纳什均衡有限次重复博弈均衡与纳什均衡的唯一性有关连锁店悖论1、均衡结果是原博弈的Nash均衡；2、同时在每一个子博弈上构成Nash均衡无限次重复博弈均衡（无名氏定理）与贴现因子有关囚徒困境（冷酷战略）无限期轮流讨价还价模型一般博弈逆向归纳法求解斯坦科尔伯格寡头竞争雇主与公会之间的竞争不完全信息静态博弈在博弈开始之前参与人之间的信息存在不确定性，但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。不确定是参与人的了性的不确定性贝叶斯纳什均衡贝叶斯纳什均衡混合战略（不完全信息情况下纯战略均衡的极限）对原混合战略加入少许不确定性因素，求极限。性别战1、均衡存在性2、不确定性体现为类型的不确定性一般贝叶斯均衡Harsanyi转换机制设计不完全信息动态博弈在博弈开始前参与人之间的信息存在不确定性，同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。精炼贝叶斯纳什均衡信号传递博弈分离均衡根据所得信息修正判断概率，根据收益最大化决策信号传递博弈不完全信息重复博弈与声誉Milgrom-Roberts垄断限价模型不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。混同均衡准分离均衡二、四种博弈类型具体分述1、完全信息静态博弈1.1完全信息静态博弈特点：每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解，博弈开始时不存在不确定性因素，参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。1.2完全信静态博弈相关概念：以新产品开发博弈举例说明：参与人：参与人1和2。参与人的集合卡表示为：Γ={1,2，…n}.表示所有参与人的集合，在新产品开发博弈中为：Γ={1,2}行动：开发、不开发。Ai表示参与人行动的集合。新产品开发博弈中参与人的行动集合为A1=A2={a,b},其中a为开发，b为不开发。a={a1,a2…an}表示参与人的行动组合。新产品开发博弈中为：A={（a,a）,(a,b),(b,a),(b,b)}战略：参与人的行动规则。在博弈中的战略可以定义为从观测集到行动集的映射关系，即：Si:Xi—Ai。用Si={si}表示参与人所有战略的集合。在n人博弈中，用S=(s1,s2,s3…,sn)表示n个参与人的战略组合，它表示博弈中每个参与人采取战略si的一种博弈情形。在完全信息静态博弈中，由于不存在决策时序上的差异，所有参与人在同一决策时点即博弈开始的那一时刻决策，因此，所有参与人面临的决策情形都只有一种，所以，参与人的战略集与行动集相同。支付：是指参与人在博弈中的所得。一般情况下也是用效用函数来表示参与人在博弈中的所得。因此，参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。支付一般用ui(1,2,…,n)表示参与人i的支付(效用水平)，支付组合u=(u1,u2,…un)表示参与人在特定博弈情形下所得到的支付，其中为参与人i的支付。因此，参与人i=(i=1,2,…,n)的支付就可表示为：ui=ui(si,s-i).信息：是参与人所具有的有关博弈的所有知识，如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。在“新产品开发博弈”中，如果两个企业都知道市场需求，那么这样的博弈情形就是我们前面所提到的完全信息假设；如果两个企业中至少有一个不知道市场需求，那么这样的博弈情形就是我们前面所提到的不完全信息假设。1.3纯战略纳什均衡纯战略：参与人在给定信息下只选择一种特定（或确定性）的战略混合战略：混合战略解释了一个参与人对其他参与人所采取的行动的不确定性，它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。纯战略纳什均衡中包括：占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。1、占优均衡占优战略：参与人的最优战略si*与其他参与人的选择s-i无关。无论其他参与人选择什么战略，参与人的最优战略总是唯一的，这样的最优战略称之为“占优战略”。在n人博弈中，如果对于所有的其他参与人的选择s-i，si*都是参与人i的最优选择则称si*为参与人的占优战略。在n人博弈中，如果对所有参与人都存在占优战略si*，则占优战略组合si*=（s1*si2*,…,sn*）称为占优战略均衡。如果所有参与人都有占优战略存在，那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。2、重复剔除劣战略如果在一个博弈中，参与人不存在占优战略，但是参与人i存在两个战略，其中一个战略叫另一个战略的所得效用要大，则理性的参与人绝对不会选择战略。严格劣战略：*(,)(,)iiiiiiussuss(,)(,)iiiiiiussuss(,)(,)iiiiiiussuss(,)(,)iiiiiussuss弱劣战略：若重复剔除过程一直可持续到只剩下唯一的战略组合，则该战略组合即为重复剔除的占优均衡，此时该博弈是重复剔除战略可解。要点：再重复剔除过程中，如果每次剔除的是严格劣战略，均衡结果与剔除顺序无关；如果剔除的是弱劣战略，均衡结果可能与剔除顺序有关。3、一般Nash均衡Nash均衡是完全信息静态博弈的解的概念，在完全信息静态博弈中，构成Nash均衡的战略是不可剔除的，即不存在任何一个战略严格优于Nash均衡战略。求解纳什均衡的方法划线法、箭头法。划线法：1、考察参与人1的最优战略2、用上述方法找出参与人2的最优战略3、找出最优战略组合箭头法：1、对于每个战略组合，检查是否有参与人会偏离这个战略组合2、直至找出没有参与人会偏离的战略组合纯战略均衡反映函数：各博弈方选择的纯策略对其他博弈方纯策略的反应。1.4混合战略纳什均衡混合战略：在博弈中，对任一参与人i，设Si={Si1,…,Sik},则参与人i的一个混合战略为定义在战略集Si上的一个概率分布δi={δi1,…,δik},其中δij（j=1,…,k）表示参与人i选择战略表示参与人i选择战略Sij的概率的概率，即δij满足0≦δij≦1，其中概率之和为1。支付：混合战略的支付为各种概率下收益的加权平均。混合战略纳什均衡：在博弈中，混合战略组合δi={δ1*,…,δn*}为一个Nash均衡。当且仅当。混合战略Nash均衡的求解：1.支付最大化法；2.支付等值法；混合战略均衡反映函数：在混合策略的范畴内，博弈方的决策是选择概率分布，因此，反应函数就是一方对另一方选择的概率分布的反应。聚点均衡：在现实生活中，参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点”均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史有关。不同均衡概念之间的关系：占优均衡重复剔除劣战略均衡纯战略纳什均衡混合战略纳什均衡1.5纳什均衡的多重性与存在性存在性：每个有限战略式博弈（参与人与相应的战略集均为有限）必存在纳什均衡，这个均衡可能是纯战略纳什均衡，也可能是混合战略纳什均衡。多重性：一个博弈可能有多个均衡，博弈论并没有一个一般的理论证明，哪一个纳什均衡结果一定能出现。11{;,...,;,.