第五章有限理性和进化博弈本章介绍有限理性基础上的进化博弈分析。完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响,有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心,以进化稳定策略为基本均衡概念的进化博弈分析,包括基本方法、概念和各种经典模型等。5.1有限理性博弈及其分析框架问题的提出:Nash在其博士论文“Non-cooperativegames”(1950年)给出Nash均衡的两种解释,一种是完全理性的解释——均衡是通过理性的参与者进行严密的逻辑演绎推理得到的,对参与者的理性能力有较高要求。一种是基于群体行为的解释——当时没有很好的方法构建数学模型。传统博弈中的理性要求1目标理性(主观理性):参与者追求自身利益的最大化(经济学理性的内涵);2具有理性的能力:参与者具有计算推理、预见、记忆、分析判断的能力(例如:求解动态博弈均衡的递推归纳法),不会犯错误(例如:颤抖手均衡要求犯错误时仍具有稳健性);3认知理性:参与者了解博弈的结构和规则、以及理性的“共同知识”(递推归纳法的基础)、作为不完全信息博弈均衡求解基础的贝叶斯理性(参与者对不确定性事物具有事前概率分布的判断,在动态过程中进行更新的贝叶斯决策)。传统博弈的理性假设过于严格有限理性的概念:aHerbetSimon提出有限理性概念,是指:参与者具有目标的理性,但是由于面对复杂的,多元化的,不确定性的社会现实,其认知能力的有限性造成参与者在决策时只能达到满意解,即缺少理性的能力。b另一种观点:有限理性是由于Knight提出的内在的不确定性造成的,即非线性系统固有的不可预知性。有限理性博弈分析的目标a放宽参与者严格的理性要求,分析有限理性的参与者通过各种学习过程,如何达到稳定的均衡状态。b.传统博弈主要解决:Nash均衡的选择(例如子博弈Nash均衡)和多重Nash均衡的精练(例如颤抖手均衡)问题。有限理性博弈分析主要解决:针对不同条件下具体的学习过程(构建的学习模型体现了理性的不同要求)、学习调整过程中均衡的稳定性(运用稳定性理论,分析原Nash均衡是否收敛)。有限理性博弈分析的范围a.个体层次上的有限理性博弈:古诺模型—参与者根据对手的上一期行动决定当期策略选择;虚拟行动—参与者对对手行动有一个包括先验概率在内的概率分布的估计,然后最大化自己的预期收益。b.群体层次上的有限理性博弈:演化博弈理论(MaynardSmithandPrice与1973年研究生物种群系统的进化现象时提出生物系统的演化博弈基本概念)。5.1.1有限理性及其对博弈的影响有限理性博弈方:不满足完全理性假设的博弈方有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离有限理性博弈方会在博弈过程中学习,博弈通过试错寻找较好的策略5.1.2有限理性博弈分析框架有限博弈方构成的一定规模的特定群体内成员的某种反复博弈.关键是确定博弈方学习和策略调整的模式.最优反应动态:有快速学习能力的小群体成员的反复博弈及策略调整的动态机制.复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈及策略调整的动态机制.进化稳定策略(ESS)5.2最优反应动态5.2.1协调博弈的有限博弈方快速学习模型考虑5个有限博弈方相互博弈的快速学习动态调整模型:50,500,4960,6049,0A博弈方2BAB协调博弈12345反应、策略调整规则推导BtxAtxtxtxBtxtxAiiiiii时,采用;当时,采用当的得益:采用的得益:采用61/22)(61/22)(60)](2[0)(49)](2[50)(()iA0,1,2ixtti假设表示在时期博弈方的邻居中采用策略邻居的数量最优反应动态模拟:初次博弈1个AABABABABBBAAAAABAAAABAABB初次博弈相邻2个AAAAAAAABAABBBAA初次博弈相连3个ABAABAAAAAAAB所有博弈方都采用的均衡状态具有稳健性。而所有博弈方都采用的均衡状态不具有稳健性。5.2.2古诺调整过程古诺模型反应函数23231221qqqq1234………博弈方12.51.52.1251.875博弈方231.752.251.93751||||1221dqdrdqdr问题:两寡头始终假设对方产量不变最优反应动态模拟收敛条件5.3复制动态和进化稳:两人对称博弈5.3.1签协议博弈的复制动态和进化稳定策略5.3.2一般两人对称博弈复制动态和进化稳定策略5.3.3协调博弈的复制动态和进化稳定博弈5.3.4鹰鸽博弈的复制动态和进化稳定策略5.3.5蛙鸣博弈的复制动态和进化稳定策略5.3.1签协议博弈的复制动态和进化稳定策略经济活动中的各种合作都可以用签协议博弈描述。特点理性层次低,大规模群体随机配对反复博弈。1,10,00,00,0同意博弈方2不同意同意不同意2)1(00)1(00)1(1xuxuxuxxuxxxunyny假设群体中采用“同意”比例x则不同策略期望得益和平均得益为:博弈方策略类型比例动态变化是有限理性博弈分析的核心,其关键是动态变化的速度以采用“同意”策略类型博弈方的比例为例,其动态变化速度可用下列微分方程反映:3222)1()()(xxxxxxxuuxdtdxy动态微分方程的相位图dx/dtx010.5稳定状态、不动点:x*=0,x*=1进化稳定策略的检验2)1()1(000)1(101)1(nynyuuuuu2)1(000)1(10)1(ynnyuuuuu策略选择了“不同意”意”比例的博弈方偏离“同策略选择了“同意”同意”比例的博弈方偏离“不ESSxuy是进化稳定策略101不是进化稳定策略00xuuny5.3.2一般两人对称博弈复制动态和进化稳定策略一般模型a,ac,bd,db,c策略1博弈方2策略2策略1策略2一般2X2对称博弈进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置是无差异的。其中abcd可以是任何得益,根据问题设定。5.3.3演化博弈均衡的一个判断标准——演化稳定策略(EvolutionaryStableStrategy,ESS)演化稳定策略(ESS)是演化博弈的一个核心概念,其反映了均衡解的稳定性状态(另一个是模仿者动态,其反映了最常用的一种向均衡稳定状态的动态收敛过程)。ESS定义:对于非常小的正数ε,所有的σ≠σ*,。ESS等价的定义表述:条件1,对所有的σ≠σ*,,即严格Nash均衡;条件2,如果,则。))1(,())1(,(uu),(),(uu),(),(uu),(),(uu复制动态分析2121)1()1()1(uxuxudxcxubxaxu)])(1()()[1())(1(dbxcaxxxuuxxdx/dtx1x])1([)(2111uxxuuxuuxdtdx复制动态的进化规则是生物学中生物特征进化规则设x为采用策略1的比例复制动态相位图5.3.3协调博弈的复制动态和进化稳定博弈50,500,4960,6049,0策略1博弈方2策略2策略1策略2一般2*2对称博弈dx/dtx111/16复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。)])(1()()[1()(dbxcaxxxxFdtdx)1161)(1(xxx5.3.4鹰鸽博弈的复制动态和进化稳定策略,0,v,v,0鹰博弈方2鸽鹰鸽鹰鸽博弈2cv2cv2v2v复制动态方程和相位图]2)1(2)()[1()(vxcvxxxxFdtdx)61)(1(xxxdx/dtx11/65.3.5蛙鸣博弈的复制动态和进化稳定策略动物进化竞争是生物多样性、复杂性的基本机制蛙鸣博弈:P-z,P-z1-m,m-z0,0m-z,1-m鸣叫雄蛙2不鸣鸣叫不鸣蛙鸣博弈不同均衡的条件ZM11鸣叫混合策略不鸣叫m=1-P+zm=z蛙鸣博弈复制动态方程和不动点x——鸣叫雄蛙比例)])(1()1()[1(zmxmzPxxxdtdx可能的不动点:x*=0x*=1x*=(m-z)/(1-p)复制动态方程蛙鸣博弈复制动态相位图xdx/dt1(m-z)/(1-P)0dx/dtx1(m-z)/(1-P)0(m-z)/(1-P)1xdx/dt1(m-z)/(1-P)15.4复制动态和进化稳定性:两人非对称博弈5.4.1市场阻入博弈的复制动态和进化稳定策略5.4.2非对称鹰鸽博弈的进化分析5.4.1市场阻入博弈的复制动态和进化稳定策略)1()1(2)1(11)1(1)1(22)1(011111xyxuxuxuyyuyyyunene12进入不进打击不打(0,0)(2,2)(1,5)xxyuyuyuxxxuxxxunsns325)1(355)1(2555)1(022222博弈方1位置博弈群体复制动态相位图xdx/dt1y1/2xdx/dt1y1/2dx/dtx1y=1/2)21)(1(][11yxxuuxdtdxe博弈方2位置博弈群体复制动态相位图xdy/dt1x=0xdy/dt1x=0)2)(1(][22xyyuuydtdys两群体复制动态的关系和稳定性xy111/205.4.2非对称鹰鸽博弈的进化分析xyyxuxuxuyyyuyyyudede6555)1(555)1(0111010)1()1(11111xyyxuyuyuxxxuxxxudede61)1(15)1(0722)1()5(22222鹰博弈方1鸽鹰博弈方2鸽0,1v2,0v2,221vv2,221cvcv非对称鹰鸽博弈博弈方1群体复制动态相位图xdx/dt1y5/6xdx/dt1y5/6xdx/dt1y=5/6)65)(1(][11yxxuuxdtdxe非对称鹰鸽博弈博弈方2群体复制动态相位图ydy/dt1x1/6ydy/dt1x1/6ydy/dt1x=1/6)61)(1(][22xyyuuydtdye两群体复制动态关系和稳定性xY111/65/6BDCA总结和前沿研究的管窥传统博弈和演化博弈的各自适用范围:传统(古典)博弈a基本特点:假定参与者在信息收集、预期形成、后果推断和决策上是超理性的,但是这种共同预期是如何形成的未加说明。b适用范围:侧重于人类的演绎推理能力,可分析规则的人为设计(如委托-代理关系中机制设计)。演化博弈a基本特点:假定参与者理性是非常有限的,在行动上被惯例的惰性和简单模仿所驱使,但是无法保证均衡结果的收敛。b适用范围:侧重于人类以观察为基础的归纳能力,可以分析以惯例、习俗体现的规则的自发演化。演化博弈的研究现状a国外理论研究中着重于不同的具体学习过程构建模型,一般化模型、基于案例分析的模型等;b另一个方向是解决多变的演化环境下,博弈中创新行为的产生机理;c应用研究上:青木昌彦等人运用于制度(博弈规则)的自发演化分析。d国内尚处于理论介绍阶段。演化博弈运用中存在的问题1.预先规定好的要素博弈如何确定?既然大家都是有限理性,那由谁来规定要素博弈的结构和规则(是人为设计的,还是自发演化形成的)?2.现有的一些学习模型是否与现实中群体的理