第五章有限理性和进化博弈完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响.有限理性(boundedrationality)的概念最初是阿罗提出.一是环境是复杂的,在非个人交换形式中,人们面临的是一个复杂的、不确定的世界,而且交易越多,不确定性就越大,信息也就越不完全;二是人对环境的计算能力和认识能力是有限的,人不可能无所不知;20世纪40年代,西蒙详尽而深刻地指出了新古典经济学理论的不现实之处,分析了它的两个致命弱点:(1)假定目前状况与未来变化具有必然的一致性;(2)假定全部可供选择的“备选方案”和“策略”的可能结果都是已知的。而事实上这些都是不可能的。西蒙的分析结论使整个新古典经济学理论和管理学理论失去了存在的基础。西蒙指出传统经济理论假定了一种“经济人”。他们具有一个很有条理的、稳定的偏好体系,并拥有很强的计算能力,靠此能计算出在他们的备选行动方案中,哪个可以达到尺寸上的最高点。西蒙认为人们在决定过程中寻找的并非是“最大”或“最优”的标准,而只是“满意”的标准。本章分四节5.1有限理性博弈及其分析框架5.2最优反应动态5.3复制动态和进化稳定性:两人对称博弈5.4复制动态和进化稳定性:两人非对称博弈5.1有限理性博弈及其分析框架5.1.1有限理性及其对博弈的影响5.1.2有限理性博弈分析框架5.1.1有限理性及其对博弈的影响有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离有限理性博弈方会在博弈过程中学习博弈通过试错寻找较好的策略5.1.2有限理性博弈分析框架最优反应动态:有快速学习能力的小群体成员的反复博弈复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈进化稳定策略(ESS)5.2最优反应动态5.2.1协调博弈的有限博弈方快速学习模型5.2.2古诺调整过程5.2.1协调博弈的有限博弈方快速学习模型模型:50,500,4960,6049,0A博弈方2BAB协调博弈12345反应、策略调整规则推导()A()0,1,22()B()50[2()]49()0[2()]60()22/611()22/611iiiiiiiiixttixtxttiAxtxtBxtxtxtitAxtitB时刻博弈方的邻居中采用策略的数量,时刻博弈方的邻居中采用策略的数量,采用的得益:采用的得益:当时,博弈方在时刻采用;当时,博弈方在时刻采用最优反应动态模拟:初次博弈1个AABABABABBBAAAAABAAAABAABB初次博弈相邻2个AAAAAAAABAABBBAA初次博弈相连3个ABAABAAAAAA5.2.2古诺调整过程古诺模型反应函数21123232qqqq1234………博弈方12.51.52.1251.875博弈方231.752.251.93751||||1221dqdrdqdr问题:两寡头始终假设对方产量不变最优反应动态模拟收敛条件5.3复制动态和进化稳定性:两人对称博弈5.3.1签协议博弈的复制动态和进化稳定策略5.3.2一般两人对称博弈复制动态和进化稳定策略5.3.3协调博弈的复制动态和进化稳定博弈经济学与生物学经济学和生物学的历史从来就交织在一起。二者研究的都是个体在给定环境下的最优策略。它们包含的内在逻辑相当一致:所有生命体的行为看上去总好像设法使其基因的遗传频率最大化,正如企业最大化其利润一样。经济学与生物学经济学生物学企业物种(或个体)最优化适应策略基因利润适应性(fitness)扩张繁殖倒闭灭绝创新变异自然界中的博弈吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个体偶尔会空腹而归,此时吸饱血的个体就会吐出胃内的血液喂给饥饿的个体,尽管它们之间并没有直接血缘关系。吸血蝙蝠更有可能回吐血液给以前曾经回吐过血液的蝙蝠,而骗子(拒绝分享的蝙蝠)将被蝙蝠群体记住,并且被排除在这种协作之外。自然界中的博弈白色念珠菌(Moniliaalbican或canidiaAlbicans),是一种真菌,通常存在于正常人口腔和消化道粘膜中,一般在正常机体中数量少,不引起疾病。当机体免疫功能或一般防御力下降,则本菌大量繁殖并改变生长形式(芽生菌丝相)侵入细胞引起疾病。演化博弈论(evolutionarystablestrategy)整合了理性经济学与演化生物学的思想,不再将参与人模型化为超级理性的博弈方,认为参与人通常是通过试错的方法达到博弈均衡的,与生物演化具有共性。在演化博弈中,认为参与人的选择行为可以依据前人的经验、学习与模仿他人行为、受遗传因素的决定等。因而演化博弈把具有主观选择行为的参与人扩展为包括动物、植物在内的有机体,动植物参与者的支付可被理解为为某种适应程度。把博弈论的分析与应用从研究人类的竞争行为扩展为研究有机体的策略互动关系。这个领域的开创性工作是由英国生物学家约翰·梅纳德·史密斯(JohnMaynardSmith)和G.R.普莱斯(G.R.Price)1973年进行的。演化博弈现在正逐渐被广泛应用于社会经济学领域。演化博弈的关注内容演化博弈强调经济变迁过程中以个体多样性变异机制和偏好选择机制为代表的种群研究。它探讨种群选择的策略是否获得最佳的收益,并消除任何小的突变群体的扰动。一个例子:对称博弈演化博弈首先假定群体中的参与人都是完全相同的(对称博弈)。其次,假定每个参与人只能机械地选择某种策略(而无法改变自己的策略)。如果某种策略获得了成功,采用这种策略的参与人将越来越多,反之如果某种策略不成功,采用这种策略的参与人就越来越少。演化稳定策略(ESS)演化稳定策略,是指如果占群体绝大多数的个体选择演化稳定策略,那么小的突变者群体就不可能侵入到这个群体。或者说,在自然选择压力下,突变者要么改变策略而选择演化稳定策略,要么退出系统而在进化过程中消失。例1:囚徒困境博弈CDC2,20,3D3,01,1C代表合作,D代表背叛。合作是否是一种演化稳定策略?分析:CDC2,20,3D3,01,1假定一个群体由合作者构成,由于基因变异出现了比例为ε的背叛者。此时合作者的收益为:(1-ε)*2+ε*0=2-2ε背叛者的收益为:(1-ε)*3+ε*1=3-2ε由于背叛者的收益高于合作者的收益,背叛者不仅不会消亡,反而会越来越多。因此,合作不是一个演化稳定策略。演化稳定策略是什么呢?CDC2,20,3D3,01,1假定一个群体由背叛者构成,由于基因变异出现了比例为ε的合作者。此时背叛者的收益为:(1-ε)*1+ε*3=1+2ε合作者的收益为:(1-ε)*0+ε*2=2ε由于合作者的收益低于背叛者的收益,合作者会逐渐消亡,因此背叛是一个演化稳定策略。结论:严格劣策略不可能是演化稳定策略。纳什均衡与演化稳定策略ABA1,10,0B0,00,0博弈的纳什均衡(A,A)和(B,B)。B是否是一个演化稳定策略?结论:1.纳什均衡并不意味着演化稳定策略;2.严格纳什均衡意味着演化稳定策略。纯策略下演化稳定策略的定义1(MaynardSmith,1972)S*01,'1*,**,'1',*','SUSSUSSUSSUSS在二人对称博弈中,纯策略是演化稳定策略,如果存在,对于下式对于所有的纯策略成立:纯策略下演化稳定策略的定义2S*1*,*',*2*,*=',**,'','USSUSSUSSUSSUSSUSS在二人对称博弈中,纯策略是演化稳定策略,如果以下两式成立:若,则例2:找出ESSABA1,11,1B1,10,0U(A,A)=U(B,A)U(A,B)U(B,B)因此A是演化稳定策略另一个例子问题1:此博弈对应现实生活中的什么情况问题2:此博弈是否存在演化稳定策略ABA0,02,1B1,20,0混合策略下演化稳定策略的定义P*1*,*',*2*,*=',**,'','UPPUPPUPPUPPUPPUPP在二人对称博弈中,混合策略是演化稳定策略,如果以下两式成立:若,则找出以下博弈的混合策略ESSABA0,02,1B1,20,0(1)找出博弈的混合策略纳什均衡。由于博弈的对称性,双方的混合策略纳什均衡必然是相同的,设为(p,1-p)给定局中人1的策略(p,1-p)局中人2选择A的收益:p*0+(1-p)*2=2-2p局中人2选择B的收益:p*1+(1-p)*0=p根据2-p=p,解出p=2/3(2)(2/3,1/3)是否是一个严格纳什均衡?(3)(2/3,1/3)是否是ESS?鹰鸽博弈HDH(v-c)/2,(v-c)/2v,0D0,vv/2,v/2博弈的演化稳定策略是什么?当vc时,(H,H)是严格纳什均衡,因此H是演化稳定策略。当v=c时,(H,H)是弱纳什均衡,因为U(H,D)U(D,D),因此H是演化稳定策略当vc时,不存在纯策略演化稳定策略。此时是否存在混合策略ESS?首先找出混合策略纳什均衡(v/c,1-v/c),其次验证其是否为ESS。蜥蜴的生存策略动态演化复制者(replicator)能够大致精确地复制自身的个体。例如基因、生物体或是弥母(meme)动态演化的复制者系统不同复制者的所占比例随时间的变化过程,其中不同策略复制的速度与他们的收益呈正相关。复制者的策略titjtitjtitjtijp当当0)(考虑一个n人演化博弈(i=1,2,...n),博弈在每个时间点t上进行(t=1,2,...).设pit为在t期中采用策略si的局中人的比例,此时si的收益为πit=πi(pt),其中p=(p1,...,pn)。不妨设π1t≤π2t≤…≤πnt假定在每个时期dt,每个个体i都以αdt的概率发现某个随机个体j的收益,如果i发现j的收益比自己高,就以pijt的概率转变为j的策略。此时在t+dt期使用si策略的局中人所占比例的期望值Epit+dt为:11111()()()()nitdttttttttttiiijjiijijjijntttttiijijjttttiiitttttnnEppdtppdtpppdtpppdtppp其中如果个体数量很多,则Epit+dt≈pit+dtdt()()tttttiiiitttttiiiippdtpdpppdt这个式子称为复制者动态(replicatordynamic)方程5.3.1签协议博弈的复制动态和进化稳定策略签协议博弈:1,10,00,00,0同意博弈方2不同意同意不同意2)1(00)1(00)1(1xuxuxuxxuxxxunyny假设群体中采用“同意”比例x(t)则不同策略期望得益和平均得益为:博弈方策略类型比例动态变化是有限理性博弈分析的核心,其关键是动态变化的速度以采用“同意”策略类型博弈方的比例为例,其动态变化速度可用下列微分方程反映(复制动态方程)3222)1()()(xxxxxxxuuxdtdxy动态微分方程的相位图dx/dtx010.5稳定状态、不动点:x*=0,x*=1进化稳定策略的检验2)1()1(000)1(101)1(nynyuuuuu2)1(000)1(10)1(ynnyuuuuu策略选择了“不同意”意”比例的博弈方偏离“同策略选择了“同意”同意”比例的博弈方偏离“不ESSxuy是进化稳定策略101不是进化稳定策略00xuuny5.3.2一般两人对称博弈复制动态和进化稳定策略一般模型a,ac,bd,db,c策略1博