第6讲:演化博弈论简介浙江工业大学经贸管理学院曹柬在前面的学习中,我们都假设博弈参与人为完全理性的人;但在现实中,不存在完全理性的人。每个人都有学习和改进过错的经历;每个人学习和改进错误的速度是有差异的。具有快速学习能力的小群体成员之间的反复博弈,可以采用“最优反应动态”。学习速度较慢的成员组成的大群体中的反复博弈,可以采用“复制动态”。第6讲:演化博弈论简介一、最优反应动态(一)协调博弈NE:(A,A),(B,B),(11/61,11/61)其中,(B,B)为pareto最优,但(A,A)为风险上策均衡60,600,4949,050,5060,600,4949,050,50甲乙ABAB第6讲:演化博弈论简介最优反应动态:能根据对方的上期策略调整自己的策略。5个博弈方,相邻者彼此博弈,初始策略组合为32种。实际上为8种:无A,1A,相邻2A,不相邻2A,3连A,非3连A,4A,5A60,600,4949,050,5060,600,4949,050,50甲乙ABAB15432例如:令xi(t)为t时期博弈方i的采用策略A的邻居的数量,则xi(t)=0,1,2.50249AiiUxtxt0260BiiUxtxt可知,当xi(t)22/61时,UAUB在t时期,当2个邻居中只要有1个邻居采用策略A,则i在t+1时期必然采用A第6讲:演化博弈论简介例举如下:1、当初始情况为1A时ABBBBBABBAABAABBAAAAAAAAA综上可知,32种初始情况下,只有1种情况稳定于5B,其余31中情况最后都将稳定于5A。(此时,A为“进化稳定策略”,即ESS,evolutionarystablestrategy)2、当初始情况为2连A时AABBBAAABAAAAAA3、当初始情况为3连A时AABBAAAAAA第6讲:演化博弈论简介(一)连续型的古诺调整过程则调整过程为:反应函数:1232qq2132qq企业1企业22.53.01.51.752.2152.251.18751.9375……则最终的进化稳定策略(ESS)为:q1=2,q2=2第6讲:演化博弈论简介二、复制动态中的对称博弈(一)签协议博弈假设:群体中“Y”的比例为x,“N”的比例为1-x0,00,00,01,1,0,,0,甲乙YNYNY:同意N:不同意110YUxxx0100NUxx21YNUxUxUx设:群体比例的动态变化速度为YdxxUUdt23dxxxdt当x=0时,稳定;当x0时,最终稳定于x*=1则:复制动态方程第6讲:演化博弈论简介dx/dtx01图1签协议博弈的复制动态相位图x*=0,x*=1为稳定状态,此时,dx/dt=0但x*=1为ESS,即最终所有人都将选择“Y”0,00,00,01,1,0,,0,甲乙YNYN23dxxxdt第6讲:演化博弈论简介(二)一般两人对称博弈群体中采用S1的比例为x,S2的比例为1-x11Uxaxb21Uxcxd121UxUxU1dxFxxUUdt11xxxacxbd当F(x)=0时,复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)则复制动态方程F(x):d,dc,bb,ca,a,,,,甲乙S1S2S1S2第6讲:演化博弈论简介稳定性定理若xx*,为使x→x*,应满足F(x)0;若xx*,为使x→x*,应满足F(x)0.F(x)=dx/dt,t↑,则x↑F(x)=dx/dt,t↑,则x↓x*F(x)x0这意味着:当F'(x*)0,x*为ESS第6讲:演化博弈论简介(三)协调博弈的复制动态和ESS1116111dxFxxxxacxbddtxxx当F(x)=0时,x*=0,x*=1,x*=11/61为稳定状态复制动态方程F(x):60,600,4949,050,5060,600,4949,050,50甲乙ABAB图2协调博弈的复制动态相位图11/61dx/dtx01可知,当F'(0)0,F'(1)0,而F'(11/61)0,则x*=0和x*=1为ESS这意味着:当初始x11/61时,ESS为x*=0;当初始x11/61时,ESS为x*=1.第6讲:演化博弈论简介111612n当n≥3复制动态与最优反应动态的比较:所以,在有限理性程度下,理性程度较高的一方不一定能得到比理性程度较低的一方更理想的结果。学习速度慢理性程度低学习速度快理性程度高第6讲:演化博弈论简介(四)鹰鸽博弈的复制动态和ESS令x为采用“鹰”策略的群体比例,1-x为采用“鸽”策略的群体比例111122dxFxxxxacxbddtvcvxxxx则复制动态方程F(x):v/2,v/20,vv,0,,甲乙鹰鸽鹰鸽(v-c)/2(v-c)/2当F(x)=0时,x*=0,x*=1,x*=v/c为稳定状态第6讲:演化博弈论简介①假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)F‘(0)0,F’(1)0,而F‘(1/6)0,则ESS为:x*=1/6当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为1/36;和平共处的可能性为25/36;一方霸道、一方忍让的可能性为10/36。发生战争的可能性随着c/v比值的增加而降低,即:和平共处的可能性也随着增加。v/2,v/20,vv,0,,甲乙鹰鸽鹰鸽(v-c)/2(v-c)/21122dxvcvFxxxxxdt1/6dx/dtx01第6讲:演化博弈论简介②假设v=8,c=8(表示种群间和平共处所得到的收益等于两者冲突导致的损失)ESS:x*=1当c≤v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因在于当一方忍让时,另一方可获得更多收益。这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。v/2,v/20,vv,0,,甲乙鹰鸽鹰鸽(v-c)/2(v-c)/21122dxvcvFxxxxxdtdx/dtx01③假设v=8,c=4(表示种群间和平共处所得到的收益大于两者冲突导致的损失)dx/dtx01ESS:x*=1第6讲:演化博弈论简介(四)蛙鸣博弈的复制动态和ESS令x为采用“鸣”策略的群体比例,1-x为采用“不鸣”策略的群体比例11dxFxxxmzPxdt则复制动态方程F(x):0,,,,,蛙A蛙B鸣不鸣P-zP-z鸣不鸣m-zm-z1-m1-m0m、P为求偶成功的概率z为机会成本(体力消耗、危险性等)满足:m∈(0.5,1],mP≤1稳定状态:x*=0,x*=1,x*=(m-z)/(1-P)第6讲:演化博弈论简介①若(m-z)/(1-P)∈(0,1),即1-Pm-z0ESS:x*=(m-z)/(1-P)在这种情况下,无论初始状况如何,最后总有(m-z)/(1-P)比例的雄蛙鸣叫。当个别雄蛙“搭便车”的收益大于群体雄蛙“鸣叫”所获得的收益时,则总会存在搭便车“不鸣叫”的雄蛙。0,,,,,蛙A蛙B鸣不鸣P-zP-z鸣不鸣m-zm-z1-m1-m011dxFxxxmzPxdtdx/dtx011mzP第6讲:演化博弈论简介②若(m-z)/(1-P)0,即zmESS:x*=0显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。当“鸣叫”的收益大于群体鸣叫而个别雄蛙“搭便车”的收益时,所有雄蛙都将鸣叫。③若(m-z)/(1-P)1,即m-z1-Pdx/dtx01ESS:x*=10,,,,,蛙A蛙B鸣不鸣P-zP-z鸣不鸣m-zm-z1-m1-m011dxFxxxmzPxdtdx/dtx01第6讲:演化博弈论简介对称博弈:相似/相同群体中的演化博弈行为非对称博弈:不同群体间的演化博弈行为三、复制动态中的非对称博弈有两个群体:竞争者和在位者1,,,,,竞争者在位者进入不进00打击不打击25125竞争者不进入进入在位者不打击打击(1,5)(2,2)(0,0)第6讲:演化博弈论简介(一)市场阻入博弈A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y1,,,,,AB进入不进00打击不打击25125对A而言:01222AeUyyy1111AnUyy1211AAeAnUxUxUxyx则竞争者群体的复制动态方程FA(x):112AAeAdxFxxUUxxydt采用A表示竞争者,B表示在位者假设:第6讲:演化博弈论简介竞争者群体的复制动态方程:A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y1,,,,,AB进入不进00打击不打击25125112AAeAdxFxxUUxxydt竞争者的群体复制动态相位图为:(b)y1/2ESS:x*=0dx/dtx01dx/dtx01(a)y=1/2x*∈[0,1]dx/dtx01(c)y1/2ESS:x*=1第6讲:演化博弈论简介A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y1,,,,,AB进入不进00打击不打击25125对B而言:01555BsUxxx21553BnUxxx1523BBsBnUyUyUxyx则在位者群体的复制动态方程FB(x):12BBsBdyFyyUUyyxdt第6讲:演化博弈论简介在位者群体的复制动态方程:第6讲:演化博弈论简介A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y1,,,,,AB进入不进00打击不打击25125在位者的群体复制动态相位图为:(b)x≠0ESS:y*=0(a)x=0y*∈[0,1]12BBsBdyFyyUUyyxdtdy/dty01dy/dty01A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y1,,,,,AB进入不进00打击不打击25125最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例通过分析可知:ESS为x*=1,y*=0即无论两个群体的初始状态落在哪个区域,最终的演化博弈结果为竞争者“进入”,在位者“不打击”1/2yx011第6讲:演化博弈论简介有两个实力不同的群体,争夺/分享资源第6讲:演化博弈论简介(二)非对称鹰鸽博弈,,,,,甲乙鹰鸽鹰鸽(v1-c)/2(v2-c)/2v1/2v2/2v100v2若简化问题分析,令v1=10,v2=2,c=12,,,,,甲乙鹰鸽鹰鸽-1-55110002A:采用“鹰”策略的群体比例为x“鸽”策略的群体比例为1-xB:采用“鹰”策略的群体比例为y“鸽”策略的群体比例为1-y对A而言:11101011AeUyyy01555AdUyyy15556AAeAdUxUxUxyxy则A群体的复制动态方程FA(x):156AAeAdxFxxUUxxydt采用A表示甲,B表示乙假设:第6讲:演化博弈论简介,,,,,AB鹰鸽鹰鸽-1-55110002A群体的复制动态方程:A的群体复制动态相位图为:(b)y5/6E