第八讲-有限理性及其对博弈的影响

huyu3003033
3 ℃
2020-06-20

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第八讲有限理性和进化博弈苏兵西安工业大学经济管理学院2008年2有限理性博弈及其分析框架最优反应动态复制动态和进化稳定性：两人对称博弈复制动态和进化稳定性：两人非对称博弈有限理性及其对博弈的影响主要内容3有限理性：追求最大利益的理性意识，分析推理能力，识别判断能力，记忆能力和准确行为能力等多方面的要求有任何一方面的不完美即为有限理性有限理性的非唯一性：博弈方有限理性的层次及各方面能力的侧重存在差异有限理性博弈：至少有部分博弈方具有有限理性有限理性及其对博弈的影响8.1.1有限理性及其对博弈的影响4博弈方有限理性对博弈的影响博弈方不会一开始就找到最优策略，会在博弈过程中学习博弈，必须通过试错来寻找较好的策略；也意味着至少有部分博弈方不会采用完全理性博弈的均衡策略，均衡是不断调整和改进而不是一次性选择的结果，而且即使达到均衡也有可能再次偏离有限理性及其对博弈的影响8.1.1有限理性及其对博弈的影响58.1.2有限理性博弈分析框架进化博弈论研究有限理性博弈的理论进化博弈的均衡能通过博弈方模仿，学习的调整过程达到，能经受错误偏离的干扰，在受到少量干扰后仍能恢复的稳健的均衡分析框架由有限理性博弈方构成的，一定规模的特定群体内成员的某种反复博弈有限理性博弈分析框架6进化博弈分析的关键确定博弈的分析框架，即博弈方学习和策略调整的模式或机制以及相互学习、模仿的环境条件。主要讨论两种动态机制有快速学习能力的小群体成员的反复博弈。——最优反应动态学习速度很慢的成员组成的大群体随机配对的反复博弈。——生物进化的“复制动态”机制有限理性博弈分析框架8.1.2有限理性博弈分析框架78.2最优反应动态分析内容少数有快速学习能力的有限理性博弈方之间的反复博弈和策略进化最优反应动态博弈方虽然在复杂局面下准确分析判断和运用预见性的能力稍差，但能对不同策略的结果作出较正确的事后评估，并相应调整策略。最适合描述这种理性层次博弈方的策略调整机制，即“最优反应动态”最优反应动态88.2.1协调博弈的有限博弈方快速学习模型5个博弈方，相邻博弈方相互博弈的快速学习动态调整模型：博弈内容如上图得益矩阵所示的两人对称静态博弈，称之为“协调博弈”。该博弈有两个纯策略纳什均衡(A,A)，(B,B)，一次性博弈中博弈结果具有不确定性博弈方260,600,4949,050,50ABAB博弈方1协调博弈的优先博弈方快速学习模型9确定分析框架博弈方虽缺乏预见能力但能够对上一阶段博弈结果进行总结，作出策略调整设5个博弈方分别处于下图所示圆周中的5个位置上，每个博弈方都与左右相邻的博弈方反复博弈21345协调博弈的优先博弈方快速学习模型8.2.1协调博弈的有限博弈方快速学习模型10每个位置的博弈方既可能采用A也可能采用B，总共有种可能，包括全部采用A，全采用B和两种策略都有人采用。根据采用A博弈方的数量和分布，总共有无A，1A、有相邻2A、有不相邻2A、有3连A、有非3连A、4A、5A共8种有实质差异博弈方能否在反复博弈过程中出现策略的收敛？523221345协调博弈的优先博弈方快速学习模型8.2.1协调博弈的有限博弈方快速学习模型11设为时期博弈方的邻居中采用A策略邻居的数量则采用B策略邻居的数量相应根据第期的相关情况博弈方采用A的得益为，采用B的得益为根据动态反应机制当即时博弈方在时期会采用A当即时博弈方在时期会采用B22()61ixt22()61ixt()502()49()02()60iiiixtxtxtxt()502()49()02()60iiiixtxtxtxt()ixt2()ixt()0,1,2ixt()502()49iixtxt()02()60iixtxti1tt1tiiit协调博弈的优先博弈方快速学习模型8.2.1协调博弈的有限博弈方快速学习模型12反应规则：如在时期博弈方的两个邻居只要有1个采用A，则在时期采用A，两个邻居都没采用A，则在时期采用B。博弈方在时期的策略与自己在时期采用的策略无关5个博弈方完全相似，除了初次博弈时所有博弈方都采用B的情况外，从其余情况出发，经最优反应动态法则的调整，最终都会收敛到所有博弈方都采用A的稳定状态。分析过程如下1tti1tt1ti协调博弈的优先博弈方快速学习模型8.2.1协调博弈的有限博弈方快速学习模型13全部采用A或B的情况不需讨论，采用A策略博弈方数量和位置有实质差异的只有6种情况初次博弈为1A的最优反应动态（已包含有相邻2A，非相连3A和4A三种情况）AAAAAAABBBAAABBABBBBAAAAB协调博弈的优先博弈方快速学习模型8.2.1协调博弈的有限博弈方快速学习模型14初次博弈为相连3A的最优反应动态初次博弈为相邻2A的最优反应动态AAAAAAABBBAAAABAAAAAAAAAAABB协调博弈的优先博弈方快速学习模型8.2.1协调博弈的有限博弈方快速学习模型15进化稳定策略在博弈方的动态调整策略中能达到，又对少量偏离的扰动有稳健性，满足这两种性质的稳定状态称“进化稳定策略”（ESS）分析现实问题，必须根据实际情况建立分析框架协调博弈的优先博弈方快速学习模型8.2.1协调博弈的有限博弈方快速学习模型168.2.2古诺调整过程博弈方策略连续分布时的最优反应动态分析以古诺模型为例，两个寡头的反应函数分别是存在纳什均衡，即各生产2个单位。现假设两博弈方都知道自己的反应函数，只是不知道对方的利润和反应函数，也没有预见能力。在这种假设下，两寡头在第一次博弈时各自的产量就难以确定。2132qq1232qq古诺调整过程17分析过程若寡头1生产2.5单位，寡头2生产3单位。第一期结束后将这两个产量分别带入寡头1、2的反应函数，得到第二期的产量1.5和1.75单位；如此类推，动态调整过程将趋向于两寡头各生产2个单位。这个稳定状态具有对微小扰动的稳健性，是一个进化稳定策略。注意收敛是有条件的，分析的逻辑基础不同，则构成不同的动态机制。12211drdrdqdq古诺调整过程8.2.2古诺调整过程188.3.1签协议博弈的复制动态和进化稳定策略分析对象学习速度较慢的有限理性博弈方的动态策略调整及其稳定性分析框架博弈方组成的大群体成员的随机配对反复博弈分析过程博弈方学习速度慢意味着向优势策略转变是一个渐进的过程，可以用生物进化的进化动态方程，即复制动态公式来表示签协议博弈的复制动态和进化稳定策略19经济活动中的各种合作都可以用签协议来代表，以右图所示的签协议博弈为例：根据该博弈的得益情况，有两个纯策略纳什均衡，(同意,同意)(不同意,不同意)前者帕累托优于后者，在理性层次较低的有限理性博弈方组成的大群体成员随机配对反复博弈的框架内分析该博弈不同意博弈方20，00，00，01，1同意不同意同意博弈方1签协议博弈的复制动态和进化稳定策略8.3.1签协议博弈的复制动态和进化稳定策略20分析过程博弈方理性较低，不会一开始就找到最佳策略。不同策略的博弈方可看作不同的类型。假设，整个群体中为“同意”类型的博弈方占整个群体的比例为x，则“不同意”博弈方比例为1-x博弈方的得益不仅取决于自己和随机配对遇到的对手类型。“同意”与“不同意”两种类型博弈方各自的期望得益和分别为：21(1)00(1)00(1)ynynuxxxuxxxuxux和：u因此，群体平均得益yunu签协议博弈的复制动态和进化稳定策略8.3.1签协议博弈的复制动态和进化稳定策略21核心：博弈方策略类型比例是动态变化的，其变化速度可用动态复制方程表示：时，无模拟榜样，博弈方不会有意识地改变策略。时，若变化率为正，采用“同意”策略的博弈方逐渐增多；若变化率为负，采用“不同意”策略的博弈方逐渐增多。2223()()(1)ydxdtxuuxxxxxxx0x0x签协议博弈的复制动态和进化稳定策略8.3.1签协议博弈的复制动态和进化稳定策略22上述复制动态微分方程的相位图如下图：除外，其他所有初始情况出发的复制动态过程，都会使博弈方都趋向于“同意”，即和是上述复制过程的两个稳定状态。0x*0x*1x签协议博弈的复制动态和进化稳定策略8.3.1签协议博弈的复制动态和进化稳定策略23当时，假设比例为的博弈方“犯错误”偏离“同意”策略，则分别采取两种策略博弈方的期望得益和平均得益为：当时，假设比例为的博弈方“犯错误”偏离“不同意”策略，则分别采取两种策略博弈方的期望得益和平均得益为：由于且接近于1，具有对少量错误偏离的稳健性，是ESS由于采用“不同意”策略博弈方得益为0，博弈方会不断减少，不是ESS*1x2(1)101(1)000(1)(1)ynynuuuuu21(1)00(1)00(1)ynynuuuuu10yu*0x签协议博弈的复制动态和进化稳定策略8.3.1签协议博弈的复制动态和进化稳定策略248.3.2一般两人对称博弈的复制动态和进化稳定策略将上述签协议博弈的分析推广至一般的2×2对称博弈，博弈内容如右图所示：•则采用两种策略博弈方的期望得益和群体平均得益为：•可得一般2×2对称博弈的复制动态方程：1212(1)(1)(1)uxaxbuxcxduxuxu2121博弈方2博弈方1a,bd,dc,bb,c1112()(1)(1)()(1)()dxxuuxuxuxudtxxxacxbd25稳定状态：令复制动态方程可得复制动态的稳定状态，最多有3个，分别为进化稳定策略：由微分方程的“稳定性定理”可知，当且时所对应的稳定状态具有稳健性，为进化稳定策略。如右图所示，为进化稳定策略。()0dxFxdt***01bdxxxabcd、、0dxdt*()0Fx*x8.3.2一般两人对称博弈的复制动态和进化稳定策略268.3.3协调博弈的复制动态和进化稳定策略例：如右图所示博弈内容将a=50,b=49,c=0,d=60代入一般复制动态方程：令解出三个稳定状态，而根据微分方程稳定性定理，可知都是该博弈的进化稳定策略，而则不是。博弈方2ABAB博弈方150，500，4960，6049，0()(1)()(1)()(1)(6111)dxFxdtxxxacxbdxxx()0Fx***110,1,61xxx**0,1xx*1161x27上述复制动态相位图如下当时稳定状态为，所有博弈方都采用策略2；当时稳定状态为，所有博弈方都采用策略1。11(0,)61x*0x11(,1)61x*1x博弈方都采用策略2的均衡是两个均衡效率较高的，若x落在(0,1)概率相同，复制动态实现高效率均衡的机会较小，只有11/618.3.3协调博弈的复制动态和进化稳定策略28有限理性博弈方通过复制动态的学习和策略调整也不一定能够实现最理想的结果，达到优化。以复制动态为核心的进化博弈分析结果和以最优反应动态为核心的进化博弈分析结果既相似又有差别。相似：两者大多情况下都会趋向于博弈方都采用策略1的效率较低的均衡。差异：复制动态趋向效率较高均衡的机会为11/61，比最优反应动态趋向较高效率均衡的机会1/32要高。主要原因：理性程度稍高的博弈方并不一定能得到比理性稍差的博弈方更理想的结果，这是囚徒困境的一种表现形式。8.3.3协调博弈的复制动态和进化稳定策略298.3.4鹰鸽博弈的复制动态和进化稳定策略“鹰鸽博弈”是指同一物种内部冲突中的策略和均衡问题，“鹰”和“鸽”分别指“攻击型”