博弈论与信息经济学5-不完全信息动态博弈

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Page:1QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。—不完全信息动态博弈华东理工大学商学院E-mail:scqian@ecust.edu.cnQianShichao钱世超不存款存款到期客户1客户2(1,1)存款不存款提前不存款客户1到期提前到期提前客户2(1,1)(1,1)(1.2,1.2)(0.6,1)(1,0.6)(0.8,0.8)存款GameTheory&InformationEconomics博弈论与信息经济学Page:2QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。不完全信息动态博弈不完全信息动态博弈,也称动态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯博弈在许多方面是相似的,差别只是动态贝叶斯博弈转化成的不是两阶段有同时选择的特殊不完美信息动态博弈,而是更一般的不完美信息动态博弈,因此可以直接利用不完美信息动态博弈的均衡概念进行分析。Page:3QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。不完美信息动态博弈的精炼贝叶斯均衡1LR(1,3)(0,2)(0,0)(2,1)(0,1)[p][1-p]B2UBUMUBM(2,1)(0,0)R(0,2)(0,1)L(1,3)(1,3)从静态博弈角度看,有两个纯策略纳什均衡:(M,U)和(L,B)从动态博弈角度看,一旦进入参与人2的决策信息集,1、参与人2首先估计参与人1选择M或R的概率分布{p,1-p}2、参与人2作出期望值估计选B:0×p+1×(1-p)=1-p选U:1×p+2×(1-p)=2-p参与人2选择U3、参与人1知道参与人2会选择U,因此选择M4、当进入参与人2的信息集,参与人2知道参与人1会选择M,因此给出p=1,并选择U5、达到精炼贝叶斯均衡(M,U;p=1)Page:4QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。不完全信息动态博弈分析的基本思路“自然”首先选择参与人的类型(参与人自己知道,其他人不知道,转换成不完美信息动态博弈参与人按先后顺序行动,后行动者能观察到先行动者的行动,但观察不到先行动者的确切类型。由于行动的类型依存性,后行动者可以通过先行动者的行为推断或修正对先行动者的类型判断(先验信息),而后确定自己的行为。先行动者预计自己的行为将被后者利用,因此将通过选择能传递对自己有利信息的行动博弈的过程不仅是参与人不断选择行动的过程,也是参与人不断修正对对手的判断的过程Page:5QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。完全信息动态博弈中引入了子博弈精练纳什均衡的概念剔除了那些不可置信的威胁,但是不完全信息动态博弈中,只有一个子博弈,不能将上述方法直接用于求不完全信息动态博弈的均衡解,但可以借用这一方法逻辑。将每个信息集开始的博弈的剩余部分称为一个“后续博弈”,一个“合理”的均衡应该满足如下要求:给定每一个参与人有关其他参与人类型的后验信念,参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。剔除这种不可信行为的方式是:假定参与人(在所有可能情况下)根据贝叶斯规则修正先验概念,并且,每个参与人都假定其他参与人选择的是均衡战略。Page:6QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。贝叶斯法则假定参与人的类型是独立分布的,参与人i有K个类型,有H个可能的行动,和分别代表一个特定的类型和一个特定的行动。如果我们观察到i选择了,参与人i属于的后验概率:1()()()(){}{}()()hkkhkkkhkhhjjjpappappapapapkkhahaPage:7QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。精练贝叶斯纳什均衡定义:精练贝叶斯均衡是一个策略组合和一个后验概率组合满足:对于所有的参与人i,在每一个信息集h,有***11()((),,())nnsss1(,,)nppp***(,)argmax(|)(,,,)iihiiiiiiiiiiissspauss*(|)(|)(.)hiiiiiihiipapas其中是使用贝叶斯法则从先验概率以及观测到的和最优战略得到的(可能时)Page:8QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求:1、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个关于类型的概率分布(信念);2、给定该信息集上关于类型的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;3、每一个参与人根据贝叶斯法则和均衡战略修正概率分布估计形成后验概率。Page:9QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。***11***11*(,,),(,,)(,,),(,,).,((nnnnpppsssssspppssps精炼贝叶斯均衡什均衡策略与均衡信念的结合,即:1.给定信念策略是最优的;2.给定策略信念是使用贝叶斯法则从均衡策略和所观测到的行动得到的因此精炼贝叶斯均衡是一个不动点,满足:**))(())ppsp;Page:10QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。信号传递博弈{}参与人2根据信号形成后验概率4.,()kmpmq%{}{}自然选择参与人的类型:参与人2形成关于的先验概率分布11.1,,2.()kkpqqqqq=L{}参与人发布信号13.1,,JmMmm?L{}参与人2选择行动15.,,HaAaa?La2Nθ1[1-p]1θ2[p]1m1m2m1m2a1a2a1a2a1a2a122支付函数:12(,,),(,,)umaumaqq****22**11()argmax()(,,)()argmax(,(),)amPampmumaPmumam()()Page:11QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。信号传递博弈中双方的策略1.混同策略:如果,选择如果,选择2.分离策略:如果,选择如果,选择3.分离策略:如果,选择如果,选择4.混同策略:如果,选择如果,选择杂合策略:如果某类型时,随机选择或11211111221212212112222212;:(,);:(,);:(,);:(,)5.mmmmmmmmmmmmmmmmmmqqqqqqqqa2Nθ1[1-p]1θ2[p]1m1m2m1m2a1a2a1a2a1a2a122参与人1:1.混同策略:如果,选择如果,选择2.分离策略:如果,选择如果,选择3.分离策略:如果,选择如果,选择4.混同策略:如果,选择如果,选择112111112212122121122222;:(,);:(,);:(,);:(,)mamaaamamaaamamaaamamaaa参与人2:Page:12QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。信号传递博弈的精炼贝叶斯均衡*2**2**11(()argmax()(,,)()arg(),()max(,(),))()ammampPampmummaPmumam()定义:信号传递博弈的精炼贝叶斯均衡是一策略组合和后验概率的结合,满足()如果参与人的策略是混同策略,则称均衡是混同的如果参与人的策略是分离策略,则称均衡是分离的如果参与人的策略在某类型时是混合杂合策略,则称均衡是准分离的111()Page:13QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。混同均衡满足的条件*******1*111***2*211*((),()())(,(),)(,(),),(,(),)(,(),),()()kkmampmumamumammumamumammpmp混同均衡;满足此时有混同均衡:不同类型的发送者选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号,因此,接收者不修正先验概率。Page:14QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。分离均衡满足的条件*1122****1*112*21112*221*12111112()((),()),((),()())(,(),)(,(),)(,(),)(,(),)()1()0mmmmampmumamumamumamumampmpm若分离均衡;满足此时有,,2122()0()1pmpm,分离均衡:不同类型的发送者(参与人1)以1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号在分离均衡下,信号准确地揭示出类型。Page:15QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。准分离均衡满足的条件**1*112*21111*122*221111121222((),()())(,(),)=(,(),)(,(),)(,(),)()1()(),()()mampmumamumamumamumampmpmppmp准分离均衡;满足此时有,准分离均衡:一些类型的发送者(参与人1)按概率选择发送信号,另一些类型的发送者选择特定的信号。在准分离均衡下,信号有时能准确地揭示出类型,有时不能。假定类型θ1的发送者随机选择m1或m2,类型θ2的发送者以概率1选择m2。此时Page:16QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。(2,1)(4,0)(1,3)(0,0)dNθ1[1-p]1θ2[p]1LRLRudududu[]p[1]p[]q[1]q22(1,0)(0,1)(2,4)(1,2)(u,u)(u,d)(d,d)(d,u)(u,u)(u,d)(d,d)(d,u)(L,L)(1,3)(1,3)(4,0)(4,0)(L,L)(2,4)(2,4)(0,1)(0,1)(L,R)(1,3)(1,3)(4,0)(4,0)(L,R)(2,4)(2,4)(0,1)(0,1)(R,R)(2,1)(0,0)(0,0)(2,1)(R,R)(1,0)(1,2)(1,2)(1,0)(R,L)(2,1)(0,0)(0,0)(2,1)(R,L)(1,0)(1,2)(1,2)(1,0)θ1θ2Page:17QSC博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。(2,1)(4,0)(1,3)(0,0)dNθ1[1-p]1θ2[p]1LRLRudududu[]p[1]p[]q[1]q22(1,0)(0,1)(2,4)(1,2)参与人1收益参与人1收益策略与收益1策略与收益

1 / 26
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功