序贯决策博弈

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

序贯决策博弈第一部分同时博弈与序贯博弈主要内容本章主要介绍:1、如何用正规型表示和展开型表示来表述同一个博弈。2、博弈论中的两个重要概念:信息集和不完美信息。3、考察包含同时决策行动和序贯决策行动的复合型博弈(混合博弈)的纳什均衡。第一节博弈的正规型表示与展开型表示第二节同时决策与序贯决策的混合博弈第三节树形博弈的子博弈第四节子博弈精炼纳什均衡第五节完美博弈的库恩定理第六节动态博弈的运用第一节博弈的正规型表示与展开型表示一、如何将博弈的展开型形式转化为正规型表示案例:“进入障碍”博弈进入者●进入不进●垄断者容忍抵抗●容忍抵抗◆(1,5)(-2,2)◆◆◆(0,10)(0,4)垄断者abc“进入障碍”的矩阵表达1,5-2,2-2,21,50,100,40,100,4进入者垄断者进入不进入{容忍,容忍}{抵抗,抵抗}{抵抗,容忍}{容忍,抵抗}二、如何将正规型的博弈转化为展开型比前面简单,尤其是序贯博弈,但如果是同时博弈,如何表示?信息集案例:情侣博弈2,10,00,01,2足球芭蕾足球芭蕾丈夫妻子夫妻之争信息集根据同时博弈的定义,每个局中人决策时不知道别人的策略,即每个局中人在做自己的行动选择时,并不知道自己处在哪个决策节点上。例如妻子在选芭蕾时,并不知道丈夫选的是芭蕾还是足球。局中人不能是别人对方“已经”做出的行动或决策,就等于同时行动或决策。此时,我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。即局中人知道博弈已经进行到他的这个信息集,但不知道博弈究竟进行到这个信息集中的哪个决策节点。信息集妻子虽然知道博弈已经进行到她的信息集,但不知道进行到信息集中的那个决策点,即她不知道丈夫会选什么,因此是同时博弈。丈夫●足球芭蕾●妻子足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,-1)(1,2)妻子注意一个信息集罩住的必须是同一个局中人的决策点。必须是同一个局中人在同一个时点的决策节点。ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒这两个虚线罩住的都不是信息集。注意同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。●●A●◆◆◆BB◆◆该虚线罩住的不是信息集。其必须满足:同集同注,即从各个决策点出发的策略选择数目相同,名称也相同。单点集和非单点集我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。因此,每一个决策位置都是一个信息集,只有单点集和非单点集之分。●●A●◆◆BB◆◆●◆非单点集单点集完美信息博弈和不完美信息博弈当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史清清楚楚,他清楚了博弈具体走到了他的这个决策节点而不是别的决策点。我们把这种历史清楚的博弈称为完美信息博弈。但是当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弈具体走到了他的这个信息集里面的那个决策点。我们把这种历史不清楚的博弈称为不完美信息博弈。如果一个序贯博弈的每个信息集都是一个单点集,那么该序贯博弈就是完美信息博弈,否则他就是不完美信息博弈。信息集举例情爱博弈的扩展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的选择;但不知道A的选择(或A、B同时决策)房地产开发博弈银行挤兑博弈案例案例情况:两个投资者每人存入银行一笔存款D,银行已将这些存款投入一个长期项目。如果在该项目到期前银行被迫对投资者变现,共可收回2r,这里DrD/2。不过,如果银行允许投资项目到期,则项目共可取得2R,这里RD。有两个时间,投资者可以从银行提款:在银行的投资项目到期之前或者在到期之后。为使分析简化,假设不存在贴现。两个投资者的提款日期可以有如下可能:A、两个都提前,都得到rB、一个提前提取另一个不动,则第一人得D,另一人得2r-D.C、两个在到期后提,各得RD、两个都不提,等到投资项目结束,都得到RE、如果一个人在期满后提取,另一人不动则分别得:2R-D,D。如下图所示:我们使用逆向归纳法分析问题从日期2开始先考虑日期2的标准式博弈,由于明显的RD,也就是说2R-DR。我们可以得到这个博弈的纳什均衡(R,R)。由于不存在贴现,我们可以直接带入日期1的博弈矩阵表示式。由于rD(并且由此可得2r-Dr),这一由两阶段博弈变形得到的单阶段博弈存在两个纯战略纳什均衡:(1)两个投资者都提款,最终收益情况为(r,r);两个投资者都不提款,最终收益为(R,R)。从而,最初的两阶段银行挤提博弈就有2个子博弈精炼解。银行挤兑(1)王则柯“银行挤兑的成因和预防”两客户在同一银行各存有100元,银行将这200元投资于一个长期项目。如果在项目到期前银行要抽回资金,则只能收回140元;但如果到期后再收回投资,则可收回本息280元。对客户来说,抽回存款的日期也有两种:一是在银行投资项目到期之前,称日期1;一是在到期之后,称日期2。假定如果两客户在日期1要求抽回资金则各得70元;如果只有一个客户在日期1要抽回资金则该客户得100元,另一客户只能得到剩余的40元。如果等到日期2两客户同时要收回资金,则各得140元;如果到日期2还只有一方要求收回资金,则要求收回资金一方得180元,另一方得100元;如果到日期2没有客户要求收回资金,则银行还是分给他们各140元。银行挤兑(3)日期1周瑜诸葛亮抽回不抽回抽回70,70100,40不抽回40,100140,140前一种结果可以解释为对银行的一次挤提。如果投资者1相信投资者2将在日期1提款、则投资者1的最优反应也是去提款,即使他们等到日期2再去提款的话两人的福利都会提高。这里的银行挤提博弈在一个很重要的方面不同于第1章中讨论的囚徒困境:虽然两个博弈都存在一个对整个社会是低效率的纳什均衡;但在囚徒困境中这一均衡是惟一的(并且是参与者的严格占优战略),而在这里还同时存在另一个有效率的均衡。从而,这一模型并不能预侧何时会发生对银行的挤提,但的确显示出挤提会作为一个均衡结果而出现。经典案例之关税竞争在国际争端中,关税与贸易争端最为激烈。由于贸易能增进双方的福利,而关税是阻碍贸易自由的最大障碍。在早期,政府自由选择关税税率时将如何决策?考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);考虑两个完全相同的国家(i=1,2),一个政府负责确定关税税率(t1,t2);企业1制造产品h1供给本国,及出口e1;考虑两个完全相同的国家(i=1,2),一个政府负责确定关税税率(t1,t2);企业1制造产品h1供给本国,及出口e1;企业制造产品供给本国(h1,h2)及出口(e1,e2);考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);企业制造产品供给本国(h1,h2)及出口(e1,e2);市场1:Q1=h1+e2考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);企业制造产品供给本国(h1,h2)及出口(e1,e2);两个市场:Qi=hi+ej考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);企业制造产品供给本国(h1,h2)及出口(e1,e2);两个市场:Qi=hi+ej,pi(Qi)=a-Qi考虑两个完全相同的国家(i=1,2),每个国家有一个政府负责确定关税税率(t1,t2);一个企业制造产品供给本国(h1,h2)及出口(e1,e2);博弈的时间顺序如下:(1)政府同时选择关税税率t1和t2;(2)企业观察到关税税率,并同时选择其提供国内消费和出口的产量(h1,e1)和(h2,e2);企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei由于πi(ti,tj,hi,ei,hj*,ej*)可表示为:企业I在市场i的利润+在市场j的利润即πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei也即πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi-chi+[a-(hj+ei)]ei-cei-tjei企业i在市场的最优化问题就可拆为一对问题,在每个市场分别求解企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi-chi+[a-(hj+ei)]ei-cei-tjei企业i在市场的最优化问题就可拆为一对问题,在每个市场分别求解hi*须满足:maxhi[a-(hi+ej*)-c],hi≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi-chi+[a-(hj+ei)]ei-cei-tjeiei*必须满足:maxei[a-(ei+hj*)-c]-tjeiei≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjeihi*须满足:maxhi[a-(hi+ej*)-c],hi≧0ei*必须满足:maxei[a-(ei+hj*)–c]-tjeiei≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjeihi*须满足:maxhi[a-(hi+ej*)-c],hi≧0且ei*必须满足:maxei[a-(ei+hj*)-c]-tjeiei≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei解得hi*=(a-ej*-c)/2ei*=(a-hj*-c-tj)/2同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量(hj*,ej*),即1()3iihact1(2)3ijeact同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量(hj*,ej*),即hj*=(a-c+tj)/3ej*=(a-c-2ti)/31()3iihact1(2)3ijeact若政府给定关税税率t1和t2,则企业i将选择产量(hi*,ei*),即hj*=(a-c+tj)/3ej*=(a-c-2ti)/31()3iihact1(2)3ijeact则利润为πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei若政府给定关税税率t1和t2,则企业i将选择产量(hi*,ei*),即hj*=(a-c+tj)/3ej*=(a-c-2ti)/31()3iihact1(2)3ijeact则利润为222()()33jiiactactπi(ti,tj,hi,ei,hj,ej)=[a-(hi

1 / 77
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功