第三章(2)博弈论

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章完全且完美信息动态博弈第一节动态博弈模型第二节几个典型的动态博弈第二节几个典型的动态博一、市场霸权博弈:在市场上有两个商贩,一强一弱,卖同一产品,价格相同,进行产量竞争。(相当于一个可以占个好位置,先选择自己的进货量,市场容量有限,另一个则根据强者的选择决定自己的进货量。)设商贩1和2的进货量分别为和。市场价格函数为两商贩的边际生产成本为商贩11q商贩22q),(21uu1q2q)(88)(21qqQQPP221cc两个商贩的得益函数分别为:如果是静态博弈,则同古诺产量模型是完全相同的。1112111)(),(qcQPqqquu12112)](8[qqqq212116qqqq2222122)(),(qcQPqqquu22122)](8[qqqq222126qqqq在古诺模型中,我们的求解方法是,两个得益函数是平等的,分别求各自的反应函数,然后求联立方程的解。解得均衡结果为(2,2)。动态博弈中求解方法就不同了。第一,首先根据逆向归纳法,第一阶段商贩1先选择。第二,在第二阶段,商贩2知道商贩1选择的情况下,选择,使自己的得益最大化。即对商贩2的得益函数求导,得到的一阶条件为:为商贩2对商贩1的反应函数。02612qq1q1q2q2u2u2312qq第三,商贩1知道商贩2的决策思想,因此在自己选择时,知道商贩2的反应函数,将商贩2反应函数的产量代入自己的得益函数。使得自己的得益最大化。由将代入得:求导得:第四,商贩2的最佳进货量为。由此,可以计算出双方的得益。1q2312qq2121116qqqqu2312qq2111121*211*211)23(66),(qqqqqqqqqqu)(21311211quqq03*1q3*1q5.1*2q同古诺模型比较,可以看出,古诺总产量为4,均衡结果为(2,2),动态霸权博弈总进货量为4.5,均衡结果为(3,1.5)。古诺总得益为8,均衡得益结果为(4,4)。动态霸权博弈总得得益为6.75,少于古诺得益。均衡得益为(4.5,2.25),商贩1的得益大于古诺得益,商贩2的得益小于古诺得益。由此博弈可得:为什么人们都喜欢当老大,而不是平等竞争。在动态博弈中信息多者并不一定就有利。第二节几个典型的动态博二、分赃博弈(讨价还价)。假设到第三阶段1方出价结束博弈。可以用逆向归纳法进行分析。11s出2接受2,s出不接受)10000,(11ss)]10000(,[22ss1接受s不接受,出)]10000(,[22ss第一,从最后一个博弈开始。1方出价为S,博弈结束,双方的实际得益为1方:,2方。第二,逆向倒推到2方。自己出价为,策略为既能让1方接受,否则如博弈进行到第三阶段,自己就没有主动权,又使自己的得益比第三阶段要大。满足1方得益为:即。自己的得益为:,比要大,因为。)]10000(,[22ss1接受s不接受,出)]10000(,[22sss2)10000(2s2sss22ss2)10000(s)10000(2s10第三,再逆向倒推回到第一阶段。1方的策略为:既使2方满意,而自己的得益比博弈进行到第二阶段,2方出价时得益大。可行的方案是:自己出价使2方满意:,即:2方得到满意,自己的得益比进行到第二阶段时的要大。因此,该博弈的子博弈完美均衡纳什均衡为:(,)11s出2接受2,s出不接受)10000,(11ss)]10000(,[2ssss2110000100001sss2110000100001ss2s21000010000s210000分析:该博弈如果进行到第三阶段,理性的1方的分配结果为S=10000。这时,博弈完美纳什均衡得益为:1方:2方:双方的得益取决于系数和如下图在0,5时博弈2方可以得到最大收益为2500。越大或越小都对博弈1方有利。但只有当接近于1时,博弈1方才有可能采取拖延的策略。)1(100002)(100002)(2)(12)0,0()(2)(125.025.01该博弈模型可以用来解释诸如经济活动中的利润分配、债务纠纷、财产继承等现象。对于诉讼纠纷,模型中的相当于,进行诉讼中的诉讼费用或时间的机会成本等。利润分配中的相当于进行再投资的机会成本。第二节几个典型的动态博三、雇用博弈(委托-代理):1雇用2接受不雇用)0),0((R])(),()([SSwSwSR2努力不接受])(),(-R(E)[EEwEw)0),0((R偷懒代理人的努力水平为,其它工作或闲暇的机会成本为努力的成本或负效用为努力水平的单调递增凸函数。产出R是努力e的随机函数,由于不完全监督,e不可观察,代理人的报酬只能是R的函数这样,委托人的得益函数为:代理人的得益函数为:现在用参与约束和激励相容性思想讨论激励机制的设计问题。Ue)(eRR)]([)(eRWRww)]([)(eRweRwR)]([)(eRweRwR)(ecc代理人的参与约束:委托人的付酬思想为代理人的报酬越少越好,因此,实际代理人的参与约束为:委托人的得益为:代理人最大化自己的得益:如下图代理人的最佳努力水平,使得其得益最大化。同时,也使委托人得益最大化。UeceRW)()]([UeceRW)()]([UeceReRWeR)()()]([)(cR,Uec)()(eRU*ee*e为清楚起见,不妨设这一为一个商店老板雇用一个店员。R为商店利润,e为店员的努力。=1设,其中为均值为0的随机扰动。店员的努力成本店主设计的报酬为固定加绩效:店主的得益为:,因为0均值随机变量,店主期望得益为:店员的期望得益为:问题为店主如何选择A和B,使这种工资制度为一有效的激励制度。即店员自愿接受。2)(eecceeRR4)()4()]([eBAeRBAw)4()4(eBAeAeB)1(424eBeAU店员的参与约束为:如果店员是风险中性,由店员的期望得益求导可得使其最大化时,得:这意味着,店员的努力与分成比例成正比。现在我们再来看店主的选择问题:首先要满足店员的参与约束:的最低值:店主的期望得益为:求导得最大值:代入店员的最佳选择,得B=1,再代入以上参与约束得A=-3。Be2*142eBeA24eBeA142eBeA214eBeA142ee2**eBe2*则可得店主最佳的激励工资设计为:这一最佳设计的公式或激励机制意味着:店主不发固定工资,而店员支付一定的承包费。其实质为承包制或租赁经营制。这一机制假设店员是风险中性的。如果店员是风险规避时,则具有固定工资的设计是必须的。RRBAw3)(第二节几个典型的动态博四、试错(触发)博弈与颤抖手均衡1、博弈方可能的犯错。如下博弈。逆向倒推可得纳什均衡为1(L),得益为(2,0)。但是,若1方犯错,开始选择了R,这时2方怎么办?在这一博弈中,2方敢为敢相信1方仅仅是在第一次偶而出错,以后会理性。第一次的不理性是故意的试探呢?还是就是理性有限?很显然,在该博弈中是理性有限。1LR)0,2(2MN1)2,0()1,0()3,1(ST2、博弈方的试错。如下博弈。逆向倒推可得纳什均衡为[1(R),2(N),1(T)],得益为(3,3)。但是,若1犯错是试探性的,开始选择了R,这时2方怎么办?在这一博弈中,2方有理由相信1方是在试探,选择权给了2方。理性的2方显然也不会选择M,而是选择N,依此类推。预想可以出现好的结果。这种,允许出现扰动的博弈均衡就称之“颤抖的手均衡”1LR)0,2(2MN1)2,0()1,0()3,3(ST3、蜈蚣博弈在这一博弈中,子博弈完美纳什均衡为1(D),博弈只进行一个阶段就结束。显然现实中不会是这个样子的。因为合作的潜力或期望得益很大。某一博弈方在开始的某一阶段试错的风险又不是很大,这时完全有可能出现某一博弈方的(触发战略)试错,使博弈得以继续进行,从而使双方都获得更大的合作收益。现实中企业中雇主和雇员的博弈可以看成为一蜈蚣博弈。1D)1,1(221121Rd)3,0(rD)2,2(R...D)98,98(Rd)100,97(rD)99,99(Rd)101,98()100,100(

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功