第五章博弈与竞争策略(习题参考答案)一、名词解释1.纳什均衡:有n个参与人的战略式表述博弈G={S1,…,Sn;u1,…,un},战略组合s*=(s1*,…,sn*)是一个纳什均衡,如果对于每一个i,si*是给定其他参与人s-i*=(s1*,…,si-1*,si+1*…,sn*)的情况下第i个参与人的最优战略,即:ui(si*,s-i*)≥ui(si,s-i*)si∈Si,i或者用另一种表述方式,si*是下述最大化问题的解:si*∈argi=1,2,…n2.子博弈精练纳什均衡:扩展式博弈的策略组合s*=(s1*,…,sn*)是一个子博弈精练纳什均衡,如果(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。3.完全信息动态博弈:是各博弈方先后行动,后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈4.不完全信息静态博弈:是指博弈的各参与人对其他参与人的得益函数不完全了解,并且各博弈方同时采取行动的博弈。5.静态竞争:是指在寡头垄断市场上,各竞争参与人只竞争一次,同时作出决策且对各参与人可能有的策略和相应得益都完全了解的竞争模式。6.战略联盟:是指两个或两个以上的独立企业(主要是大型企业集团)在自愿的基础为实现一定的战略目标而组建的松散企业联盟。二、单选题1.(B)2.(C)3.(B)4.(A)5.(D)6.(C)7.(C)8.(B)9.(A)10.(B)三、多选题1.(ABD)2.(ABCD)3.(ABC)4.(ACD)5.(AB)6.(CDE)7.(ABE)8.(AB)9.(A)10.(A)四、判断题1.(√)2.(×)3.(×)4.(×)5.(×)6.(ⅹ)7.(ⅹ)8.(√)五、简答题1.为什么我们在签订协议或制度安排时,要使该协议或制度构成一个纳什均衡。答案要点:因为假定博弈中所有参与人事先达成一项协议,规定出每个人的行为规则,那么在没有外在强制力的约束下,如果该协议构成一个纳什均衡,则该协议就会自动实施。即当事人都会自觉地遵守这个协议,给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。因为该规则已是自己的最优选择,偏离规则只会使自己受到损失。而如果一个协议或制度不构成纳什均衡,即不是所有参与人的最优策略组合,该协议就不会被自动实施,至少是不能持续。因为至少有一个参与人会有积极性违背协议。所以不满足纳什均衡要求的协议是没有意义的。2.答:此博弈的战略式表述可以用矩阵表来直观地给出小猪大猪按等待按3,12,4等待7,-10,0(1)没有占优策略均衡,因为尽管“等待”是小猪的占优战略,大猪没有占优战略。大猪的最优策略依赖于小猪的策略:如果小猪选择“等待”,大猪的最优策略是“按”;反之,如果小猪选择“按”,大猪的最优策略是“等待”。因此,不能用占优策略找出均衡。(2)假定小猪是理性的,小猪肯定不会选择“按”的战略,因为,不论大猪选择什么战略,对小猪来说,“等待”严格优于“按”,因而理性的小猪会选择“等待”。再假定大猪知道小猪是理性的,那么,大猪会正确地预测到小猪会选择“等待”;给定这个预测,大猪的最优选择只能是“按”。(按,等待)是这个博弈唯一的均衡,(3)举例1:股份公司中,股东承担着监督经理的职能,但股东中有大股东和小股东之分,他们从监督中得到的收益并不一样。监督经理需要搜集信息,花费时间。在监督成本相同的情况下,大股东从监督中得到的好处显然多于小股东,这里,大股东类似“大猪”,小股东类似“小猪”。纳什均衡是,大股东担当起搜集信息、监督经理的责任,小股东则搭大股东的便车。举例2:股票市场上炒股票。股市上有大户,也有小户,大户类似“大猪”,小户类似“小猪”。这时候,对小户而言,“跟大户”是最优选择,而大户则必须自己搜集信息,进行分析。举例3:在市场中大企业与小企业之间的关系。进行研究开发,为新产品做广告,对大企业是值得的,对小企业则得不偿失。所以,一种可能的情况是,小企业把精力花在模仿上,或等待大企业用广告打开市场后出售廉价产品。3.简述静态竞争策略性行为。答案要点:(1)静态竞争的概念(2)产量决策(3)价格决策(4)产品决策4.简述动态竞争策略性行为。答案要点:(1)动态竞争的概念(2)产量领先策略(3)长期竞争策略(4)米尔各罗姆-罗伯兹垄断限价模型六、论述题1.答:在上述问题构成的博弈中,博弈方为厂商1和厂商2。他们的策略空间都是由不同的产量组成,因为产量受生产能力的限制,因此理论上产量是有一个上限的,但如果假设产量是连续可分的,则他们各自都有无限多种可选策略。该博弈中两博弈方的得益自然是各自的利润,即各自的销售收益减去各自的成本,根据给定的情况,分别为u1=q1P(Q)一C1q1=q1[8-(q1+q2)]-2q1=6q1-q1q2-q12u2=q2P(Q)一C2q2=q2[8-(q1+q2)]-2q2=6q2-q1q2-q22。两博弈方(厂商)的得益(利润)都取决于双方的策略(产量)。虽然本博弈中两博弈方都有无限多种可选策略,因而无法用得益矩阵表示该博弈,但纳什均衡的概念同样还是适用的,即两博弈方的一个策略组合(q1*,q2*),只要其中q1*和q2*相互是对对方策略的最佳对策,就是一个纳什均衡。并且,如果我们可证实它是该博弈中唯一的纳什均衡,则它同样是博弈的解。因此,在本博弈中,(q1*,q2*)的纳什均衡的充分必要条件是q1*和q2*的最大值问题:的解。因为求最大值的两个式子都是各自变量的二次式,且二次项的系数都小于0,因此q1*和q2*只要能使它们各自对q1和q2的导数为0,就一定能实现它们的最大值。令:解之,得q1*=q2*=2,并且这是唯一的一组解。因此(2,2)是本博弈唯一的纳什均衡策略组合,也就意味着它是本博弈的解。两厂商将各生产2单位产量,双方得益(利润)都为2×(8一4)一2×2=4。市场总产量为2十2=4,价格为8一4=4,两厂商的利润总和为4+4=8。上述是两厂商独立同时作产量决策,他们根据实现自身最大利益的原则行动而得到的结果。那么这个结果究竟怎么样,两厂商有没有真正实现自身的最大利益,从社会总体的角度来看效率又如何?为了对这些问题作出一个判断,我们必须换一个角度来考察这个问题。上面是假设两厂商都是从追求自己一家的利益出发进行决策,虽然他们不能忽视其他博弈方的存在,但却不是关心其他博弈方的利益,不是以总体利益为目标的。如果我们现在以总体利益为目标来考虑市场的最佳产量,结果会有怎样的不同呢?首先我们可以根据市场的条件求出实现最大总得益(总利润)的总产量。设总产量为Q,则总得益U=QP(Q)一CQ=Q(8一Q)一2Q=6Q-Q2。很容易求得使总得益最大的总产量Q*=3,最大总得益u*=9。将此结果与两厂商独立决策,只追求自身利益时博弈的结果相比,总产量较小,而总利润却较高。因此,从两厂商构成的总体来看,后一种方法的效率更高。换句话说,如果两厂商可以合作,联合起来决定产量,找出使总利益最大的产量后各自生产该产量的一半1.5,则各自可分享到比双方不合作,只考虑自己利益而独立决策时更高的利益(4.54)。但是,在独立决策,缺乏协调机制的企业之间的这种合作并不很容易,即使双方认识到了合作的好处,达成了一定的协议,这种协议也往往缺乏足够的强制力,最终是很难维持上述对双方都真正最有利的产量,原因主要是因为各生产一半实现最大利润的总产量的策略组合(1.5,1.5)不是纳什均衡,也就是说,在这个策略组合(产量组合)下,双方都可以通过独自改变(增加)自己的产量而得到更高的利润,他们都有突破限额1.5的冲动,在缺乏有足够强制力的协议等限制手段的情况下,这种冲动注定他们不可能维持限额,最终是大家都增产,直至达到纳什均衡水平(2,2),实现并不是可能实现的最大利润的稳定状态。(2)本博弈是一个动态博弈,因此我们考虑用逆推归纳法来分析。根据逆推归纳法的思路,我们首先要分析第二阶段厂商2的决策,为此,我们先假设厂商l的选择为q1是已经确定的。这实际上就是在q1确定的情况下求使u2实现最大值的q2,这样的q2必须满足:6-2q2-q1=0即(1)实际上它就是厂商2对厂商1的策略的一个反应函数。厂商l知道厂商2的这种决策思路,因此他在选择q1的时就知道q2*将是根据(1)式确定的,因此可将(1)式代入他自己的得益函数,然后再求其最大值。即求使:得最大值的q1*。令q1=q1*时上式对q1的导数为0,可得:3一q1*=0即q1*=3此时q2*=3一1.5=1.5,双方的得益分别为4.5和2.25。(3)与两寡头同时选择的古诺模型的结果u1=u2=4相比,斯塔克博格模型的结果有很大的不同。它的产量大于古诺模型,价格低于古诺模型,总利润(两厂商得益之和)小于古诺模型。但是,厂商1的得益却大于古诺模型中厂商1的得益,更大于厂商2的得益。这当然是因为该模型中两厂商所处地位不同,厂商1具有先行的主动,且他又把握住了理性的厂商2总归会根据自己的选择(q1)而合理抉择的心理,选择较大的产量得到了好处。本博弈也揭示了这样一个事实,即在信息不对称的博弈中,信息较多的博弈方(如本博弈中的厂商2,他在决策之前可先知道厂商1的实际选择,因此他拥有较多的信息)不一定能得到较多的得益。出现这种现象的根源在于先行动者或者知识信息较少者吃准后行动者或知识信息较多者作为理性的博弈方,不可能为了公平或赌气而采取任何两败俱伤的行为,从而先发制人,选择比同时决策时更大的产量而获得的利益和好处。这一点也正是多人博弈与单人博弈的不同之处。在现实生活中这样的情况实际上是很多的,如在某些机会面前,一拥而上大家都要吃亏,这时往往是不知利害、盲目的人上去了,而懂得利害关系的理智的人都缩住了,结果是盲目行动的人反而得利,理智的人丧失了机会。2.答:(1)现在我们很清楚乙的处境。选择不借虽能保住本钱但也不会有更多的收益;选择借时,若甲信守诺言则不但能保住本钱还能获得100%的利润,但如果甲食言则血本无归。因此,他决策的关键是要判断甲的许诺是否可信。注意我们假设博弈方都是唯一的以自己的利益(即得益)为追求目标的。在这样的原则下,甲在轮到行为时的唯一选择只有不分,即独吞采到的金子,实现自己的最大得益4万。乙是清楚甲的行为准则的,因此他不可能被甲的不会信守的许诺盅惑,知道一旦借钱给甲,甲采到金子以后是决不会与自己对分的,合理的行为是选择不借,保住自己的本钱为上策。对乙来说,本博弈中甲有一个不可信的肯定不会信守的许诺。(2)该博弈为两博弈方之间的三阶段动态博弈。当甲选择不分时,乙有两种可以选择的行为,选不打官司,甲独吞4万元,乙什么好处都没有,仍然是血本无归,但当他选择打官司时,则能收回自己的1万元本钱,因此即使不考虑惩罚见利忘义的甲会给他带来的快慰的心理效用,乙的唯一的选择也是打官司,用法律的手段保卫自己的利益。对甲来说,乙的上述思路他是完全清楚的,因此乙的打官司的威胁是可信的,是肯定会信守的,他最理智的选择(也是最符合自身最大利益的行为)是分,双方共享利益,各得2万元。也就是说,在乙具有保卫自己利益的法律手段的前提下,甲的分钱的许诺变成可信的会信守的许诺。这样,已在第一阶段的合理选择应该是借。在该种条件下这个博弈中两博弈方所采用的策略完整表述如下:乙的策略是第一阶段选择借,如甲在第二阶段选择不分,则第三阶段选择打;甲的策略是如乙在第一阶段选择借,则他在第二阶段选择分。在双方这样的策略组合下,本博弈的路径是(借,分),双方得益为(2,2),实现有效率的理想的结果。