北大2006《博弈与社会》作业2及答案

136**340
0 ℃
2023-03-02

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

2006博弈与社会第二次作业（提交时间：3月29日）请在作业上写清姓名、院系、学号和作业编码（助教在第一次作业上写的数字）1、（1）用博弈的标准型表达式描述“剪刀、石头、布”的游戏（即写出双方的支付矩阵），假设获胜的一方得1，失利的一方得-1，战平各得0，并找出该博弈的所有纳什均衡（纯战略纳什均衡和混合战略纳什均衡）。（2）如果修改游戏规则，获胜的方式不同则得分不同：z剪刀赢布，赢的一方（出剪刀的一方）得3，输的一方（出布的一方）得-3；z石头赢剪刀，赢的一方得2，输的一方得-2；z布赢石头，赢的一方得1，输的一方得-1；z打平仍然各得0。重新回答第（1）题中的问题。2、“索尼爱立信”和“明基西门子”两家公司在手机市场上的定位是相似的，二者面对的是几乎相同的潜在消费群，存在着直接的竞争，不同的是索爱更先进入市场。假设两者都面临着同样的两个可行的行动：主攻照相功能（简称为照相）和主攻音乐功能（简称为音乐），但是“索爱”先于“明西”行动，刻画两者行为的博弈树如下所示：索爱照相音乐明西照相照相音乐音乐（5，4）（10，8）（11，9）（6，5）（1）写出索爱和明西的全部战略（注意战略的定义）；（2）根据双方的战略，用标准型（支付矩阵）的表述方式重新刻画这个博弈树；（3）只考虑纯战略的情况，找出全部的纳什均衡，找出全部的精炼（完美）纳什均衡。3、重新考虑双寡头竞争的市场，市场上有两家企业，生产完全相同的产品，消费者对这种产品的需求函数为，P(Q)=a-Q，Q=q1＋q2，其中q1和q2分别是企业1和企业2的产量，生产的成本函数为C(qi)=cqi，其中i=1,2，每个企业都追求利润的最大化，即企业i选择最佳的qi使得Πi＝P(Q)qi－cqi最大，i=1,2。上面的假设与讲义第16页中提到的Cournot博弈模型是完全一致的，下面我们做一个改动，现在两家企业不再同时决策，而是有一个先后顺序。企业1先制定自己的产量，企业2随后根据企业1的产量决策自己的生产，并且决策一旦做出就无法更改。求解双方的最优决策（纳什均衡），思考在这种情况下是“先下手为强”还是“先下手遭殃”？简单解释背后的原因。【提示】采用逆向归纳的办法，从企业2的决策开始向前推。2006博弈与社会第二次作业（提交时间：3月29日）请在作业上写清姓名、院系、学号和作业编码（助教在第一次作业上写的数字）1、（1）用博弈的标准型表达式描述“剪刀、石头、布”的游戏（即写出双方的支付矩阵），假设获胜的一方得1，失利的一方得-1，战平各得0，并找出该博弈的所有纳什均衡（纯战略纳什均衡和混合战略纳什均衡）。乙甲剪刀石头布剪刀0，0-1，11，-1石头1，-10，0-1，1布-1，11，-10，0该博弈不存在纯策略纳什均衡。混合策略纳什均衡：(1/3,1/3,1/3;1/3,1/3,1/3)，即双方各以同样的概率出剪刀、石头、和布。具体做法（略）见第（2）问（2）如果修改游戏规则，获胜的方式不同则得分不同：z剪刀赢布，赢的一方（出剪刀的一方）得3，输的一方（出布的一方）得-3；z石头赢剪刀，赢的一方得2，输的一方得-2；z布赢石头，赢的一方得1，输的一方得-1；z打平仍然各得0。重新回答第（1）题中的问题。乙甲剪刀石头布剪刀0，0-2，23，-3石头2，-20，0-1，1布-3，31，-10，0该博弈同样不存在纯策略纳什均衡。（很多同学提出“石头、石头”是不是一个纯策略纳什均衡，实际上不是。石头尽管是一个看上去成本收益最好的战略，但并不意味着可以以1的概率选择石头，因为给定任何一方选择必出石头，对方肯定会用出布来战胜他，尽管出布不是一个很“好”的策略，看还不至于坏到可以将其排除的程度。“布”这个战略存在的意义就在于牵制对方出石头的行为）考虑混合策略纳什均衡：设甲分别以a、b和1-a-b的概率出剪刀石头布，乙分别以x、y和1-x-y的概率出剪刀石头布。给定双方的战略，甲和乙的期望支付分别为：Payoff(甲)＝a×[0×x－2×y＋3×(1－x－y)]+b×[2×x＋0×y－1×(1－x－y)]＋(1－a－b)×[－3×x＋1×y＋0×(1－x－y)]Payoff(乙)＝x×[0×a－2×b＋3×(1－a－b)]+y×[2×a＋0×b－1×(1－a－b)]＋(1－x－y)×[－3×a＋1×b＋0×(1－a－b)]其中a、b与x、y是对称的。甲决策的目标是最大化Payoff(甲)，他能够控制的变量为a和b，分别对其求偏导得到两个一阶条件：0×x－2×y＋3×(1－x－y)＝－3×x＋1×y＋0×(1－x－y)2×x＋0×y－1×(1－x－y)＝－3×x＋1×y＋0×(1－x－y)这实际上就是让对方出剪刀（上式左边）、出石头（下式左边）和出布（两式右边）无差异的条件，而这也是我们讲的求解混合战略纳什均衡的简单方法，这就是其理论根据。求解得到x＝1/6，y＝1/2，1-x-y=1/3也就是说给定乙以（1/6，1/2，1/3）的概率出剪刀、石头、布，甲的任何战略都是最优的；同样可以由乙的优化问题解得a＝1/6，b＝1/2，1-a-b=1/3也就是说给定甲以（1/6，1/2，1/3）的概率出剪刀、石头、布，乙的任何战略都是最优的；因此，甲乙都以（1/6，1/2，1/3）的概率出剪刀、石头、布，可以实现一个均衡的结果，用标准的博弈论语言表述就是：甲的混合战略（1/6，1/2，1/3）和乙的混合战略（1/6，1/2，1/3）构成一个纳什均衡。2、“索尼爱立信”和“明基西门子”两家公司在手机市场上的定位是相似的，二者面对的是几乎相同的潜在消费群，存在着直接的竞争，不同的是索爱更先进入市场。假设两者都面临着同样的两个可行的行动：主攻照相功能（简称为照相）和主攻音乐功能（简称为音乐），但是“索爱”先于“明西”行动，刻画两者行为的博弈树如下所示：索爱照相音乐明西照相照相音乐音乐（5，4）（10，8）（11，9）（6，5）（1）写出索爱和明西的全部战略（注意战略的定义）；（索爱只有一个信息集，所以其战略为一维的；而明西有两个（分别对应索爱选照相和索爱选音乐的情况），其战略为二维的。）索爱的全部战略（两个）为：1、主攻照相；2、主攻音乐。明西的全部战略（四个）为：1、（照相，照相）——意为：不管对方选择什么策略，我选择照相2、（音乐，音乐）——意为：不管对方选择什么策略，我选择音乐3、（音乐，照相）——意为：如果索爱照相，我主攻音乐；如果索爱音乐，我主攻照相4、（照相，音乐）——意为：如果索爱照相，我也主攻照相；如果索爱音乐，我也主攻音乐（2）根据双方的战略，用标准型（支付矩阵）的表述方式重新刻画这个博弈树；（博弈的标准型表达式是定义在双方的全部战略上的）明西索爱（音乐，音乐）（照相，照相）（音乐，照相）（照相，音乐）照相10，85，410，85，4音乐6，511，911，96，5（3）只考虑纯战略的情况，找出全部的纳什均衡，找出全部的精炼（完美）纳什均衡。（纳什均衡也是定义在双方的战略上的）纳什均衡包括[照相，（音乐，照相）]、[音乐，（照相，照相）]和[音乐，（音乐，照相）]三个。这是在支付矩阵中找到的。其中唯一的精炼纳什均衡是最后一个[音乐，（音乐，照相）]，它意味着在博弈的每一个子博弈中也构成纳什均衡，这可以使用逆向归纳法寻找。3、重新考虑双寡头竞争的市场，市场上有两家企业，生产完全相同的产品，消费者对这种产品的需求函数为，P(Q)=a-Q，Q=q1＋q2，其中q1和q2分别是企业1和企业2的产量，生产的成本函数为C(qi)=cqi，其中i=1,2，每个企业都追求利润的最大化，即企业i选择最佳的qi使得Πi＝P(Q)qi－cqi最大，i=1,2。上面的假设与讲义第16页中提到的Cournot博弈模型是完全一致的，下面我们做一个改动，现在两家企业不再同时决策，而是有一个先后顺序。企业1先制定自己的产量，企业2随后根据企业1的产量决策自己的生产，并且决策一旦做出就无法更改。求解双方的最优决策（纳什均衡），思考在这种情况下是“先下手为强”还是“先下手遭殃”？简单解释背后的原因。【逆向归纳】（1）假设到了第二家企业决策的时候，这时第一家企业的产量q1已经变成已知，企业2的问题是选择自己的产量q2以使得利润Π2＝P(Q)q2－cq2＝(a－q1－q2)q2－cq2最大化，该问题的一阶条件为a－q1－2q2－c＝0，解得q2＝（a－c－q1)/2，这可以看作企业2的最优反应函数，意为不管企业1选择什么样的产量q1，企业2都会选择与之对应的q2。（2）既然如此，回到第一家企业决策的时候，问题就是如何选择一个q1使得利润Π1＝P(Q)q1－cq1＝(a－q1－q2)q2－cq2最大化，带入企业2的反应函数q2＝（a－c－q1)/2，并求出关于q1的一阶条件得：q1＝(a－c)/2，同时可知q2＝(a－c)/4。（3）比较双方同时进入的情况（q1＝q2＝(a－c)/3）可知，在产量竞争中，的确存在着“先下手为强”的先动优势，这个模型就是张老师课上提到过的斯塔克尔伯格（Stackelberg）模型的标准形式。【两点启示】（1）在博弈中信息多并不一定是好事：企业2拥有信息优势，但还是不能够扭转其战略劣势；（2）可信的承诺是重要的：第一家企业的产量一旦确定就不能再更改，否则先动优势就会拱手相让。关于这一点的理解不妨再考虑一下这样的情况：按照这样的过程，企业1生产(a－c)/2，然后企业2生产(a－c)/4，这时看到企业2生产(a－c)/4后，如果企业的产量决策可以任意更改，那么这时企业1的最优决策就不再是(a－c)/2，简单计算可知，给定企业2生产(a－c)/4，企业1最优的决策应该为3(a－c)/8（利用最优反应函数），而一旦预期到企业1实际上会生产3(a－c)/8，那么企业2就不会选择生产(a－c)/4，而是5(a－c)/16，相应的企业2又会11(a－c)/32，企业1又会21(a－c)/64，直到达到[(a－c)/3，(a－c)/4]的纳什均衡，这样就完全等同于同时决策的情况了。