博弈论

steeldoor
4 ℃
2020-04-18

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

名词解释：1、零和游戏——在一项游戏中，游戏者有输有赢，一方所赢正是另一方所输，游戏的总成绩永远为零。2、纳什均衡——在博弈中，只有在这一点上，任何一人单方面改变选择，他只会得到较差的结果。这一点就是纳什均衡，又称为非合作博弈均衡3、有限重复博弈——是指重复次数是有限的且有确定终点的博弈。二、简答题1．博弈的四个要素是什么？1、博弈要有2个或2个以上的参与者2、博弈要有参与各方争夺的资源或收益3、博弈要有游戏规则4、参与者有自己能够选择的策略2．什么是触发策略？触发策略有何优点它是指参与人在开始时选择合作，在接下来的博弈中，如果对方合作则继续合作；如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略，在博弈论里面称之为触发策略，或称冷酷策略。优点是：如果对方知道你的策略是触发策略，那么对方将不敢采取不合作策略，因为一旦他采取了不合作策略，双方便永远进入不合作的困境。因此，只要有人采取触发策略，那么双方均愿意采取合作策略。同时具有“清晰性”，能让对方在三、五步对局内辨识出来，发现规律，从而不得不采取合作的态度针锋相对策略的优越性充分展示了一个纯粹自利的人何以会选择善，只因为合作是自我利益最大化的一种必要手段。3．请描述“囚徒困境”的案例。两个嫌疑犯（甲和乙）作案后被警察抓住，隔离审讯；警方的政策是“坦白从宽，抗拒从严”：如果两人都坦白则各判8年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判15年；如果都不坦白则各判１年。这两个囚犯该怎么办呢？是选择互相合作（不坦白）还是互相背叛（坦白）？这就是囚徒困境了。4．请举例说明理性决策的困境。经济学建立在两个假设前提上：(1)人是自私的，都在追求利益的最大化；(2)人是理性的，其所有行为都是为了实现追求利益最大化这个目的。分钱博弈:一个宾馆服务员捡到了100元，他想据为己有；可是另一个服务员看到了，于是威胁如果不分给他一部分，他就要向领班报告，在那种情况下，这笔钱就要上缴，谁也得不到。A提方案时要猜测B的反应，A会这样想：根据“理性人”的假定，A无论提出什么方案给B——除了1分钱都不给B这种极端的情况，B只有接受，因为B接受了还有所得，而不接受将一无所获——当然此时A也将一无所获。此时理性的A的方案可以是：留给B一点点比如1分钱，而将99.99元归为己有，即方案是：99.99：0.01。B接受了还会有0.01元，而不接受将什么也没有。这是根据理性人的假定的结果，而实际则不是这个结果。这个博弈反映的是，“人是理性的”这样的假定在某些时候存在着与实际不符的情况。三、论述题：1．麦当劳和肯德基为什么总是相邻设店?请以博弈论的观点论述。假设有条完全笔直的公路，连接城市A到城市B之间的交通。这条公路上每天行驶着大量的车辆，并且车流量在公路上是均匀分布的。假设麦当劳和肯德基要在这条公路上选择一个位置，招揽来往车辆。一个合乎逻辑的假定：通常情况下，车辆总是乐意到距自己最近的快餐店购买食物。从资源的最佳配置来看，麦当劳、肯德基应该分别开在1/4、3/4处是最优。在这种均匀散布的情况下，每家快餐店所有拥有的客户从距离最近的城市到两家快餐店的中心为止，因此都拥有1/2的顾客量，同时对于开车的人们总体来说，这种策略的选择，车辆到快餐店的总的距离最短。肯德基与麦当劳都是百年老店，自然是精明之至，从经济学上就是具有经济理性，总是希望自己的生意尽可能地红火，至于其他人的生意的好坏则与己无关。出于这种理性，肯德基肯定会想到：如果将店铺从3/4点处向左移一点，将从麦当劳抢夺走部分顾客，这对于肯德基单方面来说无疑是一个好主意。当然麦当劳也不甘示弱，作为一个“理性人”，麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。不难想象，双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态，甲乙两人相依为邻且相安无事地做起快餐生意。即使不是两家快餐店，而是很多家快餐店，也很容易分析得到结果：这些快餐店仍然会在1/2处设店达到纳什均衡。同样的道理，如果地段的繁华等其他原因在一条路上上都可以认为到处相同的话，没有一个商家会将自己安置于某条路的一头，只要条件许可，超市将几乎趋向于相依为邻，这种现象完全可以看作公正的市场竞争的合理结果。这就是很多城市商业中心形成的原理，在博弈论中称为位置博弈。2．请举例说明博弈的“向前展望，从后倒推”的思维方式。强盗分赃:有五个海盗抢得100枚金币，在如何分赃问题上争吵不休。于是他们决定：(1)抽签决定各人的号码(1，2，3，4，5)；(2)由1号提出分配方案，然后5人表决，如果方案超过半数同意就被通过，否则他将被扔进大海喂鲨鱼；(3)1号死后，由2号提方案，4人表决，如果方案超过半数（不含半数）同意时方案通过，否则2号同样被扔进大海；(4)依次类推，直到找到一个每个人都接受的方案(当然，如果只剩下5号，他当然接受一人独吞的结果)。方法举例~~结果：1号强盗分给3号1枚金币，4号或5号强盗2枚，独得97枚。分配方案可写成(97，0，1，2，0)或(97，0，1，0，2)。3．请举例说明逆向选择的困境，并说明走出逆向选择的途径？所谓“逆向选择”应该定义为信息不对称所造成市场资源配置扭曲的现象。它的一个定义是指由交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品，进而出现市场交易产品平均质量下降的现象。在旧车市场，卖者知道车的真实质量，而买者不知道。这样卖者就会以次充好，买者也不傻，尽管他们不能了解旧车的真实质量，只知道车的平均质量，愿平均质量出中等价格，这样一来，那些高于中等价的上等旧车就可能会退出市场。接下来的演绎是，由于上等车退出市场，买者会继续降低估价，次上等车会退出市场；演绎的最后结果是：市场上成了破烂车的展览馆，极端的情况一辆车都不成交。现实的情况是，社会成交量小于实际均衡量。这个过程称为逆向选择。出现了劣币驱逐良币的现象。逆向选择的困境，解决的途径除有三个：其一是“信号传递”；其二是“信息甄别”；其三是制度设计。四、案例分析：1．某城市政府采购办公用品，每年招标，只挑选两个供应商。政府每个月采购一次，两个供应商每个月就当月采购商品报价。实行“价低者得”原则，如两供应商报价相同，则订单分为均等的两半，两供应商各得50%。如报价不同，则全部订单给价低者。请问这两个供应商应如何报价？为什么？两供应商相互合作，共同报一相同高价，获取最大利润，自是双方的最优策略。两供应商共同合作了11个月，但在第12个月，两供应商知道这是今年最后一次，对方很有可能背叛。与其对方背叛，不如自己背叛。两供应商知道第12次对方会背叛，那么第11次不如我就背叛，因为第11次采用合作的态度并不会促使对方在第12次时合作。同理，第10次、第9次……第1次，每一次都应该背叛。因此双方不可能合作共同报高价，而是相互竞争地报低价。2．假设你是一个处于古战场前线的士兵，当面对敌方的阵线时你采取何种策略最佳？如果己方获胜，你的贡献不太可能是决定性的，你倒是冒着有可能受伤或者牺牲的风险；如果敌方取胜，你伤亡的可能性就更大了。于是唯一合理的结论是：逃跑。如果每个士兵都如此推理的话，恐怕战争就不存在了。请说明为什么大多的士兵并没有逃跑？显然，在没有军规制约的条件下，士兵选择不合作（逃跑）是自然的纳什均衡点。因为在战争中已经知道会战败时，作为一个理性经济人，士兵逃跑的收益是最大的，这时士兵会作出背叛的策略，而不会去上战场作战。但实际上士兵还是没有逃跑，这是因为军规改变对策者的可能收益值的大小，若士兵临阵逃亡，则会受到军法处决，对于在战场上取得胜利的收益远好过临阵逃亡的收益好，故士兵还是勇猛的向前冲。3．仅1985年至2000年的15年里，中央就下达“减负令”49次。减轻中小学生过重负担喊了20多年，实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。请说明数十道“减负令”难见效，中小学生课业负担不减反增的原因。根据博弈论中的纳什均衡，对于学生和学校来说，别的学生减负，自己不减或增加，显然对自己有利；若别的学生不减负，那么自己还是不能减负，否则自己就输了。所以说大家都不减负，并增负才能达到纳什均衡点，这样子才能使自己的收益最大化。由于这些减负令没有改变作出背叛策略的行为的收益值，所以不能走出这个“囚徒困境”。4．百佳超市打出低价口号，“我们的价格是全市最低的。”沃尔玛超市也打出低价保证，“我们的价格保证全市最低，否则差价双倍赔偿。”请说明沃尔玛为什么敢作此保证？沃尔玛的“差价双倍赔偿”保证让百佳减价吸引顾客的策略不能奏效。百佳减价并不能起到吸引顾客的效果，反而起了完全相反的作用，将消费者全赶到沃尔玛了。同时跑来索赔的顾客在毫不知情的情况下，免费扮演了这个价格联盟的执法侦探。