1111111111111111111博弈论练习题(四)一、什么是子博弈精炼纳什均衡?答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么?答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题:(1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。(2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性”,若纳什均衡不是唯一的,上述定理的结论就不一定成立。四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:2博弈重复次数有限,意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中,如果某一参与人选择了自己的占优战略,给其他参与人造成损失,则其他参与人不可能报复。所有的参与人都明白这一点,因而在最后一次阶段博弈中都会选择占优战略,换句话说,在给定最后阶段所有参与人都会选择占优战略的前提下,所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。由此从最后的阶段开始,逐个阶段进行推理,可以得出以下结论:在阶段博弈有唯一的纳什均衡时,有限次重复博弈的唯一子博弈精炼纳什均衡结果,是阶段博弈的纳什均衡重复。这就是说,每个阶段博弈出现的都是一次性博弈的均衡结果。六、无限次重复博弈均衡解的得益一定会优于原博弈均衡解的得益吗?答:不一定。例如:无限次重复博弈的古诺博弈,此博弈是相同博弈重复无限次,当冷酷战略是整个博弈的纳什均衡时,当然也就是每个阶段的纳什均衡。此时,无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈,一是选择生产垄断产量的一半Q/2,另一是选择生产背叛产量时,冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。贴现因子较大说明未来的利益较大,对两厂商都有较大的吸引力,一般情况下,两厂商不会为了短期利益而背叛对方而失去较大的长远利益,即两厂商都有坚持冷酷战略的积极性。而当时,意味着冷酷战略不再是一个子博弈精炼纳什均衡。贴现因子较小说明未来的利益对两厂商都不具有吸引力,选择背叛才是两厂商的最优选择。这种条件下,博弈无限次重复也不能提高一次性博弈的得益。七、触发战略所构成的均衡都是子博弈精炼纳什均衡吗?答:“触发战略”是这样一种战略∶首先试探合作,如果对方合作,则给予奖励;如果对方不合作,则给以惩罚。在原博弈有多个纳什均衡的条件下,在重复博弈时,通过触发战略提高了双方的收益。首先,在第二次博弈时意味着该博弈结束,而均衡结果是原博弈的纳什均衡,双方都没有偏离的意愿;其次,第一次选的策略虽不是原博弈的纳什均衡,如果某一方偏离会增加收益,但这样会遭到对方第二次选另外的策略的惩罚而损失收益,使总得益减少。预见到这一点,只顾眼前不顾长远的偏离是得不偿失的事,因此双方会坚持选使总收益最大的策略。所以,触发战略构成的均衡都是子博弈精炼纳什均衡。八、什么是冷酷战略?什么是针锋相对战略?什么是最小最大战略?答:冷酷战略也称为触发战略,这种战略做法是∶1、参与人在博弈开始时均选择合作;2、只要对方一直选择合作,则继续合作下去,但当某一时刻对方选择了不合作,则一直永远选择不合作来惩罚对方的背叛行为。针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛。最小最大战略:最小最大战略是指当违规者不采取合作行为而对他进行惩罚时,违规者可能得到的最严厉的制裁的战略(相应的,违规者为了减少惩罚对自己的影响,而使自己得益最大的战略。练习题(五)一、若你正在考虑收购一家公司的一万股股票,卖方的开价是2元/股。根据经营情况的好坏,该公司股票的价值对你来说有1元/股和5元/股两种可能,但只有卖方知道经营的3真实情况,你只知经营好、坏的概率各为0.5。如果公司经营不好时,卖方做到使你无法识别真实情况的“包装”费为5万元,你是否会按卖方的价格买下这些股票?如果“包装”费仅为0.5万元,你会如何选择?答:当卖方使买房无法识别真实情况的包装费为5万元时,买方的股票价值期望值为E=0.5×﹙1-5﹚+0.5×5=0.5元/股在这种情况下,无法接受卖方给出的价格当卖方的包装费为0.5万元时,买方的股票价值期望值为E=0.5×﹙1-0.5﹚+0.5×5=2.75元/股在这种情况下,接受卖方给出的价格二、现实生活中常常是既有部分卖假冒伪劣产品的厂商会打出“质量三包”、“假一罚十”等旗号,也有一些卖假冒伪劣产品的厂商声明“售出商品概不退换”。问这两类厂商有什么不同,他们各自战略的根据是什么?答:第一类厂商实行战略的根据是:“最大最小战略”,根据无限次重复博弈中的子博弈精炼纳什均衡实际上是参与人相互合作的结果,要使合作成功,其战略中必须要有惩罚措施。所谓最小最大战略是指当违规者不采取合作行为而对他进行惩罚时,违规者可能得到的最严厉的制裁的战略。第二类厂商采取战略的根据是:“冷酷战略”,任何为了短期利益的背叛行为的所得对长期利益而言都是微不足道的,且会遭到对方一直背叛的冷酷打击,故参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的背叛行为。三、在有两个投标者的暗标拍卖中,投标者的估价独立分布于[0,1]且两人的估价相同,则贝叶斯纳什均衡是什么?博弈的结果是什么?如果两投标者知道他们的估价是相同的,结果会发生什么变化?解:两个人投标人为i,j,投标者i的支付如下:最终解得,拍卖的对称贝叶斯均衡战略为∶同理可得,对投标人j也可得到相同的结论即,在只有两个投标人时,这个博弈的贝叶斯均衡是,每个投标人的出价是其实际价值的一半。如果两个投标者知道他们的估价相同,即信息是完全的,买者之间的竞争将使卖者得到买者价值的全部。四、“说实话”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。答:“说实话的直接机制”。即如果所设计的直接机制能使得各投标人讲真话,也就是声明自己的真实类型(如对商品的真实价值)是贝叶斯纳什均衡,则称这样的直接机制为jijiiijiiiijiissssssssssu,0,2/)(),(;2/*iis2/*jjs4“说实话的直接机制”。也称为“激励—相容”或“鼓励—响应”机制。如果代理人从讲真话中得到稍高的效用,则讲真话变为强均衡。事实上,如果讲真话的效用足够强,则代理问题以及与之相联系的成本将会消失,能保证博弈方都按他们的真实类型行为并获得理想的结果。五、静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。答:正确。不完全信息静态博弈的静态贝叶斯纳什均衡实际上是这样一种类型依从型战略组合∶给定自己的类型和别人类型的概率分布情况下,每个参与人最大化自己的期望效用。博弈方需要针对自己的所有可能类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡六、什么是贝叶斯纳什均衡?答:n人不完全信息静态博弈:的纯战战略贝叶斯纳什均衡是一个类型依存战略组合,其中每个参与人i在给定自己的类型和其他参与人类型依存战略,的情况下最大化自己的期望效用函数,换言之,战略组合是一个贝叶斯纳什均衡,如果对于所有的i,有,贝叶斯纳什均衡实际上是这样一种类型依从型战略组合∶给定自己的类型和别人类型的概率分布情况下,每个参与人最大化自己的期望效用。七、拍卖(招标)有哪几种常用的方式?答:(1)最高价格密封出价拍卖(一级密封价格拍卖)(2)次高价格密封出价拍卖(维克瑞拍卖)(3)双方叫价拍卖(4)最高价格公开出价拍卖(英国式拍卖)(5)降价式拍卖(荷兰式拍卖)八、机制设计的基本原理是什么?什么是“直接机制”与“显示原理”?答:机制设计的基本原理是:选择一个博弈规则,最大化自己的期望效用函数。直接机制:所谓直接机制,就是指代理人(这里的买者)的战略空间(拍卖中买者的报价)等同于类型空间(拍卖中买者的价值)。其意义是只要代理人声明他们对拍卖商品的价值,并不需要他们报出标价,委托人(卖方)会根据预先确定的运作机制(包括一个随机选择过程)来确定中标者和中标价格。显示原理:显示原理∶对每个导致可能说谎(即的机制,其代理人的得益为(),存在着一个机制,代理人的得益为()使其对于每个(讲真话)的代理人得到相同的结果,这时,代理人将没有说谎话的积极性。练习题(六)一、假如某商品的确切价值是100,这只有卖方知道,你作为买方只知道该商品的价值标准分布于[80,110]上。假设因为是积压品或需要回茏资金,因此卖方对该商品的主观价},,;,,;,,;,,{1111nnnnuuppAAGi)(*iiaiu)}(,),({*1*1*nnaaa),(iiiAa},);(,{)(maxarg)(**iiiiiiiiiaiiaaupai)iiSiuiqis*iuiqisi5值评价是在客观价值上打7折,这一点你也知道。如果交易价格由卖方提出,你只能选择是否接受,问该博弈中卖方和买方(你)的合理战略是什么?答:二、假如在一个经济案件中,原告清楚上法庭自己是否会赢,而且这是原被告的共同知识,而被告不清楚谁会赢,只知道原告赢的可能性是1/3。再假设原告赢时的净利益为3,被告的净利益为-4;原告败诉时的净利益为-1,被