微观经济第十章博弈论初步

jyg121
1 ℃
2019-07-12

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第十章博弈论初步第一节博弈论和策略行为第二节同时博弈：纯策略均衡第三节同时博弈：混合策略博弈第四节序贯博弈博弈论gametheory在传统经济理论中，经济主体做出决策时，不考虑自己的选择（决策）对其他人的影响，也不考虑其他人对自己的影响。然而，在现实经济生活中，经济主体之间的行为是相互作用、相互影响的。博弈论gametheory博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。策略性环境是指，每一个人进行的决策和采取的行动都会对其他人产生影响；策略性决策和策略性行动是指，每个人要根据其他人的可能反应来决定自己的决策和行动。博弈的三个基本要素参与人（局中人，players）：可以是自然人，也可以是企业、国家，还可能是甚至是若干个国家组成的集团（OPEC，欧盟）。策略（strategies）:局中人的行动规则，它指定局中人在每种情况下应如何行动，至少有两个可供选择的策略，“相机行动方案”。如“人不犯我，我不犯人；人若犯我，我必犯人”就是一种策略：“犯”与“不犯”就是两种不同的行动，策略则规定了什么时候选择“犯”还是“不犯”。支付（payoffs）局中人得到的效用（或期望效用），局中人真正关心的东西。博弈的类型根据参与人的数量：二人博弈和多人博弈根据参与人的支付情况：零和博弈和非零和博弈参与人的支付总和为0时，零和博弈，这意味着参与人的利益在博弈是相互冲突的。根据参与人拥有的策略的数量的多少：有限博弈和无限博弈根据参与人在实施策略上是否有时间的先后（参与人在决策时是否已经知道了其他参与人的决策）：同时博弈和序贯博弈；静态博弈（staticgame）和动态博弈（dynamicgame）。同时博弈：石头、剪刀、布。序贯博弈：下棋、打麻将。一、例子：寡头博弈囚徒困境prisoner’sdilemma两个人因盗窃被捕，警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪，除非有一个供认或两个人都供认，即使两个人都不供认，也可判他们犯盗窃物品的轻罪。囚徒被分离审查，不允许他们之间互通信息，并交代政策如下：如果两个人都供认，每个人都将因抢劫罪加盗窃罪被判2年监禁；如果两个人都拒供，则两个人都将因盗窃罪被判处半年监禁；如果一个人供认而另一个拒供，则供认者被认为有立功表现而免受处罚，拒供者将因抢劫罪、盗窃罪及抗拒从严而被重判5年。二、支付矩阵payoffstable囚徒甲囚徒乙拒供供认拒供0.5年，0.5年5年，0年供认0年，5年2年，2年参与人策略支付寡头的囚徒困境厂商甲厂商乙不降价降价不降价500，5000，800降价800，0200，200厂商甲厂商乙合作不合作合作5，61，5不合作7，12，3三、条件策略和条件策略组合把甲厂商在乙厂商选择合作条件下的最优策略即合作叫做甲厂商的条件优势策略或相对优势策略，简称条件策略。把与甲厂商的条件策略相联系的策略组合叫做甲厂商的条件优势策略组合或相对优势策略组合，简称条件策略组合。在乙厂商选择合作的条件下：条件策略：不合作条件策略组合：不合作，合作在乙厂商选择不合作的条件下：条件策略：不合作条件策略组合：不合作，不合作四、纳什均衡（非合作均衡）1、博弈均衡的概念当两个厂商的条件策略组合恰好相同，从而，两个厂商都不再有单独改变策略的倾向时，整个博弈就达到了均衡，即博弈均衡。博弈均衡是博弈各方最终选取的策略组合，是博弈的最终结果，是博弈的解。四、纳什均衡2、纳什均衡的概念指的是参与人的这样一种策略组合，在该策略组合上，任何参与人单独改变策略都不会得到好处。或者说，在一个策略组合中，如果所有其他人都不改变策略时，没有人会改变自己的策略，则该策略组合就是一个纳什均衡。“单独改变策略”是指任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略。其他人也同时改变策略的情况不在考虑之列。“不会得到好处”是指任何一个参与人在单独改变策略之后自己的支付不会增加，这包括两种情况：或者支付减少，或者支付不变。五、寻找纳什均衡的方法——条件策略下划线法先用下划线法分别表示甲厂商和乙厂商的条件策略，最后确定博弈的均衡（就是找到在两个数字之下都划线的单元格即可，与这些单元格相对应的策略组合就是所要求的均衡策略组合）。五、寻找纳什均衡的方法——条件策略下划线法第一步：分解矩阵5172甲的支付矩阵6513乙的支付矩阵第二步：在甲的支付矩阵中，找出每列的最大者。5172甲的支付矩阵=第三步：在乙的支付矩阵中，找出每行的最大者。6513乙的支付矩阵=五、寻找纳什均衡的方法——条件策略下划线法第四步：合并矩阵5,61,57,12,3甲和乙共同的支付矩阵第五步：找出两个数字下均有下划线的组合。五、寻找纳什均衡的方法——条件策略下划线法在一个单元格中，如果两个数字之下均划有线，则两个参与人都没有单独改变策略的动机，因为这两个数字分别是列最大值和行最大值；如果两个数字之下均没有线，则两个参与人都有单独改变策略的动机，因为这两个数字分别不是列最大值和行最大值；如果两个数字中一个下面有线一个下面没线，则有线的数字所代表的参与人没有单独改变策略的动机，没线的数字所代表的参与人有单独改变策略的动机。六、纳什均衡的存在性、唯一性和最优性1、存在性：在同时博弈中，（纯策略的）纳什均衡可能存在，也可能不存在。没有纳什均衡的同时博弈厂商甲厂商乙左右上4，69，1下7，32，8六、纳什均衡的存在性、唯一性和最优性2、唯一性：在纳什均衡存在的情况下，可能唯一，也可能不唯一。存在多重纳什均衡的同时博弈厂商甲厂商乙左右上5，61，4下4，12，3六、纳什均衡的存在性、唯一性和最优性3、最优性：如果纳什均衡存在，可能是最优的，也可能不是最优的。存在多重纳什均衡的同时博弈厂商甲厂商乙左右上5，61，4下4，12，3七、二人同时博弈的一般理论二人同时博弈的一般模型AB策略1策略2策略1a11，b11a12，b12策略2a21，b21a22，b2211122122aaAaa的支付矩阵1121122211211222112112221121122211211222112112221121122211211222112112221.,2.,3.,4.,5.,6.,7.,8.,9.,aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa11122122aaAaa的支付矩阵AB策略1策略2策略13，b112，b12策略23，b212，b22类型1中：A在策略上是“无差异”的，可以选择策略1，也可能选择策略2，结果完全相同。112112221.,aaaa11122122aaAaa的支付矩阵AB策略1策略2策略13，b117，b12策略23，b211，b22类型2、3、4、5中：A在某一策略上具有不严格的绝对优势——它选择策略1所得到的支付不会小于策略2。112112222.,aaaa11122122aaAaa的支付矩阵AB策略1策略2策略13，b113，b12策略23，b211，b22类型2、3、4、5中：A在某一策略上具有不严格的绝对优势——它选择策略1所得到的支付不会小于策略2。112112222.,aaaa11122122aaAaa的支付矩阵AB策略1策略2策略13，b112，b12策略23，b211，b22类型2、3、4、5中：A在某一策略上具有不严格的绝对优势——它选择策略1所得到的支付不会小于策略2。112112222.,aaaa11122122aaAaa的支付矩阵AB策略1策略2策略13，b117，b12策略22，b211，b22类型6、7中：A在某一策略上具有严格的绝对优势——它选择策略1所得到的支付总大于策略2。112112226.,aaaa11122122aaAaa的支付矩阵AB策略1策略2策略13，b113，b12策略22，b211，b22类型6、7中：A在某一策略上具有严格的绝对优势——它选择策略1所得到的支付总大于策略2。112112226.,aaaa11122122aaAaa的支付矩阵AB策略1策略2策略13，b112，b12策略22，b211，b22类型6、7中：A在某一策略上具有严格的绝对优势——它选择策略1所得到的支付总大于策略2。112112226.,aaaa11122122aaAaa的支付矩阵AB策略1策略2策略13，b112，b12策略22，b213，b22类型8、9中：A在某一策略上不存在绝对优势112112228.,aaaaA按“列”，划线法B按“行”A的支付矩阵有9种可能，B的支付矩阵也有9种可能，因此，整个博弈（亦即A与B两人合在一起）的支付矩阵总共就有9×9=81种可能。全部的纳什均衡可分为五种类型，分别有四个均衡（包括1种情况）、三个均衡（包括12种情况）、两个均衡（包括38种情况）、一个均衡（包括28种情况）、零个均衡（包括2种情况）。一、不存在纯策略均衡时的混合策略均衡即使纯策略的纳什均衡不存在，相应的混合策略均衡却总会存在。1、混合策略第一，“确定性”选择在没有纳什均衡的同时博弈里，所有参与人对策略的选择都是“确定”的，即某参与人在选择某个策略的时候，他不能再同时选择其他的策略，此时相应的条件策略也是“确定”的；最后，当参与人的条件策略是“确定”的时候，最终的博弈均衡（如果有的话）也是“确定”的。第二，“混合性”选择在现实生活中，人们对策略的选择常常并不像前面所说的那样“非此即彼”，而是会以一定的可能性来选择某个策略，又以另外的可能性选择另外一些策略。没有纳什均衡的同时博弈厂商甲厂商乙0.30.7左右0.6上4，69，10.4下7，32，8第三，“混合”策略的概念把甲厂商和乙厂商原来的策略叫做“纯”策略，把赋予这些纯策略的概率向量叫做“混合”策略。没有纳什均衡的同时博弈厂商甲厂商乙q1q2左右p1上4，69，1p2下7，32，8121212120,,,1,1,1ppqqppqq且2、混合策略组合参与人的混合策略组合是一个概率向量组合，其中，每一个概率向量是相应参与人的一个混合策略。3、期望支付在混合策略博弈中，对于每一个混合策略组合，也存在一个支付组合，其中，每一项也都是相应参与人在该混合策略组合条件下所得到的支付。不过，由于现在每个参与人都是以一定的概率来选择其纯策略的，故相应的支付也就成了所谓的“期望支付”，即支付的期望值。4、条件混合策略利用计算期望支付的公式可以求得甲厂商和乙厂商的条件混合策略（即具有相对优势的混合策略）。111221221111111111149724917121171052Epqpqpqpqpqpqpqpqpqq甲上式含义：甲厂商在乙厂商选择某个既定的q1时所选择的使E甲达到最大的p1。11171052Epqq甲111110.70,10.700.7qpqq1112212211111111111638613181152178Epqpqpqpqpqpqpqpqqpp乙111100.50,10.510.5pqpp上式含义：乙厂商在甲厂商选择某个既定的p1时所选择的使E乙达到最大的q1。5、混合策略纳什均衡参与人的条件混合策略可以分别确定，确定了条件混合策略，就可以进一步来确定混合策略的纳什均衡。二、存在纯策略均衡时的混合策略均衡求解混合策略纳什均衡的方法不仅适用于纯策略纳什均衡不存在的情况，而且也适用于纯策略纳什均衡存在的情况。在后面这种情况下，纯策略纳什均衡将作为特例被包含在相应的混合策略纳什均衡之中。存在纯策略纳什均衡的混合策略模型厂商甲厂商乙q1q2合作不合作p1合作5，61，5p2不合作7，12，3