第二章策略型博弈

yang321321
1 ℃
2019-07-21

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

博弈论与信息经济学GameTheoryandInformationEconomics第二部分非合作博弈理论第二章策略型博弈第三章扩展型博弈第四章贝叶斯博弈第五章动态贝叶斯博弈主要内容第一节策略型博弈的表示第二节重复剔除严格劣策略均衡第三节纳什均衡第四节混合策略纳什均衡第五节纳什均衡的存在性第二章策略型博弈——同时行动，如何决策策略型(标准型）表述——适合表示静态博弈扩展型表述——适合表示动态博弈博弈有两种表述方法一、策略型博弈的含义完全信息静态博弈又称为策略型博弈。完全信息是指局中人对自己与其他局中人的所有与博弈有关的事前信息（策略空间、支付函数等）有充分的了解(局中人的支付函数是共同知识)。静态博弈是指在博弈中，局中人同时采取行动，或者局中人的行动有先有后，但后行动者不能知道先行动者的行动选择。第一节策略型博弈的表示二、策略型博弈的三个要素：1、局中人（Players):1,2,…,n；2、策略（Strategies):;3、支付函数（Payofffunctions)表示为：第一节策略型博弈的表示niSsii,...,2,1,},...,;,...,{11nnuuSSG1、有限博弈：(1)博弈中局中人人数有限;(2)每个局中人只有有限个策略。2、零和博弈：博弈中局中人所获支付之和为零，即一方所得为另一方所失。三、两种特殊博弈类型1、局中人：甲，乙2、策略：{坦白,不坦白}3、支付函数——支付矩阵（双人有限博弈）每个位置上第一个数字表示局中人1在对应的策略组合中得到的支付，第二个数字表示局中人2的相应所获支付。例2.1囚徒困境及其策略型表示(Tucker,1950)乙甲SS乙甲坦白不坦白坦白-6，-6-1，-8不坦白-8，-1-2，-2囚徒困境的支付矩阵乙甲石头剪刀布石头0，01，-1-1，1剪刀-1，10，01，-1布1，-1-1，10，1例2.2石头、剪刀、布的支付矩阵田忌齐王上中下上下中中上下中下上下上中下中上上中下3，-31，-11，-11，-1-1，11，-1上下中1，-13，-31，-11，-11，-1-1，1中上下1，-1-1，13，-31，-11，-11，-1中下上-1，11，-11，-13，-31，-11，-1下上中1，-11，-11，-1-1，13，-31，-1下中上1，-11，-1-1，11，-11，-13，-3例2.3田忌赛马的支付矩阵局中人：男，女策略：男：看足球，看芭蕾女：看足球，看芭蕾支付矩阵：见下一页例2.4性别大战（battleofthesexes)女男足球芭蕾足球3，21，1芭蕾-1，-12，3性别大战的支付矩阵一、基本思想：如果一个局中人在任何情况下从某种策略中得到的支付均小于从另一种策略中得到的支付，那么显然对他而言，前一种策略劣于后一种策略。从个人利益出发，被剔除的策略不会被局中人采用。从而可以利用剔除严格劣策略的概念来简化博弈局势，可能会得到博弈的解。第二节重复剔除严格劣策略均衡,如果存在，对于所有的都有且其中至少有一个为严格不等式，则称是第i个局中人的一个严格劣策略。二、严格劣策略的定义iiSsiiSs),...,,,...(),...,,,...(111111niiiniiiSSSSSsssss),(),(iiiiiissussuis1、根据理性的局中人不会选择严格劣策略这一原则，可以通过重复剔除严格劣策略的方法对博弈进行求解。2、其方法是：对每个局中人寻找严格劣策略，由于它不会被局中人选择实施，所以找到一种后就可以将其从博弈局势中剔除，从而得到一种新的缩减后的博弈局势，对这种新局势重复上述过程，直到无法找到新的严格劣策略为止。三、重复剔除严格劣策略对局中人甲而言，无论局中人乙采取何种策略，采用“不坦白”策略得到的支付都小于采用“坦白”策略。局中人甲的“不坦白”策略严格劣于“坦白”策略.“不坦白”策略都是一种严格劣策略，从而可以剔除。博弈中局中人各自从自身利益出发的理性选择（博弈均衡解）就是（坦白，坦白）。四、囚徒困境的解乙甲坦白不坦白坦白-6，-6-1，-8不坦白-8，-1-2，-2例2.1囚徒困境的支付矩阵甲：“不坦白”相对于“坦白”是严格劣策略乙甲坦白不坦白坦白-6，-6-1，-8乙：“不坦白”相对于“坦白”是严格劣策略乙甲坦白坦白-6，-6·例2.5利用重复剔除严格劣策略求解乙甲左中右上1，01，20，1下0，30，12，0·乙：“右”相对于“中”是严格劣策略乙甲左中右上1，01，20，1下0，30，12，0·甲：“下”相对于“上”是严格劣策略乙甲左中上1，01，2下0，30，1·乙：“左”相对于“中”是严格劣策略乙甲左中上1，01，2·重复剔除严格劣策略均衡是(上,中)乙甲中上1，21、每一步剔除需要局中人间相互了解的更进一步假定，如果我们把这一过程应用到任意多步，需要假定“局中人是理性的”是共同知识。2、这一方法对博弈结果的预测经常是不准确的.五、重复剔除严格劣策略有两个缺陷乙甲石头剪刀布石头0，01，-1-1，1剪刀-1，10，01，-1布1，-1-1，10，0例2.2石头、剪刀、布的支付矩阵利用重复剔除严格劣策略无法求解例2.6利用重复剔除严格劣策略无法求解乙甲左中右上0，44，05，3中4，00，45，3下3，53，56，6大多数的博弈局势中使用剔除严格劣策略的方法能够对博弈局势进行简化，但可能得不到博弈的均衡解。需要引入非合作博弈理论中的核心概念——纳什均衡(NashEquilibrium)。六、注意一、纳什均衡的思想“双赢”或“多赢”第三节纳什均衡它是关于博弈结局的一致性预测如果所有局中人预测一个特定的纳什均衡会出现，那么这种均衡就会出现。只有纳什均衡才能使每个局中人均认可这种结局，而且他们均知道其他局中人也认可这种结局。二、纳什均衡的意义1、博弈的纳什均衡是这样一种最优策略组合，是一种你好、我好大家都好的理性结局，其中每一个局中人均不能也不想单方面改变自己的策略而增加收益，每个局中人选择的策略是对其他局中人所选策略的最佳反应。三、纳什均衡的定义2、数学定义：在策略型博弈中，如果对于每个局中人i，存在，都有或则称策略组合是此博弈G的一个纳什均衡。iiSsiiiiiiiiSsssussu),,(),(),...,(1nss},...,;,...,{11nnuuSSGnissusiiiSsiii,...,2,1,),(maxarg三、纳什均衡的定义1、双人有限博弈：双划线法首先对局中人2的每一个策略，局中人1寻找支付最大的策略，在其对应支付下划线；然后对局中人1进行相应的步骤；最后，凡是两个局中人支付下均被划线的结局就是纳什均衡。四、纳什均衡的求法用双划线法可以求出纳什均衡：（坦白，坦白），（-6，-6）意义：揭示个人理性与集体理性之间的矛盾。例2.1囚徒困境的纳什均衡乙甲坦白不坦白坦白-6，-6-1，-8不坦白-8，-1-2，-2乙甲坦白不坦白坦白-6，-6-1，-8不坦白-8，-1-2，-2乙甲坦白不坦白坦白-6，-6-1，-8不坦白-8，-1-2，-2局中人：大猪，小猪策略：大猪：按，等待小猪：按，等待支付矩阵：见下一页纳什均衡：（按，等待）例2.7智猪博弈（boxedpigs)小猪大猪按等待按5，14，4等待9，-10，0例2.7智猪博弈的支付矩阵小猪大猪按等待按5，14，4等待9，-10，0小猪大猪按等待按5，14，4等待9，-10，0女男足球芭蕾足球3，21，1芭蕾-1，-12，3例2.4性别大战博弈的支付矩阵女男足球芭蕾足球3，21，1芭蕾-1，-12，3女男足球芭蕾足球3，21，1芭蕾-1，-12，3局中人：甲，乙策略：甲：放左手，放右手乙：猜左手，猜右手支付矩阵：见下一页没有纳什均衡例2.8猜左右手游戏乙甲猜左手猜右手放左手-1，11，-1放右手1，-1-1，1乙甲猜左手猜右手放左手-1，11，-1放右手1，-1-1，1乙甲猜左手猜右手放左手-1，11，-1放右手1，-1-1，12、连续性博弈纳什均衡的求法首先求出每个局中人对其他局中人策略组合的反应函数——即在其他局中人策略组合给定时极大化自己的支付，得到的最佳反应策略表现为其他局中人策略组合的函数；然后将这些反应函数联立求解即得到博弈的纳什均衡解。四、纳什均衡的求法局中人：厂商1，厂商2策略：厂商1：选择产量厂商2：选择产量假设：价格支付函数(利润函数)：例2.9两寡头产量竞争Cournot（1838）模型1q2q)(21qqap])([),(211211cqqaqqq])([),(212212cqqaqqqCournot模型求解])([),(max2112111cqqaqqqq])([),(max2122122cqqaqqqq02)1(])([),(2*1*12*11211cqqaqcqqaqqq02)1(])([),(*11*2*212212cqqaqcqqaqqq反应函数:纳什均衡：)(2121cqaq)(2112cqaq)(31),(31),(21cacaqq221)(91caCournot模型求解假设两寡头可以串谋，共同确定产量Q使总利润最大化，利润函数为：(Q)=Q(a-Q-c)总利润最大的产量为：——称为契约曲线总利润为：比较及含义：两寡头产量串谋模型)(21caQm)(2121caQQQm2)(41cam221)(92cam)(3221caqqQmQ1厂商2的反应曲线纳什均衡契约曲线厂商1的反应曲线OQ2图1反应曲线、纳什均衡与契约曲线)(21ca)(21ca)(31ca)(31ca局中人：厂商1，厂商2策略：厂商1选择价格；厂商2选择价格假设:两寡头固定成本都为0，边际成本为常数c,消费者对厂商1和2生产产品的需求量分别为：;例2.10两寡头价格竞争Bertrand（1883）模型1p2p21211),(bppappq12212),(bppappq支付（利润）函数：最优化的一阶条件是:Bertrand（1883）模型及求解))((),(121211cpbppapp))((),(212212cpbppapp02)())(1(),(2*12*1*11211cbppabppacpppp02)())(1(),(1*21*2*22212cbppabppacpppp反应函数：纳什均衡价格：bcabcapp2,2),(21)(2121cbpap)(2112cbpapBertrand（1883）模型及求解在n个局中人的策略型博弈中，1、如果重复剔除严格劣策略剔除掉除策略组合s以外的所有策略，则这一策略组合s为该博弈的唯一的纳什均衡。2、如果策略组合s是一个纳什均衡，那么它就不会被重复剔除严格劣策略所剔除。纳什均衡是比重复剔除严格劣策略更强的解概念。五、纳什均衡与重复剔除严格劣策略均衡一、举例说明混合策略纳什均衡例2.8猜左右手游戏第四节混合策略纳什均衡乙甲（q）猜左手（1-q）猜右手（p）放左手-1,11,-1（1-p）放右手1,-1-1,1在甲选，乙选这种策略时，他们的期望效用分别为：混合策略与期望效用(,1)pp甲(,1)qq乙,)(1)(1)1(1)1(1)(1)(1)4221Eupqpqpqpqpqpq甲甲乙（,)1(1)(1)(1)(1)(1)(1)14221Eupqpqpqpqpqpq乙甲乙（甲和乙的目标是:最优化的一阶条件是:1224),(maxqppqpEup乙甲甲混合策略纳什均衡1224),(maxqpp