博弈论题型一:纯策略纳什均衡1、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):小猪按等待大猪按5,14,4等待9,-10,0求纳什均衡。在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)。题型二:混合策略的纳什均衡2、求出下面博弈的纳什均衡(含纯策略和混合策略)。乙LR甲U5,00,8D2,64,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1可得混合策略Nash均衡((9891,),(7374,)据说是去年考了的原题!3、Smith和John玩数字匹配游戏,每个人选择1、2、3,如果数字相同,John给Smith3美元,如果不同,Smith给John1美元。(1)列出收益矩阵。(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少?答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。John123Smith13,-3-1,1-1,12-1,13,-3-1,13-1,1-1,13,-3(2)Smith选(1/3,1/3,1/3)的混合概率时,John选1的效用为:31131131)3(311UJohn选2的效用为:31131)3(311312UJohn选3的效用为:31)3(311311313U类似地,John选(1/3,1/3,1/3)的混合概率时,Smith选1的效用为:31)1(31)1(31331'1USmith选2的效用为:31)1(31331)1(31'2USmith选3的效用为:31331)1(31)1(31'3U因为321UUU,'3'2'1UUU,所以:)31,31,31(),31,31,31(是纳什均衡,策略值分别为John:31U;Smith:31'U。这个也是据说的去年原题古诺模型斯塔伯格模型我觉得还是很重要的4、假设双头垄断企业的成本函数分别为:1120QC,2222QC,市场需求曲线为QP2400,其中,21QQQ。(1)求出古诺(Cournot)均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。(2)求出斯塔克博格(Stackelberg)均衡情况下的产量、价格和利润,并以图形表示。(3)说明导致上述两种均衡结果差异的原因。答:(1)对于垄断企业1来说:219020)](2400max[211121QQQQQQ这是垄断企业1的反应函数。其等利润曲线为:21211122380QQQQ对垄断企业2来说:4502)](2400max[1222221QQQQQQ这是垄断企业2的反应函数。其等利润曲线为:22212242400QQQQ在达到均衡时,有:308024501902111QQQQ均衡时的价格为:180)3080(2400P两垄断企业的利润分别为:128008023080280380213600304308023040022均衡点可图示为:(2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为:4/5012QQ则企业1的问题可简化为:3/803/280204502400max211111QQQQQQ0企业195200190企业2企业1的反应线均衡点均衡时价格为:16038032802400P利润为:3/392001,9/256002该均衡可用下图表示:企业2领先时可依此类推。(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”题型三:子博弈完美纳什均衡5、在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q1-q2-q3,这里qi是企业i的产量。每一企业生产的单位成本为常数c。三企业决定各自产量的顺序如下:(1)企业1首先选择q1≥0;(2)企业2和企业3观察到q1,然后同时分别选择q2和q3。试解出该博弈的子博弈完美纳什均衡。答:该博弈分为两个阶段,第一阶段企业1选择产量q1,第二阶段企业2和3观测到q1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。(1)假设企业1已选定产量q1,先进行第二阶段的计算。设企业2,3的利润函数分别为:223212cqq)qqqa(323213cqq)qqqa(由于两企业均要追求利润最大,故对以上两式分别求一阶条件:0232122cqqqaq(1)0cq2qqaq32133(2)求解(1)、(2)组成的方程组有:3cqaqq1*3*2(3)Stackelberg均衡点企业2的反应线500企业195200190企业2企业1的反应线(2)现进行第一阶段的博弈分析:对与企业1,其利润函数为;113211cqq)qqqa(将(3)代入可得:3)cqa(q111(4)式(4)对q1求导:0cq2aq111解得:)ca(21q*1(5)此时,2*1)ca(121(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:)ca(21q*1,)ca(61qq*3*2题型四重复博弈的触发机制求δ的范围这个是重点6、如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问δ应满足什么条件,才存在子博弈完美纳什均衡?乙甲坦白不坦白坦白4,40,5不坦白5,01,1参考答案:由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为(1,1),采用触发策略,局中人i的策略组合s的最好反应支付)s,s(Pmax)s(iiiSsiii=5,Pi(s*)=4,Pi(sc)=1。若存在子博弈完美纳什均衡,必须满足:411545)s(P)s()s(P)s(ci*i*i*i,即只有当贴现因子1/4时,才存在子博弈完美纳什均衡。7、在Bertrand价格博弈中,假定有n个生产企业,需求函数为P=a-Q,其中P是市场价格,Q是n个生产企业的总供给量。假定博弈重复无穷多次,每次的价格都立即被观测到,企业使用“触发策略”(一旦某个企业选择垄断价格,则执行“冷酷策略”)。求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ是多少。并请解释δ与n的关系。分析:此题可分解为3个步骤(1)n个企业合作,产量总和为垄断产量,价格为垄断价格,然后平分利润。(2)其中一个企业采取欺骗手段降价,那个这家企业就占有的全部市场,获得垄断利润(3)其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零。参考答案:(1)设每个企业的边际成本为c,固定成本为0P=a-QTR=P*Q=(a-Q)*QMR=a-2Q因为:MR=MCa-2Q=c则:Q=(a-c)/2P=(a+c)/2π=(P-c)*Q=(a-c)2/4每家企业的利润为(a-c)2/4n(2)假设A企业自主降价,虽然只是微小的价格调整,但足以占领整个市场,获得所有的垄断利润——(a-c)2/4(3)其他企业在下一期采取冷酷策略,使得所有企业的利润为0考虑:A企业不降价:(a-c)2/4n,(a-c)2/4n,……A企业降价:(a-c)2/4,0,……使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴现值。设贴现因子为δA不降价的贴现值:[(a-c)2/4n][1/(1-δ)]A降价的现值:(a-c)2/4于是:[(a-c)2/4n][1/(1-δ)]≥(a-c)2/4解得:δ≥1-1/n题型五不完全信息下的静态博弈产生的贝叶斯均衡详情请见PPT302面303面以及不完全信息下的古诺模型8、市场进入博弈(贝叶斯均衡)一个完全垄断企业B正在垄断一个行业市场,另一个潜在的试图进入该行业的企业A,称A为进入者,B为在位者。A不知道B的成本特征,设B有两种可能的成本,即高成本和低成本。两种成本情况下的博弈矩阵如表6.1。表6.1市场进入博弈B高成本低成本默认斗争默认斗争A进入40,50-10,030,80-10,100不进入0,3000,3000,400假定B知道进入者A的成本为高成本,且与B为高成本时的成本相同。假若信息是完全的,则当B为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。当B为低成本时,唯一的纳什均衡为(不进入,斗争),即若A进入行业,具有低成本优势的B将通过降低价格将A逐出市场。由于存在行业进入成本,所以A被逐出市场后将有净的10单位进入成本的损失。当A不知道B的成本情况时,他的选择将依赖于他对B的成本类型的主观概率或先验概率密度。设A对B是高成本的先验概率判断为P,则A认为B为低成本的概率为P1。如果A进入,其期望支付为)10)(1()40(PP如果1不进入,其期望支付为0。当且仅当0)10)(1()40(PP或51P时,A选择进入;反之,当51P时,A不进入。于是,贝叶斯均衡为:(进入,默认),高成本,51P;(进入,斗争),低成本,51P;(不进入,*),51P其中*表示可以是斗争,也可以是默认。不完全信息下的动态博弈产生的完美精炼贝叶斯均衡挺难的我没找到例题,要是明天早上还有时间可以简单的找个例子说一下~