1人力资源管理209120222005魏丽娜博弈论练习题博弈论练习题(一)一、下面哪些问题适用博弈来模型化∶1、石油输出国组织(OPEC)成员国选择其年产量;2、通用汽车公司向USX购买钢材;3、两厂商,一家制造螺钉,一家制造螺帽,是用公制还是英制;4、公司董事会为其总经理(CEO)设立一项期股安排;5、联合果品公司决定招募工人;6、一电力公司估计了未来10年对电力的需求后,决定是否购置一套新的发电机组。解:第1、2、3、6适用博弈来模型化。1——多人博弈,2——单人博弈,3——双人博弈,6——单人博弈。博弈论练习题(二)一、构造具有下述性质的2*2博弈的例子1、不存在纯战略纳什均衡;2、不存在弱帕累托优势战略组合;3、至少有两个纳什均衡,其中一个帕累托优于其它所有的战略组合;4、至少有三个纳什均衡。解:(1)不存在纯策略纳什均衡:例如:监督博弈:以下博弈矩阵中参与人1表示收税人,参与人2表示纳税人。a表示应缴纳税收数额,c表示检查成本,F表示逃税的罚款。21逃税不逃税检查a-c+F,-a-Fa-c,-a不检查0,0a,-a(2)不存在弱帕累托优势战略组:2例如:囚徒困境(3)至少有两个纳什均衡,其中一个帕累托优于其它所有的战略组合:例如:廉价磋商:BAY1Y2X19,90,8X28,07,7该博弈有两个纳什均衡(X1,Y1),(X2,Y2)。显然(X1,Y1)帕累托优于(X2,Y2)。(4)至少有三个纳什均衡:例如:分蛋糕:两个人分1000克蛋糕,规则是每个参与人各自写出自己要求的数量,交给仲裁人,若两人要求数量总和不超过1000克,没人可以获得自己要求的数量,若两人的要求超过1000克,则每个人一无所获。二、不协调博弈有一男一女,各自选择是看足球还是看时装表演。男的愿意看足球,女的喜欢看时装。男的想和女方在一起,女的却想躲开男方。1、构造一个博弈矩阵来表示这个博弈,选择相应的数值以符合男、女的偏好;2、若女方先采取行动,将发生什么?3、该博弈中存在先动优势吗?4、在完全信息的静态博弈中,存在纯战略纳什均衡吗?解:1、其博弈矩阵如下:男足球电影足球3,10,0电影-1,-11,2该博弈也有两个纳什均衡(足球,足球),(电影,电影)。实际生活中可能是先动优势,谁先买票跟谁去;也可能达成默契,一次看足球,一次看电影。2、若女方先行动,则男方有后动优势。女方先行动,男方后行动,则存在先动劣势,而有女3后动优势。女方先行动时,不管她选择足球还是电影,男方后行动时都会与女方选择一致,而达到和女方在一起的目的。男足球电影足球3,-2-2,2电影-3,12,-13、不存在先动优势,存在后动优势。在所谓的“单相思性别战”中,就存在后动优势,模型中的男方是足球迷,女方更倾向看电影,男方正追求女方,女方却不愿意,千方百计地想躲开男方。4、在静态博弈中,该博弈没有纳什均衡。三、变化的囚徒困境在X与Y两囚徒博弈中,X有前科,故无论谁坦白或抵赖,X都至少要比Y多判5年。构造一个博弈矩阵,并找出该博弈的纳什均衡。解:X坦白抵赖坦白8,35,5抵赖10,06,1此时,那是那是均衡仍然是(坦白,坦白),因为这样,囚犯X会想少判刑一些,而囚犯Y也想让X判刑,自己不判刑。四、有两个厂商的古诺模型,qi是厂商i的产量,Q=q1+q2为市场总产量。价格为产量的减函数,且p(Q)=a-Q,没有固定成本,但边际成本不同,分别为c1和c2。如果0cia/2,问纳什均衡的产量各为多少?如果c1c2a,但2c2a+c1,则纳什均衡的产量又为多少?解:厂商一的利润:厂商二的利润:女Y212111112111111)()]([)(qqqqcaqcqqaqqcQpqu222122222122222)()]([)(qqqqcaqcqqaqqcQpqu4对上述两者求偏导,再令偏导等于零,可以得到:q1=(a-2c1+c2)/3,q2=(a-2c2+c1)/3(1)当0cia/2时:q1和q2都为正,此时,纳什均衡为q1=(a-2c1+c2)/3,q2=(a-2c2+c1)/3(2)当c1c2a,但2c2a+c1时,根据反应函数求出来,厂商2产量q2小于零,这意味着厂商2不会生产,这是厂商1成了垄断厂商,厂商1的最优产量即为利润最大化的垄断产量:Q1=q*=(a-c1)/2,因此,此时的纳什均衡为[(a-c1)/2,0]博弈论练习题(三)一、有一个两参与人的四阶段之间的动态博弈如下图所示。试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡战略组合和博弈的结果。解:(1)该博弈有如下三个子博弈:第一,从博弈方1选择A以后,博弈方2的第二阶段选择开始的三阶段动态博弈;第二,从博弈方2第二阶段选择C以后博弈方1的选择开始的两阶段动态博弈;第三,第三阶段博弈方1喧杂f后博弈方2的单人博弈。(2)该博弈最理想的,对双方都比较有利的博弈结果是路径a—c—f—g。但是实现该路径的双方策略中,博弈方2在第四阶段选择g是不可信的,因为得益5小于6;逆推回第三阶段,博弈方1选择f也变成不可信,因为得益3小于4;再逆推回第二阶段,博弈方2在第二阶段选择c同样也是不可信的,因为得益3小于4;最后回到第一阶段,博弈方1选择a也不可信,因为2小于5;因此,上述较理想的结果是不可能实现的。(3)根据逆推归纳放先讨论博弈方2第四阶段的选择。由于采用h的得益6大于采用g的5,因此博弈方2会采用h;倒退回第三阶段,博弈方1根据对博弈方2第四阶段选择的判断可知选择f结果是得3,而选择e的结果是4,因此,只有选择e;再推回第二阶段,博(4、3)(3、6)(8、5)22221212(5、3)(2、4)b2a2d2c2f2e2h2g25弈方2根据对后两阶段选择的判断,已知选择c将得到3,而选择d能得到4,因此,会选择d;最后回到第一阶段,博弈方1知道选择a将得到2,而选择b得到5,因此选择b。该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择b,第三阶段选择e;博弈方2第二阶段选择d,第四阶段选择h。结果为博弈方1第一阶段选择b结束博弈,双方得益(5,3)。二、三寡头市场需求函数P=100-Q,Q是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2,无固定成本。如果厂商1和2先同时决定产量,厂商3根据厂商1、2的产量决策,问三厂商各自的产量和利润是多少?解:首先,设三个厂商的产量分别为q1,q2,q3,三个厂商利润函数:U1=(100-q1-q2-q3)q1-2q1,U2=(100-q1-q2-q3)q2-2q3,U3=(100-q1-q2-q3)q3-2q3,根据逆推归纳法,先分析第二阶段厂商3的选择,将厂商1的利润函数对其产量求导,并令其为0,得到:100-q1-q2-2q3-2=0,因此,厂商3的反应函数:q3=(98-q1-q2)/2在分析第一阶段是厂商1和厂商2的决策,先把厂商3的反应函数带入厂商1和厂商2的利润函数:U1=(98-q1-q2)q1/2,U2=(98-q1-q2)q2/2,分别对q1,q2求偏导数,并令其为0,联立两个方程,可以得到:q1=q2=98/3,再带入厂商3的反应函数中,得到:q3=98/6再将三者带入利润函数中,得到三个厂商的利润分别为:4802/9,4802/9,2401/9三、两次重复下面这个得益矩阵表示的两人静态博弈。问能否有一个精炼纳什均衡战略组合,实现第一阶段的得益是(4,4)?如能,给出双方的战略,如不能,证明为什么不能。如果战略组合(x3,y1)的得益改为(1,5),会发生什么变化,至少能在部分阶段实现(4,4)的条件是什么?YY1Y2Y3XX1X2X33,10,05,02,11,23,11,20,14,4解:上述静态博弈有两个纯策略纳什均衡(X1,Y1)和(X2,Y2)。由于策略组合(X3,6Y3)实现的得益(4,4)对Y来说已经是最理想的,因此,Y不会有偏离动机,只有博弈方1可能有偏离动机,因此可以设计如下制约X行为的触发策略:X:第一阶段采取X3;第二阶段采取X1。Y:第一阶段采用Y3,第二阶段,如果第一阶段的结果是(X3,Y3),则采用Y1,否则采取Y2。不难验证该策略组合是一个子博弈完美纳什均衡,其中第二阶段采用(X1,Y1)相当于是对X的奖励,采用(X2,Y2)则相当于对博弈方1的惩罚。将(X3,Y1)的得益改为(1,5)情况会改变,因为此时第一阶段两博弈方都有偏离(X3,Y3)的动机,而上述博弈中不存在同一阶段中同时对两个博弈方惩罚或奖励的纳什均衡,因此重复两次时不可能存在子博弈完美纳什均衡部分实现(4,4)得益。至少在部分阶段实现得益(4,4)的条件是重复博弈的次数达到三次或者以上,或者得益进一步改变到(X3,Y3)是原博弈的纳什均衡。