POWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATEPOWERPOINTTEMPLATE第二章完全信息静态博弈在完全信息静态博弈中,博弈各参与方同时行动,且对博弈相关信息完全了解。“划横线法”是求解完全信息静态博弈的常用方法。通常说来,完全信息静态博弈都存在“纳什均衡”或“混合策略纳什均衡”。第一节定义和求解方法一、完全信息静态博弈的定义和实例完全信息静态博弈指:博弈各方同时决策,任何博弈参与者对博弈信息均完全了解。博弈信息包括:博弈过程、博弈结果、博弈各方的策略集、收益等。可以通过支付矩阵(PayoffMatrix)寻找完全信息静态博弈的均衡。以“囚徒困境”为例,介绍支付矩阵的构造方法和应用。1.囚徒困境在“囚徒困境”博弈中,有两个博弈参与者:嫌疑人甲和嫌疑人乙。将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付矩阵上方。嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人甲可能的策略纵向排列在博弈支付矩阵左侧。嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑人乙可能的策略横向排列在博弈支付矩阵上方。嫌疑人乙坦白不坦白嫌疑人甲坦白(5,5)(1,10)不坦白(10,1)(2,2)“囚徒困境”博弈的支付矩阵矩阵左上方的(5,5)表示:当嫌疑人甲选择“坦白”、嫌疑人乙选择“坦白”时,两名嫌疑人能够得到的收益。按照惯例,括号内逗号前面的数字“5”表示嫌疑人甲的收益。括号内逗号后面的数字“5”表示嫌疑人乙的收益。矩阵左下方的(10,1)表示:当嫌疑人甲选择“不坦白”、嫌疑人乙选择“坦白”时,两名嫌疑人能够得到的收益。矩阵右上方的(1,10)表示:当嫌疑人甲选择“坦白”、嫌疑人乙选择“不坦白”时,两名嫌疑人能够得到的收益。矩阵右下方的(2,2)表示:当嫌疑人甲选择“不坦白”、嫌疑人乙选择“不坦白”时,两名嫌疑人能够得到的收益。2.智猪博弈猪栏里养了两头猪,一头大猪、一头小猪。在猪圈的一端有一个盛食槽。在猪圈的另一端有一个按压式开关。开关每被按压一次,就有固定数量的食物出现在盛食槽中。大猪和小猪都在思考是否去按压开关。如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为5,小猪的收益为-1。如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况下,大猪得到的收益是4,小猪得到的收益是2。如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收益为10。小猪徒劳无功,看到大猪不劳而获,更增加了小猪的郁闷,小猪得到收益-2。如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食物,大猪和小猪均得到收益0。小猪按开关等待大猪按开关(5,-1)(4,2)等待(10,-2)(0,0)“智猪博弈”的支付矩阵二、划横线法1.通过“划横线法”求解“囚徒困境”博弈的均衡嫌疑人乙坦白不坦白嫌疑人甲坦白(5,5)(1,10)不坦白(10,1)(2,2)如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择?理性的嫌疑人甲会选择坦白。在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。类似可分析其他情况2.通过“划横线法”求解“智猪博弈”的均衡如果大猪选择按开关,那么小猪应该如何选择?理性的小猪会选择等待。在小猪选择等待所对应的收益“2”的下方划一道短横线。类似可分析其他情况小猪按开关等待大猪按开关(5,-1)(4,2)等待(10,-2)(0,0)第二节纳什均衡一、纳什均衡的定义给定其他参与者在博弈均衡时的策略,任何博弈参与者都没有动机改变自己在博弈均衡时的策略选择。这样的均衡被称为“纳什均衡”(NashEquilibrium)。“囚徒困境”博弈的纳什均衡为:(嫌疑人甲选择坦白、嫌疑人乙选择坦白)。给定嫌疑人乙在纳什均衡的策略选择:坦白;嫌疑人甲的最优策略就是坦白,嫌疑人甲没有动机改变自己在纳什均衡的策略。给定嫌疑人甲在纳什均衡的策略选择:坦白;嫌疑人乙的最优策略就是坦白,嫌疑人乙也没有动机改变自己在纳什均衡的策略。“智猪博弈”的纳什均衡为:(大猪选择按开关,小猪选择等待)。给定大猪在纳什均衡的策略选择:按开关;小猪的最优策略就是等待,小猪没有动机改变策略。给定小猪在纳什均衡的策略选择:等待;大猪的最优策略就是按开关,大猪没有动机改变策略。二、存在多个纳什均衡的博弈1.性别博弈采用“划横线法”寻找“性别博弈”的纳什均衡(男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是“性别博弈”的纳什均衡。女方看足球听昆曲男方看足球(10,2)(-1,-1)听昆曲(-1,-1)(2,10)甲、乙两人相对而行,试图通过一座独木桥。独木桥仅能容纳一人通行。如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄的独木桥,两人都会掉到河里,均得到收益-10。如果甲选择退让,让乙先行,那么得意的乙将得到收益20,面子受损的甲得到收益-2。如果乙选择退让,让甲先行,那么得意的甲将得到收益20,面子受损的乙得到收益-2。如果甲和乙均选择退让,那么双方均得到收益10。2.“斗鸡博弈”采用“划横线法”寻找“斗鸡博弈”的纳什均衡(甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈”的纳什均衡。乙前行退让甲前行(-10,-10)(20,-2)退让(-2,20)(0,0)假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”,另一个是企图进入市场的“潜在进入者”。潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个可以选择的策略:斗争、默许。如果潜在进入者选择进入,在位者选择斗争,那么激烈的市场竞争会使得双方均亏损,双方收益均为-10。如果潜在进入者选择进入,在位者选择默许,那么双方在市场中均可获得收益5。如果潜在进入者选择不进入,在位者选择斗争,那么潜在进入者的收益为0,在位者的收益为20。如果潜在进入者选择不进入,在位者选择默许,那么潜在进入者的收益为0,在位者的收益为153.“市场争夺战”博弈采用“划横线法”寻找“市场争夺战”博弈的纳什均衡(潜在进入者进入、在位者默许)和(潜在进入者不进入、在位者斗争)都是“市场争夺战”博弈的纳什均衡。在位者斗争默许潜在进入者进入(-10,-10)(5,5)不进入(0,20)(0,15)三、无法通过“划横线法”找到纳什均衡的博弈1.“锤头、剪刀、布”博弈通过“划横线法”无法找到“锤头、剪刀、布”博弈的纳什均衡。参与者2锤头剪刀布参与者1锤头(0,0)(1,-1)(-1,1)剪刀(-1,1)(0,0)(1,-1)布(1,-1)(-1,1)(0,0)市场中有两个厂商进行产量竞争。市场上该商品的总产量为:Q=q1+q2。其中:Q为总产量,q1为厂商1的产量,q2为厂商2的产量。市场的需求函数为:P=A-Q。其中,P为市场价格,A为外生常数。厂商1的生产成本函数为:C(q1)=cq1。其中c为厂商1的边际成本,且假设厂商1的生产没有固定成本。类似的,厂商2的生产成本函数为:C(q2)=cq2。厂商1和厂商2通过选择各自的最优产量达到各自利润最大化的目标。2.古诺寡头博弈在古诺寡头博弈中,由于厂商可以选择的产量有无穷多种,因此无法通过“划横线法”求解古诺寡头博弈的均衡。但可以通过求解两个厂商的“反应函数(Reactionfunction)”来求解寡头博弈的均衡。厂商1在决策时,假设厂商2的产量为给定厂商2在决策时,假设厂商1的产量为给定根据,得到得到反应函数(ReactionFunction)121222qqAcqqAc*1*233AcqAcqq1q20A-c2AcA-c()/2Ac厂商1的反应函数厂商2的反应函数3Ac()/3Ac古诺寡头博弈反应函数和均衡市场中有n个厂商进行产量竞争。市场上该商品的总产量为:Q=q1+q2+…+qn。其中:Q为总产量,qi为厂商i的产量。市场的需求函数为:P=A-Q。其中,P为市场价格,A为外生常数。厂商i的生产成本函数为:C(qi)=cqi。其中c为厂商i的边际成本,且假设厂商i的生产没有固定成本。市场中n个厂商通过选择各自的最优产量达到各自利润最大化的目标。3.多厂商古诺寡头博弈1221...112...1.........11...2nqAcqAcqAc市场中的n个厂商利润最大化,一阶条件得到:均衡产量为:均衡价格为:***12...1nAcqqqn****12*(...)*11nAcAncpAqqqAnnn可以证明,当厂商个数趋于无穷个时,市场价格趋于厂商的边际成本c,即:也就是说,对于寡头博弈的厂商而言,当市场中厂商的数量趋于无穷时,市场的均衡价格趋于完全竞争市场下的价格。**limlim1nnAncpcn4.伯特兰德寡头博弈市场中有两个厂商进行价格竞争。厂商1的价格为p1。厂商2的价格为p2。厂商1的生产成本函数为:C(q1)=cq1。其中c为厂商1的边际成本,且假设厂商1的生产没有固定成本。类似的,厂商2的生产成本函数为:C(q2)=cq2。厂商1和厂商2通过选择各自的最优价格达到各自利润最大化的目标。当厂商1产品的价格大于厂商2产品的价格时,消费者会购买厂商2的产品,对厂商1产品的消费量为零。当厂商1产品的价格小于厂商2产品的价格时,消费者会购买厂商1的产品,对厂商2产品的消费量为零。当厂商1产品的价格等于厂商2产品的价格时,消费者会同时消费厂商1和厂商2的产品。因此伯特兰德寡头博弈的均衡为:**12ppc伯特兰德寡头博弈的均衡是一个纳什均衡。这是因为:当厂商2的价格满足时,厂商1的最优策略选择是使得自己的定价满足如果厂商1的定价高于c,则厂商1会失去整个市场;如果厂商1的定价低于c,则厂商1会亏损。因此当厂商2的定价等于c时,厂商1的最优定价策略是使得价格等于c。类似的,当厂商1的价格等于c时,厂商2的最优定价策略也是使得价格等于c。*2pc*1pc现实中的囚徒困境1.囚徒困境与苏美争霸在苏美争霸博弈中,美国和前苏联都处于“囚徒困境”中。前苏联不扩军备战扩军备战美国不扩军备战(10,10)(-100,100)扩军备战(100,-100)(0,0)苏美争霸博弈的支付矩阵2.囚徒困境与观看演出不管别人的策略是什么,所有理性人的选择都是踮起脚尖,观众都陷入“囚徒困境”中。观众2不踮脚尖踮脚尖观众1不踮脚尖(10,10)(-5,15)踮脚尖(15,-5)(5,5)众人观看演出博弈的支付矩阵3.囚徒困境与交通秩序博弈均衡是一个“囚徒困境”。博弈参与者都选择无视交通规范和交通礼仪,胡乱夹塞,结果不但不能提高交通参与者的出行效率,