2扩展式博弈与标准式博弈2-0如何描述博弈•要分析博弈问题,首先要找到便于进行博弈分析的表达方式•标准式和扩述博弈的两种方式:–支付矩阵(PayoffMatrix)(主要用于二人博弈)–博弈树(gametree)2-1标准式博弈(normalformgame)•标准式述工具是支付矩阵(payoffmatrix)–参与人多于两个时,这种描述便产生困难(见下图)硬币游戏(零和博弈的一个例子)PayoffMatrix乙正面朝上反面朝上甲正面朝上1-1-11反面朝上-111-1支付矩阵的一个简单例子每参与人存在有限个更多的战略乙甲B1B2B3…A1A2A3…思考:若每人有无限个战略如何描述?•例如:在“西班牙叛乱”例子中,叛军可以往任何一个方向出击。•尽管此例中以这样的战略描述叛军有点可笑,但如果将叛军的处境想像为四面受敌而准备突围,这样的战略描述就是贴近现实的。同时行动博弈的基本思维方式•我认为他认为我认为…………–诸葛亮:认为曹操见到小路上的烟火会认为是自己实行之”的战略,故在小路放火、小路伏兵–曹操:认为小路烟火是诸葛亮“实则虚之”的战略,故走小路•却不知道:诸葛亮知道自己知道“实则虚之”的用兵之道2-2扩展式博弈•扩展式博弈(extensiveformgame):•描述工具是博弈树A10B90A0B0A90B10A0B0ABB给B90给B10接受拒绝接受拒绝Gametree:ultimatumbargaininggame(分配100元钱)扩展式博弈中的战略•战略是行动计划,具体到扩展式博弈中,这是由每个参与人在它的每个行动结点上对应的组合。•例如:在最后通牒博弈中,A只有一个行动结点,所以A的战略为{给B90;给B10};B有两个行动结点,每个行动结点都是接受或拒绝,于是B的战略为:{(给90接受,给10接受),(给90拒绝,给10接受),(给90接受,给10拒绝),(给90拒绝,给10拒绝)}://sj.39.net/dx/151231/4752741.html://sj.39.net/dx/160101/4753074.html://sj.39.net/dx/160101/4753077.html://sj.39.net/dx/160101/4753080.html://sj.39.net/dx/160101/4753087.html://sj.39.net/dx/160103/4753240.html://sj.39.net/dx/160104/4753483.html://sj.39.net/dx/160104/4753494.html://sj.39.net/dx/160107/4755611.html://sj.39.net/dx/160107/4755631.html博弈树结构•结点(node):表明由谁行动•分枝(branch):表明参与人可选择的行动•收益(payoff):在最后的结点上,做为博弈的结果,每种博弈的路径给参与人带来的收益A10B90A0B0A90B10A0B0ABB给B90给B10接受拒绝接受拒绝博弈树结构:分钱博弈结点分枝结点扩展式博弈的基本思维方式•向前展望,向后推理–向前展望:如果我给他留90,他会怎么做?–向后推理:如果他拒绝(接受),我该给他留多少?2-3两种形式的转换•描述扩展式博弈的博弈树与描述标准式博弈的支付矩阵可以相互转换。(1)标准式博弈转换为扩展式博弈甲1乙-1甲-1乙1甲-1乙1甲1乙-1甲乙乙正面朝上反面朝上正面朝上反面朝上正面朝上反面朝上硬币游戏(零和博弈)•信息集:当参与人轮到自己行动时所了解的信息•在同时行动的博弈中,即使用扩展式博弈来描述,甲、乙的行动也是不分先后的–在上例中,可将乙放在甲的位置上,则甲的两个结点属于同一信息集信息集的特点•如果两个结点同属一个信息集,意味着参与人在两个(或两个以上)结点处知道相同的信息,因此,参与人在这两个(或两个以上)结点必然有同样的行动集。(2)标准式博弈转换为扩展式博弈ultimatumbargaininggame(分配100元钱)PayoffMatrixA给B90给B10B接受10909010拒绝0000相机战略•这种表达意味着A、B同时行动•正确的表达应该使用每个人的战略(而不是行动)•这里的战略是相机战略–相机战略:仅在不确定性事件发生时才会采取的战略•只有对方实施了某种战略时,相机战略才会生效–计划里“如果”这一假设条件成为现实时,该相机战略才会被执行•如果将战略视为相机战略,则所有的博弈都可以用标准式博弈(2×2博弈)的支付矩阵表示分钱博弈中A、B的相机战略•A:{无论B接受还是拒绝,给10;无论B接受还是拒绝,给90}•B:{若给10接受,若给90接受;战略1若给10接受,若给90拒绝;战略2若给10拒绝,若给90接受;战略3若给10拒绝,若给90拒绝}战略4扩展式博弈与标准式博弈在描述的相互转换(2)ultimatumbargaininggame(分配100元钱)A无论B是否接受,给B90(9-1分)无论B是否接受,给B10(1-9分)B如果9-1分,接受;如果1-9分,接受10909010如果9-1分,接受;如果1-9分,拒绝109000如果9-1分,拒绝;如果1-9分,接受009010如果9-1分,拒绝;如果1-9分,拒绝00002-4联盟博弈–吴、蜀之间存在利益冲突,并多次兵戎相见,但两国为什么在赤壁之战中能结为联盟?•联盟:相互协调行动的一组博弈参与人•联盟价值:一个联盟的产出(收益)2-4几种著名的博弈例子囚徒困境警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:(1)若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。(2)若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。(3)若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。性别战懦夫博弈(斗鸡博弈)–鹰鸽博弈智猪博弈假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。猜硬币游戏/包袱剪子锤最后通牒博弈小结•博弈有两种形式:标准式(也称战略式)和扩展式–标准式博弈描述的是同时行动(静态)–扩展式博弈描述的是序贯行动(动态)•标准式和扩展式可以相互转化–动态博弈中将行动描述为相机战略,也可以用标准式表示–标准式博弈使用信息集也可以用扩展式来表达•联盟博弈是合作博弈练习与思考1:田忌赛马故事情节博弈描述参与人战略(用静态博弈方法)结果与收益田忌赛马田忌上中下上下中中上下中下上下上中下中上齐王上中下1,-11,-11,-1上下中1,-11,-1中上下1,-11,-1中下上1,-11,-1下上中1,-11,-1下中上1,-1-1,11,-1博弈描述的复杂性——再谈田忌赛马齐王田忌田忌田忌中强强弱弱齐王齐王齐王中强弱中强弱中强弱田忌田忌强弱田忌田忌强弱田忌田忌中弱中弱强弱强弱强中强中