专题一:零和博弈2020/4/101Zero-SumGame2020/4/10山西财经大学经济学院康旭华2内容提要零和博弈最小最大方法直线交叉法对抗性排序2020/4/10山西财经大学经济学院康旭华3零和博弈与非零和博弈(zero-sumgameandnon-zero-sumgame)如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零,这个博弈就叫零和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零,这个博弈就叫非零和博弈。零和博弈是利益对抗程度最高的博弈。2020/4/10山西财经大学经济学院康旭华4零和博弈:掷硬币-1,11,-1反面1,-1-1,1正面反面正面12支付2020/4/10山西财经大学经济学院康旭华5常和博弈与非常和博弈(constant-sumgameandvariable-sumgame)如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数,这个博弈就叫常和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数,这个博弈就叫非常和博弈。常和博弈也是利益对抗程度最高的博弈。2020/4/10山西财经大学经济学院康旭华6常和博弈与归零博弈设G是一个n人常和博弈,那么在G的每种战略组合下博弈的n个参与人的支付的总和是一个常数。常数的1/n称为常和博弈支付的偏零因子。对于每个n人常和博弈G,可以从每个参与人的支付中减去博弈的偏零因子,将G转换为零和博弈G/,把G/叫做常和博弈G的归零博弈。2020/4/10山西财经大学经济学院康旭华7常和博弈:掷硬币常和为-1:偏零因子-1/2-1.5,0.50.5,-1.5反面0.5,-1.5-1.5,0.5正面反面正面12支付2020/4/10山西财经大学经济学院康旭华8归零博弈:支付减去-0.5-1,11,-1反面1,-1-1,1正面反面正面12支付2020/4/10山西财经大学经济学院康旭华9非零和博弈:囚犯困境(蕴含双赢或多赢)抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A2020/4/10山西财经大学经济学院康旭华10行局中人的支付-11反面1-1正面反面正面12支付2020/4/10山西财经大学经济学院康旭华11内容提要零和博弈最小最大方法直线交叉法对抗性排序2020/4/10山西财经大学经济学院康旭华12最小最大方法由冯·诺依曼提出基本思想:作为局中人,对手将采取对他自己最有利的策略;相应的,对手会选择使你获得尽可能差的支付的策略。由于零和博弈的特点和性质,以上思想即为:任何使对手得到最好结果的策略,都会使你获得最差的结果。双方都具有这样的理性!2020/4/10山西财经大学经济学院康旭华13最小最大方法的应用610下4-3上右左甲乙支付max=10max=6min=-3min=62020/4/10山西财经大学经济学院康旭华14最小最大方法:132下41上右左12支付2020/4/10山西财经大学经济学院康旭华15最小最大方法:13,-32,-2下4,-41,-1上右左12支付2020/4/10山西财经大学经济学院康旭华16最小最大方法:234下21上右左12支付2020/4/10山西财经大学经济学院康旭华17最小最大方法:23,-34,-4下2,-21,-1上右左12支付2020/4/10山西财经大学经济学院康旭华18最小最大方法:3531621100参与人2LMR参与人1UDM2020/4/10山西财经大学经济学院康旭华19最小最大方法:35,-53,-31,-16,-62,-21,-11,-10,00,0参与人2LMR参与人1UDM2020/4/10山西财经大学经济学院康旭华20最小最大方法:4532643160参与人2LMR参与人1UDM2020/4/10山西财经大学经济学院康旭华21最小最大方法:45,-53,-32,-26,-64,-43,-31,-16,-60,0参与人2LMR参与人1UDM2020/4/10山西财经大学经济学院康旭华22内容提要零和博弈最小最大方法直线交叉法对抗性排序2020/4/10山西财经大学经济学院康旭华23最小最大方法:适用于零和博弈的纯策略纳什均衡扩展的最小最大方法(直线交叉方法):适用于零和博弈的混合策略纳什均衡在非零和博弈中,可能存在共同利益。2020/4/10山西财经大学经济学院康旭华24无纯策略纳什均衡的零和博弈-11反1-1正反正12支付max=1max=1min=-1min=-12020/4/10山西财经大学经济学院康旭华251的选择-11反(1-p)1-1正(p)反正12支付p-混合-p+(1-p)p-(1-p)min=-1min=-1min=?2020/4/10山西财经大学经济学院康旭华261的支付1-101/21-111的p混合策略2正2反参与人1的p-混合策略图解2020/4/10山西财经大学经济学院康旭华272的选择-11反1-1正反(1-q)正(q)12支付max=1max=1q-混合-q+(1-q)q-(1-q)max=?2020/4/10山西财经大学经济学院康旭华282的支付1-101/21-112的q混合策略1反1正参与人2的q-混合策略图解2020/4/10山西财经大学经济学院康旭华29内容提要零和博弈最小最大方法直线交叉法对抗性排序2020/4/10山西财经大学经济学院康旭华30对抗性排序根据收益的相关性进行2020/4/10山西财经大学经济学院康旭华31“你死我活”的掷硬币游戏-1,11,-1反面1,-1-1,1正面反面正面12支付2020/4/10山西财经大学经济学院康旭华32出现“双赢”可能的价格大战低价高价低价3,36,1高价1,65,5支付百事可乐可口可乐2020/4/10山西财经大学经济学院康旭华33个体利益与集体利益一致的性别战博弈1,20,0足球0,02,1时装足球时装妻子支付丈夫2020/4/10山西财经大学经济学院康旭华34协调博弈广义的协调博弈:包括所有能够协调出双赢对局的博弈,如囚徒困境;狭义的协调博弈:仅指个体利益与集体利益一致的博弈,对于参与人而言,合作总比不合作要好。2020/4/10山西财经大学经济学院康旭华35协调博弈举例:胖子进门-1,-11,2后走2,1-1,-1先走后走先走张三支付李四2020/4/10山西财经大学经济学院康旭华36协调博弈举例:交通规则博弈1,1-1,-1靠左-1,-11,1靠右靠左靠右张三支付李四2020/4/10山西财经大学经济学院康旭华37对称博弈对称博弈是指在无角色区分的参与者之间进行的协调博弈,它表现在支付函数的对称上,二者的策略集是一样的。抑或:通俗说就是代表参与者身份的下标,在分析中可以省略掉而没有关系。对称博弈分成三类:支付占优与风险占优不一致;支付占优与风险占优一致;无占优性可比的协调博弈。2020/4/10山西财经大学经济学院康旭华38支付占优与风险占优不一致3,32,0猎兔0,24,4猎鹿猎兔猎鹿甲支付乙纯策略猎鹿是支付占优纳什均衡、纯策略猎兔是风险占优纳什均衡。猎兔策略是一个保险策略,而猎鹿则是一个帕累托效率策略但由于策略的不确定性而使它具有较大的风险。因此,均衡选择取决于参与人对风险的态度。2020/4/10山西财经大学经济学院康旭华39支付占优与风险占优一致1,10,0右行0,01,1左行右行左行甲支付乙这种情况博弈双方有完全相同的偏好,协调博弈中两个严格纳什均衡是无差异的,而该博弈的两个严格纳什均衡就是无差异的。2020/4/10山西财经大学经济学院康旭华40无支付占优与风险占优区分2,20,0X20,01,1X1X2X1甲支付乙此类博弈有两个严格纳什均衡(X1,X1);(X2,X2)。