博弈论及其应用——完全信息静态博弈:混合策略纳什均衡张红霞国民经济管理系混合策略纳什均衡混合策略混合策略纳什均衡张红霞国民经济管理系混合策略纳什均衡混合策略混合策略纳什均衡张红霞国民经济管理系混合策略Thecliffhanger…混合策略期望效用NE和最优反应案例混合策略博弈的性质张红霞国民经济管理系混合策略混合策略:把不确定性引入纯战略,即参与者以一定的概率选择他的战略,比如网球比赛中,运动员以60%的概率发正手球,40%的概率发反手球。张红霞国民经济管理系混合策略为什么采用“混合策略”?–考虑下面的博弈:扑克牌对色游戏两个人参与这个游戏,从自己的扑克牌中抽出一张,一起翻开,如果颜色一样,甲输给乙一根火柴;如果颜色不一样,甲赢得乙一根火柴。不允许出大小鬼。描述这个博弈,寻找纳什均衡。张红霞国民经济管理系混合策略红红黑黑-1,11,-1-1,11,-1乙甲张红霞国民经济管理系混合策略–这个博弈“不存在”我们前面所讲的纳什均衡–在这个游戏中,重要的是猜测对方的出牌规律,同时避免对方猜到自己的出牌规律。也就是说,要尽量让对手迷失。这种随机化自己可选策略的做法,就是采取“混合策略”的思想。–局中人以一定的概率p选择红,以一定的概率1-p选择黑,则(p,1-p)概括了某个局中人所有的混合策略。可知这样的混合策略有无穷多个。两个局中人的策略组合有无穷多个张红霞国民经济管理系混合策略红p红q黑1-q黑1-p-1,11,-1-1,11,-1乙甲张红霞国民经济管理系混合策略–当参与人可以选择的策略比较多时(3个,4个,…),用一个字母就不够用了,需要用多个字母表示其混合策略–可以想象,混合策略情况下,参与人的支付不再是确定性的。需要用期望支付的概念张红霞国民经济管理系混合策略1)2]1,0[1),,,(,,,,;,,11111KkikikikikiKiiiKiiinnsiissSKSuuSSGn)的概率。选择参与者为的一个混合战略,称为,那么,概率分布,,个参与人参加的博弈张红霞国民经济管理系混合策略为混合战略组合),(1niiii混合战略组合空间:的混合战略空间:),()(iiiivvi的期望效用函数:参与人Ssinjjjisusv)())(()(1张红霞国民经济管理系混合策略举例–扑克牌对色游戏中,假设p=0.5,q=0.5,写出双方在这种情况下的期望支付张红霞国民经济管理系混合策略举例:两人博弈的情况},,{2};,{1232221212111sssSssS的纯战略:参与人的纯战略:参与人),(),(),(),(1),,(21231112322111222111121321112112322212ssussussussus1jjj时的期望效用为选择则参与人=的混合策略为认为参与人参与人张红霞国民经济管理系混合策略举例:两人博弈的情况),(112111=选择混合战略如果参与人312121212312111211211),(),(),(,jjjjjjssussuv他的期望效用为那么213121121213121121),(),(kjjkjkkjjkjkssussu张红霞国民经济管理系混合策略举例:两人博弈的情况类似的,可以写出参与人2的期望效用Ssiisusv)()()(简炼的表达关于期望效用函数更为张红霞国民经济管理系混合战略硬币博弈a1b1a2b21,-1-1,11,-1-1,1p(1-p)q(1-q)各种战略组合及其概率(a1,a2)(a1,b2)(b1,a2)(b1,b2)pqp(1-q)(1-p)(1-q)(1-p)q期望效用1)1)(1()1()1()1)(1(1),(211qpqpqppqv)1()1)(1(1)1(1)1()1(),(212qpqpqppqv张红霞国民经济管理系混合战略纳什均衡纯战略纳什均衡混合战略纳什均衡–对于某个参与人来说,最优混合战略是指期望效用最大化的混合战略–对于前面的例子:二人博弈来说:222*12*2*1211*211*2*11*2*1*),,(),(),,(),(),(vvvv必须满足=混合战略纳什均衡张红霞国民经济管理系混合战略纳什均衡iiiiiiiinnnvvniuuSSG),,(),(,,2,1),,(},,,;,,{*****1*11,有所有的是一个纳什均衡,若对混合战略组合对于博弈衡定义:混合战略纳什均张红霞国民经济管理系混合战略纳什均衡iijiijiiikiikiiKiiSssvsv),,(),(,0),(1有则对所有的时的最优混合战略是给定若iijiiKiiiiiiiiKiSssvsvsv),,(),(),(,0,0211===即,如果这些战略之间无差异是最优战略,参与人在优混合战略的纯战略都所有以正的概率进入最张红霞国民经济管理系混合战略纳什均衡iiiiiiiinssvvni),,(),(,,2,1),,(*****1*,有若对所有的是一个纳什均衡,定义:混合战略组合由上述混合战略纳什均衡的定义,以及混合战略的定义,可以得到:张红霞国民经济管理系a1b1a2b23,2-1,30,0-1,1社会福利博弈q(1-q)p(1-p)期望效用混合战略纳什均衡政府流浪汉qqpqqpqqpv)15()0)1()1()(1())1)(1(3(),(211ppqppqppqv3)12()0)1(3)(1()1)1(2(),(212张红霞国民经济管理系011反应函数0.50.2BR1(q)BR2(p)不救济混合策略救济qp2.0,015*1qqpv5.0,0)12(*2ppqv2.0,12.0],1,0[2.0,0qifqifqifp5.0,05.0],1,0[5.0,1pifpifpifq找工作混合策略不找工作混合战略纳什均衡反应对应反应对应张红霞国民经济管理系混合战略纳什均衡硬币博弈a1b1a2b21,-1-1,11,-1-1,1p(1-p)q(1-q)期望效用1)1)(1()1()1()1)(1(1),(211qpqpqppqv)1()1)(1(1)1(1)1()1(),(212qpqpqppqv张红霞国民经济管理系111/2[0,1]1/201/2qBRqqq201/2[0,1]1/211/2pBRppp0.50.5BR1(q)BR2(p)反应函数142BRqq224BRpp011p(a1)q(a2)混合战略纳什均衡反应对应反应对应张红霞国民经济管理系混合战略纳什均衡报案(reportingacrime)–n个人目睹一桩罪行,每个人都希望报警,但是都倾向于其他人打电话。特别的,假定能从报警中得到v单位的收益,而打电话的人需要付出c单位的成本,vc0。分析这个问题的纯战略NE和混合战略NE。张红霞国民经济管理系混合战略纳什均衡–分析:•参与人:n个•每个参与人的战略集:{打电话,不打电话}•效用:没有任何人打,所有人0支付;打,v-c;不打,但其他人至少有一个人打,v–纯战略NE•当只有两个参与人的时候(公共产品提供的斗鸡博弈)——两个NE•n个人的时候:假设有m个人提供,m1orm=1n个NE张红霞国民经济管理系混合战略纳什均衡–混合战略NE•任何一个参与人i的期望效用函数:假设i提供的概率为pi,第i个参与人最大化自己的期望效用,得到)})1(1()1(0{)1()(),(ijjijjiiiiipvppcvpVvcpijj/)1(张红霞国民经济管理系混合战略纳什均衡由此,c/v1,因此,随着人数n的增加,p减小,即人越多,每个人选择报案的概率就会越小,如果n=1,则p=1社会心理学与博弈分析ppppn21)1/(11)/(1)1(nnvcpvcp张红霞国民经济管理系1.几乎所有有限博弈都有有限奇数个纳什均衡2.对每个参与人来讲,在构成混合战略均衡纯战略之间是无差异的,即带来的支付是无差异的3.因此,寻找混合战略纳什均衡的方法除了优化方法,还有等值法混合战略纳什均衡张红霞国民经济管理系案例分析有人要打网球吗??张红霞国民经济管理系小结混合策略的定义,含义期望效用混合策略纳什均衡:–定义–求解–含义案例张红霞国民经济管理系Homework1.Findall“mixed”strategyNEtoaPrisoners’Dilemma.Commentonanyconnectionwithdominantstrategies.张红霞国民经济管理系Homework2.FindallmixedstrategyNEtothefootballgameshownbelow.RunPass1,-10,015,-15RunPass5,-5OffenseDefense