混合战略纳什均衡混合战略纳什均衡社会福利博弈23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作没有一个战略组合构成纳什均衡混合战略纳什均衡1-1,-11,-11,1-1,反面正面反面正面猜谜游戏两个儿童各拿一枚硬币,若同时正面朝上或朝下,A给B1分钱,若只有一面朝上,B给A1分钱。零和博弈博弈参与者有输有赢,但结果永远是0。没有一个战略组合构成纳什均衡混合战略纳什均衡警察与小偷银行酒馆警察小偷2万元1万元东边西边警察与小偷的最优策略各是什么?混合战略纳什均衡上述博弈的特征是:在这类博弈中,都不存在纯战略纳什均衡。参与人的支付取决于其他参与人的战略;以某种概率分布随机地选择不同的行动每个参与人都想猜透对方的战略,而每个参与人又不愿意让对方猜透自己的战略。这种博弈的类型是什么?如何找到均衡?1-1,-11,-22,2-2,西边东边西边东边混合战略纳什均衡警察抽签决定去银行还是酒馆,2/3的机会去银行,1/3的机会去酒馆;同样,小偷也抽签决定去银行还是酒馆,2/3的机会去酒馆,1/3的机会去银行。混合战略纳什均衡社会福利博弈23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的期望效用:1/2×2+1/2×1=1.5流浪的期望效用:1/2×3+1/2×0=1.5因此,流浪汉的任何一种战略都是都是对政府混合战略的最优反应混合战略纳什均衡社会福利博弈23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的概率:0.2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略混合战略纳什均衡1-1,-11,-11,1-1,反面正面反面正面猜谜游戏两个小孩的最优策略是采取每个策略的可能性均为1/2;每个小孩各取策略的1/2是纳什均衡。零和博弈混合战略纳什均衡请举一些这样的例子:石头、剪子、布游戏老虎、杠子、鸡、虫子游戏扑克游戏橄榄球赛战争中这样的博弈的均衡是混合战略纳什均衡混合战略纳什均衡战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。纯战略:如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,该战略为纯战略。混合战略:如果一个战略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动则该战略为混合战略。混合战略纳什均衡纯战略可以理解为混合战略的特例,即在诸多战略中,选该纯战略si的概率为1,选其他纯战略的概率为0。5,14,49,-10,0等待小猪大猪按等待按1-1,-11,-11,1-1,反面正面反面正面在n个参与人博弈的战略式表述中,假定参与人有K个纯战略:,那么,概率分布称为的一个混合战略,这里是选择的概率,对于所有的。nnuuSSG,,;,,11iikiiSSS,,1ikii,,1i)(ikiksiiks1,10,,,11KikikKk混合战略纳什均衡混合战略纳什均衡如何寻找混合战略纳什均衡?支付最大化法支付等值法由于混合战略伴随的是支付的不确定性,因此参与人关心的是其期望效用。最优混合战略:是指使期望效用函数最大的混合战略(给定对方的混合战略)在两人博弈里,混合战略纳什均衡是两个参与人的最优混合战略的组合。混合战略纳什均衡23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作*11311101515100.2GLGLGvv假定政府的混合战略是(,);流浪汉的混合战略是(,)。政府的期望效用函数为:(,)(()())()(())()求微分,得到政府最优化的一阶条件:故即:流浪汉以0.2的概率选择寻找工作,0.8的概率选择游荡同样,可以根据流浪汉的期望效用函数找到政府的最优混合战略。??支付最大化法混合战略纳什均衡社会福利博弈23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的概率:0.2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略混合战略纳什均衡假定最优混合战略存在,给定流浪汉选择混合战略(r,1-r),政府选择纯战略救济的期望效用为:3r+(-1)(1-r)=4r-1选择纯战略不救济的效用为:-1r+0(1-r)=-r如果一个混合战略(而不是纯战略)是政府的最优选择,一定意味着政府在救济与不救济之间是无差异的。4r-1=-rr=0.223,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作支付等值法混合战略纳什均衡社会福利博弈23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的概率:0.2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略混合战略纳什均衡对的解释:如果流浪汉以找工作的概率小于0.2,则政府选择不救济,如果大于0.2,政府选择救济,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略.对*=0.5的解释如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是寻找工作.*0.2混合战略纳什均衡混合战略纳什均衡的含义:纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中,,*=0.5是唯一的混合战略纳什均衡。从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2,那么政府的唯一最优选择是纯战略:不救济;如果政府以1的概率选择不救济,流浪汉的最优选择是寻找工作,这又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。*0.2流浪汉寻找工作的概率小于0.2政府概率为1:不救济流浪汉寻找工作政府救济夫妻之争的混合策略纳什均衡2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争3)(0)(0)(1)(FpCpFpCp)(0)(0)(2)(FpCpFpCphhhh妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.75混合战略纳什均衡1-1,-11,-11,1-1,反面正面反面正面用上述方法:求该猜谜游戏的混合战略纳什均衡如何理解混合战略——虚张声势一个参与人选择混合战略的目的是给其他参与人造成不确定性,这样尽管其他参与人知道他选择某个特定纯战略的概率是多少,但不知道实际上对手会采用哪个战略。正是因为它在几个战略之间的无差异性,他的行为才难以预测,混合战略均衡才会出现。如何理解混合战略——个体类型判断将混合战略当作是对参与人类型的一种判断假定这个流浪汉是从一群流浪汉中抽取出来的,政府不知道他的特征,但知道全部的流浪汉包括两种类型,一种是努力求职型,一种是继续游荡型,各占0.2,0.8当随机从流浪汉群体中抽取一个流浪汉,政府将以0.5的概率救济他,0.5的概率不救济他。如何理解混合战略——集体行为推测用众多的流浪汉代替单个流浪汉,这些流浪汉有相同的偏好和赢利函数。在众多的流浪汉情况下有一个纯战略均衡:20%的流浪汉选择纯战略求职,80%的流浪汉选择纯战略游荡。我们用代表的混合战略空间代表混合战略组合(mixedstrategyprofile),其中为的一个混合战略,代表混合战略组合空间。iiii),,,,(),(1niiiiiX)(n个参与人的混合战略纳什均衡n个参与人的混合战略纳什均衡在纯战略情况下,参与人的支付是纯战略组合的函数,即;对于任何给定的战略取一个确定的值。与混合战略相伴随的是支付的不确定性,因为一个参与人并不知道其他参与人的实际战略选择。因此,参与人关心的是期望效用。我们用表示参与人的期望效用函数(其中,是除之外所有其他参与人的混合战略组合,它可以定义为:iuiii),,,,(1nissss),,,,(1niiisssuuiniussss),,,,,(1),()(iiiivv),,,,,(111niiiSsinjjjiiisusv)())((),(1让我们以两人博弈为例说明这一点。假定,即参与人1有K个纯战略,参与人2有J个纯战略。若参与人1相信参与人2的混合战略为,那么,参与人1选择纯战略的期望效用为:参与人1选择混合战略的期望效用为:这里,是参与人1选择且参与人2选择的概率,即纯战略组合发生的概率。),,(1111KssS),,(2212JssS),,(2212Jks1),(21121jkjJjssu),,(1111K),(),(),(21121112112111211jkjkJjKKjkjJjkKKssussuvjk21ks1js2),(21jkssn个参与人的混合战略纳什均衡n个参与人的混合战略纳什均衡类似地,如果参与人1选择,参与人2选择,参与人2的期望效用为:),,(1111K),,(2212J),(),(),(21221112111121212jkjkJjKKjkkKKjJjssussuvn个参与人的混合战略纳什均衡有了上述期望效用函数的概念,我们现在可以重新定义纳什均衡。在两人博弈里,混合战略纳什均衡是两个参与人的最优混合战略的组合,这里,最优混合战略是指使期望效用函数最大化的混合战略(给定对方的混合战略)。换言之,如果是一个纳什均衡,它必须满足:一般地,我们有下述定义:),(212221221211211211),,(),(),,(),(vvvv在n个参与人博弈的战略式表述中,混合战略组合是一个纳什均衡,如果对于所有的,下式成立:nnuuSSG,,;,,11ni,,,,1(,)(,),iiiiiiiivvni,,2,1n个参与人的混合战略纳什均衡注意:每个参与人的期望效用是自己的混合概率的线性函数。这一点意味着,如果是相对于给定的一个最优混合战略,那么,对于所有的,下式成立:就是说,如果是相对于给定的的一个最优混合战略,如果这个混合战略规定以严格正的概率选择纯战略,那么,本身一定是相对于的一个最优战略。在两人博弈的情况,如果是相对于的最优战略,,则意味着ikii,,1i0ikiiiiikiSssvsvik),,(),('ikii,,1iiiksiksi1k2212,,01k112111221112''),(),(SsssussukkkJjjkkJjjn个参与人的混合战略纳什均衡是一个纳什均衡,如果对于所有的参与人,ni,,,,1iiiSssvviiiii),,(),(i注意:进一步,因为所有以正的概率进入最优混合战略的纯战略都是最优战略,参与人在所有这些纯战略之间一定是无差异地。就是说,如果,那么反过来,若参与人有几个纯战略是最优的,那么,任何以正的概率选择其中一些或所有这些纯战略的混合战略也是最优的。根据上述道理,纳什均衡也可以表述如下:),(),(),(21iiKiiiiiiisvsvsv0,,01iKin个参与人的