Lecture13博弈论与经济行为2Introduction到目前为止,我们对经济活动的考察没有考虑人们之间的相互影响。其实,一个人的行为总是受到他人行为的影响。人们在追逐自己利益时,难免要与他人发生利益冲突或矛盾。如何克服和解决人们之间的利益冲突?如何才能实现一种既能让每个人都实现自己的利益,又能让每个人都不妨碍和伤害他人利益的互利互惠的和谐局面?博弈论(gametheory)为解决这些问题提供了有力工具。博弈论以人的理性为基本假定,强调策略性——一种普遍的行为现象。这种现象的广阔背景是市场中的竞争与合作。20世纪80年代以来,博弈论在经济学中得到了广泛应用,在揭示经济行为的相互影响和制约方面取得了重大进展。大部分经济活动都可以用博弈论加以解释,甚至连市场调节与宏观调控这样的重大问题,都可看成博弈现象来研究。3(一)两个充满理性与智慧的博弈故事Introduction猪圈里有一大一小两头猪,猪圈一边装有踏板,踩一下,远离踏板的食槽端就会落下食物。若一猪去踩踏板,另一猪就会等在槽边抢先吃到食物。若小猪去踩,大猪会在小猪跑到食槽前吃光食物;若大猪去踩,大猪还有机会在小猪吃完之前抢吃到食物的一半。这两头猪会采取什么策略呢?答案:小猪舒服地等在槽边,大猪要为争取残羹奔忙于踏板和食槽之间。原因:对小猪而言,去踩,吃不到食物;不去踩,反而能吃到一半食物,当然不去踩了。反观大猪,明知小猪不为,那么自己为之总还是要比不为强。1.智猪博弈的故事4智猪故事揭示了大、小企业的关系。当企业定位于“大猪”时,应选择“主动获得”之优势策略;当定位于“小猪”时,应选择“等待获得”,这也是优势策略。比如,研究开发、为新产品做广告,这对大企业值得,对小企业是得不偿失的。完全市场中,作为一个理性企业,最可能的情况是小企业把精力花在模仿上,或等待大企业打开市场后出售廉价产品。而大企业应当以主动的态度来开拓市场。智猪故事还给竞争中的弱者以等待为最佳策略的启发。博弈中,每一方都想方设法攻击对方、保护自己,最终取得胜利;同时,对方也是一个与你一样的理性人,他会这么做吗?这就需要更高明的智慧。任何理性企业都必然会像智猪那样,总是选择优势策略。Introduction(三)两个充满理性与智慧的博弈故事1.智猪博弈的故事(启示)5Introduction(三)两个充满理性与智慧的博弈故事2.鱼与鱼竿的故事从前有两个饥饿的人从一位智者那里得到了一根鱼竿和一篓鲜鱼。•得到那篓鲜鱼的人在原地把鱼煮熟吃完,解决了饥饿问题,可很快又感到肚内空空,最终饿死在空鱼篓旁边。•另外一个得到鱼竿的人提着鱼竿朝向遥远的大海走去,当他终于来到海边的时候,也用尽了最后一点力气而死去。不久之后,同样是两个饥饿的人,也从智者那里得到了一根鱼竿和一篓鲜鱼。不同的是:•他们一起去寻找大海。每到饥饿的时候,就从鱼篓中拿出一条鱼吃。•当他们最终来到海边的时候,这两个人就拿着那根鱼竿开始了捕鱼为生的日子!6(二)博弈论的研究对象博弈是一种普遍现象,人们总会有意、无意地运用博弈的思想。比如企业在决策时,总是会考虑竞争对手的反应;个人与政府之间“上有政策,下有对策”;金融监管与创新犹如“猫鼠博弈”;博弈还作为消遣游戏,让人们获得快乐。博弈的特征表现为两个或两个以上具有利益冲突的当事人处于一种不相容状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。当所有当事人都拿定主意作出决策时,博弈的局势便确定下来。博弈论的目的是要研究人们之间这种不相容的行为,推广标准的一人决策理论。博弈论关注的问题:在每个当事人的收益都依赖于其他当事人的选择的情况下,追求个人收益最大化的当事人应该如何采取行动?Introduction7(三)博弈的标准形式与分类基本要素:局中人(players)、策略(strategies)、收益(payoffs)局中人以策略定胜负,以收益最大化为目标。标准形式(normalform):G=(Xi,fi)n,其中Xi为局中人i的策略集合,fi:SR为局中人i的收益函数(i=1,2,,n)。S=X1X2Xn叫做博弈G的局势集合。局势:策略n元组(x1,x2,,xn)(xiXi,i=1,2,,n)。博弈的分类:一般按照博弈的基本要素进行分类。①按人数分:二人博弈、多人博弈②按策略分:有限(策略)博弈、无限(策略)博弈③按收益分:常和(零和)博弈、变和博弈④按性质分:非合作博弈、合作博弈⑤按次序分:同时移动博弈、先后移动博弈(序贯博弈)交叉分类:以上分类方式的结合,比如二人零和有限博弈。Introduction8矩阵博弈我们先以矩阵博弈为重点,建立博弈论的基本分析框架。矩阵博弈:二人零和有限博弈,这是最简单的博弈形式。特点:甲与乙利益冲突,一方的收益就是对方的损失。甲的策略集X={x1,x2,,xm};乙的策略集Y={y1,y2,,yn}S=XY={(xi,yj):i=1,2,,m;j=1,2,,n}甲的收益函数f:SR;乙的收益函数g:SR零和:f(xi,yj)+g(xi,yj)=0(i=1,2,,m;j=1,2,,n)标准形式:G=(X,f;Y,g)=(X,Y,f)矩阵博弈的矩阵表示:甲的收益矩阵f即可表示矩阵博弈。),,2,1;,,2,1(),(njmiyxffjiijmnmmnnnmijffffffffff112222111211)(f9(一)古诺均衡局中人的目标:选择合适的策略以使自己的收益(对方的损失)达到最大,也即让对方的收益(自己的损失)达到最小。假定:甲和乙彼此了解对方的收益矩阵,双方都清楚自己的收益就是对方的损失。博弈过程:每个人都根据对方的行动来确定自己的行动,每个人都不断地在对方选定了策略的情况下来调整自己的策略以使自己的收益达到最大。博弈结局:当策略调整达到这样的局势(xh,yk)使得xh是甲在乙选定yk的情况下的收益最大策略,同时yk是乙甲在选定xh的情况下的收益最大策略的时候,双方策略调整宣告结束,博弈得以确定。此时的局势(xh,yk)就是古诺均衡(最优解),即}:),({min}:),(max{),(YyyxfXxyxfyxfhkkh矩阵博弈101.最大最小原理依据定义,矩阵博弈f的古诺均衡正对应于矩阵f的鞍点。鞍点定理(最大最小原理)是矩阵的鞍点(即局势(xh,yk)是矩阵博弈f的古诺均衡)当且仅当下述等式成立:ijminjhkijnjmifff1111maxminminmaxhkfnmijf)(f矩阵博弈古诺均衡的求解步骤从矩阵各行的最小元中找出最大元,称为最大最小元;从矩阵各列的最大元中找出最小元,称为最小最大元;如果最大最小元与最小最大元一致,那么该元素就是鞍点,代表矩阵博弈的古诺均衡。(一)古诺均衡矩阵博弈x1y1x2x4x3y3y4y5YXz鞍点古诺均衡),(yxfzy2112.两个博弈事例乙甲作广告不作广告作广告3030不作广告2020例1.广告竞争:存在古诺均衡单位:万元(一)古诺均衡矩阵博弈例2.便士匹配:没有古诺均衡甲、乙独立决定出示硬币正或反面。若两人出示相同,甲赢乙1元;若出示相反,乙赢甲1元。甲的收益表如下:乙甲出示正面出示反面出示正面11出示反面11123.稳妥策略与不稳定性只有当收益矩阵的最大最小元与最小最大元一致时,矩阵博弈才有古诺均衡(最优解)。最大最小元和最小最大元总存在,但二者未必一致,从而矩阵博弈可能没有最优解。例如,便士匹配博弈没有最优解。矩阵博弈可能没有最优解的真正原因是什么?稳妥策略•甲的稳妥策略:甲的收益矩阵的最大最小元;•乙的稳妥策略:甲的收益矩阵的最小最大元。问题的答案:原因在于稳妥策略可能不稳定。•不稳定的稳妥策略不能使博弈中的策略调整过程结束。•即使甲和乙都选择稳妥策略,但若稳妥策略不稳定,那么博弈就无法达到古诺均衡。矩阵博弈(一)古诺均衡13(二)混合策略为了消除古诺均衡未必存在的困惑,人们提出使用混合策略,即一种连当事人自己都不知道会采取什么行动的策略,对手就更不得而知了,从而使得局中人的行动变得相当诡异。考虑二人有限博弈G=(X,f;Y,g):•X={x1,x2,…,xm}:甲的纯策略集合;•Y={y1,y2,…,yn}:乙的纯策略集合;•S=XY:博弈G的纯局势集合。混合策略(mixedstrategies):以一定的概率采取一种策略。•甲的混合策略集合:•乙的混合策略集合:•G的混合局势集合:•甲的预期收益:•乙的预期收益:混合扩充:博弈叫做G的混合扩充。YXSqYpXnjjnmiim~~~}1:]1,0[{~}1:]1,0[{~11qp矩阵博弈nmijnmijgf)(,)(gf)~),(()()~),(()(1111Sgqp,EgSfqp,EfTminjijjiTminjijjiqpqgpqpqpqfpqp),~;,~(~EgYEfXG141.矩阵博弈的混合扩充定理博弈G=(X,f;Y,g)为常和博弈当且仅当G的混合扩充为常和博弈。当G是常和博弈时,G与具有相同的收入常和。因此,矩阵博弈的混合扩充仍为二人零和博弈。矩阵博弈G的混合均衡:是指G的混合扩充的古诺均衡。即,G的混合局势(p*,q*)叫做G的混合均衡(混合最优解)是指(p*,q*)满足如下条件:定理(混合均衡的存在性)任何矩阵博弈都有混合均衡。矩阵博弈f的混合均衡正对应于函数Ef的鞍点。鞍点定理(最小最大原理)(p*,q*)是矩阵博弈G的混合均衡(即函数Ef的鞍点)当且仅当下述等式成立:G~G~G~}~:)*,({min}~:*),(max{*)*,(YEfXEfEfqqppqpqp(二)混合策略矩阵博弈),(maxmin*)*,(),(minmax~~~~qpqpqpqpqpEfEfEfYXYX152.事例:求解便士匹配博弈的混合均衡便士匹配博弈中,甲的收益矩阵为]1,0[}10:),1{(~]1,0[}10:),1{(~qqqYpppX寻找混合均衡,就是去找出使得2]1,0[*)*,(qp}10:)*,(min{*)*,(}10:*),(max{qqpEfqpEfpqpEf)5.0,5.0(*)5.0,5.0(*.i.e5.0*5.0*0)1*2(2*)*,(0)1*2(2*)*,(qpqppqqpEfqpqpEf1111)(22ijff(二)混合策略矩阵博弈)12)(12()1()1()1)(1(),(),(),1(),,1(,]1,0[~~~),(22211211T2qpfpqfqpfqpfqpEfqpEfqqppYXSqpqfpqpqp163.混合均衡集的特点博弈值:•混合均衡的存在性及鞍点定理,保证了V(G)是良好定义的,并且当(p*,q*)是混合均衡时,V(G)=Ef(p*,q*)。•博弈值在解释均衡及求解混合均衡方面相当有用。•还可通过V(G)证明矩阵博弈的混合均衡集的下述特点。令),(maxmin),(minmax)(~~~~qpqppqqpEfEfGVXYYX}ofmequilibriuanis*)*,(:~*)*,({)}ofmequilibriuanis*)*,)((~*(:~*{)}ofmequilibriuanis*)*,)((~*(:~*{21GSTGXYTGYXTqpqpqppqqpqp定理对于甲和乙的矩阵博弈G=(X,Y,f)来说,T=T1T2且混合均衡集T是空间的非空有界闭凸子集,从而甲的混合最优策略集T1是的非空有界闭凸子集,乙的混合最优策略集T2是的非空有界闭凸子集。nm