不完全信息动态博弈一、不完全信息动态博弈举例二、海萨尼转换三、贝叶斯法则四、精炼贝叶斯纳什均衡一、不完全信息动态博弈举例去过古玩市场的人,通常最深刻的感受莫过于古玩的价格非常玄乎,简直让人琢磨不透。古玩交易让人疑惑和不放心的根本原因,不是由于古玩的价格昂贵,而是其性质和价值基础比较特殊。古玩属于奢侈品而不是生活必需品,其效用和价值基础的主观程度高,客观程度较低。因此对古玩价值的评价非常困难,而且相互之间很难了解对方的评价。由于双方都无法知道对方的估价,因此相互对对方的得益都不可能完全清楚,这是不完全信息的博弈问题。古玩市场由于古玩市场的交易一般是卖方先开价,然后买方再还价,直至达成一个双方都接受的价格或放弃交易,因此古玩交易通常是动态博弈问题。二、海萨尼转换1967年,海萨尼提出了“海萨尼转换”来处理不完全信息的博弈。基本思路是:引入一个虚拟的参与人——“自然”,“自然”首先行动选定参与人的某种类型,各参与人知道自己的类型,但其他参与人不知道。不过,“自然”以怎样的概率来选择各参与人的类型,此概率分布却是共同知识。以对参与人类型的概率的分析代替对参与人确切行动的分析,这样的转换就是“海萨尼转换”。通过海萨尼转换,博弈开始时,所有参与人有关“自然”的行动有一致的信念,即都知道所有人类型的概率分布,此即“海萨尼公理”。海萨尼转换后的市场进入博弈N●P1-P●●进入者进入者不进进不进进●●●●(0,300)在位者打击●●打击●●在位者(40,50)(-10,0)(0,400)(30,80)(-10,100)三、贝叶斯法则在不完全信息开始之前,“自然”首先行动,选择各参与人的类型。各参与人除了知道自己的类型以外,对“自然”的行动都有着一致的信念,称之为先验信念。之后,参与人先后行动,后行动者能观察到先行动者的行动,但观察不到先行动者的类型。但是,因为参与人的行动是依赖于其类型的,每个参与人的行动都传递着有关自己类型的某种信息,后行动者可以通过观察先行动者的行动来修正对其各种类型判断的先验信念(概率分布),然后选择自己的最优行动。先行动者预测到自己的行动将被后行动者所利用,也就会设法传递对自己有利的信息,避免传递对自己不利的信息。因此,不完全信息动态博弈不仅是参与人选择行动的过程,更是参与人不断修正信念的过程。例所罗门判子所罗门王是古代以色列国的一位以智慧著称的君主。一次,两个妇人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。听罢这位妇人的求诉,所罗门王立即作出最终裁决——婴儿是这位请求不杀婴儿的妇人的,应归于她。这个故事讲的道理是,尽管所罗门王不知道两位妇人中谁是婴儿的母亲,但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈成两半的。所罗门王正是利用这一点,一下就识别出谁是婴儿的真正的母亲了。例黔之驴黔无驴,有好事者船载以入。至则无可用,放之山下。虎见之,庞然大物也,以为神。蔽林间窥之,稍出近之,憖憖然莫相知。他日,驴一鸣,虎大骇,远遁,以为且噬已也,甚恐。然往来视之,觉无异能者,益习其声,又近出前后,终不敢搏。稍近,益狎,荡倚冲冒,驴不胜怒,蹄之。虎因喜,计之曰:“技止此耳!”因跳踉大㘎,断其喉,尽其肉,乃去。噫!形之庞也类有德,声之友也类有能,向不出其技,虎虽猛,疑畏卒不敢取;今若是焉,悲夫!概率论中贝叶斯公式贝叶斯法则是先验概率,是类型,是一特定行动。问题是假如观测到了,则属于类型的概率,即后验概率。niBPBAPBPBAPABPnjjjiii,...2,1,1KjjjhkkhhkPaPPaPaP10kPkkhahahkaP贝叶斯法则例对人的判断把所有的人划分为好人GP和坏人BP两类,所有的事划分为好事GT和坏事BT两类。那么一个人干好事的概率是。如果观测到一个人干了件好事,那么这个人是好人的后验概率是更具体点,假定认为这个人是好人的先验概率为1/2,那么在观测到他干了好事之后,如何修正先验概率依赖于我们认为这件好事好到什么程度。第一种情况,这是一件非常好的好事,好人一定干,坏人绝不可能干。12/102/112/11GTGPPGTPGPPGPGTPGTGPPBPPBPGTPGPPGPGTPGTP第二种情况,这是一件非常一般的好事,好人会干,坏人也会干第三种情况,好人肯定会干,坏人可能干也可能不干2/12/112/112/11GTGPP3/22/12/12/112/11GTGPP可以看到,我们如何改变对一个人的看法不仅依赖于我们认为他是好人或坏人的先验概率,而且依赖于我们如何“认为”好人干好事和坏人干好事的条件概率。不能任意地“认为”。当认为坏人干好事的概率为时,那么,在给定信息情况下,如果这个人确实是坏人,则是他的最优选择。这对于理解精炼贝叶斯纳什均衡是非常重要的。BPGTP/BPGTP/例二手车市场认为车子是好的先验概率为,认为车子是不好的先验概率为。当卖(sell)这个行动发生后,车子是好的后验概率是]/[NgPNgsPgPgsPgPgsPsgPgPNgP贝叶斯法则不是一个技术性法则,而是人们修正信念的唯一合理方法。四、精炼贝叶斯纳什均衡1●●●●●●●●RLM(p)(1-P)22UDUD(2,1)(0,0)(0,2)(0,1)精炼贝叶斯纳什均衡是:﹛L,U;p=1﹜纳什均衡是:(R,D)(L,U)(1,3)假定参与人2认为参与人1选择L和M的概率分别为p和(1-p)。给定这个信念,参与人2选择U的期望效用是p×1+(1-p)×2=2-p,选择D的期望效用是p×0+(1-p)×1=1-p.不论p为何值,参与人2一定选择U。给定参与人1知道参与人2将选择U,参与人1的最优选择是L。给定L是参与人1的最优战略,当参与人2观察到参与人1没有选择R时,他知道参与人1一定选择了L,即p=1。因此,这个博弈的唯一的精炼贝叶斯纳什均衡是﹛L,U;p=1﹜第一,在每一个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);第二,给定该信息集上的概率分布和其他参与人的后续策略,参与人在该信息集处的行动必须是最优的(后续策略指的是从给定信息集开始的后续博弈上的行动规则);第三,每个参与人根据均衡策略和贝叶斯法则做出判断和修正,得到后验概率。满足上述要求的博弈均衡就称为“精炼贝叶斯均衡”。信号传递博弈信号传递博弈是一类比较简单但有广泛应用意义的不完全信息动态博弈,许多博弈问题都可以归结为此类型的博弈。如市场进入与遏制、委托-代理关系、拍卖机制的设计等。在信号传递博弈中有两个参与人,先后各行动一次;参与人1有多个类型,先行动;参与人2后行动,他不知道参与人1的具体类型,但可以观察到先行动一方的行动并从中获得部分信息。先行动的一方行动对后行动者来说好像是某种反映其类型信息的信号,因此该博弈被称为“信号传递博弈”。一般称先行动的参与人1为信号发送者,记为S;后行动的参与人2称为信号接收者,记为R。例垄断厂商的低价销售:信号传递博弈有许多垄断厂商并未如人们所料想的那样给商品定出一个很高的价格,而是以较低的价格长期销售某种产品。譬如,发达国家的私营铁路、航空、海运码头等的价格都远低于按照其垄断定价方法定出的价格。这是什么原因呢?现在,我们用这个“信号传递博弈”的原理,来解释为何一些垄断厂商长期在低价格水平上经营。如果这个垄断厂商是一个低生产成本的厂商,当其它较高生产成本厂商也进入这个厂商所经营的行业与之进行竞争时,原先的那个垄断厂商可以通过降价将进入者赶出这个行业,从而继续维持垄断经营。由于垄断厂商有更低的生产成本,所以,它能够将产品价格降到比进入厂商的生产成本还要低的水平上,这就造成进入者或者高价格经营导致顾客流失,或者同样也降价但价格低于成本,两种情形进入者都会亏损,最后不得不退出行业。但是,这种“打斗”行为尽管可以击退进入者,但由于一段时间的降价经营可能对垄断者带来较大损失。垄断者为了避免这种损失,可以向外宣布它是低成本的,别的厂商休想进来与它竞争。但仅凭口头宣布人家是不会相信的,因为即使垄断者不是低成本的厂商,它也会如此宣布。一种方法就是,垄断者向外发送一个信号,向外界传递它真是低成本的信息。它可以长期在一个较低价格水平上经营。如果它的价格足够低,高成本厂商不敢模仿,行内厂商会据此判定它确是低成本的。同时,它的价格也不能太低,以致于较之与进入者进行降价竞争,其损失为小一些。这样,垄断者才会采取如此策略。潜在的高成本进入者不敢进入,垄断者得以保持长期的垄断地位。例为什么有的商品广告既无商品的价格信息又无售货地点信息,只有明星的表演?通常认为,商业广告的功能是向消费者提供必要的购货信息,如散布商品的价格,质量功能,出售地点等信息。再者,人们还认为有些广告可能是为了引导消费,特别是新产品出现时,消费者还不知道、不熟悉它,商业广告中通过一些电影明星使用新产品的图象,利用公众的“追星”心理打造市场。这种关于新产品市场引导的广告在国外的电视广告中特别常见,通常是一位当红明星在电视上用新产品表演一番,既无价格,也无售货地点的介绍,除了显示一下商标外,完全没有对产品性能的说明。不过,对于这类广告,博弈论还有一种“信号传递”的解释呢。假设有一家企业(记为企业A)开发出一种很有市场潜力的饮料,该产品饮后对人的健康确实有好处。但同时,另一家生产假冒伪劣产品的企业(记为企业B)也准备向市场推出一种伪劣产品饮料。两个企业都会向公众宣布其产品是上乘的,如何如何的好。但公众是理性的,不会仅凭商业宣传就相信它们。但是,如果产品真的好,随着时间的推移,消费者能够识别出来。所以,生产好饮料的的企业A对自己的市场有信心,它相信随着时间的推移,企业B生产的伪劣产品终究会被消费者识破,顾客会跑到自己这里来,从而自己的市场会不断扩大,销售收入及利润会不断增长。而企业B开始可以蒙骗一部分消费者,但时间一长,产品的问题会暴露出来,市场会不断缩小,收入及未来利润都不会有企业A的大。这样一来,企业A的未来预期收入远大于企业B。因此,如果企业A请一位当红明星打广告,由于是当红明星,他们打广告有很高的市场价格,就可以使企业B不敢模仿。譬如,假定企业A的预期收入为3千万元,企业B的预期收入为1千万元。当红明星打广告的市场价格为2千万元,那么,企业A可以请明星打广告但企业B就请不起。消费者也明白这个道理,从而会在一开始就识别出不能请当红明星打广告的企业B是生产伪劣产品的。这样,企业B一开始就没有市场。当企业A请了当红明星打广告时,企业B发现这位明星的市场价格太高,自己难以模仿企业A,开始就会放弃生产伪劣产品的计划。所以,企业A通过请当红明星打广告而清除掉了潜在的市场模仿者,它向公众传递自己是生产好产品的信号,这种信号的价值在于其所请来的当红明星有着较高的出场价格,而不在乎明星在广告节目中说了什么,表演了什么,当然更无所谓广告节目是否介绍产品价格等信息了。企业A请当红明星打广告就为公众传递了它是生产好产品的企业的一个信号。例为什么许多实力雄厚的公司还要向银行借很多钱?在国外,一些资金实力雄厚的公司通常也会向银行贷款。更加令人感到奇怪的是,一些好的公司,一方面自己借钱给别的公司,同时,另一方面又向银行借钱。博弈论运用“信号传递”原理可以对此现象作出解释。对于一家公司来说,负债增加会增大公司破产的可能性;但是,对于实力雄厚的公司,在同样负债比例下,其破产可能性要小一些。每个公司都会向社会吹嘘自己是好的公司,实力雄厚,但公众不会仅凭口头宣传就相信的。于是,真正好的公司通过向银行借钱来增大自己破产