不完全信息博弈

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2.4不完全信息博弈本节内容:不完全信息静态博弈贝叶斯纳什均衡的应用举例不完全信息动态博弈很多时候,参与人并不清楚对手的偏好、战略空间、各种组合下的利润水平,即,只拥有不完全信息。每个人知己于必然,知人于或然引入一个虚拟的参与人:自然。它选择了参与人的特征类型。海萨尼转换。完全但不完美信息博弈。因为使博弈分析成为可能,故称“完全”,但所知不确,故“不完美”给定自己的类型和别人的类型的概率分布的情况下,每个参与人的期望效用达到最大。不完全信息静态博弈:贝叶斯-纳什均衡不完全信息博弈在信息上,各对手有时势均力敌,可能形成完全信息博弈其技术标准是:支付函数是共同知识大量的对局中信息不对称,如古董(他们坐店收购时从来不先出价,卖猫的故事)企业选择员工保险销售至少有一个人不知道其他人的支付函数,即形成“不完全信息博弈”不完全信息博弈和贝叶斯纳什均衡不完全信息博弈例:市场进入博弈进入者不知道在位者的成本函数,只能猜概率如果你是高成本,我就进入,预期收益40,如果你是低成本,我就不进入。到底进还是不进?进入者进入不进入在位者高成本情况低成本情况默许斗争默许斗争40,50-10,030,80-10,1000,3000,3000,4000,400期望利润:p×40+(1-p)×(-10).为保证不亏,期望利润为0,则p=0.2。大于0.2会赚钱。对p的判断就是“贝叶斯理念”静态贝叶斯博弈的时间顺序为:1、自然选择类型向量,参与人i能观测到自己的类型,但参与人j只知道除i之外所有参与人类型,但不知道参与人i的类型。2、n个参与人同时行动;3、参与人i得到类型依存支付函数。给定参与人i只知道自己的类型而不知道其他参与人的类型,参与人i将选择使自己的效应最大化的期望效用。静态贝叶斯博弈不完全信息博弈和贝叶斯纳什均衡海萨尼在1967-1968年提出了一个处理不完全信息的方法——引入一个虚拟的参与人“自然”,自然首先行动,选择决定参与人的特征(如成本函数),参与人知道自己的特征,其他参与人不知道。这样不完全信息博弈就转换为完全但不完美信息博弈,可以利用标准的分析技术进行分析,这就是“海萨尼转换”。海萨尼转换不完全信息博弈和贝叶斯纳什均衡类型:一个参与人拥有的所有的个人信息(即所有不是共同知识的信息)称为他的类型。根据这个定义,甚至允许参与人不知道其他参与人是否知道自己的类型。例如:市场进入博弈:在位者不知道进入者是否知道自己是高成本还是低成本,只知道进入者有p’的概率知道自己的成本函数,(1-p’)的概率不知道自己的成本函数。这种情况下,进入者也有两种类型:知道(在位者的成本)或不知道(在位者的成本)。不完全信息意味着,至少有一个参与人有多个类型。海萨尼转换不完全信息博弈和贝叶斯纳什均衡贝叶斯纳什均衡贝叶斯纳什均衡:n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合,其中每个参与人i在给定自己的类型θi和其他参与人类型依存战略的情况下,最大化自己的期望效用。不完全信息博弈和贝叶斯纳什均衡贝叶斯纳什均衡的定义的理解如果我是某种类型,则其他人属某类型的概率乘以这种情况下其他人的最好选择时,我所得到的效用。对此乘积加总,找出我的最大效用贝叶斯均衡相当于“各人的类型之和”下参与人的纳什均衡不完全信息博弈和贝叶斯纳什均衡1、不完全信息古诺模型前面已经分析过完全信息静态古诺模型和动态斯坦克尔伯格模型。后者,由于先行者的优势而使均衡结果不同于完全信息下的结果(如果是选择价格,均衡结果不利于先行者)(张维迎P148)贝叶斯纳什均衡的应用举例qi:第i个企业的产量Ci:代表第i个企业的成本假定逆需求函数为:第i个企业的利润函数为:2,1),)((),(21icQPqqqiii)()(21qqaQP1、不完全信息古诺模型假定a=2,c1=1,c2l=3/4,c2h=5/4。给定企业2知道企业1的成本,企业2将选择q2最大化利润函数:t=a-c=a-3/4=5/4或t=a-5/4=3/4依赖于企业2的实际成本。从最优化一阶条件可得企业2的反应函数为:)(2*122qqtq)(21),(11*1qttqq3信息与非合作博弈理论)(21),(11*2qttqq也就是说,企业2的最优产量不仅依赖于企业的产量,而且依赖于自己的成本,令q2l为t=5/4时企业2的最优产量,q2h为t=3/4时企业2的最优产量。那么,q2l=1/2*(5/4-q1);q2h=1/2*(3/4-q1)企业1不知道企业2的真实成本从而不知道企业2的最优反应究竟是q2l还是q2h,因此企业1将选择q1最大化下列利润函数:)1(21)1(21h211l2111qqqqqqE最优化一阶条件得企业1的反应函数为:)1(21)21211(212l2h2*1Eqqqqh2l222121qqEq是企业1关于企业2产量的期望值均衡意味着两个反应函数同时成立,解两个反应函数得贝叶斯均衡为:24/5;24/11;31*h2*l2*1qqq2、双方叫价拍卖doubleauction–两群人各自出价,有中间的拍卖商。–叫价较低者容易卖出,但成交价格有可能高于他的出价;出价高者容易买到,但成交价格有可能低于他的出价–Chatterjee&Samuelson“双方叫价拍卖模型”–假设你卖我买–你觉得这东西值c,要价ps;我觉得这东西值v,要价pb。同时报数–如果你要价较低,成交,价格为中间数–如果你要价较高,不成交贝叶斯纳什均衡的应用举例贝叶斯纳什均衡的应用举例双方叫价拍卖doubleauction如果是完全信息,我知道那东西对你意味着什么,你也知道那东西对我来讲值多少钱。这将形成一个均衡:你我出价相等,皆大欢喜如果谁想沾便宜,生意就没法做还可能出现无效率的均衡:双方都没有认真选择价格,漫天要价,坐地还钱,做不成生意贝叶斯纳什均衡的应用举例双方叫价拍卖doubleauction•如果是不完全信息,我不知道那东西对你意味着多少钱,你也不知道那东西对我来讲有多大价值。但可以假设我们互相知道对方的分布函数•根据纳什均衡的定义,我们都选择最大化•根据均衡战略,即使我觉得它值1,但我最多只出3/4,如果想成交,你的要价必须不高于3/4贝叶斯博弈与混合战略均衡•完全信息混合战略均衡可视为不完全信息纯战略均衡的极限•混合战略均衡的纯化定理银行挤兑(1)王则柯“银行挤兑的成因和预防”两客户在同一银行各存有100元,银行将这200元投资于一个长期项目。如果在项目到期前银行要抽回资金,则只能收回140元;但如果到期后再收回投资,则可收回本息280元。对客户来说,抽回存款的日期也有两种:一是在银行投资项目到期之前,称日期1;一是在到期之后,称日期2。假定如果两客户在日期1要求抽回资金则各得70元;如果只有一个客户在日期1要抽回资金则该客户得100元,另一客户只能得到剩余的40元。如果等到日期2两客户同时要收回资金,则各得140元;如果到日期2还只有一方要求收回资金,则要求收回资金一方得180元,另一方得100元;如果到日期2没有客户要求收回资金,则银行还是分给他们各140元。银行挤兑(2)日期1客户2客户1抽回不抽回抽回70,70100,40不抽回40,100下一日期日期2客户2客户1抽回不抽回抽回140,140180,100不抽回100,180140,140银行挤兑(3)日期1客户2客户1抽回不抽回抽回70,70100,40不抽回40,100140,140不完全信息动态博弈精炼贝叶斯均衡二手车交易市场类型混同均衡与分离均衡单一价格二手车交易“自然”首先选择参与人的类型,参与人自己知道,其他参与人不知道;在自然选择之后,参与人开始行动,参与人的行动有先后,后行动者能观测到先行动者的行动,但不能观测到其类型。不完全信息动态博弈后行动者可以通过观察而增加对先行者的了解,再修正其主观判断,并由此选择自己的行动。先行者知道自己的行为会被他人利用,就会设法传递有利信息。博弈过程是不仅是参与人选择行动的过程,还是不断学习的过程。不完全信息动态博弈精炼贝叶斯均衡要求:给定其他参与人类型的信念,参与人的策略在每一个信息集开始的“后续博弈”上构成贝叶斯-纳什均衡,而且在所有可能的情况下,参与人要根据观察结果来修正对其他参与人的信念,据此选择自己的最优化行为。精炼贝叶斯均衡精炼贝叶斯均衡是一个战略组合和一个概论分布,它们满足以下要求:(1)在各个信息集,轮到选择的参与人必须具有一个关于博弈达到该信息集中各决策结的概率的判断(即信息集上的概率分布);(2)给定概率分布和其他参与人的选择,每个参与人的战略是最优的;(3)概率分布是使用贝叶斯法则从最优战略和观测到的行动得到的。精炼贝叶斯均衡1、贝叶斯法则在日常生活中,当面临不确定时,我们对某事件发生的可能性有一个判断,然后,会根据新的信息来修正这个判断。统计学上,修正之前的判断称为“先验概率”修正后的判断称为“后验概率”贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。1、贝叶斯法则假定参与人的类型是独立分布的,参与人i有K个类型,有H个可能的行动,өk和ah分别代表一个特定的类型和一个特定的行动。如果我们观察到i选择了ah,i属于өk的后验概率是多少?kjjjhkkhhkkhhkpappapaobpapaob1)()()()(}{Pr)()(}{Pr精炼贝叶斯均衡1、贝叶斯法则人:好人(GP),坏人(BP)事:好事(GT),坏事(BP)一个好人干好事的概率等于他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP),加上他是坏人的概率p(BP)乘以坏人干好事的概率p(GT|BP):Prob{GT}=p(GT|GP)*p(GP)+p(GT|BP)*p(GT|BP)精炼贝叶斯均衡1、贝叶斯法则假定观测到一个人干了一件好事,那么这个人的是好人的后验概率是:}{Pr)()(}{PrGTobGPpGPGTpGTGPob假定我们认为这个人是好人的先验概率是1/2,观测到他干了好事之后如何修正他的先验概率依赖于他干的好事好到什么程度:精炼贝叶斯均衡1、贝叶斯法则1)是一件非常好的好事,坏人绝对不可能干,则p(GT|GP)=1p(GT|BP)=02)这是一个非常一般的好事,好人会干,坏人也会干:p(GT|GP)=1p(GT|BP)=112/102/112/11}{PrGTGPob212/112/112/11}{PrGTGPob精炼贝叶斯均衡3)介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不会干:p(GT|GP)=1/2p(GT|BP)=1/2322/12/12/112/11}{PrGTGPob1、贝叶斯法则精炼贝叶斯均衡假定我们观测到他干了一件坏事,我们相信,好人绝对不会干坏事,那么可以肯定他绝对不是一个好人。02/12/102/10}{PrpBTGPob假定我们原来认为他是个好人,大突然发现他干了一件好事,我们如何看待呢?1102/1}{PrpqpGTBPob1、贝叶斯法则精炼贝叶斯均衡1)在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);2)给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;3)每一个参与人根据贝叶斯法则和均衡战略修正后验概率。2、精炼贝叶斯均衡精炼贝叶斯均衡博弈顺序:1)“自然”首先选择参与人1的类型,参与人1知道,但参与人2不知道,只知道1属于该类型x的先验概率。2)参与人1观测到类型x后发出信号。3)参与人2观测到参与人1发出的信号,使用贝叶斯法则从先验概率得到后验概率,然后选择行动。2、精炼贝叶斯均衡精炼贝叶斯均衡二手车交易假定你现在到二手车市场去买一辆旧车,到了市场后,你却发现不知道每辆旧车真正的质量究竟怎样,因为它们看起来都象新车一样。但通常卖方对旧车的质量要清楚得多。现在假定

1 / 41
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功