决策与博弈论第4章

堕lazyangel
2 ℃
2019-07-05

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

2019/8/281第四章不完全信息动态博弈4.1.1基本概念不完全信息意味着至少有一个参与人拥有私人信息，通常用类型表示拥有不同私人信息的参与人，类型由“自然”或“上帝”给定。博弈顺序：（1）“自然”选择参与人的类型，并将类型告诉参与人自己，不告诉其他参与人，只将类型分布告诉其他参与人；（2）参与人开始行动，参与人的行动有先有后，后行动者能观察到先行动者的行动，而不能观察到先行动者的类型。先行动者的类型行动后行动者推断2019/8/282先行动者预测后行动者的行动信息后续博弈（continuationgame):从每一个信息集开始的博弈的剩余部分。与子博弈的区别：子博弈必须开始于单结信息集，并且不能切割信息集，而后续博弈可以始于任何完全信息集（不论是否为单结）。完美贝叶斯均衡要求：（1）在每一个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；（2）给定有关其他参与人类型的信念，参与人的策略在每一个信息集开始的后续博弈上构成贝叶斯均衡；（3）在所有可能的情况下（贝叶斯法则能适用），参与人使用贝叶斯法则修正有关其他参与人类型的信念。2019/8/283完美贝叶斯均衡吸取了子博弈完美纳什均衡和贝叶斯均衡的精华，是贝叶斯均衡、子博弈完美均衡和贝叶斯推断的结合。子博弈完美纳什均衡：策略不仅必须是整个博弈的纳什均衡，还必须是其中每一个子博弈的纳什均衡。完美贝叶斯均衡：策略不仅必须是整个博弈的贝叶斯纳什均衡，而且还必须构成每一个后续博弈的贝叶斯纳什均衡。例：在图4.1.1表示的博弈中，自然赋予参与人1两种类型，L或H，将类型告诉参与人1，但只将参与人1的类型分布告诉参与人2.参与人1有两个行动L和R，参与人2有行动A和B，参与人2能够观察到参与人1的行动，但是不知道参与人1的类型（或自然的行动）。2019/8/284图4.1.1海萨尼转换后的情形N11L[]P1PH[]LRLRAABB(2.5,3)(2.5,3)(3,3)(2,1)(1,2)(1,1)22019/8/285图4.1.212LMRBABA(2.5,3)(2,1)(1,2)(1,1)(3,3)2019/8/286博弈有两个纯策略纳什均衡，（L,A）和(R,B)。给定参与人1选择L，参与人2的信息集没有达到；给定参与人2选择A，参与人1的最优选择是L，因此，（L,A）是一个纳什均衡。因为这个博弈只有一个子博弈（从广义的角度看），即原博弈，所以（L,A）和(R,B)都是子博弈完美均衡。完美纳什均衡（L,A）依赖于一个不可置信的威胁：当参与人1偏离L而选择其他行动时，参与人2的最优行动是选择B，所以,参与人1不应该相信参与人2会选择A。（L,A）的剔除：假设参与人2认为参与人1选择M和R的概率分别为q和1-q。给定这个信念，参与人2选择A的预期效用是,选择B的预期效用是,这样，参与人2一定会选择B.1(1)11qq23(1)31qqq2019/8/287给定参与人1知道参与人2将选择B，参与人1的最优选择是R。但给定R是参与人1的最优策略，当参与人2观察到参与人1没有选择L时，他推断参与人1一定选择了R，即。0q因此，这个博弈的唯一完美贝叶斯均衡是{,;0}RBq2019/8/2884.1.2不完全信息下的博弈与决策服务行业的市场进入模型，博弈顺序为：（i）进入者决定进入（E）或不进入（O）；（ii）在位者选择高价（H）或低价（L）；（iii）自然选择需求，正常需求（N）的概率为0.6，萎缩需求（R）的概率为0.4；在正常需求的情况下，如果进入者选择不进入，则进入者的支付为0，在位者选择低价时的支付为40，选择高价时的支付为200；如果进入者选择进入，则当在位者选择低价时，进入者的支付为-80，在位者支付为-40，当在位者选择高价时，进入者和在位者各得支付80。在萎缩需求时，在每种情况下，在位者的支付比正常情况少了40；而进入者选择进入时，其支付比正常情况下也少了40。2019/8/289不完全信息下的博弈与决策根据上面的的行动顺序，可以画出进入者的决策树（decisiontree)，见图4.1.3。进入者在位者自然自然OELHRNRN0[0.5][0.5][0.4][0.6][0.4][0.6]-120-804080图4.1.3市场进入决策树2019/8/2810不完全信息下的博弈与决策市场进入博弈树4.1.4市场进入博弈树进入者在位者OE在位者自然LHRN[0.4][0.6](0,0)(0,40)自然RN[0.4][0.6]自然LHRN[0.4][0.6]自然RN[0.4][0.6](0,160)(0,200)(-120,-80)(-80,-40)(40,40)(80,80)2019/8/28114.2.1信号博弈的完美贝叶斯均衡信号博弈信号博弈中有两个参与者，具有信息优势的一个称为信号发送者（S），另一个称为信号接收者（R），博弈顺序为：（i）自然从可行的类型集中赋予发送者类型的先验概率为，并告知接收者，而告知发送者，接收者不知道发送者的类型，；{1,2,,}n()0p()p1()1np（ii）发送者从信号集中选择一信号m发送；[0,)M（iii）接收者观察到m后，从可行行动集中选择行动a；[0,)A（iv）发送者的效用函数为，接收者的效用函数为或给出接收者的最优反应函数，两者为共同知识。1(,,)uma2(,,)uma(,)am后验概率表示观察到信号m，接收者相信是类型发送的概率。(|)m2019/8/2812信号博弈的完美贝叶斯均衡定义（i）21()argmax(|)(,,)naAammuma（ii）1()argmax(,,())mMmumam（iii）是接收者使用贝叶斯法则从先验概率、观察到的信号和发送者的最优策略得到的（在可能的情况下）。(|)m()p()mm1()(|)(|)()(|)SnSppmmppm((),())mam(|)m定义4.2.1信号博弈的完美贝叶斯均衡（perfectBayesianequilibrium）是策略组合和后验概率的结合，它满足：2019/8/2813信号博弈的完美贝叶斯均衡定义如果不知道接收者的效用函数，但知道完全信息下接收者的最优反应函数，那么，定义4.2.1中的（i）用下面的（i´）代替（i´）1()[(,)](|)(,)namEammam信号博弈的完美贝叶斯均衡可以分成三类：分离均衡、混同均衡和准分离均衡。更加具体地，它们分别定义如下：分离均衡（separatingequilibrium）这种均衡中，不同类型的发送者以概率1选择不同的信号，也就是说，没有两种类型选择同一信号。在分离均衡中，信号准确地表现类型，特定的类型发送特定的信号。接收者完全可以通过信号准确判断出发送者的类型，即后验概率要么为0要么为1。(|)m11(,,())(,,())iiiijjumamumam2019/8/2814信号博弈的完美贝叶斯均衡定义混同均衡（poolingequilibrium）在这种均衡中，不同类型的发送者选择了相同的信号，换句话说，没有任何类型选择与其他类型不同的信号。这时，接收者无法从信号中得到新的信息，也就无法对先验信念进行修正。因此，后验概率等于自然赋给信号发送者类型的概率。(|)m()p在混同均衡中，对于任何类型的信号发送者，选择均衡信号比选择其他任何信号的效用都高，即m11(,,())(,,())umamumammm,,准分离均衡（semi-separatingequilibrium）一些类型的发送者随机地选择信号，另一些类型的发送者选择特定的信号。接收者得到某些信号时能够准确地判断出发送者的类型，得到另外的信号时尽管不能完全判断发送者的类型，但是能够修正自己的信念。2019/8/2815信号博弈的完美贝叶斯均衡直观标准的含义是，在非均衡路径中，接收者认为发送者不会选择无论接收者怎样采取行动发送者的效用总小于均衡时发送者效用的信号。(|)0m直观标准如果m之后的信息集处于均衡路径之外，且m为类型的均衡劣信号，即均衡效用，则（在可能的情况下）接收者的推断。(,)()max(,,(,))amuumam信号博弈的完美贝叶斯均衡中一般存在不可置信((incredible)的均衡，为了剔除之，可以采用Kreps(1984)或Cho和Kreps(1987)的直观标准（intuitivecriterion）。接收者对类型发出的信号m所采取的行动记为，以替代效用函数中的a，下同。(,)am2019/8/2816信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈Cho和Kreps(1987)的“啤酒和热狗(beerandquiche”信号博弈中，博弈顺序为：（iv）发送者和接收者的效用见图4.2.1，两者为共同知识。（i）自然从可行的类型集中赋予发送者类型的概率为，并将告知接收者，而将告知发送者，接收者不知道发送者的类型，且；12{,}()0p()p1()0.1p2()0.9p（ii）发送者从信号集中选择一信号发送；{,}MBQ（iii）接收者观察到信号后，从可行行动集中选择行动；{,}ADN在博弈顺序中，类型代表软弱型（wimpy），代表粗暴型（surly）；B代表啤酒，Q代表热狗；D代表与发送者冲突（duel），N代表不与发送者冲突。[p]表示当接收者接收到信号后，认为发送者的类型为的概率，即。1211(|)pQQ2019/8/2817信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈图4.2.1“啤酒和热狗”信号博弈b,1d,00,-1b+d,0d,00,1b,-1b+d,0DNDNDNDNQBQB[p][1-p][q][1-q]12RR0.10.9N2019/8/2818信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈支付的定性特征是，软弱型宁愿热狗，粗暴型宁愿啤酒，两种类型都不愿意与接收者冲突，而接收者宁愿与软弱型冲突，但不愿与粗暴型冲突。具体地，对两种类型的发送者来说，偏好的早餐价值，不偏好的早餐价值为0，而避免冲突价值。对接收者来说，与软弱型（粗暴型）冲突的支付为1（-1），所有其他支付为0。0b0d2019/8/2819“啤酒和热狗”信号博弈在啤酒和热狗博弈中，是发送者的一个分离策略，这里代表在发送者是软弱类型的情况下，选择热狗。如果，那么，发送者的策略和接收者的策略以及后验概率和是这个博弈的完美贝叶斯均衡。这里代表在发送者选择热狗的情况下，接收者选择冲突，也可以类似地解释。12(|,|)QB1|Qbd12(|,|)QB(|,|)DQNB1p0q|DQ|NBb,1d,00,-1b+d,0d,00,1b,-1b+d,0DNDNDNDNQBQB[p][1-p][q][1-q]12RR0.10.9N2019/8/2820信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈当时，是否啤酒和热狗有其他完美贝叶斯均衡？发送者可能选择的其他策略是、和。当时，软弱的发送者选择热狗得到的最低支付超过选择啤酒时得到的最高支付，这样软弱型将不选择啤酒，发送者也许选择的其他策略为。类似地，粗暴发送者选择啤酒得到的最低支付超过选择热狗得到的最高支付d，这样粗暴型将不选择热狗，策略不能成为完美贝叶斯均衡策略。于是，当时，上面取的分离完美贝叶斯均衡是该信号博弈的唯一完美贝叶斯均衡。12(|,|)QQbd12(|,|)QQbd12(|,|)BQbd12(|,|)BBb12(|,|)QQbd2019/8/2821信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈0.1q当时又是怎样的呢？现在，没有分离完美贝叶斯均衡。但是，有两个混同完美贝叶斯均衡。可直接证明，当时，发送者的策略