第三章-不完全信息静态博弈

wornchurch
1 ℃
2020-04-01

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第三章不完全信息静态博弈不完全信息博弈和贝叶斯纳什均衡贝叶斯均衡的应用贝叶斯均衡与混合战略均衡*机制设计问题和显示原理第三章不完全信息静态博弈3.1不完全信息博弈和贝叶斯纳什均衡一、不完全信息博弈1、定义不满足完全信息假设的博弈称为不完全信息博弈。完全信息假设：支付函数是共同知识。即是说，在不完全信息博弈中，至少有一个参与人不知道其他参与人的支付函数。0，4000，4000，3000，300-10，10030，80-10，040，50在位者高成本低成本默许默许斗争斗争进入者不进入进入假定在位者有两种可能的成本函数：高成本或低成本；进入者有关在位者的成本信息是不完全的。当信息完全时，若在位者是高成本，进入者的最优选择是进入；若在位者是低成本，进入者的最优选择是不进入。由于进入者不知道在位者是高成本还是低成本，其最优选择依赖于它在多大程度上认为在位者是高成本或低成本。支付矩阵2、市场进入博弈的例子假定进入者认为在位者是高成本的概率是p，低成本的概率是1-p。那么，进入者选择进入的期望利润是p×(40)+(1-p)×(-10)，选择不进入的期望利润是0。进入者的最优选择：当p×(40)+(1-p)×(-10)0，即当p0.2时，进入者选择进入；当p0.2时，进入者选择不进入。引入虚拟参与人“自然”；自然首先行动决定参与人的特征，参与人知道自己的特征，其他参与人不知道；特征的分布函数是共同知识；“不完全信息”转换为“完全但不完美信息”，可使用标准的分析技术来分析。二、海萨尼（Harsanyi）转换1、例子：市场进入博弈注意：一般地，自然在博弈的开始选择包括参与人的战略空间、信息集、支付函数等；一个参与人所拥有的所有个人信息（即所有不是共同知识的信息）称为他的类型；参与人的类型是其个人特征的一个完备描述；一般地，将参与人的支付函数等同于他的类型。不完全信息意味着，至少有一个参与人有多个类型。niaauuaaniiniiniin,,1),,,,(,,0,,1,),,(0111各博弈方得益中选择行动方案同时从各自的行为空间个实际博弈方原来的静态博弈，即各在前述基础上，再进行博弈方的类型部分）博弈方知道其他全部或自己的类型，但不让（让每个实际博弈方知道博弈方，其中成向量取他们的类型，构方按随机方式或者说抽之前，为每个实际博弈择，其作用是在博弈方选可称为博弈方引进虚拟自然博弈方，2、完整描述根据海萨尼公理，假定分布函数P（θ1,…,θn）是所有参与人的共同知识，用θ-i=（θ1,…,θi-1,θi+1,…,θn）表示除i之外的所有参与人的类型组合。这样，θ=（θ1,…,θn)=（θi,θ-i）。称pi(θ-i|θi)为参与人i的条件概率，即给定参与人i属于类型θi的条件下，他有关其他参与人属于θ-i的概率。根据条件概率规则，iiiiiiiiiiiippppp,,,|这里，p(θi)是边缘概率。如果类型的分布是独立的，pi(θ-i|θi)＝p(θ-i)。三、不完全信息静态博弈的战略式表述和贝叶斯纳什均衡贝叶斯纳什均衡是完全信息静态博弈纳什均衡概念在不完全信息静态博弈上的扩展。不完全信息静态博弈又称为静态贝叶斯博弈。1、贝叶斯博弈的战略式表述n人静态贝叶斯博弈的战略式表述包括：参与人的类型空间；条件概率；类型依存战略空间；类型依存支付函数。n,...,1npp,...,1nnAA,...,11nnnnaauaau,,...,,...,,,...,1111参与人i知道自己的类型，条件概率pi(θ-i|θi)描述给定自己属于θi的情况下，参与人i有关其他人类型的不确定性。我们用代表该博弈。iiii},,;,,;,,;,,{1111nnnnuuppAAG2、静态贝叶斯博弈的时间顺序（1）自然选择类型向量θ=（θ1,…,θn)，参与人i观测到θi,但其他参与人j只知道pj(θ-j|θj)，观测不到θi；（2）n个参与人同时选择行动a=（a1,…,an),其中；（3）参与人i得到。iiiAainiaau,,...,1讨论：1）若所有参与人的类型空间只包含一个元素，不完全信息静态博弈就退化为完全信息静态博弈；2）若参与人的类型是完全相关的，当参与人i观测到自己的类型时也就知道了其他参与人的类型，博弈是完全信息的。3、贝叶斯纳什均衡n人不完全信息静态博弈的纯战略贝叶斯纳什均衡是一个类型依存战略组合，其中每个参与人i在给定自己的类型θi和其他参与人类型依存战略的情况下最大化自己的期望效用函数vi。换言之，战略组合是一个贝叶斯纳什均衡，如果对于所有的i，，},,;;,,;,,{111nnnuuPAAGniiia1*iia*nnaaa*1*1*,...,iiiAa**argmax(|)(,;,)iiiiiiiiiiiaapuaa注意：与纯战略纳什均衡不同的是，在贝叶斯均衡中，参与人i只知道具有类型θj参与人j将选择aj(θj)但并不知道θj，因此，即使纯战略选择也必须取支付函数的期望值。贝叶斯均衡在本质上也是一个一致性预测，即每个参与人i都能正确预测到具有类型θj的参与人j将选择aj*(θj)。3.2贝叶斯均衡的应用举例一、不完全信息的古诺模型：假定参与人的类型是成本函数，逆需求函数是P=a-q1-q2。令ci是企业i的单位成本，企业i的利润函数为：2,1,21icqqaqiii假定企业1的单位成本c1是共同知识，企业2的单位成本可能是c2L也可能是c2H，c2Lc2H；企业2知道自己的成本是c2H还是c2L，但企业1只知道c2＝c2L的可能性为μ，c2＝c2H的可能性为1-μ；μ为共同知识。进一步假定：a＝2，c1＝1，c2L＝0.75，c2H＝1.25μ＝0.5。给定企业2知道企业1的成本，企业2将选择q2最大化利润函数：，t＝a-c2，依赖于企业2的实际成本。2*122qqtq根据最优化的一阶条件得到企业2的反应函数：11*221;qttqq企业2的最优产量不仅依赖于企业1的产量，而且依赖于自己的成本。令q2L为t=1.25时企业2的最优产量，q2H为t＝0.75时企业2的最优产量。有：12124321;4521qqqqHL企业1不知道企业2的真实成本，从而不知道企业2的最优反应是q2L还是q2H，因此企业1将选择q1最大化其期望利润函数：HLqqqqqqE2112111121121解最优化的一阶条件得企业1的反应函数为：222*11212121121EqqqqHL均衡意味着两个反应函数同时成立。解两个反应函数得贝叶斯均衡为：245;2411;31*2*2*1HLqqq比较不完全信息下的贝叶斯均衡与完全信息下的纳什均衡：如果企业2的成本是c2L＝0.75，企业1知道企业2的成本，那么，反应函数为：1*22*14521;121qqqq纳什均衡产量为q1*=0.25,q2*=0.5。同样地，若企业2的成本是c2H＝1.25，企业1知道企业2的成本，纳什均衡产量为。61,125*2*1qq即：24561;31125241121;3141*22*11*22*11HNEHNEHLNELNELqqqqqqqq就是说，与完全信息情况相比，在不完全信息情况下，低成本企业的产量相对较低，高成本企业的产量相对较高。二、不完全信息情况下公共产品的提供三、一级密封价格拍卖四、双方叫价拍卖3.3贝叶斯均衡与混合战略均衡完全信息情况下的混合战略均衡可以解释为不完全信息情况下纯战略均衡的极限。----海萨尼3.3贝叶斯均衡与混合战略均衡一、混合战略纳什均衡的本质特征不在于参与人j随机地选择行动，而在于参与人i不能确定参与人j将选择什么纯战略，这种不确定性可能来自参与人i不知道参与人j的类型。贝叶斯博弈中，因为参与人的战略是类型依存的，每个参与人在选择自己的行动时他面对的似乎是选择混合战略的对手。自然便是通过选择参与人的类型制造了不确定性。二、例子1、抓钱博弈0，00，11，0-1，-1参与人2抓不抓参与人1抓不抓这个博弈有两个非对称纯战略均衡：一个参与人抓，另一个参与人不抓；一个对称混合战略均衡：每个参与人以0.5的概率选择抓。（1）完全信息（2）不完全信息0，00，1+θ21+θ1，0-1，-1参与人2抓不抓参与人1抓不抓每个参与人有相同的支付结构，但若他赢了，其利润是（1+θi）。θi是参与人的类型，参与人i自己知道θi，但另一参与人不知道。假定θi在[-ε,+ε]区间上均匀分布。考虑下列纯战略：1）参与人1：如果θ1≥θ1*，抓；如果θ1＜θ1*，不抓；2）参与人2：如果θ2≥θ2*，抓；如果θ2＜θ2*，不抓。所以，给定参与人j的战略，参与人i选择抓的期望利润为：)1()|(1)1)(|(iijiijiippu＝抓即)1()(1)1)((**ijjijjiippu＝抓因为θj在[-ε,+ε]区间上均匀分布，有在[0,1]上均匀分布。所以，上式整理得：2j)1(2)1(21)1()22()1()22(1)1()()1()(1******ijjijjijjiijjijjiippppu＝抓参与人i不抓的利润是ui(0)=0。给定j的战略，i在抓与不抓之间无差异，所以，θi*满足下列条件：0)1(2)1(21**ijj整理为：202****iijj因为博弈是对称的，在均衡情况下，θi*=θj*，上述条件意味着θi*=θj*＝0。即是说，每一个参与人，在均衡情况下的最优选择是：如果θi≥0，选择抓；如果θi0，选择不抓。因为θi≥0和θi0的概率各为0.5，每一个参与人在选择自己的行动时都认为对方选择抓和不抓的概率各为0.5，似乎他面对的是一个选择混合战略的对手，尽管每个参与人实际上选择的是纯战略。当ε趋于0时，上述纯战略贝叶斯均衡就收敛为一个完全信息博弈的混合战略纳什均衡。所以，海萨尼认为：完全信息博弈的混合战略均衡是不完全信息博弈贝叶斯均衡的极限。2、性别战0,00,0男女足球足球性别战1,2mf2,1芭蕾芭蕾假定：θm只有男的知道，θf只有女的知道，二者都是在[0，x]上均匀分布，分布函数是共同知识。构造一个贝叶斯均衡：存在一个θm*∈[0，x]和一个θf*∈[0，x]，如果θm≥θm*，男的将选择足球赛；如果θf≥θf*，女的将选择芭蕾。所以，男的选择足球的概率是，女的选择芭蕾的概率是。xm*1xf*1求解过程：给定男的战略，女的选择足球和芭蕾的期望效用分别为：)2()2()0(11)0()1(1******fmfmmmmmxxxxxx和所以，θf*满足的条件为：)2(1***fmmxx)2(***fmmx即因为博弈是对称的，在均衡情况下，θi*=θj*，解上述条件得：2493*x因此，贝叶斯均衡是：1）男参与人：如果θm≥θ*，选择足球，否则，选择芭蕾；2）女参与人：如果θf≥θ*，选择芭蕾，否则，选择足球。给定不完全信息，男的认为女的选择芭蕾，女的认为男的选择足球的概率都为：xx24931当x趋于0时，上述概率收敛于，即完全信息下混合战略的概率。32三、混合战略均衡的纯化定理给定战略式表述