第八章不完全信息动态博弈本章讨论不完全信息动态博弈,也就是动态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯博弈在许多方面是相似的,差别只是动态贝叶斯博弈转化成的不是两阶段有同时选择的特殊不完美信息动态博弈,而是更一般的不完美信息动态博弈,因此可以直接利用不完美信息动态博弈的均衡概念进行分析。本章主要介绍信息传递条件、机制和效率方面的模型。本章分五节8.1不完全信息动态博弈及其转换8.2声明博弈8.3信号博弈8.4重复信号8.5不完全信息的工会和厂商谈判8.1不完全信息动态博弈及其转换8.1.1不完全信息动态博弈问题8.1.2类型和海萨尼转换8.1.1不完全信息动态博弈问题古玩市场等各种议价博弈不完全信息先后选择产量的寡头市场产量博弈彩礼问题广告对消费者的影响学历、成绩在招聘人才、员工中的作用投保人寿保险前的体检学生考试前和毕业论文中的诚信承诺8.1.2类型和海萨尼转换与静态贝叶斯博弈基本相似,动态贝叶斯博弈也可以通过海萨尼转换,引进自然对博弈方类型的选择,转化为完全但不完美信息动态博弈。经过海萨尼转换以后,动态贝叶斯博弈与一般不完美信息动态博弈基本相似,可以直接用完美贝叶斯均衡进行分析。8.2声明博弈8.2.1声明的信息传递作用8.2.2连续型声明博弈8.2.1声明的信息传递作用声明:消费者偏好,企业新闻发布会,国家间威胁恐吓。声明不直接影响事物、利益,但往往影响接受声明者行为,通过接受声明者行为对利益产生影响。声明无或几乎无成本,接受者不一定采取有利于声明者的行为,因为双方利益往往不一致,因此声明的真实性没有保证。接受者不会轻易相信声明。声明的影响取决于接受者的理解、判断和反应。当声明者和接受者利益一致或没有冲突时,声明会使接受者相信。房客声明不喜欢暖气太足房东会相信;工人提出有恐高症不适合高空作业雇主会相信;顾客喜欢甜或咸厨师会相信。工人声明自己高素质雇主并不会轻易相信因为相信。2X2声明博弈1.不同类型的声明方必须偏好行为方不同行为2.对应声明方不同类型行为方必须偏好不同行为3.行为方的偏好必须与声明方具有一致性1a2,11,02,11,0声明方类型行为方行为能传递信息的声明博弈2a2t1t2,01,12,01,1声明方类型行为方行为不能传递信息(声明方与行为方偏好相反)2a1a2t1t2,11,12,01,0行为方行为不能传递信息(行为方对声明方类型无差异)2a1a2t1t声明方类型声明方类型2,11,00,11,0行为方行为不能传递信息(不同类型声明方偏好相同)1a2a2t1t离散型声明博弈模型),(),(.4},{.3.21)()(,),(},{.1,111,1kiRkiSKKjijjiTiiTTiatuatuaaaAttttTttptptpttTt,行为方的得益为声明方的得益为中选合后,在可选择的行为集声明行为方在听到声明方的以不同(说假话)相同(说真话),也可可以与当然作为自己声明的类型。中选择以后,从声明方了解对自己的随机抽取,其中中以概率分布集合,抽取的方法是从类型自然抽取声明方的类型8.2.2连续型声明博弈声明方类型标准分布于区间[0,1],即T=[0,1],行为方的行动空间A=[0,1]。声明方得益函数,行为方得益函数。可以看出,当声明方类型为t时,声明方最希望的行为方行为是,而行为方对自己最有利的行动是。2)]([),(btaatUS2)(),(taatURbtata克劳馥和索贝尔证明,当b不等于0时,存在一种“部分合并均衡”的完美贝叶斯均衡。其基本特征是类型空间[0,1]被分成n个区间,属于同一区间类型的声明方作同样声明,在不同区间类型的声明方作不同声明。先对n=2的简单分割进行论证。这时类型空间分为,属于前一区间的声明方作一个同样声明,属于后一区间的声明方作另一同样声明。行为方听到前一种声明时根据期望利益最大化分析,确定出最佳行动是,后一种情况时最佳行动是。声明方清楚行为方的判断和决策思路,因此只有当声明方偏好时,才会声明自己属于,另一区间类似。而当行为方的行为离越近时,声明方得益越大,反之则越小,即声明方的偏好对称于点的。)1,[),[),0[1211nxxxx,,,]1,[),0[11xx和21x2)1(1x21x),0[1xbtbt因此,两区间分界点必须满足,小于的偏好,大于的都偏好那么所代表类型的声明方最希望的行为方行为正好处于和的中点,即:整理得:由于,则。即只有当时才有可能存在两部分合并均衡,如果,则双方偏好相差太大,这种最低限度的信息传递也不可能存在。21x1tu0t+b连续型声明博弈的部分合并均衡1x4121x2121x),(atUS1x1x21x2)1(1x1x21x2)1(1x2212111xxbxbx25.0101x25.0b1x25.0b25.0b不在均衡路径上的声明声明问题如果声明的类型只有和两种,那么出现其余所有类型的声明都不在均衡路径上。采用任何其他特定类型作为共同的声明也都会有该问题。上述问题的实质是分两个区间以后,如何作出声明的问题——精确到具体类型则还是会存在对方不信的问题。克劳鳆和索贝尔采用的一种随机选择的混合策略可以克服这种问题。21x2)1(1x部分合并完美贝叶斯均衡的区间划分和数量两区间部分合并均衡区间长度不等长,=0.5-2b,前一个区间的长度是-0=0.5-2b,后一个区间的长度为1-=0.5+2b,后一个区间长4b。结论对更多区间的部分合并均衡也成立。n区间,[,)是之一,长度为c,行为方对该区间类型最优行为(+)/2,对后一区间[,)类型的最佳行为(+)/2。两个区间交界处类型声明方偏好的行为,须在(+)/2和(+)/2间无差异:+b=x1x1x1xk1xkxk1xkxk1xkxkxk1xk1xkxkxk1122211xxxxkkkkxk因为(+)/2=-c/2,代入上式,得:+b=化简得-=c+4b。后一个区间比前一个区间长4b。xkxkxk112221xcxxkkkxkxk1xk设将类型区间[0,1]分n个小区间时第一个区间长度d,第二个区间长度必须d+4b,第三个区间长度必须d+8b。。。n个区间总长度必须为1。d+(d+4b)+…+[d+(n-1)·(4b)]=nd+n(n-1)·(2b)=1给定任何一个满足n(n-1)·(2b)1的n,都存在满足上述等式的d。因此存在分n个区间的部分合并均衡的必要条件是不等式n(n-1)·(2b)1必须成立。从该关于n的一元二次不等式中可解得,部分合并均衡可以分成的最大区间个数n*(b)必须小于/2。112b结论(1)b越小,则信息交流越充分,b越大,则信息交流越少越困难;(2)当b0.25时,n*(b)=1,即信息交流完全不可能发生,因为双方的偏好差距太大;(3)当b趋向于0时,n*(b)趋向于无穷大,也即信息接近充分交流,声明方接近能声明自己的真实类型;(4)只要b不等于0,即双方偏好不完全一致,信息交流不可能真正完全。8.3信号博弈8.3.1行为传递的信息和信号机制8.3.2信号博弈模型和完美贝叶斯均衡8.3.3股权换投资8.3.4劳动市场信号博弈8.3.1行为传递的信息和信号机制萨摩亚岛居民的文身;波那佩岛的山药;孔雀开屏;蛙鸣信号:经济或其他活动中具有信息传递作用的行为信号机制:通过信号传递信息的过程信号发出方:通过行为传递信息的一方信号接收方:获得信息的一方二手车模型中昂贵的承诺8.3.2信号博弈模型和完美贝叶斯均衡信号博弈模型kjiRSkjjiiamtuuRSamRmSStStp和都取决于和的得益和后选择行为看到选择行为知道,并让选择类型为以概率博弈方,.4.3.2)(0.1信号博弈完美贝叶斯均衡的策略和叶斯法则也仍要符合对应的信息集处的判断在使即使不存在的策略和贝叶斯法则。集处的判断必须符合的信息在对应于,则使得,如果存在对每个的解最大化问题是的得益最大,即必须使的选择时,的策略给定的解是最大化问题最大,即的期望得益必须使的行为,的信号和的判断给定的概率分布是每种类型时,选择的判断,即的类型之后,必须有关于的信号在观察到信号发出方信号接收方SmRmtmTtSmRmtmTtMmmamtutmStmSmaRamtumtpmaRmaRmSmtpRmtpmtptSmSSmSRjjiijjiijjjiSmiijkjiRtjiajjjjitjijiijjjiki)()(.4)](,,[max)()()(.3),,()|(max)()()|(.21)|(,0)|(.1********8.3.3股权换投资))(1()()1(.4.3.21)(),(.1RSRSrISSpLpHp得益为,企业资人得益,如投资人接受,则投为,企业得益人得益为如投资人拒绝,则投资提议是接受还是拒绝企业的能性的概率,然后选择是高低两种可,只知道,但看不到投资人看到比例股权换取这笔投资,愿出企业自己了解是高还是低,已知有利润自然随机决定该企业原8.3.4劳动市场信号博弈劳动力素质的信号机制'P劳动生产率信号成本工人素质010.5bP工人的素质与劳动生产率劳动生产率信号成本工人素质010.5e(e+1)/2PCdabE信号机制的存在和作用'P'C斯潘塞劳动市场博弈模型0We0完全信息的劳动力市场均衡21)(*w)(*e),(ey表示员工工资率工作。用相同,则随机决定为谁资份工作。若两厂商的工员工接受工资较高的一支付给员工的工资率水平,然后同时提出愿育员工观察到员工的受教有两个厂商同时观察到平自己选择一个受教育水为力属于高还是低,然后员工清楚自己的生产能识是员工和厂商的共同知和的概率力高低。并且自然选择生产能和可能,分别记为有高低两种,的生产能力自然随机决定一个员工weLpHpLH.4.30.2)()(.18.4重复信号签约选手的素质判断问题10)]05.015.0)(95.0[(18)]01.019.0)(95.0[(11tttt一般:尖子:012345678910次数概率(%)46193935尖子选手获胜次数概率012345678910次数概率(%)11441212212125一般选手获胜次数概率一次比赛试用期十次比赛试用期833.0)|(,167.0)|(357.0)|(1)|(643.05.05.09.05.09.05.0)|(LMpLSpWSpWMpWSp8.5不完全信息的工会和厂商谈判否则拒绝,则接受该工资要求,超过如果厂商的利润,第二回合工资修改为标准分布于商利润的判断求被拒绝,工会将对厂如果第一回合的工资要否则拒绝则厂商接受超过如果厂商的利润工会第一回合要求工资*2*1*1*1*1*12*1.4)342(2121],0[.3,342.2)34(2)2(.1