第十三章信号博弈及其应用主要内容:一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈主要内容:一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈第十三章信号博弈及其应用一、信号博弈•信号博弈(signalinggames)是一类比较简单而应用相当广泛的不完全信息动态博弈,其基本特征是博弈参与人分为信号发送者(Sender,用S表示)和信号接收者(Receiver,用R表示)两类,信号发送者先行动,发送一个关于自己类型的信号,信号接收者根据所接收到的信号选择自己的行动。其具体博弈时序如下:1)自然根据特定的概率分布p(ti),从可行的类型集T={t1,t2,…,tn}中选择发送者类型ti,这里,对,p(ti)0且p(t1)+…+p(tn)=1;2)发送者观测到ti,然后从可行的信号集M={m1,m2,…,mJ}中选择一个发送信号mj;3)接收者不能观测到ti,但能观测到mj,他从可行的行动集A={a1,a2,…,aK}中选择一个行动ak;4)双方分别得到收益uS(ti,mj,ak)和uR(ti,mj,ak)。{1,2,,}in∀∈•在信号博弈中,发送者发出的信号依赖于自然赋予的类型,因此,先行动的信号发送者的行动,对后行动的信号接收者来说,具有传递信息的作用。同时,这又使得接收者的行动依赖于发送者选择的信号。考察信号博弈的一种简单情况的扩展式描述(不考虑支付)p1p−1t自然发送者发送者2t接受者接受者1m1m2m2m1a1a1a1a2a2a2a2a1x2x3x4x5x6x•发送者的信息集为Is(x1)和Is(x2),分别对应于观测到自然的选择为t1和t2,行动为m1和m2,因此,发送者的战略s为:•其中,HS为发送者的信息集集合,即:SsHM→12{({}),({})}SSSHIxIx=发送者有以下4种纯战略:1)战略(m1,m1)——如果自然赋予t1,则发送者选择m1,即s(t1)=m1;如果自然赋予t2,则发送者选择m1,即s(t2)=m1;2)战略(m1,m2)——如果自然赋予t1,则发送者选择m1,即s(t1)=m1;如果自然赋予t2,则发送者选择m2,即s(t2)=m2;3)战略(m2,m1)——如果自然赋予t1,则发送者选择m2,即s(t1)=m2;如果自然赋予t2,则发送者选择m1,即s(t2)=m1;4)战略(m2,m2)——如果自然赋予t1,则发送者选择m2,即s(t1)=m2;如果自然赋予t2,则发送者选择m2,即s(t2)=m2。•对于接收者,其信息集为IR({x3,x4})和IR({x5,x6}),分别对应于观测到信号m1和m2,行动为a1和a2,因此,接收者的战略s为:•其中,HR为接收者的信息集集合,即HR={IR({x3,x4}),IR({x5,x6})}。:RsHA→接收者有以下4种纯战略:1)战略(a1,a1)——如果发送者选择m1,则接收者选择a1,即s(m1)=a1;如果发送者选择m2,则接收者选择a1,即s(m2)=a1;2)战略(a1,a2)——如果发送者选择m1,则接收者选择a1,即s(m1)=a1;如果发送者选择m2,则接收者选择a2,即s(m2)=a2;接收者有以下4种纯战略:3)战略(a2,a1)——如果发送者选择m1,则接收者选择a2,即s(m1)=a2;如果发送者选择m2,则接收者选择a1,即s(m2)=a1;4)战略(a2,a2)——如果发送者选择m1,则接收者选择a2,即s(m1)=a2;如果发送者选择m2,则接收者选择a2,即s(m2)=a2;•在发送者的4个战略中,根据发送者的类型与发送信号间的相互关系,可将发送者的战略分为两类——混同战略和分离战略。•1)对于第1和第4个战略,由于在不同类型时发送者都发出相同的信号,因此称其为混同(pooling)战略。•在多于两种类型的模型中,还存在部分混同(partiallypooling)战略,其中所有属于给定类型集的类型都发送同样的信号,但不同的类型集发送不同的信号。•2)对于第2和第3个战略,由于在不同类型时发送者发出不同的信号,因此称其为分离(separating)战略,分离战略意味着不同类型的发送者发出不同的信号。•与混同战略相似,在多于两种类型的模型中,还存在准分离(semi-separating)战略,其定义与部分混同战略相同。•在信号博弈中还存在与混合战略相类似的战略,称为杂合战略(hybridstrategy)。二、信号博弈的精炼贝叶斯Nash均衡•为了求解信号博弈的精炼贝叶斯Nash均衡,需将精炼贝叶斯Nash均衡定义中的条件(1)~(4)分别施加到信号博弈之上。•1)由于发送者知道自己的类型,其选择发生于单决策结信息集,因此,精炼贝叶斯Nash均衡定义中的条件(R1)在应用于发送者时就无需附加任何条件;•相反,接收者在不知道发送者类型的条件下观测到发送者的信号,并选择行动,也就是说接收者的选择处于一个非单决策结的信息集上,因此,需将精炼贝叶斯Nash均衡定义中的条件(R1)应用于接收者的信息集。•当精炼贝叶斯Nash均衡定义中的条件(R1)应用于信号博弈接收者的信息集时,可得信号条件(R1)。信号条件(1)•在观测到M中的任何信号mj之后,接收者必须对哪些类型可能会发送mj,持有一个推断。这一推断用概率分布表示,其中对,且()ijptmitT∀∈()0ijptm≥()1iijtTptm∈=∑•2)给定发送者的信号和接收者的推断,精炼贝叶斯Nash均衡定义中的条件(2)要求接收者选择最优行动,因此,需将精炼贝叶斯Nash均衡定义中的条件(2)施加于接收者的行动。此时,可得到信号条件(2R)。信号条件(2R):•对M中的每一mj,并在给定对的推断的条件下,接收者的行动必须使接收者的期望效用最大化,即()ijptm*()jam*()arg(,)kjRjkaAamMaxUma∈∈•精炼贝叶斯Nash均衡定义中的条件(R2)同样需施加于发送者的选择,但由于发送者的选择发生于单决策结信息集上,发送者拥有完全信息,并且发送者只在博弈的开始时行动,因此,精炼贝叶斯Nash均衡定义中的条件(2)施加于发送者的选择时,必须满足信号条件(2S)。信号条件(2S):•对T中的每一ti,在给定接收者战略的条件下,发送者选择的信号必须使发送者的效用最大化,即*()jam*()imt**()arg(,,())jisijjmMmtMaxutmam∈∈•3)给定发送者的战略,用Tj表示选择发送信号mj的类型ti的集合,即•如果Tj不是空集,则对应于信号mj的信息集就处于均衡路径之上;否则,若任何类型都不选择mj,则其对应的信息集处于均衡路径之外。()*imt()*{}jiijTtmtm==•对处于均衡路径上的信号,将精炼贝叶斯Nash均衡定义中的条件(3)运用于接收者的推断,可以得到信号条件(3)。信号条件(3):•对中每一mj,如果在T中存在ti使得则接收者在对应于mj的信息集中所持有的推断必须决定于贝叶斯法则和发送者的战略:()*ijmtm=()()()()()kjjiiijjkktTpmtptptmpmtpt∈⋅=⋅∑•由于对,因此上式可表示为(),1ijjitTpmt∀∈=()()()kjiijktTptptmpt∈=∑•4)对处于均衡路径之外的信号,将精炼贝叶斯Nash均衡定义中的条件(4)运用于接收者的推断,可以得到信号条件(4)。•对M中某一mj,如果在T中不存在ti使得即,则接收者在对应于mj的信息集中所持有的推断必须决定于贝叶斯法则和可能情况下发送者的均衡战略。()*ijmtm=jT=∅•信号博弈中一个纯战略精炼贝叶斯Nash均衡是满足信号条件(1)、(2R)、(2S)、(3)及(4)的战略组合以及推断**((),())ijmtam()ijptm•如果发送者的战略是混同的或分离的,我们就称均衡分别为混同的或分离的精炼贝叶斯Nash均衡。例子:1t自然发送者发送者2t接受者接受者LLRRuuuudddd[]p[1]p−0.50.5[]q[1]q−1,34,02,40,12,10,01,01,21x3x2x4x•在该博弈中,发送者有4个纯战略,因此可能存在的纯战略精炼贝叶斯Nash均衡有:(1)发送者的均衡战略为(L,L);(2)发送者的均衡战略为(R,R);(3)发送者的均衡战略为(L,R);(4)发送者的均衡战略为(R,L)。下面依次分析以上四种均衡存在的可能性。1)假设存在一个混同于行动L的精炼贝叶斯Nash均衡,发送者的战略为(L,L),则接收者对应于L的信息集IR({x1,x3})处于均衡路径之上,于是接收者在这一信息集上的推断[p,1-p]决定于贝叶斯法则和发送者的战略,即由于。因此,p=1-p=0.5与先验分布相同。11121()()()()()iiipLtptpptLpLtpt=⋅==⋅∑1212()()1,()()0.5pLtpLtptpt====•给定这样的推断,接收者在观测到信号L之后,根据行动u和d的期望收益,决定自己的选择。接收者选择u的期望收益为:•而接收者选择的期望收益为:[]3(1)443.5Euppp=⋅+−⋅=−=[]0(1)110.5Edppp=⋅+−⋅=−=•因此,接收者在观测到信号L之后的最优反应为选择u。此时,类型为t1和t2的发送者分别可得到的收益为1和2。•为了使两种类型的发送者都愿意选择L,即发送者的最优战略为(L,L),需要确保:如果发送者选择信号R,接收者的反应(选择)给两种类型的发送者所带来的收益,小于它们选择信号L时的收益。(1)如果接收者对R的反应为u,则类型为t1的发送者选择R的收益为2,高于自己选择L的收益1。此时,类型为t1的发送者不会选择L;(2)如果接收者对R的反应为d,则通过选择R,类型为t1和t2的发送者的收益将分别为0和1,而他们选择L却可分别获得1和2。此时,类型为t1和t2的发送者都会选择L。•因此,如果存在一个前面所假设的混同均衡,其中发送者的战略为(L,L),则接收者对R的反应必须为d,于是接收者的战略必须为(u,d)。•此外,还需要考虑接收者在对应于R的信息集IR({x2,x4})中的推断[p,1-p],以及给定这一推断时选择d时是否最优的。在信息集IS({x2,x4})上,接收者选择u的期望收益为:•而接收者选择d的期望收益为:()[]110Euqqq=⋅+−⋅=[]0(1)222Edqqq=⋅+−⋅=−•由于接收者在信息集IS({x2,x4})上的最优反应为d,因此,,所以•此时,得到上述博弈的混同精炼贝叶斯Nash均衡为[][]EdEu≥23q≤2((,),(,),0.5,)3LLudpq=≤2)假设存在一个混同于行动R的精炼贝叶斯Nash均衡,发送者的战略为(R,R),则q=0.5。•此时,接收者选择行动u和d的期望收益分别为0.5和1,所以接收者对R的最优反应为d。•但是,如果类型为t1的发送者选择L,则无论接收者在信息集IR({x1,x3})上的推断如何,接收者对L的最优反应都是u,这意味着类型为t1的发送者只要选择L,就确保可得到收益1,大于选择R的收益0。•因此,上述博弈不存在发送者战略为(R,R)的混同精炼贝叶斯Nash均衡。3)假设存在发送者的战略为(L,R)的分离均衡,则接收者的两个信息集IR({x1,x3})和IR({x2,x4})都处于均衡路径之上,于是两个推断都决定于贝叶斯法则和发送者的战略:p=1,q=0。•接收者在此推断下的最优反应分别为u和d,所以两种类型的发送者获得的收益都是1。此外,还需检验对给定的接收者战略(u,d),发送者的战略是否是最优的。结果是否定的。•所以,上述博弈中不存在发送者战略为(L,R)的分离的精炼贝叶斯Nash均衡。4)假设存在发送者的战略为(R,L)的分离均衡,则接收者的推断必须为p=0,q=1,于是接收者的最优反应为(u,u),此时,两种类型的发送者都可得到2的收益。•此外,还需检验对给定的接收者战略(