1东北财经大学数量经济系刘德海ldhai2001@163.com博弈论前沿专题(AdvancesinGameTheory)2理论分析实验检验理性主义均衡分析传统博弈演化主义均衡分析机制设计理论、信息经济学实验博弈演化博弈非合作博弈合作博弈不完全或不完美信息博弈完全完美信息博弈博弈论的理论体系:经验主义均衡合作信息3第八章讨价还价和合作博弈理论本章课程内容概述:第一节讨价还价问题第二节讨价还价问题的纳什解法第三节讨价还价问题的K-S解法第四节考虑讨价还价过程的Rubinstein轮流出价模型第五节联盟博弈的核第六节夏普利值4理论体系:传统博弈理论根据参与者在行为互动过程中是否存在一个有约束力的协议,划分为合作博弈、非合作博弈。发展历史:(1)1944年冯·诺依曼和摩根斯坦合著的《博弈理论与经济行为》(TheTheoryofGamesandEconomicBehavior)一书标志着对策论的出现;(2)50年代合作博弈理论(cooperativegamestheory)处于发展的鼎盛时期,纳什提出讨价还价理论的纳什谈判解,夏普利等人提出合作博弈的夏普利值(Shapleyvalue)等概念;(3)经历60年代以后长期的冷落后,进入90年代合作博弈理论又成为理论研究的热点。第八章讨价还价和合作博弈理论一代数学天才冯·诺伊曼(Neumann,Johnvon)5夏普利1923年生于Cambridge,Massachusetts,1953年获得普林斯顿大学数学博士学位,1981年开始任教加利福尼亚大学。1953年夏普利定义了联盟博弈解的概念,即著名的“夏普利值”。同年,夏普利还开创了随机博弈理论。在1969年,夏普利等人系统研究了非转移效用的联盟博弈问题,从而完善和发展了博弈论。如果说纳什均衡是非合作博弈中的核心概念的话,那么夏普利值是合作博弈(或联盟博弈)最重要的概念。夏普利是博弈论学术圈子里口碑最好的学者,个性友善且富有合作精神。在94年最具竞争力6位诺奖候选人中,除获得当年度诺贝尔经济学奖的三位经济学家海萨尼、纳什和泽尔藤以外,还包括本年度诺贝尔经济学奖获得者奥曼和谢林,以及著名的合作博弈论专家劳埃德·夏普利。根据诺贝尔经济学奖授奖的“平衡”规律,继非合作博弈领域授奖之后,合作博弈领域很可能成为博弈论中的下一个授奖领域。[资料夹]夏普利与合作博弈理论:几个例子:市场交易和求职待遇、国际谈判“六方会谈”讨价还价问题的特点:(1)各方都面临共同的结果集合(即包含各种可能的谈判方案);(2)参与者在讨价还价过程中不会考虑那些比现状更糟糕的结果(即使谈判失败,也会维持现状而不会变得更差);(3)至少有一个讨价还价的结果是各方都有利可图的。讨价还价问题的研究:Nash早在1950年即提出讨价还价问题的“纳什谈判解”(NashBargainingSolution)。这篇文章建立了一般问题模型,并给出公理化求解方法,为后面的公理化讨价还价理论的大量研究铺平了道路。值得注意的是,它是在纳什熟悉冯·诺依曼和摩根斯坦工作之前写下的本科课程论文。JohnNash,TheBargainingProblem,Econometrica,18(1950),155-162第八章讨价还价和合作博弈理论第一节讨价还价问题72003年首次六方会谈的顺利举行,其带来的启示。第一,无论国家间的矛盾和争端多么尖锐和复杂,都需要而且可以通过沟通和对话找到彼此均能接受的解决办法,这是实现国家和地区安全的最佳途径。第二,建立互信是处理和解决争端的必由之路,为此有关国家应相互尊重、平等相待,不使用武力或以武力相威胁,不采取可能导致事态复杂化的言论和行动。第三,尽管各方的立场差距不小,但只要共同努力,耐心探讨,最终不难找到利益的交汇点。2005年9月19日第四轮六方会谈通过并发表了六方《共同声明》。美方承诺将与朝鲜和平共存,并采取步骤实现两国关系正常化;各方同意“在适当时候讨论向朝鲜提供轻水反应堆问题”。朝鲜承诺重返《不扩散核武器条约》,并回到国际原子能机构(IAEA)保障监督体制下。六方同意,根据“承诺对承诺、行动对行动”原则,分阶段落实上述共识。[资料夹]朝鲜核问题的六方会谈朝一核反应堆施工现场(2002年8月7日)8国际铁矿石谈判每年一次,钢铁集团与铁矿石供应商对下一年铁矿石价格进行商定。中国已经取代日本,成为全球最大的钢铁生产国,同时也是全球最大的铁矿石进口国。国际垄断供应商为澳大利亚的必和必拓、力拓及巴西的淡水河谷3家矿业巨头。在2006年度价格谈判中(截至2007年3月的一年),巴西淡水河谷就绕过规则,与德国一家非谈判企业先确定价格,从而瓦解了钢铁企业的谈判阵线。中国曾试图施加自己的影响力,但其谈判策略过于强硬。最后,它接受了19%的价格涨幅。在2007年12月中国方面以宝钢集团、中钢集团和中国五矿集团为首与全球最大铁矿石生产商——巴西淡水河谷展开铁矿石价格谈判。一旦达成任何价格协议,无论是日本和欧洲的钢铁生产商,还是澳大利亚的铁矿石生产商,全球钢铁行业都会接受。[资料夹]国际铁矿石价格谈判9二人讨价还价问题(two-personbargainingproblem)的定义1:一个二人讨价还价问题由三个要素构成:参与者1,2;可行的备选方案(feasiblealternative),即结果集合S(其中包含谈判破裂d的情况);每个参与者i在结果集合S上定义的效用ui:S→R,满足:(1)谈判破裂d带来的双方效用都是最低的,对于任意结果s∈S,u1(s)≥u1(d),u2(s)≥u2(d);(2)至少有一个谈判结果s带来的效用,要大于谈判破裂d的效用,至少有一个s∈S,u1(s)>u1(d),u2(s)>u2(d)。我们将上述二人讨价还价问题记为:B=(S,d;u1,u2)讨价还价问题的效用配置集(thesetofutilityallocation):对于每一个s∈S,参与者都获得一对效用值(u1(s),u2(s)),称为问题B的一个效用配置,其集合:U(B)={(u1(s),u2(s)):s∈S}第八章讨价还价和合作博弈理论第一节讨价还价问题10例1:基本情况描述:某个工程项目需要沙子1000吨,合格供货企业只有A,B两家,每吨沙子获利100元。企业A在其它业务上获利5万元,企业B在其它业务上获利为3万元。假设企业风险中性(可以用利润最大化代替效用最大化),分析:(1)两家企业的可能供货量:s1+s2≤1000,s1≥0,s2≥0(2)效用函数:u1(s1,s2)=100s1+50000,u2(s1,s2)=100s2+30000(3)该问题结果集合(图1):S={(s1,s2):s1+s2≤1000,s1≥0,s2≥0}(4)该问题效用配置集(图2):U(B)={(u1(s),u2(s)):s∈S}={(100s1+50000,100s2+30000):s1+s2≤1000,s1≥0,s2≥0}(5)规范化处理(图3):将谈判破裂点d作为原点,进行平移第八章讨价还价和合作博弈理论第一节讨价还价问题Ss1s210001000U(B)u1(s)10万u2(s)10万U(B)u1(s)15万5万u2(s)13万3万d11第八章讨价还价和合作博弈理论第二节讨价还价问题纳什解法讨价还价问题的解法:对于一个讨价还价问题B,在可行结果集S(B)中找出解集σ(B)的方法,有纳什解法、K-S解法、平均主义解法、效用主义解法、M-P解法等。即是切蛋糕的不同方法。讨价还价问题的效用配置集U(B)和可行结果集S(B)存在对应关系:U(B)={(u1(s),u2(s)):s∈S}(见P9图1和图3)(1)思路:根据效用最大化原则在可行结果集中选择均衡解。问题归结为两个参与者之间的效用分配问题,回忆消费理论:12(1)消费者的预算空间(市场机会集)是在一定收入水平M的约束下,可以选择的消费集合(X,Y)。(2)无差异曲线(indifferencecurve):消费者得到同样满足的两种商品不同组合的轨迹,是序数效用论的分析基础。(2)消费者效用最大的最优消费组合(X1,Y1):无差异曲线与可行消费集的外边界(预算约束线)的切点E。[资料夹]消费理论预算线:Y=M/Py-Px·X/Py0XM/PyM/Px预算线:Y=M/Py-Px·X/PyYYX1EY113第八章讨价还价和合作博弈理论第二节讨价还价问题纳什解法讨价还价问题的纳什解法:不考虑具体讨价还价过程,现假定有一个裁判者操刀切蛋糕,其效用偏好(即反映了该问题的一种解法)在图形上表现为无差异曲线:u(s)=u1(s)·u2(s)双曲函数,边际替代率递减该无差异曲线与效用配置集U(B)的切点N即为讨价还价问题的纳什解。定义2(讨价还价问题的纳什解法):对于任何二人讨价还价问题B=(S,d;u1,u2),确定解集:σN(B)={s∈argmax[u1(s)-u1(d)]·[u2(s)-u2(d)]}(2)注意:[u1(s)-u1(d)]·[u2(s)-u2(d)]是考虑到效用配置集不作规范化处理的一般情况。0U(B)u1(s)10万u2(s)10万u(s)=u1(s)·u2(s)=cNashN14第八章讨价还价和合作博弈理论第二节讨价还价问题纳什解法P9例1的求解:代数求解:即下列优化问题:maxs1,s2(100s1)·(100s2)s.t.s1+s2≤1000,s1≥0,s2≥0几何求解:在效用配置图上,无差异曲线簇c=u1(s)·u2(s)与效用配置集U(B)的切点N,即:u1(s)=u2(s)=5万则:s=σN(B)={(500,500)}0NU(B)u1(s)10万u2(s)10万u(s)=u1(s)·u2(s)=c15第八章讨价还价和合作博弈理论第二节讨价还价问题纳什解法讨价还价问题的解法的基本要求(公理化体系):基本说明:(1)裁判者的效用σN(B)(即分配方案)是定义在效用配置集U(B)上的连续函数。如果U(B)是实数空间R2的非空紧致子集,σN(B)一定存在最大值,即讨价还价问题的解。(2)欧氏空间的紧致子集(nonemptycompactsubset)即有界闭集,其上的任何连续函数,一定会在该子集上取得最大值和最小值。(3)最大值和最小值不等于极大值和极小值。全局的局部的16第八章讨价还价和合作博弈理论第二节讨价还价问题纳什解法讨价还价问题的解法的基本要求(公理化体系):公理1:帕累托最优讨价还价问题的解不会是严格劣势的结果。数学表述:对于任何讨价还价问题B=(S,d;u1,u2),如果s,t∈S,ui(s)ui(t),i=1,2,则tσ(B)讨论:(1)帕累托效率要求讨价还价解在可行结果集的外边界上取得;(2)帕累托效率表明,讨价还价问题中参与者仍是传统博弈的完全理性假设,因此不会选择那些“损人不利己”的非理性策略。完璧归赵的典故(3)根据讨价还价问题的定义(P8)“至少有一个谈判结果带来的效用,要大于谈判破裂的效用”,因此参与者永远不会选择谈判破裂点。现实中为什么存在谈判破裂的情况?17战国时代,赵惠文王获得稀世之宝和氏璧,秦昭王听到这个消息后,就派人送信给赵王,希望以15座城来换取和氏璧。赵王明知秦国想巧取豪夺此璧,但慑于秦国强大,只好派蔺相如奉璧出使秦国。蔺相如到了秦国,将璧献给秦王,秦王大喜,将璧传给妃嫔和大臣观看。蔺相如见秦王无意割城,就走上前说:“璧上有点瑕疵,请让我指示给大王看。”秦王将璧递给蔺相如,蔺相如立即持璧跑至柱旁,怒道:“赵王知道大王喜爱此璧,故为此斋戒五天,才派我将璧奉给大王。但大王却傲慢无礼,将璧传给众人赏玩,并且没有提及以城易璧之事,故此将璧取回。大王若逼我献璧,我的头今天就和璧一起碰碎在柱子上!”说罢,便举璧视柱,好像想碰在柱上。秦王恐怕璧被碰碎,连忙道歉