中山大学岭南学院孙洛平lnsslp@mail.sysu.edu.cn博弈论与决策策略田忌赛马•田忌与齐国诸公子赛马,设重金赌注。孙膑发现他们的马脚力都差不多,可分为上、中、下三等。于是孙膑对田忌说:“您只管下大赌注,我能让您取胜。”田忌相信并答应了他,与齐王和诸公子用千金来赌注。比赛即将开始,孙膑说:“用您的下等马对付他们的上等马,用您的上等马对付他们的中等马,用您的中等马对付他们的下等马。”三场比赛完后,田忌一败两胜,最终赢得齐王千金赌注。百度百科23我们能从博弈论中学到什么?•博弈论是描述日常决策行为的一种思考问题的方法。•如果我们试图从博弈论中获得具体的克敌制胜的方法,那么是会失望的。•不过,博弈的理念是我们理解日常决策中的最重要的思想方法之一。内容•市场机制•博弈简介•重复博弈•动态博弈•混合策略•公地悲剧•多个均衡•演化博弈•体制稳定•经济制衡4市场机制6市场模型商品市场要素市场企业居民要素支付(货币)劳动、资本、土地……商品支付(货币)食品、服装、服务……7价格信号•价格信号的作用:商品、服务和生产资源的价格在市场中决定,它们影响和引导所有市场参与者的行为和决策。•决定价格的机制是市场供求法则。需求供给供求法则8价格向均衡价格回归的动力来自于自利行为的驱动。供给需求需求供给价格=价格=9市场中的自利行为•价格向均衡价格回归的动力来自于企业和消费者的自利行为。•在市场经济中,自利行为无可非议。•问题:如果人人为自己,能否带来社会整体利益?10斯密与看不见的手•斯密指出,市场价格信号就象一只“看不见的手”在引导着人们的行为,使得个人在为自己利益的同时,不由自主地导致了社会整体的经济利益。•机制:用消费者的利己行为制约生产者的利己行为。AdamSmith1723-1790靠思想觉悟还是靠利益机制•我们希望人们的思想觉悟高,但它不能作为一种经济体制运行的基础。•建立一个良好机制的要点在于,“用利己行为制约利己行为”。11博弈简介什么是博弈论•竞争者之间具有互动性的行为或结果,应该用博弈论的方法来研究。•博弈论是用于分析两个和两个以上的参与者在相互作用的情况下,选择行动或策略及其影响的一种理论。1314博弈论的基本概念•局中人:行为相互作用的参与者。•策略:参与者选择的行动方案。•支付表:用一个表格(矩阵)来反映参与者之间不同的策略引起的得与失。“囚犯两难”问题•“囚犯两难”问题:警察抓获两个犯罪嫌疑人,根据警方手中的证据,每个嫌犯可判刑1年,若两个嫌犯将警方不知道的犯罪行为都交待,每人判刑8年。•警方的政策:为使两个犯罪嫌疑人自动交待其罪行,警方制定“坦白从宽,抗拒从严”的政策。1516囚徒的困境“坦白-坦白”是均衡结果。嫌犯乙坦白沉默坦白8年20年嫌犯甲8年自由沉默自由1年20年1年表中的数值表示坐牢时间。17思想•“囚犯两难”博弈的经济和社会意义在于,个人理性不一定导致集体理性,或者说,人人为自己未必导致整体利益。•与市场的“看不见的手”机制是否冲突?18市场机制与博弈论的关系•“看不见的手”机制,是指消费者群体与生产者群体之间的竞争会导致社会生产力的进步。生产者竞相降价消费者竞相提价可以看作是博弈论的思想供给大于需求需求大于供给19为什么“坦白-坦白”是均衡•只要不是落入“坦白-坦白”的均衡状态,就至少有一个博弈的局中人(参与者)有激励改变自己的选择。坦白沉默坦白8年20年8年自由沉默自由1年20年1年嫌犯乙坦白沉默坦白8年20年嫌犯甲8年自由沉默自由1年20年1年找出均衡结果的划线法20•参与博弈的人具备“同时最优”的对策结果为均衡结果,也称之为纳什均衡。企业2¥100¥120企业1¥100¥30¥30¥100¥120¥100污染博弈21表中的数值表示利润。“污染-污染”是(纳什)均衡治理治理污染污染22污染的市场失灵•企业排放污染不能仅仅看作是一个企业的觉悟不高的问题。•若无政府出面,市场竞争机制将淘汰治理污染的企业。•解决的办法:排放污染的企业罚款。23政策制定者应具有博弈意识•政策制定者应该清楚,政府实际上在与人们进行利益博弈。这就是多年以前政府部门常常抱怨的“上有政策,下有对策”。•政府的政策不能建立在人们的思想觉悟基础上,而是应该依据利益(制衡)机制。重复博弈25问题:企业为什么打价格战?•观点1:企业打价格战是不明智的。如果企业知道价格战最终没有好处,它就不应该率先降价。•观点2:企业率先降价一定是打价格战对它有某种好处,否则是不会开战的。企业乙降价不降价降价¥20¥10企业甲¥30¥120不降价¥100¥70¥15¥80企业价格战的困境26表中的数值表示利润。“降价—降价”是均衡结果。27关于价格战的认识•企业之间的价格战不是一个明智与否的问题。•我们应该关心的是价格战的发生是否有必然性,即无论企业的主观愿望如何,价格战在实际中是否会发生。28问题:企业为什么会合谋?•观点1:由“价格战困境”看来企业之间打价格战是有必然性了。•观点2:为什么有些企业之间会通过合谋的形式来避免价格战呢?•疑问:如果实际中有企业合谋,就应该有其合谋的道理……29合谋的博弈机制•在“囚徒的困境”博弈中,如果作案必须两个人合作,那么当一人启用“针锋相对”或“触发战略”时,就可能导致合谋行为。背叛:0,8,8,8……合谋:1,1,1,1……坦白沉默坦白8天20天8天自由沉默自由1天20天1天30寡头合谋的可能性•如果一次性博弈能够被多次重复,就构成重复博弈。•合谋的可能:如果寡头之间的博弈是重复的,就有可能导致合谋行为。•重复博弈也是人们讲信誉的基础。。31为什么企业多了难合谋•寡头之间的竞争没有确定的结果,寡头之间可能成功合谋,可能价格战。•行业中的企业数量多了,心不齐,难以成功合谋。•企业的数量越多,合谋成功后单个企业的欺骗价值就越大,即使眼下合谋成功也容易瓦解。32应用:反垄断政策•实现有效竞争是反垄断政策的目标。•反托拉斯法活动的指导思想是,通过改变市场的竞争格局和市场参与者的行为,即使没有政府的直接介入,也能在企业的日常决策工作中改善其绩效。动态博弈34动态博弈•如果博弈的双方有一方先决策,而另一方后决策,这样的博弈就是动态博弈(序列博弈或顺序博弈)。•一般而言,先决策的一方具有先动优势。35沃尔玛的抢先策略•沃尔玛百货公司的创立者萨姆·沃尔顿在美国西南部的许多小镇上建立了成千上百的连锁店。因为这些城镇的市场太小,只能维持一个平价百货店,所以他的策略是首先去做。•事实上,沃尔玛很快建立了1600多家连锁百货店,萨姆·沃尔顿取得了巨大的成功。——摘自埃德温·曼斯菲尔德:《管理经济学》,p49936先下手为强!•市场的地理空间饱和:企业还能通过分散设厂,使市场的地理空间饱和来阻止潜在进入者进入。37抢先策略的机制(斗鸡博弈)见张维迎:《博弈论与信息经济学》,p20。②和③是均衡结果。斗鸡B进退进①-3②0斗鸡A-32退③2④00038动态博弈的扩展式表述斗鸡A行动斗鸡B行动斗鸡B行动进退进进退退πA=-3πB=-3πA=2πB=0πA=0πB=2πA=0πB=0斗鸡A行动进退39求解动态博弈均衡的倒推法斗鸡B行动斗鸡B行动斗鸡A行动进退进进退退πA=-3πB=-3πA=2πB=0πA=0πB=2πA=0πB=0???40沃尔玛的扩张方式•在那个时代,凯马特百货是不会到5万人以下的小镇去开店的,就是吉布森百货店的开店标准也要有1万到1.2万人以上的城镇。而沃尔顿的信条是,即便是少于5千人的小镇也照开不误。•沃尔玛强调到小镇开店,并不是说他们不重视大城市,但他们的大城市战略与众不同。他们并不打算真正往大城市里发展,而是在大城市周围一定距离内先发展分店,静候城市向外发展。——摘自MBA教程案例田忌赛马:后发优势•田忌与齐王及诸公子赛马之所以能够取胜,是因为孙膑知道齐王公子们不同等级的赛马出场的先后顺序,因此后发优势。•其实,齐王公子们要是能够隐瞒自己不同等级的赛马的出场顺序,田忌就为难了。41后发优势42上中下上下中中上下中下上下上中下中上齐王公子行动田忌行动下上中下中上上下中上中下中下上中上下混合策略44混合策略•在上面讨论过的博弈中,我们假定每个参加者都只选择一个行动方案。这种方案选择称为纯策略。但在许多博弈中,纯策略可能是一种坏的选择。•在实践中,我们可能以某种概率(或可能性)选取不同的策略,这种方法就称为混合策略。45社会福利博弈见张维迎:《博弈论与信息经济学》,p97。流浪汉找工作游荡救济23政府3-1不救济10-1046说明•不是所有的博弈都有确定的纯策略纳什均衡选择,比方说,划拳就不能选择一个固定的出法。•划拳的最优出法是什么?•别让对手钻了你的空子!47期望收益(平均所得)•期望收益等于收益与其对应的概率(可能性)的乘积的和。•例子:如果以抛掷硬币定收益,正面得10元,背面得2元,期望价值为0.5×10+0.5×2=6(元)•如果以0.4的可能性得到10元,0.6的可能性得到2元,期望值为0.4×10+0.6×2=5.2(元)48政府的最优混合策略•若政府以0.5的概率救济,以0.5的概率不救济,那么流浪汉将无法钻政府的空子。•因为流浪汉无论采用什么策略,他的期望所得都是1.5分。找工作:0.5×2+0.5×1=1.5救济233-1不救济10-10找工作游荡游荡:0.5×3+0.5×0=1.549流浪汉的最优混合策略•流浪汉若以0.2的概率寻找工作,以0.8的概率选择游荡,政府则无计可施,因为政府的任何策略都一样,期望得分为-0.2。救济:0.2×3+0.8×(-1)=-0.2找工作游荡233-110-10救济不救济不救济:0.2×(-1)+0.8×0=-0.250纳什均衡的存在定理•每一个有限博弈至少存在一个纳什均衡(纯策略的或混合策略的)。(Nash,1950)•思想:实际中的博弈都有最优策略。JohnNash1928-51混合策略的用处•城市的警察应该有多少为好?•政府对企业的财务审计和对个人的税收检查应该使用多少人力?•企业对于员工的监督应该多大的力度?•对员工实行固定聘用制好还是实行随时解聘制好?公地悲剧53问题:共有资源为什么低效•共有资源是指那些任何人都可以使用的资源。•结果,共有资源被过度使用。此为“公地悲剧”。54如果只有一个人养羊•如果这块土地为私人所有,那么他该养4只或5只羊,羊肉总增加重量20斤。养羊数量123456789每只羊增重876543210总增重814182020181480•如果只有两个人养羊呢,会各养几只羊?55如果有两个人养羊(博弈)•如果只有两个人,那么博弈均衡的养羊数量是3+3=6只。•因为每一个人的收益都为9,如果某人养2只羊,收益为8,养4只羊,收益也为8。养羊数量123456789每只羊增重876543210总增重8141820201814804只×2斤/只=8斤2只×4斤/只=8斤2只×0斤/只=0斤0只×2斤/只=0斤568个人养羊的博弈均衡•如果有8个人,每个人养1羊是纳什均衡。•因为其中每一个人收益为1,要是多养1只羊,收益为0,少养1只羊,收益也为0。养羊数量123456789每只羊增重876543210总增重81418202018148057如果有更多的人养羊•如果人人都可以使用草地,那么养羊的数量是9只。“放牧-放牧”是博弈的均衡结果。牧羊人2放牧退出放牧无利嫉愤牧羊人1无利微利退出微利无利嫉愤无利形成公地悲剧的条件•形成公地悲剧的条件有两个:•1)不能阻止他人使用的资源(无排他性);•2)一个人的使用会降低他人使用同一资源的价值(有竞争性)。5859怎么解决城市道路拥挤问题?•观点1:政府应该多修道路。•观点2:对使用汽车的人征税。•观点3:对汽油加收高额税收。城市中的道路属于公地•城市中的道路属于公地,因为:1)不能阻止他人使用道路(无排他性);2)在一条拥挤的道路上,一个人挤进来会使得其他人更拥挤(有竞争性)。60免费医疗是公地•全民免费医疗满足公地的两个条件:没有排他性,即不能阻止某个个体看病的选择;有竞争性,即多一个