博弈论讲座

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1博弈论讲座【导语】美国环球公司2001年出品了一部电影,叫做《美丽心灵》。这部影片可谓家喻户晓,它一举囊括了第59届金球奖5项大奖,并荣获2002年第74届奥斯卡奖4项大奖。影片本身与银幕背后的人物原型,都深深震撼了全世界人们的心灵。《美丽心灵》是一部纪实性影片,它艺术地再现了数学天才、博弈论大师、患妄想型精神分裂症30多年又奇迹般恢复正常的约翰·纳什(JohnNash)传奇般的人生经历。在一般的纪实性电影中,演员形象总是比真实生活中的原型更具有动人风采。然而,让人难以置信的是,现实的纳什无论容貌风度都比男主角奥斯卡影帝罗素·克洛(CroweRussell)稍高一筹。正是这个曾如希腊古神一般英俊潇洒却又古怪精灵的数学与经济学的双料天才——纳什,其早年在博弈理论方面的巨大贡献一直改变着我们的生活。因为他在博弈论方面的突出贡献,1994年被授予诺贝尔经济学奖。这是诺贝尔经济学奖第一次授予博弈论专家。与他同期获奖的还有海萨尼和泽尔滕。1994年,诺贝尔经济学奖授予三位博弈论专家:纳什、海萨尼、泽尔腾,以表彰他们在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响;1996年,诺贝尔经济学奖授予两位博弈论与信息经济学研究专家:莫里斯、维克里,前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献;2001年,诺贝尔经济学奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性的贡献;2005年,诺贝尔经济学奖授予有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们在博弈论领域做出的贡献。2为什么博弈论在经济学领域会产生如此大的影响呢?源于博弈论在解释现实经济生活和经济政策的分析中所具有的极其广泛的重要作用,它从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。一、什么是博弈论:从“囚徒困境”谈起案例1:囚徒困境甲和乙两个嫌疑犯作案后被警察抓住,警方将两人分别置于两个房间分开审讯。每个嫌疑犯必须选择是否供认并指证同伙。如果二人中一人供认,一人不供认,则鉴于供认者与警方合作的表现,无罪释放,其同伙将遭到严惩,判刑15年;如果二人都供认并指证同伙,两人都将判刑8年;如果二人都不供认,则证据不足但因非法携带武器各拘留1年。在这里,嫌疑人甲和乙称为局中人,每个局中人都有两种选择:坦白或抵赖,博弈论里边称之为策略或战略。每个局中人遭受的徒刑则是对他的支付或收益。由此,“囚徒困境”博弈可用收益矩阵表示。表中,第一列是嫌疑人甲的策略空间,即局中人甲各种可能策略的集合;第一行是嫌疑人乙的策略空间,即局中人乙的各种可能策略的集合;第二、三行和第二、三列的交叉部分是两个局中人的收益组合,每一收益组合中的两个数字分别对应于两个局中人。表1囚徒困境收益矩阵乙甲坦白抵赖坦白-8,-80,-15抵赖-15,0-1,-1应该如何解决这一博弈问题呢?引导学员思考并研讨分析:3对于甲、乙两个局中人,什么样的战略才是最理性的呢?如果两人都抵赖,结果是两人都判刑1年,这对整体而言,无疑是最有利的,这是最好的结果;如果两人都坦白,各判刑8年,这是最坏的结果。大家可能会认为,既然两个囚犯最好的结果是都抵赖,两人都只判刑1年,那么,这个博弈的最终结果就是两个囚犯都选择抵赖。然而,人算不如天算,“囚徒困境”之所以称为困境,正是因为这个博弈的最终结局恰恰是最坏的结果,即两个囚犯统统招供,结果都被判处有期徒刑8年。为什么两个囚犯都选择了“坦白”,傻到接受这种最坏的结果呢?我们可以运用“剔除劣战略”的方法来分析。对甲来说,他可能会做如下思考:“有两种可能性会发生:乙坦白或抵赖。假定乙坦白,则我抵赖将被判刑15年,坦白将判刑8年,所以这种情况下最佳选择是坦白。相反,假定乙抵赖,则我也抵赖将判刑1年,坦白将获得自由,坦白还是最佳选择。”尽管甲不知道乙是选择了“坦白”还是“抵赖”,他发现他自己选择“坦白”都是比选择“抵赖”为好的。因此,“抵赖”是相对于“坦白”的劣战略,他不会选择劣战略。所以,甲会选择“坦白”,在这里,“坦白”称之为占优策略。同样,根据对称性,乙也会选择“坦白”,结果是甲乙两人都“坦白”。“囚徒困境”博弈中,局中人所选择的战略构成的组合(坦白,坦白)被称为博弈均衡。这个组合中前后两个战略分别表示甲和乙所选择的战略。甲和乙都不会选择劣战略“抵赖”,称为“剔除劣战略的占优策略均衡”。其中“坦白”是占优于(优于)“抵赖”的占优策略。囚徒困境的问题是博弈论中的一个基本的、典型的事例,它反映了一个深刻问题,这就是个人理性与团体理性的冲突。微观经济学的基本观点之一,是通过市场机制这只“看不见的手”,在人人追求自身利益最大化的基础上可以达到全社会资源的最优配置。而在囚徒困境中,每个人都根据自己的利益作出选择,但结果却是谁也捞不到好处。因此,囚徒困境对传统经济学提出了新的挑战。由案例一引出博弈论的基本概念:1、定义4博弈论是研究决策个体在其行为发生直接相互作用时的决策问题以及这种决策的均衡问题。换言之,在经济学中,博弈论是研究当某一经济主体的决策受到其他经济主体决策的影响,同时该经济主体的相应决策又反过来影响其他经济主体决策时的决策问题和均衡问题。比如在囚徒困境中,甲在决策时会考虑乙的决策对自己的影响,同样乙在决策时也会考虑到甲的决策对自己的影响。2、博弈的组成要素参与人,又称局中人,是指博弈中选择行动以实现自身利益最大化的决策主体(可以是个人,也可以是团体,如厂商、政府、国家),囚徒困境中有两个局中人,甲和乙。信息,指局中人所掌握的对他决策有影响的所有知识。策略,又称战略,是局中人在所有给定信息集的行动规则,他规定局中人在什么时候选择什么行动。囚徒困境中,甲和乙都有两个策略,坦白和抵赖。支付,又称收益,是指参与人从博弈中获得的利益水平,是每个参与人真正关心的东西,如消费者最终所获得的效用、厂商最终所获得的利润;囚徒困境中,甲和乙采用不同策略所遭受的徒刑,就是他们的收益了。均衡,是所有参与人的最优策略或行动的组合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用的集合。囚徒困境中,局中人甲和乙所选择的战略构成的组合(坦白,坦白)被称为博弈均衡。就是博弈中各个局中人根据利益最大化原则选择自己的策略,达到相对稳定状态时候的策略组合。……囚徒困境是经济学中的经典案例,在现实生活中广泛存在。我们可以利用这个道理来分析日常生活中的许多不合作现象。案例2:商家价格战案例3:学生减负案例4:苏格兰的草地为什么消失了?二、智猪博弈:开车者与搭便车者的较量5案例5:智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位食物,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。表2给出这个博弈的支付矩阵。小猪踏不踏大猪踏5,14,4不踏9,-10,0引导学员思考,展开讨论分析:观察这个矩阵我们可以发现,大猪没有优势策略,而小猪有优势策略:无论大猪踏不踏,小猪选择不塌总是最合适的(道理很简单:若大猪踏,则小猪得1,不踏得4;若大猪不踏,小猪得-1,不踏得0,即任何情况下都是不踏更好)。这里,小猪有劣势策略,而大猪没有。“踏”这是小猪的劣势策略。我们知道,作为一只“理性的猪”,小猪是不可能去选择劣势策略的,因此可以把“踏”这个策略从小猪的策略集合中剔除出去。于是小猪只剩下“不踏”这一策略。剔除劣策略“踏”之后的收益矩阵就变成下面这个样子:小猪不踏大猪踏4,4不踏0,0从简化后的收益矩阵中我们可以发现,对于大猪而言,不踏是劣势策略,大猪不会采用,因此,我们可以继续剔除大猪的“不踏”策略。6小猪不踏大猪踏4,4至此,我们得到了这个博弈中唯一的策略组合:大猪选择踏,小猪选择不踏。智猪博弈深刻地反映了经济和社会生活中的免费搭车问题。无论大猪踏不踏,小猪都选择不踏(这是它的优势策略),给定小猪不踏,大猪最好去踏。而且,有意思的是,大猪选择踏在主观上是为了自己的利益,但客观上小猪也享受到了好处。智猪博弈在现实生活中给了我们这样一个启示:如果你的某个行为在使你自己受益的同时,在客观上也能使其他人一点力气不花就可以受益,你最好不要因为有人会乘坐你的“顺风车”而不去做这件事。因为做了这件事固然可以使他人无端受益,但是如果你不做这件事,损失最大的将是你自己。智猪博弈听起来似乎有些滑稽,但智猪博弈的例子在现实生活中却是比较常见的。智猪博弈这一模型可以扩展到生活中的各个方面,不论是在战争中还是商业竞争中,我们都会看到类似于智猪博弈这种情况的存在。案例6:刘邦为什么能当上起义军首领?案例7:朱元璋“缓称王”夺取政权案例8:为何股份公司中的大股东才去监督经理层?案例9:证券投资中的智猪博弈三、纳什均衡:退而求其次也是一种智慧案例10:情侣博弈建民与小冬是一对恩爱中的夫妻,年关将近,他们面临“回谁家过春节”的选择。二人都是独生子女,而且平素都对父母非常孝顺。7建民希望回东北老家与自己的父母一起过春节,而小冬则希望回四川老家与自己的父母一起过春节。有的朋友会说:“那还不好办?‘各回各家、各找各妈’不就解决了?”可是问题的关键在于,建民与小冬很恩爱,分开各自回家过春节,才是他们最不愿意见到的情形。这样一来,他们就将面临一场温情笼罩下的“博弈”。假设二人回建民家过春节,则建民的满意度为10,而小冬的满意度只有5;如果回小冬家过春节,则建民的满意度为5,而小冬的满意度为10;如果双方意见不一致,坚持各回各家,则他们谁都过不好这个春节,满意度各自为0,甚至为负数。当然从常理推断,基本上不存在小冬去东北的建民家过年、而建民去四川的小冬家过年的可能性。我们在“囚徒困境”中曾经提到过“优势策略”这个概念:即无论对方选择什么,我选择的这一个策略总是最有利的。可是我们在上面的这个博弈中,看不到哪一方有严格的优势策略——尽管建民是东北人,但回东北过年不是建民的优势策略,因为如果小冬坚持回四川,他选择回东北的满意度只能为0,而选择跟小冬一起回四川的满意度却还可以是5。也就是说,对建民而言,不存在“无论小冬是选择回东北还是回四川过年,我选回东北过年总是最好的策略”这一情况。同样的道理,小冬也没有绝对的优势策略。在这个博弈中,建民只能看小冬回四川过年的态度有多坚决,然后再据此选择自己的策略。如果小冬态度模糊,则建民把她带到东北,自己可得10,如果小冬执意回四川,最好建民也跟着去,这样自己还能得5;小冬也是如此。由此引出了博弈论中最重要的概念——纳什均衡。纳什均衡是这样的一种博弈状态:对博弈参与人来说,给定对手选定的一个策略,则我选择的某个策略一定比选其他的策略好。纳什均衡的思想就这么简单:在博弈达到纳什均衡时,局中的每一个博弈者都不会因为为自己单独改变策略而获益。它是一个稳定的结果,就像把一个乒乓球放在一个光滑的铁锅里,不论乒乓球的初始位置在哪里,但乒乓球最终都会停留在锅底,这时的锅底就可以被称为一个纳什均衡点。8比如在上述情侣博弈中,(东北,东北)、(四川,四川),即双方都回东北过年,或者双方都回四川过年的选择就是博弈中的纳什均衡状态。因为对双方而言,单独改变策略对双方都没有好处。比如说两人约定一起回东北过年,则建民的满意度为10而小冬的满意度为5,如果此时小冬单独改变主意自己回四川了,变成自己和建民各得0,对谁都没有好处;相反如果两人约定一起回四川过年,则小冬的满意度为10而建民的满意度为5,如果此时建民单独改变主意自己回东北过年,也变成自己与小冬各得0,同样对谁都没有好处。所以,两人一起去回东北过年或者一起回四川过年,才是稳定的博弈结局,也能取得一方绝对满意、另一方相对满意而不是双方都不满意的结局。通过上述分析我们可以发

1 / 13
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功