博弈模型

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

人质困境此为博弈模型之一,人质困境:多个人的囚徒困境要理解这个定义,我们可以从这样一个童话故事开始:老鼠们意识到,假如可以在猫脖子上系一个铃铛,那么,他们的安全就会有保障。问题在于,谁会愿意冒赔上小命的风险给猫系上铃铛呢?老鼠所面临的这个问题同样摆在人类面前:人们在直接面对威胁或损失时,也面临同样的心理困境。在一群人面对威胁或损失时,“第一个采取行动”的决定是很难做出的,因为它意味着将付出惨重代价。这个困境便就叫做人质困境。酒吧博弈2008年04月11日星期五23:16美国著名的经济学专家阿瑟教授于1994年提出了少数人博弈这个理论。其理论模型是这样的:有100个人很喜欢泡酒吧。这些人在每个周末,都要决定是去酒吧活动还是待在家里休息。酒吧的容量是有限的,也就是说座位是有限的。如果去的人多了,去酒吧的人会感到不舒服。此时,他们留在家中比去酒吧更舒服。假定酒吧的容量是60人,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。这100人如何作出去还是不去的决定呢?这个博弈的前提条件做了如下限制:每一个参与者面临的信息只是以前去酒吧的人数,因此,他们只能根据以前的历史数据,归纳出此次行动的策略,没有其他的信息可以参考,他们之间更没有信息交流。这就是著名的酒吧问题,即少数人博弈。酒吧问题所模拟的情况,非常接近于一个赌博者下注时面临的情景,比如股票选择、足球博彩。这个博弈的每个参与者,都面临着这样一个困惑:如果许多人预测去的人数超过60,而决定不去,那么酒吧的人数会很少,这时候作出的这些预测就错了。反过来,如果有很大一部分人预测去的人数少于60,他们因而去了酒吧,则去的人会很多,超过了60,此时他们的预测也错了。因而一个作出正确预测的人应该是,他能知道其他人如何作出预测。但是在这个问题中每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人如何作出预测,因此所谓正确的预测几乎不可能存在。阿瑟教授通过真实的人群以及计算机模拟两种实验得到了两个迥异的、有趣的结果。在对真实人群的实验中,实验对象的预测呈有规律的波浪状形态,实验的部分数据如下:从上述数据看,虽然不同的博弈者采取了不同的策略,但是其中共同点是这些预测都是用归纳法进行的。我们完全可以把实验的结果看作现实中大多数理性人作出的选择。在这个实验中,更多的博弈者是根据上一次其他人作出的选择而作出这一次的预测。然而,这个预测已经被实验证明在多数情况下是不正确的。那么,在这个层面上说明,这种预测是一个非线性的过程。所谓这样一个非线性的过程是说,系统的未来情形对初始值有着强烈的敏感性,这就是人们常说的蝴蝶效应:在某地的一只蝴蝶动了一下翅膀,遥远的另一个地方就下了一场大暴雨。通过计算机的模拟实验,得出了另一个结果:起初,去酒吧的人数没有一个固定的规律,然而,经过一段时间后,这个系统去与不去的人数之比接近于60:40,尽管每个人不会固定地属于去或不去的人群,但此系统的这个比例是不变的。如果把计算机模拟实验当做更为全面的、客观的情形来看,计算机模拟的结果说明的是更为一般的规律。生活中有很多例子与这个模型的道理是相通的。股票买卖、交通拥挤以及足球博彩等等问题都是这个模型的延伸。对这一类问题一般称之为少数人博弈。例如,在股票市场上,每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于卖股票的位置,而你处于买的位置,股票价格低,你就是赢家;而当你处于少数的卖股票的位置,多数人想买股票,那么你持有的股票价格将上涨,你将获利。在实际生活中,股民采取什么样的策略是多种多样的,他们完全根据以往的经验归纳得出自己的策略。在这种情况下,股市博弈也可以用少数人博弈来解释。少数人博弈中还有一个特殊的结论,即:记忆长度长的人未必一定具有优势。因为,如果确实有这样的方法的话,在股票市场上,人们利用计算机存储的大量的股票的历史数据就肯定能够赚到钱了。而这样一来,人们将争抢着去购买存储量大、速度快的计算机了,在实际中人们还没有发现这是一个炒股必赢的方法。少数人博弈还可以应用于城市交通。现代城市越来越大,道路越来越多、越来越宽,但交通却越来越拥挤。在这种情况下,司机选择行车路线就变成了一个复杂的少数人博弈问题。在这个过程中,司机的经验和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段;有的司机经验不足,往往不能有效避开高峰路段;有的司机喜欢冒险,宁愿选择短距离的路线;而有的司机因为保守而宁愿选择有较少堵车的较远的路线等等。最终,不同特点、不同经验司机的路线选择,决定了路线的拥挤程度。专家指点:少数人博弈这个理论的提出,为解决日常生活中的交通拥挤等问题提供了一个新的思路和方法,但并不能找到一个炒股必赢的方法。酒吧博弈问题(barproblem)酒吧博弈问题是美国人W.B.Arthur1994年在《美国经济评论》发表的题为《归纳论证和有界理性》一问中提出的,然后他又从1999年的《科学》杂志上发表的《复杂性和经济学》一文中阐述了这个博弈。该博弈是说:有一群人,例如n=100,每个周末,均要决定是去一酒吧活动还是呆在家里。酒吧的容量是有限的,假定是60人。如果某人预测去酒吧的人超过60人,那么他决定去还是不去?......每个参与者或决策者面临的信息只是以前去酒吧的人数,只能根据以前的人数的信息来归纳出策略来。这是一个典型的动态博弈问题。......通过计算机的模型实验,阿瑟得出了一个有意思的结果:不同的行动者是根据自己的归纳来行动的,并且,去酒吧的人数没有一个固定的规律,然而,经过一段时间以后,去的平均人数总是趋于60。阿瑟说,预测者自组织到一个均衡系统中去和不去的人群,或形成一个生态稳定系统。......这就是酒吧问题。酒吧问题所反映的是这样一个社会现象,正象阿瑟教授说的那样,我们在许多行动中,要猜测别人的行动,然而我们没有更多关于他人的信息,我们只有通过分析过去的历史来预测未来。我们生活的世界是个混沌体,没有人可以预测未来。就算有超级计算机,我也绝不相信它可以做到。Barproblem是斯坦福经济学教授阿瑟在1994年的《美国经济评论》中提出。酒吧问题:假设小镇上只有一间酒吧,能容纳60人,而小镇有100人。酒吧设计的接待人数为60,这个时候气氛融洽,服务也最好。第一次,100人中的大多数去了,结果酒吧爆满,回来的人抱怨还不如不去,而没去的人反而庆幸。第二次,人们去之前,有了上一次的经验,就多数决定不去,结果导致少数去的人享受了超高级的服务。没去的自然就后悔了。那么问题出来了:小镇上的人应该如何做出去还是不去的选择呢?这是典型的动态群体博弈问题。高考填志愿和这个模型一模一样,只是参加的人比较多。为了更接近生活,这个模型还有个前提限制:每个参与者的信息只是以前去酒吧的人数。因此,他们只能根据以前的历史数据归纳出此次行动的策略,他们之间没有信息交流。可以想象,每个人只要知道其他人的决策,就可以做出正确的决定,但矛盾在于,每个人拥有的信息来源是一样的,那就是相同的历史经验,因此不可能知道其他人如何做决策。阿瑟教授通过计算机模拟和对实际人群的考察得到了两个不同的结果。计算机的结果是:开始,去酒吧的人数是没有固定规律的,但是后来,去酒吧的人数很快稳定在60左右,尽管每个人不是固定的去或者不去,但自发的形成了一个稳定的生态系统。可是对实际人群的观察却并非如此,而是呈有规律的波浪形态,却难以稳定。至于原因,我想是因为计算机模拟的都是理性的人,而现实生活中总有少数不是很理性的人???传统经济学认为:经济主体或行动者的行动是建立在演绎推理的基础上,而实际上,多数人的行动是基于归纳的基础上的。“股票交易”,“交通拥挤”,“足球博彩”都是酒吧问题的衍生。也可称之为“少数人博弈”,最简单的模型是:失火了,有两个门,你必须选择人数较少的生门来逃生,选择决定了逃生的成功率。股市上也是这样:股民老是猜测别人的行为,并努力与之不同。如果多数处于卖的位置,你就能以高价买入;而多数人想买的时候,你肯定能以高价卖出。股市的存在正是建立在它的不可预测上。如果有一个系统可以预测它,那么股市就会停,因为所有人最后都会知道什么是潜力股,什么是垃圾股,就会没人抛潜力股,没人买垃圾股。酒吧问题告诉我们,我们的预测来源于对历史的归纳,而历史数据在当前的推导理论中又不具有帮助性,那么,未来是不可预知的。酒吧问题的启示是:A,2是1的2倍,但100万未必是1的100万倍,后者是不能准确了解的系统,那么我们不知道什么时候量变引起质变。那么,我们的策略因此退到寻找临界点上。B,少数者策略往往会获胜。猎鹿博弈2008-10-2822:27偶尔看到这样一个故事感触颇深,与博友们分享。。。。在原始社会,人们靠狩猎为生。为了使问题简化,设想村庄里只有两个猎人,主要猎物只有两种:鹿和兔子。如果两个猎人齐心合力,忠实地守着自己的岗位,他们就可以共同捕得一头鹿。要是两个猎人各自行动,仅凭一个人的力量,是无法捕到鹿的,但却可以抓住4只兔子。从能够填饱肚子的角度来看,4只兔子可以供一个人吃4天;1只鹿如果被抓住将被两个猎人平分,可供每人吃10天。也就是说,对于两位猎人,他们的行为决策就成为这样的博弈形式:要么分别打免子,每人得4;要么合作,每人得10(平分鹿之后的所得)。如果一个去抓兔子,另一个去打鹿,则前者收益为4,而后者只能是一无所获,收益为0.在这个博亦中,要么两人分别打名兔子,每人吃饱4天;要么大家合作,每人吃饱10天,这就是这个博亦两个可能结局。通过比较“猎鹿博弈”明显的事实是,两人一起去猎鹿的好处比各自打兔的好处要大得多。用一个经济学术语来说,两人起去人头猎鹿比各自去打兔更符合帕累托最优原则。帕累托是一位意大利的经济学家,他最伟大的成就,是提出了“帕累托最优”这个理念。所谓帕累托最优,指的是资源分配的一种理想状态。一旦达到了这种理想状态,如果想要使某些人的处境变好,就必定要使另外某个人的境况变坏。换句话说就是,你的得到是以他人的失去为代价的。在某种意义上,我们可以认为,帕累托最优是一个兼顾公平与效率的“理想王国”。相反,如果还可以在不损害其他人的情况下改善某个人的处境,我们就可以认为资源尚未被充分利用,这时就不用说已经实现了帕累托最优。这一案例中有一个隐含的假设,就是两个猎人的能力和贡献差不多,所以双方均分猎物。但是实际情况显然不会这么简单。如果一个猎人的能力强、贡献大,他就会要求得到较大的一份,这样分配的结果就可能是(14、6)或(15、5)。但有一点是肯定的,能力较差的猎人的所得,至少要多于他独自打猎的所获,否则他就没有合作的动机。假设猎人甲在猎鹿过程中几利承担了全部的工作,他据此要求最后的分配结果是(17、3)。这时相对于分别猎兔的收益(4、4),合作猎鹿就不具有帕累托优势。虽然这样17比4多,改善了很多,17+3也比4+4大得多,猎人总体收益也改善了很多,但是由于3比4小,猎人乙的境遇不仅没有改善,反而恶化。也就是说他的收益受到了损害。所以站在乙的立场,(17、3)没有(4、4)好。如果合作结果是这样,那么,乙一定不愿合作。所以,为了实现帕累托最优,就必须充分照顾到合作者的利益,使他的收益大于不合作时,他才会愿意选择合作,从而实再双赢的最佳结局。猎鹿博弈启示我们,双赢的可能性都是存在的,而且人们可以通过采取各种举措达成这一局面。但是,有一点需要注意,为了让大家都赢,各方首先要做好有所失的准备。在一艘将沉的船上,我们所要做的并不是将人一个接着一个地抛下船去,减轻船的重量,而是大家齐心协力地将漏洞堵上。因为谁都知道,前一种结果是最终大家都将葬身海底。在全球化竞争的时代,共生共赢才是企业的重要生存策略。为了生存,博弈双方必须学会与对手共赢,把社会争变成一场双方都得益的“正和博弈”。这个故事告诉我们双赢才是最佳的合作效果,合作是利益最大化的武器。许多时候,对手不仅仅只是对手,正如矛盾双方可以转化一样,对手也可以变为助手和盟友,微软公司对苹果公司慷慨解囊就是一个最好的案例。如同国际关系一样,商场中也不存在永远的敌人。作

1 / 22
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功