数学文化与思维主讲人:宋艳兵博弈论剧情回顾影片中有这样一个情节:在美国普林斯顿大学的酒吧里,4个男生正商量着如何去追求一位漂亮女生,当时还正在大学读书的纳什却在朦胧的“博弈论”思维逻辑引导下喃喃自语:“如果他们4个人全部去追求那漂亮女生,那她一定会摆足架子,谁也不睬。然后再去追其他女孩子,别人也不会接受,因为没人愿意当‘次品’。但如果他们先追其他女生,那么漂亮女生就会感到被孤立,这时再追她就会容易得多。”在纳什眼里,追求女生就是一场“博弈”,而“博弈”是要遵循一定规则的,是需要“博弈”策略的。博弈论是什么?博弈论又被称为对策论(GameTheory)既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论是研究具有斗争或竞争性质现象的数学理论和方法。它考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。目前已被广泛运用到各个领域,在经济学中取得了尤为突出的发展。战争是怎样发生的?8岁的男孩问父亲:“爸爸,战争是怎样发生的?”男孩的父亲回答:“很简单。比如说第一次世界大战的爆发,是因为德国入侵比利时……”在一旁的妻子立即打断他的话:“你讲的不对。第一次世界大战的起因是有人在萨拉热窝被刺杀了。”丈夫听了一脸不悦,冲妻子不耐烦地说道:“是你回答这个问题,还是我回答?”妻子听了也是满脸的不高兴,她转身跑出起居室,砰的一声将门关上。紧接着,从厨房里传出了碗碟猛摔在地上的声音,过了一会儿,整个屋子陷入死一般沉寂。男孩眼眶里含着泪水,轻声说:“爸爸,你不用说了,我知道战争是怎样发生的了.远观博弈论夫妻二人以一种两败俱伤的方式,使自己的孩子明白了战争的发生和夫妻两个人吵架之间的内在关联:让国家之间一步一步走向世界大战的机制,同样也正是同一屋檐下夫妻失和的原因。也就是说,无论是国与国之间,还是人与人之间的合作和冲突,其中所蕴含的博弈原理是大同小异的。诺贝尔经济学奖得主奥曼在权威的《帕尔格雷丈夫辞典》中,对“博弈论”此条的解释十分精辟和凝练。他认为,博弈论描述性的名称应该是“互动的决策论”。因为人们之间的决策与行为会形成互为影响的关系,一个主体在决策时必须考虑到对方的反应。博弈的形成博弈的目的是利益,利益形成博弈的基础。最基本的假设就是经济人或理性人的目的就在于使收益最大化。参与博弈者正是为了自身收益的最大化而互相竞争。参与博弈的各方形成相互竞争、相互对抗的关系,以争得利益的多少来决定胜负,一定的外部条件又决定了竞争和对抗的具体形式。这样就形成了博弈。简单的案例夫妻俩下班回到家,吃完晚饭想看电视。电视预报显示,一个频道会播放丈夫喜爱的足球赛,而另一个频道会播放妻子喜爱的选秀节目。但是家里只有一台电视机。这样,围绕着到底看什么节目。一场博弈就展开了。要素分析在这场博弈中,完整地包含了形成一个博弈的4个要素:(1)2个或2个以上的参与者(player)。博弈中必需的条件:不是一个人在一个毫无干扰的环境中做决策。(2)博弈要有参与各方争夺的资源或收益(resources/payoff)资源指的不仅仅是自然资源,还包括了各种社会资源,如人脉、信誉、学历、职位等。人们之所以参与博弈是受到利益的吸引,将来所获得利益的大小直接影响到博弈的吸引力和参与者的关注程度。简单说就是:凡是自己主观需要的就是资源;相反,主观不需要的对自己就不能构成资源。这就是“情人眼里出西施”的道理。要素分析(3)参与者有自己能够选择的策略(strategy)通俗地说,策略就是计策,是博弈参与者所选择的手段和方法。制定博弈论中的策略,要先对局势和整体状况进行分析,确定局势特征,再找出其中关键因素,最后才进行手段选择。由此可见,博弈论中的策略是牵一发而动全身的,直接对整个局势造成重大影响。(4)参与者拥有一定量的信息(information)博弈就是个人或组织在一定的环境条件与已定的规则下,同时或先后,一次或是多次选择策略并实施从而得到某种结果的过程。案列分析上述“夫妻博弈”模型大致会出现三种情况:一是两人争执不下,于是干脆关掉电视,谁都别看;二是你看足球,我到其他地方看选秀,或你看选秀,我到其他地方看足球;三是其中一方说服另一方,两人同看足球或同看选秀节目。案例分析夫妻二人通常不会因为电视节目的分歧而分开活动的。这是研究该问题的潜在前提。但是,对于看什么节目,双方又各有偏好。因此我们可以假定:如果丈夫和妻子分开活动,男女双方的效用为0,如果双方一起去看球赛,则丈夫的效用为5,而妻子的效用为1;如果双方一起看选秀,则丈夫的效用为1,妻子的效用为5。案例分析根据上述假定夫妻双方不同选择的所有结果及其效用组合如下表。夫/妻球赛选秀球赛5/10/0选秀0/01/5就是这样一个矩阵,可以一目了然地把我们介绍的几种因素包含在里面。矩阵是博弈论中用来描述两个或多个参与人的策略和效用的最常用工具,又被称为“收益矩阵”或“得益矩阵”。纳什均衡在所有的均衡中,“纳什均衡”又是一个基础性的概念。简单地说,所谓“纳什均衡”就是所有人的选择综合在一块,不一定所有选择都能实现最大化原则,但能使所有人都达到最大化的均衡状态。纳什均衡是一种最常见的均衡。在纳什均衡点上,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。也就是说此时如果他改变策略,他的收益将会降低,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡不仅要求所有的博弈参与人都是理性的,而且要求每个参与人都了解所有其他参与人也都是理性的。需要注意的是,博弈的结果并不都能成为均衡。博弈的均衡是稳定的,因此可以预测。囚徒困境模型两个共同偷窃的犯罪嫌疑人甲和乙被带进警察局。警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到同伴的选择。警方怀疑他们作案,但手中并没有掌握确凿证据,于是明确地分别告知两名犯罪嫌疑人,对他们犯罪事实的认定及相应的罪刑完全取决于他们自己的供认。警方提出条件如下:囚徒困境模型分析两名囚徒面临的选择及其带来的后果组合用收益矩阵表示如下:甲乙抵赖供认抵赖甲无罪释放/乙无罪释放甲无罪释放/乙重判10年供认甲重判10年/乙无罪释放甲判刑5年/乙判刑5年哪一种选择对犯罪嫌疑人更有利呢?囚徒困境模型分析从上表中可以知道:每个犯罪嫌疑人都有两种可供选择的策略:供认或抵赖。而且,每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择。如果甲选择抵赖,那么就可能会出现两种情况:如果乙选择供认,那么甲将被加重惩罚,判刑10年,而乙则无罪释放;如果乙也同样选择抵赖,那么他们两个都将因证据不足而被释放。很显然,这第二种结果对于两个人都是最有利的。但是,因为警方没有把两名嫌疑人放在一间囚室里,因而这种合作难以顺利进行,使得结果预测的不确定性加大,或者说增加了抵赖合作的风险性。因此,基于人是理性的这一前提。由于犯罪嫌疑人不知道对方的想法,最理性的博弈策略,就是选择供认。这时的策略,我们可以称为占优策略。聪明还是不聪明?两个旅行者从一个出产细瓷花瓶的地方回来,都买了花瓶。可是提取行李的时候,发现花瓶被摔坏了。于是。他们向航空公司索赔。航空公司知道花瓶的价格总在八九十元上下浮动,但是不知道两位旅客买的确切价格是多少。于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲的是真话,并按照他们写的数额赔偿;如果两人写的不一样,航空公司就论定写得低的旅客讲的是真话,并且照这个低的价格赔偿。但是对讲真话的旅客奖励10元钱,对讲假话的旅客罚款10元。为了获取最大赔偿,甲乙两位旅客最好的策略就是都写100元,这样两人都能够获赔100元。可是甲很聪明,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到109元。何乐而不为?所以他准备写99元。可是乙更加聪明,他算计到甲要算计自己而写99元。“人不犯我,我不犯人,人若犯我,我必犯人”,于是他准备写98元。想不到甲又聪明一层,算计出乙要这样写98元来坑他,“来而不往非礼也”,他准备写97元…聪明还是不聪明?下象棋的时候,讲究看得越远,胜算越大。在花瓶索赔的例子中,如果两个人都“彻底理性”,像上面那样“精明比赛”下去,最后将落到什么地步呢?事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡,是两位旅客都写0。旅行者困境这是哈佛大学巴罗教授在研究囚徒困境模型的过程中演进了的“旅行者困境”。一方面它启示人们在为私利考虑的时候不要太精明,因为精明不等于高明,太精明往往会坏事;另一方面,它对于理性行为假设的适用性也提出了警告。