龙源期刊网基于囚徒困境模型的博弈论的日常应用作者:张育弘来源:《消费导刊》2017年第04期摘要:本文旨在引入博弈论的基本概念、基本内容以及基本方法。并对囚徒困境模型进行分析、研究。将该博弈模型与日常生活相结合。将决策模型应用到日常生活中的两个案例中:购买火车票时的应用、马路行驶违章问题研究。并针对其产生的问题提出一定的建议。关键词:博弈论囚徒困境日常生活最优化一、博弈论基础(一)博弈的基本概念博弈论,又名“对策论”,它研究的是决策者为获得最大利益如何选择适当的策略的理论和方法。作为应用数学的一个分支,博弈论在运筹学领域也有重要地位。它研究的是在彼此依赖的条件下,决策者为获得最大利益如何抉择适当的策略的理论和方法。(二)博弈的基本内容博弈的构成要素有五个,分别是:参与者、行动、支付、规则以及均衡。参与者是博弈的决策主体;行动指参与者可以采取的行动方案;支付指根据决策结果获得的收益;规则指对参与者行动的先后次序等内容的规定;均衡指一切参与者的最优策略的组合。(三)纳什均衡纳什均衡是指参与者在作出决策后,所得到的支付结果是稳定的,并且任一方都不能通过改变自己的策略得到更大的收益,因此,参与者都不会改变策略来打破这个均衡。博弈的结果总为纳什均衡,因此,我们用纳什均衡来表示博弈的结果。二、囚徒困境模型囚徒困境是博弈论中具典型的案例。警察抓捕两个作案嫌疑犯,并将其关在不同的房间受审。警察告诉每个嫌疑犯:若两人都抵赖,各判刑一年;两人都坦白,各判八年;一人坦白而另一人抵赖,则释放坦白嫌疑犯,对抵赖嫌疑犯判刑十年。在这个博弈中,每个嫌疑犯都有两种选择:坦白或抵赖。然而,每个嫌疑犯的最优选择是坦白:如果同伙抵赖、自己坦白,则被释放,不坦白则会判刑一年,总之,坦白要比抵赖好;如果同伙坦白、自己坦白的话判八年,抵赖则被判十年,坦白还是比抵赖更好。结果,两个嫌疑犯都选择坦白,各判刑八年。这就是囚徒困境。龙源期刊网运用博弈论分析,参与者为嫌疑犯甲和嫌疑犯乙;行动集分别为嫌疑犯坦白或者抵赖。若两名嫌疑犯均选择坦白,其支付结果为(-8,-8);若嫌疑犯甲坦白而乙抵赖,其支付结果为(0,-10);若嫌疑犯甲抵赖,乙坦白,支付结果为(-10,0);若嫌疑犯甲、乙均选择抵赖,其支付结果为(-1,-1)。运用下划线法进行分析,支付矩阵为表2-1:由囚徒困境案例得知,一个人在追求自身利益最大化的行为不一定可以满足集体利益的最大化,这就导致了个人选择和集体理性的矛盾。三、囚徒困境模型在日常生活中的应用(一)购买火车票时的应用火车出行方便快捷、价格合理,因此乘坐火车出行已成为人们内剧增,火车票的购买难度便明显增加。因此,抢票是无法避免的。假设学生甲和学生乙同时购买仅剩的一张火车票,运用博弈论进行分析,该博弈的参与者为学生甲和学生乙;行动集为学生选择放弃或者继续坚持;若学生甲坚持,学生乙放弃,其支付结果为(1,-1);若学生甲坚持,学生乙坚持,其支付结果为(-∞,-∞);若学生甲放弃,学生乙坚持,其支付结果为(-1,1);若学生甲放弃,学生乙放弃,其支付结果为(0,0);运用下划线法进行分析:划线后的支付矩阵为表3-1:(二)马路行驶中的违章问题研究为了节省时间,大部分驾驶员会选择加速、超车甚至闯红灯,所以造成了日益突出的城市交通问题和交通拥堵现象。运用博弈论对该现象进行分析。假定在不全违章的情况下,违章的成本低于不违章的成本,违章成本为1,不违章成本为2;若驾驶员同时违章,会造成交通堵塞,产生额外的成本2。假设马路上有两名驾驶员:驾驶员甲和乙,即为该博弈的参与者。行动集为:驾驶员违章或不违章;若驾驶员甲违章,乙不违章,则支付表示为(-1,-4);若驾驶员甲违章,乙违章,支付表示为(-3,-3);若驾驶员甲不违章,乙违章,支付表示为(-4,-1);若驾驶员甲不违章,乙不违章,他们的支付表示为(-2,-2),运用下划线法分析后的支付矩阵为表3-2:从支付矩阵看,该博弈的策略组合:驾驶员甲不违章且驾驶员乙不违章为唯一的纳什均衡。但是,由于每位驾驶员都会追求个人利益最大化,因此他们都会不约而同的选择违章,从而引发交通问题,既损害了个人利益,也损害了整个社会的利益。四、结论与建议龙源期刊网以上案例直接明了的让我们看到了博弈论的用途。博弈是决策与对应结果的互动过程。决策结果不仅依赖于我们自身的决策,同时也离不开他人的决策选择。因此在生活中我们要运用理性的思维方式去思考问题、解决问题,要善于避开各种各样的社会准则,加深对于对手的认识和理解,最终根据对方的选择做出明智的决策,让自己的人生之路走得更顺利。