第2章-Nash均衡

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第一部分:完全信息静态博弈第二章Nash均衡主要内容:一、占优行为二、重复剔除劣战略行为;三、Nash均衡。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、占优行为二、重复剔除劣战略行为;三、Nash均衡。第二章Nash均衡ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng囚徒困境的例子•首先考察博弈论中最为经典的一个博弈模型——“囚徒困境”(prisoners’dilemma)博弈。•“囚徒困境”博弈问题是Tucker在20世纪50年代提出的,该问题不仅“可以作为实际生活中许多现象的一个抽象概括”,而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng“囚徒困境”(prisoners’dilemma)•两个小偷作案后被警察抓住,分别关在不同的屋子里审讯。在审讯之前,小偷从律师那里得知:如果两个人都坦白,将被各判刑4年;如果两个人都抵赖,将会因为证据不足而各判1年;如果其中一人坦白另一人抵赖,坦白的将会得到宽大处理而被无罪释放,而抵赖的将被重判,判刑6年。试问两个小偷将会如何选择?ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng“囚徒困境”(prisoners’dilemma)-4,-40,-6-6,0-1,-1小偷2小偷1抵赖坦白坦白抵赖对于每个小偷,当对方坦白时,自己坦白得,抵赖得,所以,应该选择“坦白”;而当对方抵赖时,自己坦白得0,抵赖得,所以,还是应该选择“坦白”。无论对方如何选择,每个小偷都会选择“坦白”。因此,博弈的结果就是两个小偷都选择“坦白”。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng第一个问题•除了(坦白,坦白)和(抵赖,抵赖)以外,“囚徒困境”是否还会出现其它的结果呢?•比如说一个人坦白,另一个人抵赖?-4,-40,-6-6,0-1,-1小偷2小偷1抵赖坦白坦白抵赖我们说这样的结果也是不会出现的,因为在对方选择“坦白”的情况下,自己选择“抵赖”显然是不理性的。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng第二个问题•当两个小偷都选择“坦白”时,是否会有人偏离“坦白”而选择“抵赖”?-4,-40,-6-6,0-1,-1小偷2小偷1抵赖坦白坦白抵赖两个小偷只要是理性的,这种情况就不会发生。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng“囚徒困境”的寓意•虽然结果(抵赖,抵赖)是结果(坦白,坦白)的Pareto改进(即所有的人都得到好处),但只要两个小偷是理性的,这种对所有人都有好处的“改进”两人都无法得到。•这也反映出现实生活中经常出现的“个人理性与集体理性间的矛盾”。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng“囚徒困境”的例子•寡头垄断市场上厂商间的价格大战;•20世纪90年代末期我国出现的彩电企业间的价格大战;•有关中小学生教育方式的选择,家长明知素质教育对孩子的长远发展更有益处,但为了应付各种各样的升学考试,也不得不让自己的孩子参与各种名目的“模拟考试”或“考试培训”。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng“囚徒困境”(prisoners’dilemma)-4,-40,-6-6,0-1,-1小偷2小偷1抵赖坦白坦白抵赖无论对方如何选择,每个小偷都会选择“坦白”,可以发现战略“坦白”具有这样的特点:无论对方怎样选择(选择“坦白”或者“抵赖”),“坦白”总是理性小偷的最优战略。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng一、占优行为•考察更一般的n人博弈情形。在n人博弈中,参与人i(i=1,2,...,n)的支付ui=ui(si,s-i)既与自己的选择si有关,也与其他参与人的选择s-i有关。•在一般情况下,使参与人的支付ui=ui(si,s-i)最大化的最优战略是与其他人的选择s-i有关的。*isControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng1.占优战略•但可能会出现这样的情况:参与人的最优战略与其他参与人的选择无关。•也就是说,无论其他参与人选择什么战略,参与人的最优战略总是惟一的。这样的最优战略我们称为“占优战略”(dominantstrategy)。*isisControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng定义1:占优战略在n人博弈中,如果对于所有的其他参与人的选择,都是参与人i的最优选择,即,有则称为参与人的占优战略。*is*1(),niiiiijjjisSsssS*(,)(,)iiiiiiussussis*isControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在一个博弈问题中,如果某个参与人具有占优战略,那么只要这个参与人是理性的,他肯定就会选择他的占优战略。•参与人的这种选择行为我们称为占优行为。•占优行为是理性参与人选择行为的最基本特征。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例12,1-2,-63,0-1,211a2a21,20,13,3-1,-21b2b3b4bControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng2.占优战略均衡•如果所有的参与人都具有占优战略,那么只要参与人是理性的,肯定都会选择自己的占优战略。•博弈的结果就由参与人的占优战略共同决定。像这种由参与人的占优战略共同决定的博弈结果,称为占优战略均衡(dominant-strategyequilibrium)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng定义2:占优战略均衡•在n人博弈中,如果对所有参与人i(i=1,2,...,n),都存在占优战略,则占优战略组合称为占优战略均衡。*is****12(,,...,)nssssControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在一个博弈问题中,如果所有参与人都有占优战略存在,那么占优战略均衡就是惟一的所有理性参与人可以预测到的博弈结果。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng300,300800,00,8000,0企业2企业1开发不开发开发不开发“新产品开发博弈”中的占优战略均衡•当市场需求大时,在完全信息静态的“新产品开发博弈”中,企业1和2都有占优战略“开发”,因此,博弈的结果为占优战略均衡(开发,开发)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例2•占优战略均衡是?2,1-2,-63,0-1,211a2a21,2-2,13,3-1,-21b2b3b4bControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、占优行为二、重复剔除劣战略行为;三、Nash均衡。第二章Nash均衡ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng二、重复剔除劣战略行为•在“囚徒困境”中,“坦白”是小偷的占优战略,也就是说,相对于战略“抵赖”,“坦白”在任何情况下都是小偷的最优选择。因此,小偷只会选择战略“坦白”。•反过来也可以这么理解:相对于战略“坦白”,小偷选择“抵赖”所得到的支付都要小于选择“坦白”所得到的。既然选择“抵赖”的所得总是小于选择“坦白”的所得,小偷当然就不会选择“抵赖”,这也就相当于小偷将战略“抵赖”从自己的选择中剔除掉了。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•考察更一般的n人博弈情形:在n人博弈中,不存在占优战略,但是参与人i存在两个战略和(),虽然不是占优战略,但与相比,自己在任何情况下选择的所得都要大于选择的所得。•因此,理性的参与人绝对不会选择战略。isis,iiissSisisisisisControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng定义3:劣战略在n人博弈中,如果对于参与人i,存在战略,对,有则称战略为参与人i的劣战略,或者说战略相对于战略占优。,iiissS1,nijjjisS(,)(,)iiiiiiussussisisisControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng剔除劣战略行为•在博弈中,如果战略是参与人i的劣战略,那么参与人i肯定不会选择战略。这也就相当于参与人将战略从自己的战略集中剔除掉,直接从战略集中选择自己的战略。参与人的这种选择行为我们称之为剔除劣战略行为。•剔除劣战略行为也是理性参与人选择行为的基本特征之一。isis\{}iiSsisiSControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•考察战略式博弈如果战略是参与人i的劣战略,那么参与人i将只会从战略集中选择自己的战略。•令,构造一个新的战略式博弈此时,对战略式博弈G的求解问题就可转换为对的求解。11;,,,,;,,,,ininGSSSuuuis\{}iiSs\{}iiiSSs11;,,,,;,,,,ininGSSSuuuGControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng1,01,20,10,30,12,0BALMRUD1,2BMAUB理性B不仅理性,且知道A理性,且知道A知道B理性。例子0,10,31,21,0BLMAUD1,21,0BLMAUA理性且知道B理性ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•存在两个战略和(),与相比,虽然选择的所得并不一定总是大于选择的所得,但自己在任何情况下选择的所得都不会比选择的所得小,而且在某些情况下选择的所得严格大于选择的所得。•显然,在这种情况下,理性的参与人将战略从自己的选择中剔除掉也是有道理的。与定义2.3中所定义的劣战略相仿,

1 / 60
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功