博弈论原理与方法-关于均衡的分析绪论-博弈论简介博弈论的提法可能太过于学术化,容易让人们退避三舍。其实它有一个非常通俗的名字--游戏理论(博弈论的英文名字叫做“GameTheory,如果直译,就是游戏理论)。博弈论在我国还有一个名字,叫对策论。这些名字都很好理解,博弈字面意思就是赌博、下棋,赌博和下棋当然是游戏了,赌博和下棋的时候常常要千方百计地应付对手,自然是要讲究对策了。绪论-博弈论简介博弈论主要研究人们的策略的相互依赖行为。博弈论认为,人是理性的,即人人都会在一定的约束条件下最大化自身的利益。非合作博弈:当事人不能达成一个有约束力的协议。合作博弈绪论-博弈论简介在博弈理论中,虽然每方都要最大化自己的利益,但它与优化理论有所区别:优化理论可看成单人决策,追求的是目标函数的优化。影响结果的多个变量控制在决策者自己手中。企业管理成本最小化问题、运输问题、车间调度…博弈理论可看成多人决策,追求的是策略组合的均衡。影响结果的变量是由多个博弈者操纵。社会经济系统中的大量问题,竞价问题、企业竞争决策…绪论-博弈论的历史沿革犹太法典(Talmud)中一个男人如何将死后的财产发给三个妻子的难题;在一个案例中,一个男人有三个老婆,丈夫在给她们各自的婚姻契约中规定一旦自己死亡她们分别接受100货币、200货币300货币。这部法典明确地给出了不同的建议:如果男人留下的遗产只有100货币,将其平分;如果遗产为200货币,将其按(50,75,75)的比例划分;遗产为300货币时按(50,100,150)的比例划分。第一种情况容易理解,而如何理解后两种划分?这一问题困挠了研究犹太法典的学者达二几千年之久。直到1985年,有人提出:犹太法典的这一建议是完全符合合作博弈理论的,每一方案都符合特定博弈的要旨所在。中国古代田忌赛马;Cournot的寡头竞争模型(1838年《财富理论的数学研究》)绪论-博弈论的历史沿革博弈理论开始于1944年由冯·诺依曼(VonNeumann)和摩根斯坦恩(OskarMorgenstern)合作的《博弈论和经济行为》(TheTheoryofGamesandEconomicBehaviour)一书由PrincetonUniversityPress出版。20世纪50年代以来,纳什(Nash)、泽尔腾(Selten)、海萨尼(Harsanyi)等人对非合作博弈理论的研究使博弈论最终成熟并进入实用。绪论-博弈论的历史沿革JohnNash:1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。因为在现实世界中,非合作博弈要比合作博弈普遍得多。绪论-博弈论的历史沿革泽尔腾(1965)将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”。而海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(1967-1968)。总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型绪论-博弈论的历史沿革博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(bindingagreement)。倘若不能,则称非合作博弈Non-cooperativegame。合作博弈强调的是集体主义,团体理性CollectiveRationality,是效率、公平、公正;绪论-博弈论的历史沿革而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡。绪论-博弈论的历史沿革博弈论相关诺贝尔奖1972年JohnR.HicksandKennethJ.Arrow经济均衡原理和社会福利原理。1990年HarryN.Markowitz,MertonM.MillerandWilliamF.Sharpe金融经济学原理。1994年JohnHarsanyi,JohnF.NashandReinhardSelten非合作博弈中均衡的研究1996年JamesA.MirrlessandWilliamVickery不对称信息条件下激励机制问题绪论-博弈论的历史沿革2001年JeorgeAkerlof、MichaelSpenceandJosephStiglitz非对称信息市场分析2002年丹尼尔·卡尼曼和弗农·史密斯心理和实验经济学方面2005年ThomasSchellingandRobertAumann合作博弈方面博弈论在构成了微观经济学的基础性方法。绪论-什么是博弈论博弈论的定义:博弈论是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。简单地说,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡。绪论-什么是博弈论从博弈特性角度定义“博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法”。也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。所以在这个意义上说,博弃论又称为“对策论”.(张维迎)绪论-什么是博弈论从博弈过程角度定义:博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的约束条件下,依靠所掌握的信息,同时或先后、一次或多次、从各自可能的行为或策略集合中进行选择并实施,各自从中取得相应结果或收益的过程。绪论-什么是博弈论Whatisagame?AGamehasthefollowingfourthings:–Theplayers:Whoisinvolved?Definingsociety/system.–Therules:Whatcantheydo?Defininginteractionspossibleinthesociety.–Theoutcomes:Whatistheresultoftheinteraction?–Thepayoffs:Whatisthepayoff/profitofeachpossibleoutcomes?绪论-什么是博弈论示例:猜硬币游戏–Theplayers:2players,{1;2}.–Therules:Bothplayerstosstheirrespectivecoinssimultaneously.–Outcome:Coinsmatch(bothheadsuportailsup)ordon'tmatch.–Payoff:Ifcoinsmatch,player1pays$1toplayer2andiftheydon'tmatchthenplayer2pays$1toplayer1.绪论-什么是博弈论Thereareatleasttwoplayers.Aplayermaybeanindividual,acompany,anation,abiologicalspecies,nature,etc.Eachplayerhasanumberofpossiblestrategies,thatiscoursesofactiontheycanfollow.Thestrategiestheplayersfollowdeterminetheoutcomeofthegame.Associatedwitheachoutcomeisapayoff(支付)toeachplayeri.e.thevalueoftheoutcometoeachplayer.示例:囚徒困境(Prisoner’sDilemma)如果都不坦白,每人判1年如果都坦白,每人判8年如果一人坦白,一人不坦白,则坦白的人释放、不坦白的人判9年。绪论-什么是博弈论绪论-什么是博弈论一场博弈包括–参与人(players)(例如囚犯A和B);–每个参与人的一组策略(例如“坦白”和”不坦白”);–支付(payoffs):参与人在所选策略(策略组合,thestrategyprofile)上的效用例如如果A坦白,而B不坦白,A得0,B得-9绪论-什么是博弈论得益矩阵-8,-80,-9-9,0-1,-1坦白不坦白坦白不坦白行参与者列参与者每位参与者得策略行参与者支付列参与者支付针对每位参与者、每个可能结果的支付绪论-几个典型模型囚徒困境描述如前,分析:对囚徒1来说,假设囚徒2选择不坦白,则对囚徒1来说,不坦白的得益为-1,坦白的得益为0,他应选择坦白;假设囚徒2选择坦白,则对囚徒1来说,不坦白的得益为-9,坦白的得益为-8,他还是应选择坦白。坦白是囚徒1的一个占优的“上策”(DominantStrategy)。同样,囚徒2的“上策”也应是坦白。最终结果两方坦白。但对两个囚徒来说,最佳结果应该均为不坦白,既没有实现两人总体的最大利益,也没有真正实现自身个体的最大利益。-8,-80,-9-9,0-1,-1坦白不坦白坦白不坦白绪论-几个典型模型80,8020,130130,2060,60寡头竞价模型高价低价高价低价分析:假设寡头2采用高价策略,那么寡头1采用高价策略得益80,采用低价策略得益130,显然它应采用低价策略,假设寡头2采用低价策略,那么寡头1采用高价策略得益20,采用低价策略得益60,它也应采用低价策略。用同样方法可得寡头2也应采用低价策略。低价-低价对双方不是理想的结果,但因为双方均无法信任,所以均坚持采用低价策略。绪论-几个典型模型猜硬币游戏-1,11,-11,-1-1,1正面反面正面反面猜方盖方分析:在本博弈中,双方的利益是严格对立的,取胜的关键是不能让另一方猜到自己的策略而同时自己又要尽可能猜出对方的策略。在一次博弈中结果取决于机会,在多次重复中,如果双方决策都正确,则我们可求得平均的双方收益。彼此得益相同。绪论-博弈基本要素参与人players又称“局中人”或”博弈方”,是指博弈中独立决策、独立承担后果、以自身利益最大化来选择行动的决策主体(可以是个人、也可以是团队,如厂商、政府、国家)。每个参与人必须有可供选择的行动和一个很好定义的偏好函数。不做决策的被动主体只能被当作环境参数。博弈主体的完全理性(PerfectRationality)和有限理性,个体理性和集体理性。绪论-博弈基本要素虚拟参与人pseudo-player为了分析方便,自然nature被当作虚拟参与人。自然代表决定外生随机变量的概率分布的机制。比如房地产开发中市场需求的大小。绪论-博弈基本要素战略strategies参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。战略与行动:战略是行动的规则而不是行动本身。在静态博弈中,战略和行动是相同的。战略必须是完备的,要给出参与人在每一种可想象得到的情况下的行动选择。绪论-博弈基本要素行动ActionorMoves指参与人所有可能的策略或行动的集合,如消费效用最大化决策中的各种商品的购买量。根据该集合是有限的还是无限的,可分为有限博弈和无限博弈。参与人在博弈的某个时点的决策变量。{坦白,抵赖}N个参与人的行动的有序集称为行动组合。例如:(坦白,抵赖)。绪论-博弈基本要素行动的顺序(sequenceorder)指参与人作出策略选择的先后顺序,决策的顺序。对于博弈的结果非常重要。有关静态和动态博弈的区分就是基于行动的顺序做出的。同样的行动集合,行动的顺序不同,每个参与人的最优决策就不同,博弈的结果也不同。尤其在不完全信息博弈中,后行动者依赖观察先行动者的行动来获取信息。绪论-博弈基本要素信息information指参