博弈论的基本要素

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1上一讲内容回顾博弈论用处(解释、预测和提出建议)猜数游戏----博弈关注的(interdependence)博弈论发展简史囚徒困境智猪博弈商业中心区(CBD)的形成动态博弈与承诺行动信息不对称(二手车市场)混合策略机制设计(定价策略、制度设计等)2通俗理解博弈论博弈论是有关取舍策略的科学,它的方程式告诉你在与人接触中怎样得到最大的好处。博弈论刚开始运用到经济领域,现在几乎在哪个科学领域都能看到它的身影,尤其是那些涉及到人性与人的行为的科学。34上述问题都有如下共同点都有若干决策者,我们称之为参与人(players)N-人博弈问题的决策者集合,习惯上也用N表示针对具体问题,参与人可以是个人一个政府公司的整个董事会博弈的基本要素567对参与人的理解博弈中的决策者。每个参与人的目标是选择一个期望最大化的策略,要求博弈的决策主体具有行为选择能力,并且对博弈结果负责的能力,否则不是参与人。众所周知的田忌赛马博弈,参与人是田忌和齐威王,孙膑仅仅是一个策略分析者。孙膑并不是决策者,因而不是参与人.虚拟参与人,又称为自然(nature)。自然在博弈的一些特定点按照给定的概率随机选择行动。虚拟参与人与正常的参与人之间在概念上的差异是:参与人有预先设定的效用函数,而虚拟的参与人对于给定的结局,不存在任何效用感受。8博弈论对参与人做两个基本假设1理性的(rational)?1—如果一个决策者在追逐其目标时能前后一致地做决策,就称他为rational。RogerB·Myerson(P2)2—广义而言指的是一种行为方式,他同在给定条件或约束下最有效地实现预期目标相关。具体地讲,理性含义如下:9(1)存在一组可供选择的备选或替代方案;(2)每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度;(3)人们总是选择那个能够带来最大预期净收益的方案。(西蒙,1964)博弈论对参与人做两个基本假设102智能的(intelligent)?当我们像博弈论专家那样分析一个博弈时,如果参与人知道我们对此博弈所知道的一切,并能做出我们对此博弈所能做出的一切推断,我们就说此博弈的参与人是智能的。RogerB·Myerson(P3)博弈论对参与人做两个基本假设11参与人都存在若干策略(strategies)或行动(actions)参与人i的策略用si表示,参与人i的所有策略构成的集合称为策略集,记为Si,si∈Si注意行动与策略的区别博弈的基本要素121314支付(收益、效用)(payoff)各参与人对所有参与人不同策略组合(strategyprofile),构成了博弈的一个局势。记为s参与人i(i∈N)对局势s有一个主观的偏好,可用一个函数表示这种偏好,这个偏好函数称为参与人i的支付博弈的基本要素1516参与人、各参与人的策略集、各参与人的支付函数,是博弈最重要的基本要素。博弈的基本要素171:博弈的基本特征是一个参与人的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选择;是策略组合的函数。2:效用是参与人真正关心的东西,参与人在博弈中的目标就是选择自己的策略以最大化自己的效用函数。1819202122Anitemofinformationinagameiscommonknowledgeifalloftheplayersknowitandalloftheplayersknowthatallotherplayersknowitandallotherplayersknowthatallotherplayersknowthatallotherplayersknowit,andsoon.Thisismuchmorethansimplysayingthatsomethingisknownbyall,butalsoimpliesthatthefactthatitisknownisalsoknownbyall,etc.23Considerasimpleexampleoftwoalliedarmiessituatedonoppositehilltopswaitingtoattacktheirfoe.Neithercommanderwillattackunlessheissurethattheotherwillattackatexactlythesametime.ThefirstcommandersendsamessengertotheotherhilltopwiththemessageIplantoattackinthemorning.Themessenger'sjourneyisperilousandhemaydieonthewaytodeliveringthemessage.24Ifhegetstotheotherhilltopandinformstheothercommander-canwebecertainthatbothwillattackinthemorning?Notethatbothcommandersnowknowthemessage,butthefirstcannotbesurethatthesecondgotthemessage.Thus,commonknowledgeimpliesnotonlythatbothknowsomepieceofinformation,butcanalsobeabsolutelyconfidentthattherestknowit,andthattherestknowthatweknowit,andsoon.25共同知识趣题有一群人围坐在一起,假定只有4个人,每人头上带着戴着一顶帽子,颜色为黑色和白色,每个人看不到自己头上帽子的颜色,但能看到别人帽子的颜色.为了分析的方便,我们假定这四个人均戴的是黑色帽子。这时候,一个局外人来到他们集体当中,对他们说:“你们其中至少一个头戴的是黑色帽子。”当他说完这句话后,他问:“你们知道你们头上的帽子颜色吗?”4个人都说不知道。这个局外人第二次问道:“你们知道你们头上帽子的颜色吗?”4个人又都说不知道。局外人第三次问:“你们知道你们头上帽子的颜色吗?”4个人又说不知道。局外人第四次问道:“你们知道你们头上帽子的颜色吗?”这时4个人均说知道了。你能知道这是为什么吗?26博弈概念的理解OPEC成员国选择其年产量;两家制造商,一家做螺钉,一一家做螺帽,决定是采用美制标准还是公制标准;公司董事会为其总经理设立一项期股安排;一家电力公司在估计了未来10年对电力的需求后,决定是否购置一套新的发电机组;明天出去玩,决定是否带伞;诸葛亮和司马懿进行的空城计;27DefinitionofaGameMustconsiderthestrategicenvironmentWhoarethePLAYERS?(Decisionmakers)WhatSTRATEGIESareavailable?(Feasibleactions)WhatarethePAYOFFS?(Objectives)RulesofthegameWhatisthetime-framefordecisions?Whatisthenatureoftheconflict?Whatisthenatureofinteraction?Whatinformationisavailable?2829303132课程主要内容完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈33完全信息静态博弈概念概念:各参与人对彼此的策略集、支付函数有准确了解博弈行为同时进行一些实例石头、剪子、布游戏彼此了解的两个厂商的价格战34完全信息静态博弈概念有些实际博弈虽然决策不是在绝对时间意义上的“同时”,但决策的时间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。如不同竞标单位作出的工程投标决策35博弈的策略式表述常用G表示一个博弈博弈模型的两种表示形式策略式表述(Strategicform),扩展式表述(Extensiveform)本章主要介绍博弈的策略式表述36博弈的策略式表述参与人集合N人博弈的参与人集合,往往也记为N。参与人则记为i,i∈N参与人i的策略集,记为Si,其中的一个特定策略,可记为si.有si∈Si.37对于给定的参与人i,i=1,2,…N,卡氏积S1×S2…×Si-1×Si+1…×Sn表示除了参与人i外所有参与人所有策略的可能组合,通常记为S-i;于是所有参与人不同策略组合构成的策略空间可表示为S=(Si,S-i)博弈的策略式表述38Si中的元素si表示参与人i的一个具体策略一旦确定了所有参与人的策略,便形成了一个博弈局势,表示为s=(s1,s2,…sN),s∈S。博弈的策略式表述39参与人i的效用函数参与人i的支付函数,是从博弈局势集S=S1×S2…×SN到实数集R的一个映射,记为ui(s1,s2,…sN),表示参与人i对局势s=(s1,s2,…sn)的偏好。一个博弈可以表示为G={S1,…,SN;u1,…,uN,i∈N}这就是博弈的策略式表述博弈的策略式表述40博弈的策略式表述例写出囚徒问题的策略式表述参与人集合N={囚徒1,囚徒2}参与人的策略集S1=S2={坦白,不坦白}各参与人的支付,可用图1-1表示。坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)图1-1囚徒问题的支付矩阵囚徒1囚徒241博弈的策略式表述实质上,图1-1已经完全表述了囚徒困境的策略式表述信息称图1-1为二人有限博弈的双矩阵(bimatrix)表述坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)图1-1囚徒问题的支付矩阵囚徒1囚徒242占优均衡英文术语:Dominant-strategyEquilibrium定义:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。43占优策略对于所有的s-i,si*称为参与人i的严格占优战略,如果满足:ui(si*,s-i)ui(si',s-i)s-i,si'si*44占优均衡占优均衡定义一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。45占优均衡占优战略均衡:每个参与人的占优战略组合(如果存在的话)被称为占优战略均衡。坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)图1-2囚徒问题的支付矩阵囚徒1囚徒246占优均衡以囚徒1为例,无论囚徒2采取什么策略…坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)图1-2囚徒问题的支付矩阵囚徒1囚徒247占优均衡坦白总是占优策略图1-2囚徒问题的支付矩阵囚徒1囚徒2坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)48占优均衡由于矩阵的对称性,对囚徒2来说亦可得出类似结论坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)图1-2囚徒问题的支付矩阵囚徒1囚徒249占优均衡因此,该博弈的策略组合(坦白、坦白)是占优均衡。图1-2囚徒问题的支付矩阵囚徒1囚徒2坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)50占优均衡但该占优均衡的收益,却劣于另外一个策略组合(不坦白,不坦白)。坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)图1-2囚徒问题的支付矩阵囚徒1囚徒2成绩博弈,分析占优策略和占优均衡5152重复剔除严劣策略均衡前面介绍了第一均衡概念——占优均衡(显然)并非所有博弈都存在占优均衡,如石头、剪子、布游戏对占优均衡概念稍加扩展,就得到重复剔除严劣策略均衡概念选举实例中间选民

1 / 66
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功