博弈论任课教师:南京航空航天大学经管学院李帮义教授博弈论与信息经济学——第一章完全信息静态博弈博弈论的基本概念博弈论的基本概念包括参与人、行动、信息、战略、支付(效用)、结果和均衡。其中,参与人、战略和支付是描述一个博弈所需要的最少的要素。1.参与人:参与人指的是一个博弈中的决策主体,它的目的是通过选择行动(或战略)以最大化自己的支付(效用)水平。自然(N)——虚拟参与人:决定外生的随机变量的概率分布的机制。博弈论的基本概念2.行动:参与人在博弈的某个时点的决策变量。ai—第i个参与人的一个特定行动Ai={ai}—可供i选择的所有行动的集合a=(a1,…,ai,…,an)—行动组合3.信息:参与人有关博弈的知识,特别是有关“自然”的选择,其他参与人的特征和行动的知识。完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。完全信息:指自然不首先行动或自然地初始行动被所有参与人准确观察到的情况,即没有事前的不确定性。博弈论的基本概念4.战略:参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。si—第i个参与人的一个特定战略Si={si}—第i个参与人的所有可选择的战略集合s=(s1,…,si,…,sn)—战略组合战略与行动是两种不同的概念,战略是行动的规则而不是行动本身。例:人不犯我,我不犯人;人若犯我,我必犯人。——战略犯、不犯——行动特例:在静态博弈中,战略和行动是相同的。博弈论的基本概念5.支付:指在一个特定的战略组合下参与人得到的确定效用水平;或指参与人得到的期望效用水平。ui—第i个参与人的支付(效用水平)u=(u1,…,ui,…,un)为n个参与人的支付组合博弈的一个基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择。ui是所有参与人的战略选择的函数:ui=ui(s1,…,si,…,sn)6.结果博弈论的基本概念7.均衡:所有参与人的最优战略的组合。si*=(s1*,…,si*,…,sn*)si*—第i个参与人在均衡情况下的最优战略,是i的所有可能的战略中使ui或Eui最大化的战略。为了把一个特定的参与人与其他参与人相区别,用s-i=(si,…,si-1,si+1,…,sn)表示除i之外的所有参与人的战略组成的向量。si*是给定s-i情况下第i个参与人的最优战略,意味着ui(si*,s-i)≥ui(si’,s-i)战略表达式战略表达式(标准式表达):所有参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。战略式表达给出:博弈的参与人集合:i∈Γ,Γ=(1,2,…,n)每个参与人的战略空间:Si,i=1,2,…,n每个参与人的支付函数:ui(s1,…,si,…,sn),i=1,2,…,nG={S1,…,Sn;u1,…,un}—战略式表达博弈有限博弈:1.参与人的个数是有限的;2.每个参与人可选择的战略是有限的。完全信息静态博弈完全信息:每个参与人对所有其他参与人的特征(包括战略空间、支付函数等)有完全的了解。静态:指所有参与人同时选择行动且只选择一次。完全信息静态博弈纳什均衡重复剔除劣战略占优战略均衡占优战略均衡、重复剔除的占优均衡及纳什均衡的关系纳什均衡举例混合战略纳什均衡占优战略均衡占优战略:一个参与人的最优战略并不依赖于其他参与人的战略选择,也就是说,不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”。例:囚徒困境“囚徒困境”:两个嫌疑犯作案后被警察抓住,被分别关在不同的房间里受审讯。警察知道两人有罪,但缺乏足够的证据定罪,除非两人当中至少有一个人坦白。警察告诉每个人:如果两人都不承认,每个人都以轻微的犯罪判刑1年;如果两人都坦白,各判刑8年;如果两人中一个人坦白另一个人抵赖,坦白的释放出去,抵赖的判刑10年。占优战略均衡囚犯B坦白抵赖坦白囚犯A抵赖在这个博弈中,每个囚徒都有两种可选择的战略:坦白或抵赖。对于囚犯A:坦白—-8,0对于A,坦白总比抵赖好抵赖—-10,-1同理B所以,不论同伙选择什么战略,每个囚徒的占优战略是“坦白”。-8,-80,-10-10,0-1,-1占优战略均衡一般地,si*称为参与人i的(严格)占优战略,如果对应所有的s-i,si*是i的严格最优选择,即ui(si*,s-i)ui(si’,s-i)。占优战略均衡的定义:在博弈的战略式表达中,如果对于所有的i,si*是i的占优战略,那么,战略组合s*=(s1*,…,sn*)称为占优战略均衡。完全信息静态博弈纳什均衡重复剔除劣战略占优战略均衡占优战略均衡、重复剔除的占优均衡及纳什均衡的关系纳什均衡举例混合战略纳什均衡重复剔除劣战略例:智猪博弈“智猪博弈”,猪圈里圈着两头猪,一头大猪,一头小猪,猪圈的一头有一个猪食槽,另一头安装着一个按钮,控制着猪食的供应。按一下按钮,8个单位的猪食进槽,但需要支出2个单位的成本。若大猪先到,大猪吃到7个单位,小猪只能吃到1个单位;若小猪先到,大猪和小猪各吃到4个单位;若两猪同时到,大猪吃到5个单位,小猪吃到3个单位。重复剔除劣战略小猪按等待按大猪等待在这个支付矩阵中,每头猪都有两种可选择的战略:按或等待。对于小猪:按—1,-1对于小猪,“等待”是占优战略。等待—4,0对于大猪:按—3,2没有占优战略。等待—7,03,12,47,-10,0重复剔除劣战略重复剔除劣战略:首先找出某个参与人的劣战略,把这个劣战略剔除掉,重新构造一个不包含已剔除战略的新的博弈;然后再剔除这个新的博弈中的某个参与人的劣战略;继续这个过程,一直到只剩下一个唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解。“智猪博弈”,首先剔除小猪的劣战略“按”,则小猪在新博弈中只有“等待”战略,大猪仍有两个战略。但“等待”已显然为大猪的劣战略,剔除,剩下的唯一战略组合(按,等待)为均衡解。重复剔除劣战略均衡结果是否与劣战略的剔除顺序有关?1.如果每次剔除的是严格劣战略,均衡结果与剔除的顺序无关。2.如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。例:参与人BC1C2C3R1参与人AR2R32,121,101,120,120,100,110,120,100,13完全信息静态博弈纳什均衡重复剔除劣战略占优战略均衡占优战略均衡、重复剔除的占优均衡及纳什均衡的关系纳什均衡举例混合战略纳什均衡纳什均衡纳什均衡的定义:有n个参与人的战略式表达博弈G={S1,…,Sn;u1,…,un},战略组合s*=(s1*,…,si*,…,sn*)是一个纳什均衡,如果对于每一个i,si*是给定其他参与人选择s-i*=(s1*,…,si-1*,si+1*,…,sn*)的情况下第i个参与人的最优战略,即ui(si*,s-i*)≥ui(si,s-i*)。如何寻找纳什均衡:首先考虑A的战略,对于每一个B的给定的战略,找出A的最优战略,在其对应的支付下划一横杠,然后再用类似的方法找出B的最优战略。在完成这个过程后,如果某个支付格的两个数字下都有杠,这个数字格对应的战略组合就是一个纳什均衡。完全信息静态博弈纳什均衡重复剔除劣战略占优战略均衡占优战略均衡、重复剔除的占优均衡及纳什均衡的关系纳什均衡举例混合战略纳什均衡占优战略均衡、重复剔除的占优均衡及纳什均衡的关系1.每一个占优战略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优均衡。2.纳什均衡一定是在重复剔除严格劣战略过程中没有被剔除掉的战略组合,但没有被剔除的战略组合不一定是纳什均衡,除非它是唯一的。完全信息静态博弈纳什均衡重复剔除劣战略占优战略均衡占优战略均衡、重复剔除的占优均衡及纳什均衡的关系纳什均衡举例混合战略纳什均衡纳什均衡举例1.Cournot寡头竞争模型:一个市场中存在两个企业令P=a-(q1+q2),a0,成本为c企业1:企业2:1212111111})({),(},0:{,0qcqqaqqqqSq2212122222})({),(},0:{,0qcqqaqqqqSq011q022q)(21)(*221qcaqq)(21)(*112qcaqq)(31**21caqq221)(91**ca纳什均衡举例1.Cournot寡头竞争模型:若市场上只有一家企业,则:企业:竞争使供给上升竞争使利润下降寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。qcqaqq)()(,0**)(21*021qqcaqq**)(41*212ca纳什均衡举例练习:P1,P2竞争,C=0q1,q2竞争,C=0p,q竞争,C=0纳什均衡举例pqpq企业j企业i22)2(1,)2(1rr222222)432(,)43()2)(1)(1(rrrrrrr222222)43()2)(1)(1(,)432(rrrrrrr)1()2(1,)1()2(122rrrrrr通过比较可得,为占优战略。qqqq21,纳什均衡举例2.Hotelling价格竞争模型在豪泰林模型中,产品在物质性能上是相同的,但在空间位置上有差异。假定有一个长度为1的线性城市,消费者均匀地分布在[0,1]区间里,分布密度为1。假定有两个商店,分别位于城市的两端,商店1在x=0,商店2在x=1,出售物质性能相同的产品。每个商店提供单位产品的成本为c,消费者购买商品的旅行成本与离商店的距离成比例,单位距离的成本为t。商店1顾客商店2CP1CP2xx1纳什均衡举例2.Hotelling价格竞争模型顾客的成本:ttPPxxtPtxP2~)1(1221商店1的市场分布:ttPPD2121商店2的市场分布:ttPPD2212利润函数:0202)()(1211121111PtCPPttPPCPDCP0202)()(2122212222PtCPPttPPCPDCP22121ttCPP纳什均衡举例2.Hotelling价格竞争模型推广至一般情况:商店1顾客商店20ab11axxb1顾客的成本:21)1(2~)1()(122221abbattPPxxbtPaxtP商店1的市场分布:)1(221121batPPbaaD商店2的市场分布:)1(221212batPPbabD纳什均衡举例2.Hotelling价格竞争模型利润函数:)31)(1(0)(222222babatCPPDCP)31)(1(0)(111111babatCPPDCP纳什均衡举例3.公共地的悲剧考虑一个有n个农民的村庄共同拥有一片草地,每个农民都有在草地上放牧的自由。每年春天,每个农民要决定自己养多少只羊。用0ig代表第i个农民饲养的数量;niigG1代表n个农民饲养的总数量;v代表每只羊的平均价值假设)(Gvv,因为每只羊至少要一定数量的草才不至于饿死,由于各最大可存活的数量Gmax:0)(,;0)(,maxmaxGvGGGvGG当草地上的羊很少时,增加一只也许不会对其它羊的价值有太大的不利影响,但随着饲养量的不断增加,每只羊的价值会急剧下降。纳什均衡举例3.公共地的悲剧因此,假定0,022GvGv利润函数:0)(')()(),...,,...,(cGvgGvgcgGvggggiiiiiniii说明增加一只羊有正负两方面的效应,正的效应是这只羊本身的价值v,负的效应是这只羊使所有之前的羊的价值下降。00)('')('0)('