博弈论和竞争策略将要讨论的问题博弈和决策占优策略纳什均衡的回顾重复博弈将要讨论的问题序列博弈威胁、承诺和可信性阻止进入讨价还价策略拍卖单人优化问题:在给定的环境下或条件下,个人如何做才可以取得最好的结果比如,消费者均衡问题,生产均衡问题多人优化问题:多个人的决策相互依赖,必须考虑其他人的反应。也称博弈问题。比如,下棋打牌,核军备竞赛,美伊战争,广告战,价格战博弈论博弈论(GameTheory)又名对策论,游戏论:研究在多个决策者策略相互依赖、相互作用的条件下的最优化问题的学科。是研究理性的决策者之间冲突及合作的学科。应用:被广泛地应用于政治、外交、军事、经济的研究领域博弈论博弈的三个要素博弈参加者。博弈论分析假定参与者都是理性的。行动或策略空间。博弈论参与者必须知道他自己及其对手伙伴的策略选择范围。决策行为结果。博弈论用数字表示这类结果,并称之为支付(Payoff)。博弈的分类同时博弈(静态博弈)和顺序博弈(动态博弈)一次性博弈和重复博弈合作博弈和非合作博弈零和博弈和非零和博弈完全信息博弈和不完全信息博弈完美信息和不完美信息博弈博弈和决策“如果我相信我的竞争对手是理性的和追求利润最大化的,在我自己作出利润最大化决策时,我应当怎样考虑他们的行为?”博弈和决策非合作博弈与合作博弈合作博弈各博弈方可以谈定能使他们设计联合策略的有约束力的合同,该博弈就是合作的例子:卖方和买方就一个产品或一种服务讨价还价,或两个厂商建立合资企业(比如,Microsoft和Apple)两个厂商签订一份分配联合利润的有约束力的合同是可能的博弈和决策非合作博弈与合作博弈非合作博弈签订有约束力的合同是不可能的博弈方个各自作出其最佳的决策博弈和决策非合作博弈与合作博弈“策略设计基于你对竞争对手的观点的理解,并且(假设你的对手的理性的)推导出对手对你的行动的可能的反应”占优策略占优策略(DominantStrategy)无论对手如何选择都是最好的例子A和B销售竞争的产品他们正在决定是否做广告广告博弈的支付矩阵厂商A做广告不做广告广告做广告不做广告厂商B10,515,010,26,8广告博弈的支付矩阵厂商A厂商B10,515,010,26,8观察A:不论B怎样决策,做广告总是最好的B:不论A怎样决策,做广告总是最好的做广告做广告不做广告广告不做广告广告广告博弈的支付矩阵厂商A做广告不做广告做广告不做广告厂商B10,515,010,26,8观察A和B的占优策略都是“做广告”不用担心其他博弈方的选择(做广告,做广告)是占优策略均衡占优策略并非每个博弈都有占优策略此时,一个博弈方的最优策略依赖于其他博弈方的选择10,515,020,26,8厂商A做广告不做广告做广告不做广告厂商B修改过的广告博弈10,515,020,26,8厂商A做广告不做广告做广告不做广告厂商B修改过的广告博弈观察A:不存在占优策略,选择依赖于B的选择B:做广告问题A应该如何选择?(提示:考虑B的选择)纳什均衡的回顾占优策略“我所做的是不管你做什么我所能做的最好的”“你所做的是不管我做什么你所能做的最好的”纳什均衡的回顾纳什均衡“我所做的是给定你所做的我所能做到的最好的”“你所做的是给定我所做的你所能做到的最好的”多个纳什均衡的例子两个麦片公司面临两个市场:只能容纳一个公司的脆麦片市场只能容纳一个公司的甜麦片市场每个厂商只有推出一种产品的资源非合作纳什均衡的回顾产品选择问题产品选择问题厂商1脆甜脆甜厂商2-5,-510,10-5,-510,10产品选择问题厂商1脆甜脆甜厂商2-5,-510,10-5,-510,10问题存在纳什均衡吗?如果不存在,为什么?如果存在,该纳什均衡如何达到?位置博弈问题两个卖软饮料的竞争者Y和C200米长的海滩晒太阳的人均匀地分布在海滩上Y的价格=C的价格顾客总是就近购买位置博弈竞争者应该选址在何处(何处是纳什均衡)?Ocean0BBeachA200米C位置博弈2)类似的例子还有:加油站的选址顾客的口味总统选举Ocean0BBeachA200米C讨论题在一条长街的两边住着许多居民(假定均匀分布),现拟建设一个大型商场。从方便居民生活出发,商场应该建在什么地方?从商场经营者的利益出发,又应建在什么地方?若预测到商场建成后可获巨额利润,引起另一竞争者进入,那么从方便居民生活出发,两个商场应该分别建在什么地方?从两个商场经营者各自的利益出发,又应建在什么地方?从商场利益出发,均衡解是大家都位于中点如果不是这样,任何一个商场向对方移动都会使得其顾客增加,从而使得收入增加。只有都位于中点,才是均衡。也就是说,此时,任何一方的移开都会使自己的收入减少。从顾客利益出发,最优解在1/4处和3/4处假设街的长度是1。两个商场的位置分别在a和b(ab)。假设顾客走单位路程的成本是1。X处的顾客到商店的最短距离是R(x):(0,)(,)2()(,)2(,1)axxaabxaxaRxabbxxbxbxb总费用求解最小值问题:a=1/4,b=3/41220()0.750.750.50.5CRxdxababb22min0.750.750.50.5Cababb极大极小策略(MaximinStrategy)极大极小策略(MaximinStrategies)问题两个销售文件加密软件的相互竞争的厂商他们都采用相同的加密标准(用一种软件加密后可以用另一种软件解密——对顾客有好处)极大极小策略(MaximinStrategy)极大极小策略问题厂商1的市场份额比厂商2大许多双方都在考虑投资一个新的加密标准极大极小策略(MaximinStrategy)厂商1不投资投资厂商20,0-10,1020,10-100,0不投资投资极大极小策略厂商1不投资投资厂商20,0-10,1020,10-100,0不投资投资观察厂商2的占优策略:投资纳什均衡厂商1:投资厂商2:投资极大极小策略厂商1不投资投资厂商20,0-10,1020,10-100,0不投资投资观察如果厂商2不投资,厂商1会招致显著的损失厂商1也许会选择不投资使损失极小化(为10)——极大极小策略如果双方是理性的和完全信息的两个厂商都会投资纳什均衡纳什均衡的回顾极大极小策略考虑如果博弈方2是非理性的或者不完全信息的厂商1的极大极小策略是不投资厂商2的极大极小策略是投资如果1知道2采用极大极小策略,1将会投资纳什均衡的回顾极大极小策略囚徒困境囚徒A坦白不坦白坦白不坦白囚徒B-5,-5-1,-10-2,-2-10,-1囚徒困境囚徒A坦白不坦白坦白不坦白囚徒B-5,-5-1,-10-2,-2-10,-1求:占优策略纳什均衡极大极小解纯策略博弈方做确定的选择混合策略博弈方基于特定的概率在两个或多个可能的行动中做随机的选择纳什均衡的回顾混合策略对硬币博弈方A正面反面正面反面博弈方B1,-1-1,11,-1-1,1对硬币博弈方A正面反面正面反面博弈方B1,-1-1,11,-1-1,1观察纯策略:不存在纯策略纳什均衡混合策略:随机选择成为纳什均衡厂商会基于随机选择假设来定价吗?性别战吉姆摔跤歌剧摔跤歌剧琼2,10,01,20,0性别战吉姆摔跤歌剧摔跤歌剧琼2,10,01,20,0纯策略都去看摔跤都去看歌剧混合策略吉姆以2/3的概率选择摔跤琼以1/3的概率选择摔跤投标和拍卖竞争性的定价方式拍卖的形式公开喊价拍卖英式(攀高)拍卖拍卖人低价起拍,向竞价者一次次提高征求价格,直到只有一个投标人。荷式(递减)拍卖拍卖人高价起拍,向竞价者一次次减低征求价格,直到有人举手应拍拍卖的形式密封投标:每个竞价者把竞价密封交给卖者第一价格密封投标出价最高的投标人获胜,并以此价成交第二价格密封投标出价最高的投标人获胜,但以第二最高价成交投标者的投标是根据对标的的估价拍卖估价私人估价PrivateValuationauction(PV)每一个竞价者都有其个人估价的角度和信息不同的人有不同的估价(即使信息相同)公共估价CommonValueauctions(CV)每个竞价者具有不同的估价信息,但实际上拍卖品对所有人的价值(转卖价值)是一样的私人估价竞价者有着不同的保留价格每个竞价着必须选择合适的策略英式拍卖选择停止竞价的价格荷式拍卖选择预期的竞价价格私人估价问题:各种拍卖有什么差别?对拍卖者收入有何影响?对投标者预期效用有何影响?私人估价例:两个竞价者,有不同的保留价格,最高价成交.低报竞价是上策.0,-2-2,0-2,00,-20,00,00,-20,00,2竞价A(v=9)11971086竞价B(v=8)私人估价例:两个竞价者,有不同的保留价格,第二最高价成交.诚实竞价是上策.0,-1-1,01,00,10,11,00,30,30,3竞价A(v=9)11971086竞价B(v=8)重复博弈(RepeatedGames)囚徒困境是静态的,均衡是个体理性的,并非最有效的解很多情况下,寡头厂商是在进行重复博弈。在囚徒困境的不断重复中,厂商可以建立起他们行为的声誉,并研究竞争对手的行为因此,在重复博弈中,惩罚成为可能,在惩罚的作用下,博弈的各方可能会考虑长远利益,采用合作解(团体理性解,或卡特尔解)定价问题厂商1低价高价低价高价厂商210,10100,-5050,50-50,100定价问题厂商1低价高价低价高价厂商210,10100,-5050,50-50,100非重复博弈策略是(低价,低价)重复博弈一项模拟试验表明,以牙还牙策略(Tit-for-tat)是盈利性最好的策略重复博弈结论:在重复博弈中利用以牙还牙策略,重复囚徒困境博弈能形成合作解这种情况最可能出现在:厂商较少稳定的需求稳定的成本合作是困难的,因为在长期中,这些因素可能是变化的战略低价格高价格低价格高价格0,050,-10-10,5010,10寡头厂商1寡头厂商2例子:触发策略无限重复博弈:一次一次无止境地行动,参与人从每次行动中得到收益;存在货币的时间价值问题;采用“触发战略”有助于形成共谋。无限重复博弈:一般地,利率低时,厂商会发现共谋索取高价可获最大利润。若1欺骗,其利润的现值为PV1·欺骗=50+0+0+……若1不欺骗,每期收益为10,合作的现值为12310101010(1)10...1(1)(1)iPViiii合作如果欺骗所得的现值小于合作所得的现值,就不会欺骗。1.1.10(1)50iPVPVi欺骗合作即若i=1/4,利率低于25%,欺骗的损失大于收益,1不会欺骗。水表行业中的寡头合作市场的特征四个厂商:罗克韦尔国际(35%),巴吉尔表业,耐普顿水表公司和赫希产品(后三家总共有50~55%的份额)水表行业中的寡头合作市场的特征相当没有弹性的需求支出预算中的一个很小的比例,顾客只关心水表的准确定和可靠性市场的特征稳定的需求顾客和厂商的长期关系进入障碍规模经济进入障碍水表行业中的寡头合作市场的特征这是一个囚徒困境合作定价都可获得可观的利润都试图通过降价扩大份额,利润会下降到接近完全竞争的水平重复博弈问题为什么出现长期合作的局面?水表行业中的寡头合作序列博弈(SequentialGames)博弈方依次行动博弈方必须考虑可能的行动和其他博弈方的理性反应序列博弈例子对竞争者广告策略的反应进入决策对管制政策的反应问题两种麦片:(甜,脆)一个厂商生产一种麦片才会成功甜麦片卖得更好如果一个厂商生产一种麦片还是有利可图的序列博弈博弈的扩展形修正过的产品选择问题厂商1脆甜脆甜厂商2-5,-510,20-5,-520,10修正过的产品选择问题厂商1脆甜脆甜厂商2-5,-