博弈论第一二章

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

博弈论2010-2011学年《博弈论》姚国庆,南开大学出版社,2003版;《经济博弈论》谢识予,复旦大学出版社1997版;《博弈论教程》(加拿大)奥斯本,(美)鲁宾斯坦,魏玉根译,中国社会科学出版社,2000版;《博弈论教程:理论、应用》黄涛,首都经济贸易大学出版社,2004版;《博弈论》施锡铨,上海财经大学出版社,2000版第一章导论什么是“博弈论”博弈论革命博弈论要点课程结构安排第一节什么是博弈论一、什么是“博弈”“博”“弈”二、几个例子1.石头、剪刀、布游戏规则:双方必须同时出招,谁后出算谁输;石头胜剪刀,剪刀胜布,布胜石头;如果一样,不输不赢,重新再来一次。从这个游戏我们可以看出,孙悟空采取什么策略,关键取决于猪八戒的策略;而猪八戒采取什么策略反过来又取决于孙悟空的策略。对这种情况的正规表述是:孙悟空和猪八戒的策略具有相互依存性。引入策略函数的概念,设fs孙悟空的策略函数,fz为猪八戒的策略函数。a11表示孙悟空的策略——石头;a12表示孙悟空的策略——剪刀;a13表示孙悟空的策略——布;a21表示猪八戒的策略——石头;a21表示猪八戒的策略——剪刀;a21表示猪八戒的策略——布;(这里默认a的第一个下标表示第几个参与者,1表示孙悟空,2表示猪八戒;a的第二个下标表示第几个策略,1表示石头,2表示剪刀,3表示布)2、诺曼底登陆3、囚徒的困境——经典案例三、博弈的正式定义博弈是指决策主体(个人、企业、集团、政党、国家等)在相互对抗中,对抗双方(或多方)相互依存的一系列策略和行动的过程集合。在这个定义中要注意以下几点:1.博弈中参与者各自追求的利益具有冲突性2.博弈是一个过程集合:人们在对抗过程中有关的所有方面的集合3.博弈一个本质特征就是策略的相互依存性四、博弈论的含义博弈论是专门研究博弈如何出现均衡的规律的学科。博弈论体现的是一种经济学思想,不过这中思想不仅仅局限于经济学本身。第二节博弈论革命(了解)在经济学领域的“革命”在其他学科领域的运用第三节博弈论要点一、博弈的要素(1)参与者:参与博弈的决策主体单人博弈、两人博弈、多人博弈(2)博弈的规则:对博弈作出具体规定的集合(3)结果:对所有的参与者每一个可能的行动组合,会出现什么样的结果(4)收益:在可能的每一个结果上,参与者的所得和所失。零和博弈、常和博弈、变和博弈二、博弈的基本式用参与者、策略和收益函数来表述一个博弈,就称为博弈表达基本式。三、博弈论的扩展式四、信息和顺序(一)信息:1.如果所有参与者在给定任意策略组合下,每一个参与者的收益都是确定的(包括期望值),那么就是完全信息博弈。2.如果至少有一个参与者的收益是不确定的,那么就是非完全信息博弈。(二)顺序1.如果博弈方同时行动(在博弈论中,所谓同时行动是指一方在作出行动时并不清楚对手是否已经做出了行动),称为静态博弈。2.如果一方在作出行动时,知道对手已经做出了行动(可能不知道具体行动是什么),称为动态博弈。练习一:一个逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能的1000元奖金。请分别用得益矩阵、博弈基本式和扩展式表达该博弈。第二章完全信息静态博弈完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。第一节基本分析思路和方法上策均衡严格下策反复消去法划线法箭头法一、上策均衡如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果。我们称这样的策略组合为该博弈的一个“上策均衡”。上策均衡是博弈分析中最基本的均衡概念之一,上策分析是最基本的博弈分析方法。二、严格下策反复消去法(1)原理和思路选择——排除如果在一个博弈中,不管其他博弈方的策略如何变化,一个博弈方的某种策略给他带来的得意,总是比另一种策略给他带来的得意要小,那么我们称前一种策略为相对于后一种策略的一个“严格下策”。反复寻找博弈中各个博弈方的,在策略之间两两比较意义上的“严格下策,,并把它们消去的方法,就称为“严格下策反复消去法”(2)应用三、划线法以策略之间的相对优劣关系,而不是绝对优劣关系为基础。四、箭头法对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加收益。第二节纳什均衡一、纳什均衡的定义二、纳什均衡的一致预测性质纳什均衡的价值主要在于它有一些非常重要的性质,“一致预测性”就是其中最重要的性质之一。1.“一致预测性”:如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此,这个预测结果最终会成为博弈的结果。这里“一致”是指各博弈方的实际行为选择与他们的预测一致,而不是不同博弈方的预测相同、无差异。2.“一致预测性”在博弈分析中的重要地位:(1)纳什均衡具有一致预测的性质,而且只有纳什均衡才具有一致预测的性质。因此,一致预测的性质是纳什均衡的本质属性。简单的证明:如果一个博弈的所有博弈方都预测博弈结果是某个纳什均衡,那么由于纳什均衡策略组合中各博弈方的策略都是对其他博弈方策略、策略组合的最佳对策,因此任一博弈方都不会单独改变策略,因此预测的结果成为博弈的最终结果。这说明一个纳什均衡作为各个博弈方的共同预测时,一定是一致预测。反过来,如果每个博弈方都预测某个策略组合将是博弈结果时,都会主动坚持该策略组合中的策略,而不想采取与预测不一致的策略,则说明该策略组合中每个博弈方的策略都是对其他博弈方策略的最佳对策。根据纳什均衡的定义,这个策略组合一定是纳什均衡。(2)纳什均衡的一致预测性质是其预测能力的基本保证。预测时博弈分析的最基本的目的之一。因此,一个博弈分析概念的作用和价值,很大程度上是由其对博弈结果预测能力的大小决定的。其他博弈分析要么不具备这种性质,从而不存在预测的稳定性,因此不可能成为具有普遍意义的博弈分析概念,要么本身也是纳什均衡,是纳什均衡的一部分。三、纳什均衡与严格下策反复消去法1.上策均衡是包含在纳什均衡范围内上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡,因此上策均衡是比纳什均衡更强、稳定性更高的均衡概念。(因此在博弈分析中可以首先考察是否存在上策均衡,若不存在上策均衡,再寻找纳什均衡)2.划线法和箭头法是可以用得益矩阵表示的博弈中寻找纳什均衡的方法。3.纳什均衡与严格下策反复消去法的关系命题2.1和命题2.2保证了严格下策反复消去法和纳什均衡分析之间的相容性,保证了在进行纳什均衡分析之前通过严格下策反复消去法简化博弈是可行的。第三节混合策略与混合策略纳什均衡一、引例(混合策略的引进)猜硬币博弈该博弈在双方“正面”、“反面”两种策略的意义上,不存在纳什均衡策略组合。因为无论双方采用的是哪个策略组合,结果都是一方赢一方输,而输的一方又总是可以通过单独改变策略而反输为赢。在这个博弈中各博弈方决策的第一个原则:第二个原则:第三个原则:二、混合策略和混合策略纳什均衡从上述例子可以看出,当两个博弈方都以1/2的相同概率选择正面、反面时,双方都无法根据对方的选择方式,选择或调整自己的策略获得利益,从而在双方对两种策略随机选择概率分布的意义上达到了一种稳定,或者说均衡。我们称这种策略选择方式为“混合均衡”。与此相对,则把博弈中原来意义上的策略称为“纯策略”。三、一个例子在这个博弈中两博弈方决策的第一个原则是不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性。第二个原则是他们选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风。练习二:求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡:四、多重均衡博弈和混合策略经典博弈案例——夫妻之争一对夫妻得到了两张时装表演票和同一时间的两张足球比赛票。妻子更想去看时装表演而丈夫更想去看足球,但又不愿意或不能分头行动,争执不下就决定双方投票一次决定。若同时选择时装则去看时装表演,同时选择足球则去看足球比赛,如选择不一致则哪里都不去。再假设丈夫与妻子同时去看时装表演,妻子得益(也就是效用,下同)为2个单位,丈夫得益1单位;若丈夫与妻子都去看足球比赛则丈夫得益3个单位,妻子得益1个单位;若因为双方选择不同而没有出门则双方得益均为0单位。这个博弈有两个纳什均衡,即(时装,时装)和(足球,足球)。如果一方知道了另一方已经选择了某种策略,则前者明智的选择就是与对方选择保持一致,以免的最差的得益为0。换句话说,本博弈两个博弈方都不会害怕对方猜到自己的选择,他们主观上并不想隐藏自己的选择。由于本博弈有两个纳什均衡,而且夫妻双方对于两个纳什均衡的偏好显然有矛盾,妻子偏好前一个纳什均衡,而丈夫偏好后一个纳什均衡。因此当夫妻两人首先从自身的最大利益出发独立做出决策时,我们不能肯定博弈的最终结果是哪个纯策略。也就是说,在纯策略的范围内,该博弈也是无法对博弈方的选择做出确定性建议的。因此也需要考虑博弈方采用混合策略的可能性

1 / 65
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功