博弈论课节3教案(2011-02-公选课)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

教案3第1章纯策略博弈11课节3教学题目:(两人零和有限博弈的极大极小原理)学时数2教学目的和要求:掌握两人零和有限博弈的极大极小原理及计算方法。教学基本内容:基本概念:两人零和有限博弈基本方法:极大极小原理教学重点与难点:重点在掌握两人零和有限博弈的极大极小原理及计算方法。教学过程:1.课前复习2.讲授新课:§1.1两人有限零和博弈(矩阵博弈—MatrixGame)以策略博弈“石头-剪子-布”为例,看基本式局中人21收益值1(石头)2(剪子)3(布)1(石头)0,01,-1-1,12(剪子)-1,10,01,-13(布)1,-1-1,10,0教案3第1章纯策略博弈22其中,局中人1的策略集有123{}X,,,局中人2的策略集有123{}Y,,,策略空间CXY共有9个元素(局势)。两个局中人的收益函数可用矩阵表示为011101110A011101110BA.显然,()0ABAA.所以策略博弈“石头-剪子-布”被称作为两人有限零和博弈,被称作两人有限单矩阵博弈。简记为,,GNCA.而例1-2囚徒的困境其中,局中人A的策略集有12{}X,,局中人B的策略集有12{}Y,,策略空间CXY共有4个元素(局势)。两个局中人的收益函数可用矩阵表示为60101A61001B.显然,AB.所以策略博弈“囚徒困境”不是两人有限零和博弈,被囚徒B坦白囚徒B抗拒囚徒A坦白-6,-60,-10囚徒A抗拒-10,0-1,-1教案3第1章纯策略博弈33称作两人有限双矩阵博弈。例1-7现在,我们讨论单矩阵博弈{1,2},,GCA,其中,1231234{,,}{,,,}C,110323132334A。解:先做表,G用基本式表示:局中人21123411-1032-2-3-1-332334(第一步)如果局中人1选取他的策略1,不论局中人2选取4条中的哪一条策略,他至少可以得到:min{1,1,0,3}1.同理,局中人1选取策略2,他至少可以得到:min{2,3,1,3}3.局中人1选取策略3,他至少可以得到:min{2,3,3,4}2.在自己收益有保证的情况下,要使收益尽可能大,局中人1选取3.此时,无论局中人2选择何种策略,他至少可以有:max{1,3,2}2.教案3第1章纯策略博弈44方法:先在矩阵每一行选取一个最小值,再在三个最小值中选取最大值*v。(第二步)对局中人2而言,A是他的收益矩阵,A就是他的损失矩阵.不论局中人1取何种策略,局中人2取1234,,,策略时分别得到的最大损失为:1max{1,2,2}2;2max{1,3,3}3;3max{0,1,3}3;4max{3,3,4}4.但局中人2又希望其损失尽可能地小,即min{2,3,3,4}2所以局中人2应取策略1.方法:在矩阵每一列选取一个最大值,再在四个最大值中选取最小值*v。得到的局势31(,)后,局中人1,2的收益为(2,2),也称作两人有限零和博弈{1,2},,GCA的值。在这种意义下得到的解31(,)也叫作零和博弈的纯策略的解,以区别后面要讲到的混合策略的解。上面的这个讨论过程可以简单地表示为:局中人1选取策略i时,其最小收益为:3414min1,2,3.()ijijjaiAa但局中人1应选取某个i,使得上述3个值中最大者:*1413max(min)ijijjivaa教案3第1章纯策略博弈55称作此博弈的下值,也称作最大最小值.同理,局中人2选取策略j时,其最大损失为:13max1,2,3,4.ijiaj局中人2应选取个j,使得上述4个值中的最小者:*min(max)ijijjivaa称作此博弈的上值,也称作最小最大值.将以上讨论汇总起来有:局中人21策略1234minmax11-103-1*2v2-2-3-1-3-3323342Max23342vMin*2v在我们的这个例子中,出现了:**maxminminmaxijijjjiivaav且**2vvv,这就是博弈均衡解的值。教案3第1章纯策略博弈66练习题1-1:某城市有甲乙两家电视台在某个黄金时间段里,甲台有三套节目可供选择播放,乙台有四套节目可供选择播放,双方都有最新的收视率统计(百分比)资料,其中,收看甲台的情况如下:局中人乙台播放甲台播放节目一节目二节目三节目四节目160203055节目250754560节目370453530为使自己的节目拥有更多的观众,甲电视台应当在黄金时间段选播哪一套节目?解:(第一步)确认该博弈的类型:两人,有限,零和博弈;(第二步)用最大最小值方法求出平衡局势(节目2,节目三);局中人乙台播放甲台播放节目一节目二节目三节目四节目160203055节目25075456045节目37045353045教案3第1章纯策略博弈77(第三步)由平衡局势(节目2,节目三)得到博弈的值为:收看甲台的收视率为45%,博弈的解为(节目2,节目三)。平衡局势(节目2,节目三)的几何意义:鞍点(SaddlePoint)仔细观察博弈的解和博弈的值,联系大猪和小猪的博弈平衡在一个博弈G中,如果局中人仅有两个{1,2},每个局中人的策略集中的元素是有限的:局中人1,2的策略集分别为11{,,},{,,}mnAB则称此博弈为两人有限博弈。又如果两人的收益函数分别为:,(,)(1,,,1,,):,(,)(1,,,1,,)ijijijijuABRuaimjnvABRvbimjn且满足(1,,,1,,)ijijabimjn,则该博弈G称作两人有限零和博弈。由于两人的收益函数可以只用一个矩阵表示,故两人有限零和博弈又称为单矩阵博弈。单矩阵博弈是博弈论中最简单的,也是最基本的内容。1944年,数学家VonNeumann(冯·诺伊曼)和经济学家Morgenstern(摩根斯坦)由此出发,合作奠定了博弈论的基础理论和博弈行为研究的基本思想。教案3第1章纯策略博弈88定理1-1-1设有两人有限零和博弈{1,2},,GCA,其中,收益矩阵111212122212nnmmmnmnaaaaaaAaaa,则必有不等式**1111maxminminmaxijijjnjnimimvaav.证明:{1,2,,}im,有minijijjaa于是*maxminmaxijijjiivaa由于*v为常数,**minmaxijjivav。**vv.□定理1-1-1表达了这样的一个意思:局中人1的最小收益不超过局中人2的最大损失。一个零和博弈,如果出现**vvv则称v为此博弈,,GNZA的值,对应的局势00(,)ij称作G的一个解.由于几何意义,该局势又被称作博弈G的鞍点(鞍点的问题与经济上的投入产出模型是一致的)。练习题1-2:请读者试着研究两人有限零和博弈博弈,,GNCA,其中112111011012A.教案3第1章纯策略博弈99这个博弈的解不是惟一的:11,()和12,()都是G的解,并且博弈的值都是1。因此,我们对两人有限零和博弈归纳为三种情况:1)**vv,博弈有唯一的解(练习题1-1);2)**vv,博弈有多个解;(练习题1-2);解决的方法:优超3)**vv,博弈不存在纯策略的解。(例1-1)解决的方法:引入混合策略对练习题1-2的计算有:局中人21策略1234minmax11121112110-1-1310120Max11221Min1显然,11,()和12,()都是G的解,并且博弈的值都是1。解有2个!教案3第1章纯策略博弈10103.课程小结:学生应当掌握的知识点:1)两人有限零和博弈的定义;2)两人有限零和博弈的最大最小原理和计算方法;3)两人有限零和博弈在出现多解的情况时的优超方法。教学方式及教学方法:课堂讲授作业及课外训练:1.练习题1-1,1-2教案小结:本教案在时间和内容上很好地达到了要求。11年3月8日

1 / 10
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功