数据模型决策08对策论(PPT38页)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第八章对策论2对策论的基本概念在第三章我们讨论了决策技术,其核心是在不确定的自然状况下如何评价和选择方案。实际上,一个决策主体在进行决策时,不仅要面对自然的状况,还常常要与其他决策者发生直接的相互作用,而各决策主体的利益又往往存在着冲突,这就形成了决策者间的竞争。这种具有冲突特征从而具有竞争甚至斗争性质的决策现象称为对策现象。对策论(又称博弈论)就是研究对策现象的理论和方法,它既是现代数学的一个分支,也是管理科学的一个重要部分,而且已成为主流经济学的重要组成部分。3对策论的基本概念例(市场占有):某城市东、南、西三个城区分别居住着40%,30%,30%的居名,目前该市还没有大型仓储式超市,公司甲计划修两个,公司乙计划修一个。每个公司都知道,若在某个区内设有两个以上超市,这些超市将分摊该区域业务;若在某个城区只有一个超市,则该超市将独揽这个城区的业务;若在一个城区没有超市,则该城区的业务将分摊给其他城区的超市。每个公司都想使自己的营业额尽可能多,试分析:两个公司的最优策略以及各应该占有多大的市场份额。4对策论的基本概念对策模型的三个基本要素:•1.局中人:局中人指能够选择自己的行动方案从而使自身的利益最大化的决策主体,即有决策权的参加者。(理性)•2.策略集:局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集;•3.一局势对策的益损值:局中人各自使用一个策略就形成了一个局势,局中人各选择一个特定的策略所形成的局势下局中人得到的收益称为益损值。5对策论的基本概念3232%3032%3032%40数据:当甲公司决定只在东城区修建两个超市,且乙公司也决定在东城区修建一个超市时,甲公司的市场占有率为:此时乙公司的市场占有率为1/3,若甲公司的市场占有率上升,则乙公司的市场占有率就会下降,双方的利益是激烈对抗的,两公司的市场占有率总和在任何情况下都为“1”.类似的,可以写出其他各种局势下的结果.6甲在各局势中的市场分额对策论的基本概念甲:行局中人;乙:列局中人乙1(1,0,0)2(0,1,0)3(0,0,1)甲1(2,0,0)2/30.60.62(0,2,0)0.52/317/303(0,0,2)0.517/302/34(1,1,0)0.70.750.75(1,0,1)0.70.70.756(0,1,1)0.643/6043/607对策论的基本概念其中:公司甲的策略集:S1={1,2,3,4,5,6},公司乙的策略集:S2={1,2,3}。下面矩阵称公司甲的赢得矩阵:2/30.60.60.52/317/300.517/302/30.70.750.70.70.70.750.643/6043/60A=8二人有限零和对策(又称矩阵对策):局中人为2;每个局中人的策略集的策略(也称纯策略)数目都是有限的;每一局势(也称纯局势)的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。通常将矩阵对策记为:G={S1,S2,A}S1:甲的策略集;S2:乙的策略集;A:甲的赢得矩阵“市场占有”是一个矩阵对策问题基本假定:理性人、完全信息二人有限零和对策(矩阵对策)9矩阵对策的最优纯策略双方都是从采用不同的策略可能出现的最坏的结果中选择一种最好的结果作为决策依据(从最坏处着想,去争取最好的结果),该原则假定局中人是保守性的决策者。甲在各局势中的市场分额乙1(1,0,0)2(0,1,0)3(0,0,1)甲1(2,0,0)2/30.60.62(0,2,0)0.52/317/303(0,0,2)0.517/302/34(1,1,0)0.70.750.75(1,0,1)0.70.70.756(0,1,1)0.643/6043/6010矩阵A中每行的最小元素分别为0.6,0.5,0.5,0.7,0.7.0.6。在这些最少赢得中最好的结果是0.7,故公司甲会采取策略4,或者5,无论对手采取何策略,公司甲至少获得70%的市场分额。对于公司乙,矩阵A中每列的最大的元素分别为其可能给自己带来的最大损失,分别为0.7,0.75,0.75。乙会采取1策略,确保公司甲的市场分额不会超过0.7。此时,局中人公司甲只可能以4,5作为其最优选择,局中人公司乙只可能以1作为其最优选择,相应的可能的局势有(4,1)和(5,1)。只有当赢得矩阵A=(aij)满足时,上面的局势才是稳定的,此时两个居中人都不能通过单方面改变策略而受益。所以,当对策重复进行时,居中人都会坚持使用该策略不变。这种策略称为最优纯策略,并把(4,1)和(5,1)称为对策G在纯策略意义下的解,又称对策G的鞍点。把其值V=0.7称之为矩阵对策G={S1,S2,A}的对策值。maxminminmaxijijjjiiaa矩阵对策的最优纯策略11设矩阵对策G={S1,S2,A}。当时,不存在最优纯策略。例:设一个赢得矩阵如下:min595A=max6策略2866imax89min8策略1j矩阵对策的最优纯策略maxminminmaxijijjjiiaa12当甲取策略2,乙取策略1时,甲实际赢得8,乙当然不满意。此时,乙发现他选择2要好过1。反过来,此时如果乙采取策略2,甲发现他选择1要好过2,则赢得更多为9…。因此,对两个局中人甲、乙来说,没有一个双方均可接受的平衡局势,其主要原因是甲和乙没有执行上述原则的共同基础,即:矩阵对策的最优纯策略5986A=maxminminmaxijijjjiiaa注:判断局势是否是鞍点的另外一种方法是:对任意i和j存在。**(,)ij****ijijijaaa13优超原则:假设矩阵对策G={S1,S2,A}甲方赢得矩阵A=若存在两行(列),s行(列)的各元素均优于t行(列)的元素,即:()称甲方策略优超于(乙方策略优超于)。优超原则:当局中人甲方的策略被其它策略所优超时,可在其赢得矩阵A中划去第t行(同理,当局中人乙方的策略被其它策略所优超时,可在矩阵A中划去第t列)。矩阵对策的最优纯策略[]ijmna,1,2,...,sjtjaajn,1,2,...,isitaaimststtt142/30.60.60.52/317/300.517/302/30.70.750.70.70.70.750.643/6043/60被第4、5行所优超被第4、5、6行所优超被第4、5、6行所优超优超原则:甲方的赢得矩阵如下:矩阵对策的最优纯策略150.70.750.70.70.70.750.643/6043/60被第1列所优超被第1列所优超优超原则:得到得到0.70.70.6被第1、2行所优超矩阵对策的最优纯策略31260351416在没有最优纯策略的情况下,一个比较自然且合乎实际的想法是:既然各居中人没有最优纯策略可出,是否给出一个选取不同纯策略的概率分布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少)--即混合策略。求解混合策略的问题有图解法、迭代法、线性方程法和线性规划法等,我们这里只介绍线性规划法,其他方法略。矩阵对策的混合策略17例:求解“市场占有”问题。已知公司甲的赢得矩阵A求得故不存在纯策略意义下的解,可求其混合策略。60/4360/4375.07.07.075.0Amaxmin0.7minmax0.75ijijjjiiaa设甲选择混合策略(x1,x2,x3).即使用策略1的概率为x1,使用策略2的概率为x2,使用策略3的概率为x3设乙选择混合策略(y1,y2).即使用策略1的概率为y1,使用策略2的概率为y2矩阵对策的混合策略18公司甲:60/437.075.0321xxx公司乙选择纯策略此时,公司甲的预期收益(1,0)(0,1)60/4375.07.0321xxx给定公司甲的混合策略(x1,x2,x3),在最坏的情况下,公司甲的预期收益等于)60/4375.07.0,60/437.075.0min(321321xxxxxx尽可能大)60/4375.07.0,60/437.075.0min(321321xxxxxx公司甲应该选择(x1,x2,x3),使得矩阵对策的混合策略19建立求公司甲最佳策略的线性规划如下:)60/4375.07.0,60/437.075.0min(321321xxxxxxv令123123123123maxzv0.75x0.7x43x/60v0.7x0.75x43x/60vs.txxx1x,x,x,v0则线性规划模型为:矩阵对策的混合策略20公司乙:217.075.0yy公司甲选择纯策略此时,公司乙的预期损失(1,1,0)(1,0,1)(0,1,1)2175.07.0yy给定公司乙的混合策略(y1,y2),在最坏的情况下,公司乙的预期损失等于)60/4360/43,75.07.0,7.075.0max(212121yyyyyy尽可能小)60/4360/43,75.07.0,7.075.0max(212121yyyyyy公司乙应该选择(y1,y2),使得60/4360/4321yy矩阵对策的混合策略21建立求公司乙最佳策略的线性规划如下:)60/4360/43,75.07.0,7.075.0max(212121yyyyyyw令1212121212minzw0.75y0.7yw0.7y0.75yws.t43y/6043y/60wyy1y,y,w0则线性规划模型为:矩阵对策的混合策略22对给定的,局中人1策略集为,局中人2的策略集为,假定二人零和对策问题局中人1的赢得矩阵如下:6347确定该问题的解ASSG,,21},{211S},{212S作业:23二人有限非零和对策定义:局中人为2;每个局中人的策略集的策略数目都是有限的;每一局势两个局中人的所得之和不为零。同二人有限零和对策相比,在二人有限非零和对策中,两个居中人并非完全处于对抗性的竞争状态中,因此居中人有可能进行合作。如果居中人都各自独立的选择自己的策略,则称这样的二人有限非零和对策为不合作的二人有限非零和对策,反之,就是合作的二人有限非零和对策。24“囚徒困境”有一天,有位富翁在家中被杀,财物被窃。警方在侦破这个案件过程中,抓到了甲、乙两犯罪嫌疑人,并且从他们的住处搜出了被害人家中丢失的财物。但他们却矢口否认曾经杀过人,辩称是先发现富翁被杀,然后顺手牵羊偷了点儿东西而已。于是,警方将甲、乙两个犯罪嫌疑人进行隔离审讯。警察分别对甲与乙说:“你们的盗窃罪证据确凿,所以可判你们1年监禁。但我可和你做个交易。如你单独坦白杀人的罪行,我只判你3个月监禁,但你的同伙要被判10年监禁;如果你拒不坦白,而被同伙检举,那么你就将被判10年监禁,他只被判3个月监禁;但是,如果你们两人都坦白交代,那么你们都要被判5年监禁。”二人有限非零和对策25二人有限非零和对策纳什均衡:如果给定了甲的选择,乙的选择是最优的;并且给定乙的选择,甲的选择也是最优的,那么这样的一组策略就是一个纳什均衡.双方最佳结果是:抗拒从宽。实际结果往往是:坦白从宽,牢底坐穿乙不坦白坦白甲不坦白-1,-1-10,-0.25坦白-0.25,-10-5,-526二人有限非零和对策囚徒困境说明了什么?在(坦白、坦白)这个组合中,囚徒甲和囚徒乙都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果甲和乙都选择不坦白,各判刑1年,显然比都选择坦白各判刑5年好得多。当然,甲和乙可以在被警察抓到之前订立一个“攻守同盟”,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。27二人有限非零和对策囚徒困境例子:价格战2000年我国几家生产彩电的大厂

1 / 38
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功