第9章竞争型决策方法

fantasyjht
0 ℃
2018-07-06

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

决策理论与方法（DecisionMakingTheoryandMethods）《决策理论与方法》第2页第2页第九章竞争型决策方法《决策理论与方法》第3页第3页学习目的了解竞争型决策的基本概念，理解竞争型决策的基本理论，掌握竞争型决策的研究方法，最终在现实生活中能够熟练应用。《决策理论与方法》第4页第4页本讲内容9.1竞争型决策概述9.2完全信息静态竞争型决策9.3完全信息动态竞争型决策9.4不完全信息静态竞争型决策9.5不完全信息动态竞争型决策《决策理论与方法》第5页第5页本章第1节从竞争型决策的现象、竞争型决策的要素、竞争型决策的分类三个方面对竞争型决策的基本概念进行介绍，2-5节具体研究完全信息静态竞争型决策、完全信息动态竞争型决策、不完全信息静态竞争型决策、不完全信息动态竞争型决策这4种竞争型决策方法。通过本章的介绍可以让读者对竞争型决策有一个全面的了解，并能够在现实生活中应用竞争型决策的理论和方法。《决策理论与方法》第6页第6页9.1竞争型决策概述竞争型决策是研究理性的决策者如何在竞争的情况下做出决策的理论，具体讲就是研究当决策主体的行为在发生直接的相互作用时，人们如何进行决策以及这种决策的均衡问题。竞争型决策问题，不是仅仅局限于站在某个决策方的立场上去找针对其他方的决策，而是从广义的角度分析在决策过程中决策主体之间相互制约、相互作用的规律，用以指导各决策方的合理决策。此外，竞争型决策研究的决策问题是包括开始、过程和结果的整个决策过程。《决策理论与方法》第7页第7页1.“囚徒困境”“囚徒困境”讲的是警方拘捕两个同案犯罪嫌疑人（囚徒）后，为防其相互间串供，而将两人分别拘押、隔离审问时，两疑犯所面临的认罪策略选择的问题。摆在两疑犯面前的选择有两种：坦白或不坦白。按照通常的政策，坦白从宽，抗拒从严。所以，若两人均坦白，则可从轻处理，分别判刑5年；若两人中有一人坦白而另一人拒不坦白，则坦白者可免于处罚，而拒不坦白者，将从重惩处被判10年；当然，若两人均不交代，而警方手中又无足够的证据可以指控犯罪嫌疑人，那么他们只可能被按妨碍公务罪被判被判1年。9.1竞争型决策概述9.1.1竞争型决策的现象《决策理论与方法》第8页第8页-5,-50,10-10,0-1,-1坦白不坦白坦白不坦白囚徒2囚徒1图9-1-1囚徒困境博弈如果用-1，-5，-10分别表示犯罪嫌疑人被判1年、5年、10年的收益，用0表示犯罪嫌疑人被释放的收益，则可以用一个矩阵将这个竞争型决策问题表示出来，如图（9-1-1）。9.1竞争型决策概述《决策理论与方法》第9页第9页图9-1-1中囚徒1、囚徒2代表本竞争型决策中的两个竞争参与者，因为这两个囚徒被隔离开，其中任何一人在选择策略时都不可能知道另一人的选择，因此可以把他们的决策看作是同时进行的。矩阵中的每个元素都是由两个数字组成的数组，表示在所处行、列代表的两个竞争方所选策略的组合下双方各自的收益，其中第一个数字为囚徒1的收益，第二个数字为囚徒2的收益。对两个竞争方来讲，各自都有两种可选择的策略，但各方的收益不仅取决于自己的策略选择，也取决于另一方的对应选择。因此，各竞争方虽然无法知道另一方的选择，但是他必须先权衡对方的不同策略选择对自己利益的不同影响，然后，做出自己的最佳选择。9.1竞争型决策概述《决策理论与方法》第10页第10页可以看出：两囚徒决策时都以自己的最大利益为目标，结果是无法实现最大利益甚至较大利益。因此囚徒困境反映了一个很深刻的问题，即个体理性与集体理性之间的矛盾，即从个体利益出发的行为往往不能实现集体的最大利益；用经济学的术语讲，该竞争中存在帕累托改进的机会，而个体理性选择的结果并非帕累托最优，不符合集体理性的要求，囚徒因此陷入了理性的困境。这个问题在社会经济活动中具有很大的普遍性。比如，在市场经济体制下，每个人或组织仅考虑自身利益最大化的结果不一定是资源配置效果的帕累托最优，存在着参与者利益都改进的可能性却无法利用，通常称这种情况为“市场失灵”。9.1竞争型决策概述《决策理论与方法》第11页第11页2.“田忌赛马”春秋战国时期齐威王经常约手下大将田忌与他赛马。赛马的规则是这样的：每次双方各出三匹马，一对一比赛三场，每一场的败者要输一千金给胜者。齐威王的三匹马和田忌的三匹马按实力都可分为上中、下三等。由于齐威王的上、中、下三匹马都分别比田忌的上、中、下三匹马略胜一筹，因此田忌每次都是连输三场，要输掉三千金。后来田忌的谋士孙膑知道这一情况后，给田忌出了个主意，即让田忌不要用自己的上马去对抗齐威王的上马，而是用下马对抗齐威王的上马，上马则去对抗齐威王的中马，中马去对抗齐威王的下马。这样，虽然第一场田忌必败无疑，但后两场田忌却都能取胜，二胜一负，田忌反而能赢齐威王一千金。9.1竞争型决策概述《决策理论与方法》第12页第12页如果这个故事到这里就结束了，那它还只是一个单方面运用策略的较为简单的问题，因为在赛马的齐威王和田忌两方中，只有田忌一方意识到策略的重要性，在安排马的出场次序方面运用策略，而齐威王一方却没有充分运用策略来应对田忌的策略，显然还构不成一个双人竞争的问题。这里为说明问题，不妨假设齐威王发觉田忌在使用计谋，明白了自己为什么输金的原因而及时地调整了自己的对策。这样，齐威王与田忌的赛马也就成了一个具有策略依存特征的决策较量，构成了一个典型的竞争型决策问题。这个重新设定的齐威王与田忌赛马的竞争型决策问题可以用竞争型决策的术语表示如下：（1）该竞争型决策中有两个竞争参与者，即齐威王和田忌。9.1竞争型决策概述《决策理论与方法》第13页第13页（2）两竞争参与者可选择的策略即为各自马的出场次序，因为三匹马的排列次序共有6种，因此双方各有6种可选择的策略，如图（9-1-2）。3,-31,-11,-11,-1-1,11,-11,-13,-33,-33,-33,-33,-31,-11,-11,-11,-11,-11,-11,-11,-11,-11,-11,-11,-11,-11,-11,-11,-11,-11,-11,-1-1,1-1,1-1,1-1,1-1,1上中下上下中中上下中下上下上中中上下上中下上下中中上下中下上下上中中上下齐威王田忌图9-1-2齐威王与田忌赛马博弈9.1竞争型决策概述《决策理论与方法》第14页第14页（3）根据前面的讨论，假设双方在决策之前都不能预先知道对方的决策，因此可以看作是同时选择策略的，而且决策选择没有先后次序的关系。（4）如果把赢一千金记成收益为1，输一千金记成收益为-1，则两竞争参与者在各种策略组合下的收益如图9-1-2收益矩阵中数组元素所示，每个数组表示两竞争参与者在对应行列代表的双方策略下各自的收益，其中前一个数字表示齐威王的收益，后一个数字表示田忌的收益。由图9-1-2可以看到，如果按照严格的竞争型决策问题的假设来重新安排这一游戏的话，齐威王只要把从策略集合中选择策略的顺序不断改动，不让田忌掌握策略规律，齐威王的胜率显然要高于田忌。9.1竞争型决策概述《决策理论与方法》第15页第15页9.1竞争型决策概述9.1.2竞争型决策的要素一个正式的竞争型决策包括以下几个要素：竞争的参与者、各竞争方可选择的全部行为或策略的集合、竞争的支付、竞争方的信息、竞争的次序、结果和均衡等。1.竞争型决策的参与者竞争型决策的参与者是指竞争中独立决策、独立承担结果的决策主体，他们可能是自然人，也可能是各种社会组织。参与者的划分标准是看他们是否统一决策、统一行动、统一承担结果等，即通常将利益一致的参与者作为一个竞争方，而不是看数量的多寡抑或规模的大小。一般地，记竞争方为，即共有n个竞争方。,n},,{i,N21《决策理论与方法》第16页第16页9.1竞争型决策概述2.策略的集合策略是指每个竞争方在进行决策时（同时或先后，一次或多次）可以选择的方法、做法等。策略有纯策略和混合策略之分。纯策略是指每个竞争方在竞争中可以选择采用的行动方案。混合策略是在纯策略空间上的一种概率分布，表示竞争方实际竞争时根据这种概率分布在纯策略空间随机选择并加以实施的策略。《决策理论与方法》第17页第17页9.1竞争型决策概述记竞争方的策略为，为竞争方可选择的策略组成的策略集合，又称策略空间，则。如囚徒困境中，两竞争方的策略空间均为（坦白，不坦白）。N个局中人各选择一个策略形成的向量，称为策略组合，囚徒困境中s=（坦白，坦白）为囚徒1、2的策略组合。iisiSiiiSsiiSs),,(1nsss《决策理论与方法》第18页第18页9.1竞争型决策概述3.竞争方的支付竞争方的支付即每个竞争方从各种策略组合中获得的收益的效用，它是策略组合s的函数，所以也被称为支付函数。记竞争方的支付函数为。如囚徒困境中的囚徒1、2对应s=（坦白，坦白）的支付为。4.竞争方的信息信息是竞争方有关竞争的知识，如有关其他竞争方的策略、收益等知识。竞争中竞争方掌握信息的多少是影响其策略选择的一个重要因素，直接关系到决策的准确性。竞争方应尽可能多地收集有关竞争的信息，从而在采取策略进行决策时掌握主动。i)(sui521uu《决策理论与方法》第19页第19页9.1竞争型决策概述5.竞争的次序规定一个竞争型决策就必须规定其中的次序，不同的次序必然是不同的竞争型决策，即使其他方面都相同。),,,,(***2*1*nisssss6.结果和均衡结果指竞争型决策中竞争方的行动所产生的每一可能情形。而均衡是指所有竞争方的最优策略的组合，记为其中，*isi为第个竞争方在均衡的情况下的最优策略，即第个竞争方在考虑其他竞争方策略选择的情况下，有针对性地选择最大化自己支付的策略。《决策理论与方法》第20页第20页9.1竞争型决策概述9.1.3竞争型决策的分类①按竞争型决策中参与人数目的多少，将竞争型决策分为单人竞争型决策、两人竞争型决策和多人竞争型决策。②根据各竞争方可选策略数量的多少，将竞争型决策分为有限竞争型决策和无限竞争型决策。③按参加竞争型决策的各个竞争方从竞争中所获得的利益的总和，可将竞争型决策划分为零和竞争型决策、常和竞争型决策和变和竞争型决策。《决策理论与方法》第21页第21页9.1竞争型决策概述④按参与人行动的先后顺序，竞争型决策可以分为静态竞争型决策和动态竞争型决策。⑤根据参与人所掌握的信息可以把竞争型决策分为完全信息竞争型决策和不完全信息竞争型决策。⑥把参与人行动顺序和掌握的信息结合起来划分，可以得到四种类型的竞争型决策，即：完全信息静态竞争型决策、完全信息动态竞争型决策、不完全信息静态竞争型决策、不完全信息动态竞争型决策。《决策理论与方法》第22页第22页9.2完全信息静态竞争型决策9.2.1竞争型决策的标准式表述完全信息静态竞争型决策是指各竞争方同时决策，且所有竞争方对各方支付都了解的竞争型决策。在竞争型决策论中从静态中抽象出的最基本要素构成的模型描述就是标准型。在竞争型决策的标准式表述中，一般包括如下基本要素：①竞争型决策的参与者；②竞争方可选择的全部行为或策略的集合；③针对所有参与者可能选择的策略组合，每一个参与者获得的收益。《决策理论与方法》第23页第23页9.2完全信息静态竞争型决策对各竞争方从1到n排序，设其中任一个参与者的序号为，令代表参与者的策略空间，其中任一特定的策略记为，则。令表示每一个参与者选定一个策略形成的策略组合，令iiSiisiiSsnsss,,1iu表示第参与者的收益。综合上述内容，对竞争i型决策进行如下定义。《决策理论与方法》第24页第24页9.2完全信息静态竞争型决策定义9.2.1在一个n人竞争型决策的标准式表述中，参与者的策略空间分别为，收益函数分别为nSS,,1nuu,,1，则nnuuSSG,;,11表示此竞争型决策。《决策理论与方法》第25页第25页9.2完全信息静态竞争型决策9.2.2纳什均衡纳什均衡指的是一种策略组合，这种策略组合由所有参与人的最优策略组成，也就是说，在给定别人策略的情况下，没有任何单个参与人有积极性选择其他策略