从逻辑的观点看连锁店悖论①

kissleo
5 ℃
2016-09-06

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第１３卷第５期２０１０年９月　　湖南科技大学学报（社会科学版）ＪｏｕｒｎａｌｏｆＨｕｎａｎＵｎｉｖｅｒｓｉｔｙｏｆＳｃｉｅｎｃｅ＆Ｔｅｃｈｎｏｌｏｇｙ（ＳｏｃｉａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ）　　Ｖｏｌ．１３Ｎｏ．５Ｓｅｐ．２０１０■逻辑今探　从逻辑的观点看连锁店悖论①李　莉（南京大学哲学系，江苏南京２１００９３）摘　要：塞尔登连锁店悖论指出了博弈中人们面临的一个理性困境：按照博弈论的理性规则推理得出的合理行为，事实上却是不合理的。从逻辑的角度重新审视了这个疑难。根据悖论标准，塞尔登连锁店悖论可界定为严格的逻辑悖论。学者们对该悖论的形成机理进行了分析。该悖论的消解对博弈论、逻辑学等学科的发展具有极其重要的意义。关键词：连锁店悖论；理性；悖论中图分类号：Ｂ８１２　　　文献标识码：Ａ　　　文章编号：１６７２－７８３５（２０１０）０５－００３１－０４　　一　什么是塞尔登连锁店悖论１９９４年，莱因哈德·塞尔登与纳什、哈桑尼三人因博弈论的贡献获诺贝尔经济学奖。塞尔登在１９７８年的论文中提出了与合理决策有关的连锁店悖论，他指出应用博弈论进行理性分析的结果和实际人们会采取的合理行为之间存在不一致的现象。在博弈论领域，这个悖论是被热烈讨论的对象，塞尔登本人也曾提出过分层理性的解决方案，但都不尽如人意。此悖论来源于这样一个例子：在一个博弈中有２１个参与人，参与人Ａ和参与人１－２０。参与人Ａ在２０个城市拥有连锁店，参与人１－２０为竞争者。在博弈的第一轮中，参与人１要决定是否在城市１中开一家竞争店，如果他选择不这样做，即“不进入”，Ａ在这一轮的收益为５分，参与人１得到１分，如果他选择开一家竞争店，即“进入”，那么参与人Ａ面临“合作”策略或者“斗争”策略的选择。如果参与人Ａ选择“合作”，两个参与人的收益都是２分，否则都为零。在第二轮中，博弈从参与人２开始，他在“开分店”还是“不开分店”之间进行选择，Ａ选择“合作”还是“斗争”……这个博弈直到第二十轮，博弈结束。这是一个完全信息动态博弈。在这个博弈中，所有参与人都是理性的，所有的选择都是完全信息。每一个参与人的目标就是把自己的收益最大化。按照博弈理论，参与人Ａ在参与人１－２０选择“进入”时，都应当选择“合作”。但塞尔登指出，即使是受过数学训练的参与人也会不采用这个博弈论结论而会选择“斗争”策略［１］３３－３４。我们已经看到，如果竞争者只进入一个市场的话，连锁店Ａ将不会选择“斗争”，但是现在Ａ有２０个市场，他可能会为了阻止竞争者进入其他１９个市场而选择“斗争”，因而现在的结果可能不同于只有一个市场时的均衡结果。重复博弈比一次性博弈要复杂的多，参与人的行动仍然是“进入”或者“不进入”，以及“斗争”或“合作”，但是参与人现在的策略描述了当两个参与人在上一阶段的行动给定时，参与人在这一阶段将选择什么行动。现在我们来求解这个博弈。因为第一阶段的历史最短，所以一个显而易见的方法是从第一阶段开始求解。但是，这个方法不是最简单的求解方法。在采取第一个行动的时候，参与人已经预先估计了现在的行动对将来各阶段的影响，因而要考虑的情况相对复杂，所以最简单的方法是从多阶段博弈的最后一阶段开始求解。塞尔登认为这个悖论来源于对两种不同方案的考虑。第一种是博弈论方法，称之为逆向归纳法，根据这个方法，第２０个参与人会这样推理：“如果Ａ是理性的，那么他会选择‘合作’策略，因为我之后再不会有更多的对手进入，而Ａ采取‘合作’策略会给他提供更高的收益。我选择‘进入’的收益为１３①收稿日期：２０１０－０６－１８作者简介：李　莉（１９７４－），女，湖北鄂州人，博士生，主要从事逻辑哲学研究。２分，但是‘不进入’只为１分。因此我选择‘进入’。”Ａ作为理性人，此时当然会选择“合作”。倒数第二轮博弈中，参与人１９也会这样推理：“参与人２０是理性的，因此会按照上面推理，因此，无论我和Ａ之间发生什么，都不会对参与人２０的行为产生影响，所以我应当选择‘进入’。”因为Ａ作为一个理性人，知道参与人２０怎样行为，所以会采用“合作”策略。接下来的参与人也会照此推理。因而在每轮博弈中Ａ都会选择“合作”。第二种方法被塞尔登称为“惩罚理论”。Ａ会这样推理，因为没什么会影响参与人２０，或者参与人１９，和１８，但是Ａ可以通过“斗争”来达到惩罚效应，使得不选择“进入”会得到更高的收益。塞尔登指出，虽然不确切的是参与人Ａ什么时候停止使用惩罚效应，但惩罚理论比归纳法更具有“直觉上”的吸引力。理性的参与人会拒绝接受归纳理论的有效结论而转向选择惩罚理论作为实际行为的向导。因而，Ａ选择“斗争”的策略才是最理性的行为［２］３。二　从逻辑的观点看：塞尔登连锁店悖论是逻辑悖论吗？给逻辑悖论进行准确的定义，有助于我们了解悖论的本质特征，分清悖论命题和非悖论性命题，对解悖方案的提出有指导作用。塞尔登连锁店博弈是不是逻辑悖论就有讨论和澄清的必要了。塞尔登认为在某种弱的意义上，这是一个悖论：一个令人惊讶的，不期望的博弈论结果。但我们认同孔斯的观点，认为在某种强的意义上，这是一个逻辑悖论：一个关于合理信念的语用悖论［３］４７－６６。国内学界对于悖论的定义争议颇多，但在定义中提及与认知主体相关的语用要素很少。张建军指出：“逻辑悖论指谓这样一种理论事实或状况，在某些公认正确的背景知识之下，可以合乎逻辑地建立两个矛盾语句相互推出的矛盾等价式。”［３］２６根据这个定义，他首先强调了构成悖论的属概念，“理论事实”。它有两个方面的含义：一，悖论并不存在于纯客观对象世界，而存在或内蕴于人类已有的知识系统之中，因而是被发现，而不是被发明的。其二，悖论是系统性存在物，再简单的悖论都是根据主体的背景知识经过逻辑推导而来的，孤立的语句不可能构成悖论。悖论实际上是一个复杂的情境构成，而不是简单的矛盾语句互推式［３］２６。在这个情境中，他继续指出了悖论构成的三个要素为“公认正确的背景知识”、“严密无误的逻辑推导”和“矛盾等价式”。我们注意到，无论是“公认”还是“背景知识”要素，都具有与认知主体密切相关的语用要素。在定义中，“公认”总是为某一认知共同体所公认，或者可以是日常进行合理思维的普遍性认知共同体，或者可以是某个特定学科领域的科学家共同体，“背景知识”可以是指人们公认的明晰知识，也可以是认知共同体不自觉地使用的预设［５］。因为这两个要素的存在，决定了悖论的语用性质。现在来简要的回顾一下上面的塞尔登连锁店博弈。在此博弈中，首先给出了一个博弈情境：Ａ与竞争者１－２０分别决定采取何种策略，来达到使自己利益最大化。他们都具有公认为正确的理性人假设的博弈论背景知识，彼此相信对方是理性人，并且自己无论自己采取什么行动，对方总是会选择理性策略。这些是各自认知系统中，毫无问题的博弈论假设。按照这个信念，我们进行了一系列严密无误的逻辑推导，但却得出了矛盾的结果。并且我们可以看到这个推导和认知主体Ａ、竞争者本人的信念密切相关。现在我们来看看这个博弈中的推导：出于简单化的考虑，假定只有两个潜在的竞争者。假定对于Ａ而言，如果第一个竞争者“进入”市场，与之“斗争”是不理性的，那么Ａ与第一个竞争者“斗争”将使第二个竞争者相信Ａ不是一个理性人（自我利益最大化者），因此他可能会与第二个竞争者“斗争”。如果我们假定第二个竞争者在这种情形下被震慑了，“不进入”市场，那么我们就有一个强有力的论证来说明，与第一个竞争者的“斗争”对Ａ而言是理性的（利益最大化）。一个聪明的Ａ很了解这种论证，因而，和我们原来的假定相反，与第一个竞争者的“斗争”将不是不理性的。因此，对Ａ而言，与第一个竞争者“斗争”将不是一件不理性的行为。如果Ａ与第一个竞争者“斗争”，第二个潜在的竞争者也能合理地相信Ａ是一个理性的利益最大化者，他显然不会与第二个竞争对手“斗争”。因此，与第一个竞争者“斗争”并没有带来惩罚效应。Ａ知道我们得出结论的所有事实，因而，对他而言，与第一个竞争者“斗争”是不理性的。因而，Ａ与第一个竞争者“斗争”是不理性的当且仅当它不是不理性的。让我们用ＪｉＰ表示竞争者ｉ（ｉ＝ｍ，ｃ）对于命题Ｐ的合理信念。令Ａ与第一个竞争者“斗争”，使得第二个竞争者“不进入”，这个虚拟命题为Ｋ。近似地的，让我们假定Ａ相信ＫＪｃＪｍＫ，也就是第二个竞争者会不想进入市场，除非他相信Ａ相信Ｋ。如果Ａ也相信竞争者相信ＪｍＫ，当且仅当Ａ会合理的相信它，那么Ａ就会推出ＫＪｍＪｍＫ．。推导过程如下：（Ｊ１）ＪＪφ→Ｊφ，（Ｊ２）Ｊφ，此处φ是逻辑公理，（Ｊ３）Ｊφ→ＪＪφＪ（φ→ψ）→（Ｊφ→Ｊψ），（Ｊ４）Ｊφ→ＪＪφ，（Ｊ５）从φ，推出Ｊφ．２３不协调性可以被这样证明：（１）Ｊ（ＫＪＪＫ），（假设）（２）ＪＫ，（假设）（３）ＪＪＪＫ，（１）（２）（Ｊ２）（Ｊ３）｛（１），（２）｝（４）ＪＪＫ，（３），（Ｊ１）｛（１），（２）｝（５）ＪＫ→ＪＪＫ，｛（１）｝（６）Ｊ（ＫＪＪＫ）→［ＪＫ→ＪＪＫ］，（７）Ｊ［Ｊ（ＫＪＪＫ）→［ＪＫ→ＪＪＫ］，（６），（Ｊ５）（８）ＪＪ（ＫＪＪＫ），（１），（Ｊ４）｛（１）｝（９）Ｊ（ＪＫＪＪＫ），（７），（８），（Ｊ３）｛（１）｝（１０）ＪＪＫ，（假设）（１１）ＪＪＪＫ，（９），（１０），（Ｊ３）｛（１）（１０）｝（１２）ＪＪＫ，（１１），（Ｊ１）｛（１）｝（１３）Ｊ（Ｋ→ＪＪＫ）→ＪＪＫ，（１４）Ｊ［Ｊ（ＫＪＪＫ→ＪＪＫ］，（１３），（Ｊ５）（１５）ＪＪＪＫ，（８），（１４），（Ｊ３），｛（１）｝（１６）ＪＫ，（１），（１５），（Ｊ２），（Ｊ３）｛（１）｝（１７）ＪＪＫ，（１６），（Ｊ４），｛（１）｝（１８）Ｊ（ＫＪＪＫ）．归谬，（１），（１２），（１７）因此，我们说塞尔登连锁店悖论是个逻辑悖论，并且是个严格意义上的语用悖论。通过以上的分析可见，塞尔登连锁店博弈情形，为张建军教授的逻辑悖论定义提供了有力佐证。它说明把语用性质纳入到悖论研究的视野中不仅是有用的而且是必要的。它可以拓宽悖论研究的范围，从逻辑悖论的角度统摄政治学、经济学、伦理学中类似的人类理性“困境”。三　悖论产生的原因分析塞尔登连锁店博弈之所以成为逻辑悖论在于其语用性质，也就是公认正确的背景知识这个要素有问题。公认正确，并非实际上正确。菲力普·莱尼（ＰｈｉｌｉｐＲｅｎｙ）和克里斯汀那·比基瑞（ＣｈｒｉｓｉｔｉｎａＢｉｃｃｈｉｅｒｒｉ）认为这个悖论的出现表明博弈理论不谐调。这里的“博弈理论”是指对于博弈树，对其它参与人的信念与合理性的一套假定。理由是：第一，如果竞争者处于对垄断者的信念和合理性有把握的一种状态，假定塞尔登的逆向演绎论证是正确的，假如垄断者要惩罚第一个竞争者，这个信息显然和竞争者原有的信念集不协调。这时候竞争者如何来回应这种不协调呢？他也许会认为垄断者是不理性的，因而实际上他就不会进入市场了。第二，如果垄断者知道这些，那么他就会意识到从一开始就采取“斗争”策略是理性的，而不会去考虑逆向归纳论证。问题在于：如果在第一轮博弈中，垄断者采取“斗争”策略是理性的，竞争者知道垄断者这样做怎么会与博弈理论不协调呢？比基瑞打算使用伊萨克·莱维（ＩｓａｃｃＬｅｖｉ）和彼得·加登福斯（ＰｅｔｅｒＧａｒｄｅｒｎｆｏｒｓ）提出的信念修正理论来解决这个悖论，以限制第二个竞争者对垄断者报复行为的反应。根据伊萨克·莱维和彼得·加登福斯的信念修正理论，比基瑞指出，竞争者不可能用贝叶斯条件来更新他的信念，因为垄断者实施惩罚行为的先验概率为零（也就是，它没有“严格”的可能性），并且竞争者应当放弃对于他而言最没有认知价值的信念。如果博弈理论（包括竞争者的信念）和信念修正规则是两个参与人之间的最重要的公共信念，那么比基瑞认为竞争者应当放弃这样一个信念：“参与人在所有的节点上都采取他们自由选择的策略”，转而认为惩罚行为只是无意识的“颤抖手”（意指是意外的、偶然的）的后果，是Ａ没有成功的实施它的真实意图。竞争者会认为这些错误应当是相当少有的例外，结论是他不会被斗争进入市场。因此，垄断者不会实施惩罚，逆向演绎论证显然得到了辩护。但是问题在于，如果竞争者对垄断者的理性或