WTO贸易政策审议机制的有效性分析——基于复制动态的进化博弈理论林高榜(浙江大学经济学院)摘要本文以进化博弈为分析框架,分析了在博弈双方对称和不对称情况下的WTO贸易政策审议机制的内部有效性。通过两个博弈复制动态发现,当博弈双方博弈地位对称时,越是多边之间的贸易往来,WTO贸易政策审议机制就越有可能具备内部有效性。当博弈双方博弈地位不对称时,博弈的均衡策略为一方采用严格审议的策略,而另一方采用严格审议的策略,WTO贸易政策审议机制同样具有内部有效性。关键词WTO贸易政策审议机制有效性进化博弈ResearchontheeffectivenessoftheTPRM:BasedontheEvolutionaryGameTheoryLinGaobangAbstract:CompanywithusingtheDuplicativeDynamicsofEvolutionaryGame,thispaperanalysestheeffectivenessoftheTradePolicyReviewMechanism(TPRM).Theresultshowsthat,iftherelationbetweentheplayersissymmetrical,themoremultilateraltradeintercourse,itisthemorepossibleTPRMiseffective.Iftherelationisasymmetrical,thestableequilibriumisoneplayeradoptsthe“StrictReview”strategy;theotheradoptsthe“Non-StrictReview”strategy.TPRMalsohasitseffectiveness.Keywords:TPRMofWTO,effectiveness,EvolutionaryGame作者简介:林高榜,博士研究生单位:浙江大学经济学院研究方向:经济计量、国际贸易、世界投资通讯地址:浙江杭州浙大路38号浙江大学经济学院林高榜邮编:310027电话:13857169606;Email:rememberlgb@hotmail.com—1—一、引言于1988年的WTO“乌拉圭回合”中期审评会议临时批准建立的贸易政策审议机制(TradePolicyReviewMechanism,简称TPRM),是世贸组织成员集体对各成员的贸易政策及其对多边贸易体制的影响,定期进行全面审议。实施贸易政策审议机制的目的,是促使成员方提高贸易政策和措施的透明度,履行所作的承诺,更好地遵守世贸组织规则,从而有助于多边贸易体制平稳运行。因而很多WTO的成员国都借每期年度审议的机会,对于一些成员国在贸易政策上的不足提出整改意见,以期为本国的国际贸易创造更好的条件。虽然贸易政策审议的结果,不能作为启动争端解决程序的依据,也不能以此要求成员增加新的政策承诺。但由于审议过程秉承公开、公正、公平的原则,对于各个成员国而言都相当重视。2006年对于中国而言,是入世以后参与第二次对美国的审议,因此国家商务部在年初便发动企业、机构和行业协会提出对美国的意见,对其重视的程度可见一斑。然而,不可回避的是,贸易政策审议机制由于不存在法律上的约束力,因此对于其内部实际的有效性并不能直观地认识到。就WTO贸易政策审议机制的内部有效性研究而言,近年来,学者们开始了一些初步的研究,发现就其自有的特点而言,贸易政策审议机制有利于改善WTO成员间的贸易关系,减少和预防贸易的摩擦(张国平,1997)。而从现实的情况出发,贸易政策审议机制监督的有效性是有限的(陆燕,2004)。而且对于贸易政策有很强的自主性和对国家利益原则的坚持会使得贸易政策审议机制失效(曲延英,2006)。以上学者的观点,似乎已经从现实的角度分析贸易政策审议机制的有效性问题,而就其机制的内部运作机理而言,并未完全的揭示,同时机制的内部有效性又直接决定了机制是否可以长期存在并有效。本文借用复制动态进化博弈分析的框架,分析WTO贸易政策审议机制的内部有效性。二、贸易政策审议机制复制动态的进化博弈分析有限理性的一般假定为:人们的理性是有限的,知识是不完全的,对别人行为预期的判断是很难正确无误的;人们通常是在模仿、学习、不断的试验中,对外部世界的冲击做出反应②。因此,一般认为有限理性的博弈是一个调整和学习的过程,而不是一次博弈的过程③。尽管有限理性博弈的假设表现为博弈方在知识、判断上的不完全理性,但就具体而言,依然会有多种有限理性的层次和程度。就此可以把进化博弈划分为“昀优反应动态的进化博弈”(BestResponseDynamicsofEvolutionaryGame)和“复制动态的进化博弈”(DuplicativeDynamicsofEvolutionaryGame)两类。其中前—2—者的前提是,少数有快速学习能力的博弈方之间的反复博弈和策略进化。④后者则相对学习速度较慢。按照《建立WTO协定》附件3的规定:“通过增加各成员贸易政策和实践的透明度以及达成对各成员贸易政策和实践的谅解来发挥多边贸易体制的作用”,WTO建立贸易政策审议机制的初衷是为了增加多边贸易体制的透明度,减少贸易摩擦,以达到自由贸易的昀终目标。因此,本文首先给出贸易政策审议机制内部有效性的衡量标准:参与审议的成员国采取严格的审议行为,以促进贸易自由化。1、对称的复制动态进化博弈分析对于复制动态进化博弈,具体按照参与博弈的群体成员是否有差异,可以分为:群体中任意个体无差异的“对称博弈”和群体成员有差异的“非对称博弈”。对称的复制动态博弈可以认为是博弈位置无差异的两人对称博弈。也就是,博弈双方选择同一策略的概率是相同的。反映到贸易政策审议机制中,就是在贸易政策审议机制中规定的三个不同的审议层次中⑤,如果博弈的两个群体同处于一个层次时,则双方博弈选择的同一策略的概率相同。为分析简易起见,以下给出贸易政策审议机制对称的复制动态进化博弈的前提:1)博弈局中人(players)为A、B两个群体,且双方都是有限理性的;2)双方的策略集合(strategyset)为:{严格审议,不严格审议},其中严格审议是相对另一战略:不严格审议而言的;3)在博弈进行过程中不存在制度变迁此时该博弈的得益矩阵为:B严格审议不严格审议严格审议DR−0,DR−0CR+0,CR−0A不严格审议CR−0,CR+00R,0R其中,在双方都不采取“严格审议”时,相当于保持现状,因此各自的得益均为,建立在这样的基础之上,当仅有一方采取“严格审议”时,未采取“严格审议”的博弈方会因为自己被要求改正贸易政策而损失一部分得益,记为C,同时采取“严格审议”的一方则会获得这部分得益。如表一中次对角线方向的策略组合。昀后,当双方均采用“严格审议”的策略时,相互都会因为被要求修正政策而损失得益,记为D,为便于分析,可以给定。0RCD—3—不难看出,当该博弈是同时选择的,也就是静态博弈,根据得益矩阵的情况不难看出,它存在两个纳什均衡即(不严格审议,严格审议)和(严格审议,不严格审议)。然而现实给定的并非都是双方同时决策,而是存在先后秩序和不完全理性。现在考虑在一个大群体的成员间随机配对进行博弈:假设双方群体中,各有比例为x的博弈方采用“严格审议”策略,有比例为x−1的博弈方采用“不严格审议”策略。按照前文的假定,博弈群体中各个个体之间的学习速度比较慢,也就是当某一个体改变策略时,其他博弈方模仿的速度比较慢。设两种策略的博弈方的期望得益为和,以及群体的平均期望收益为1u2uu,则由得益矩阵可知:()()CRxDRxu+⋅−+−⋅001)1(=()002)1(RxCRxu⋅−+−⋅=21)1(uxxuu−+=应该说,两种策略的博弈方的期望得益为和在大多数情况下都是存在差距的1u2u⑥,因此,只要博弈方有着基本的,包括直觉和经验的判断能力,早晚会发现得益的差距,得益较差的博弈方或早或迟会发现“改变策略对自己是有利的”,并开始模仿另一类型的博弈方。这意味着博弈方选择“严格审议”和“不严格审议”的比例x和是随着时间而变化的,可以写成时间的函数和,为简单表达起见,本文依然采用x−1()tx()tx−1x和x−1来代替。以上所表述的策略变化速度取决于博弈方学习模仿的速度。通常情况下,博弈方学习模仿的速度取决于观察模仿的难易程度⑦和模仿成功的收益程度⑧。以选择“严格审议”策略为例,其动态变化的速度为:()uuxdtdx−⋅=1其中,x为选择“严格审议”的博弈方比例,为选择“严格审议”策略的期望得益,1uu为平均期望得益。为选择“严格审议”博弈方在群体中比例的时间变化率。将具体的dtdx/x、和1uu的表达式代入得:()()()(CDxxxuuxxdtdx−−−=−−=1121)根据昀有解条件,即,0/=dtdxx有三个解,分别为:、和0*=x1*=xDCx=*。据此,可以得到该博弈的复制动态相位图,如图一:—4—dtdx0*x1x图一:对称复制动态博弈相位图因此,有对于初始的五种情况:0x第一,如果,上述的变化率等于0,即如果初始时刻没有博弈方选择“严格审议”策略,那么采用这种策略的博弈方就始终不会出现。也就是,对于有限理性的博弈方来说,一定要有模仿的对象才能进行复制和模仿,当时,就不可能有学习模仿的榜样,因此所有博弈方都不会改变策略。00=x0=x第二,如果()*00xx,∈,从复制动态方程中可以看出,也就是0/dtdxx会逐渐增大,反映到博弈方中,则是由于选择“严格审议”的得益会大于选择“不严格审议”的得益,因此,原本选择“不严格审议”的博弈方会进行学习和模仿,使得选择“严格审议”的博弈方比例逐渐增大,即x逐渐变大,并向靠拢,如图一所示。*xx=第三,如果,此时对于任意的博弈方而言,选择“严格审议”和“不严格审议”的得益相等,因此对于任意一个博弈方而言,都没有动机选择改变策略。*0xx=x的值稳定不变。第四,如果()1*0,xx∈,此时从复制动态方程中可以看出,也就是0/dtdxx会逐渐增大,反映到博弈方中,则是由于选择“不严格审议”的得益大于选择“严格审议”的得益,因此,会出现选择“严格审议”的部分博弈方逐步复制学习,改变策略,使得选择“严格审议”的比例下降,并向靠拢,如图一所示。*xx=第五,如果,此时所有的博弈方都选择“严格审议”策略,由于博弈群体中没有一个个体选择“不严格审议”策略,也就是说,选择“严格审议”策略的博弈方没有模仿和学习的对象,因此,10=xx的值也稳定不变,也就是博弈方不会改变策略。—5—因此,通过上面的分析,笔者发现,该博弈存在三个均衡。然而,根据进化稳定策略的性质,一个稳定状态必须对微小扰动有稳健性才能称为进化稳定策略。而对于和两种状态,如果00=x10=xx发生微小的变动,就会破坏平衡。例如,当x稍稍偏离时,由于选择“严格审议”的得益大于“不严格审议”策略,因此,原先选择“不严格审议”的博弈方会有动机改变策略,也就是,选择“严格审议”的博弈方比例将会增加,直到。同理可知,在时,也会对00=x*xx=10=xx发生微小的变动而趋向于的均衡。*xx=相反,对于的初始状态,如果发生*xx=x微小的变动,都会自动恢复到原来的均衡。因此可以认为是整个博弈复制动态的均衡解。*xx=在数学上,就以上的过程,相当于对均衡点:当干扰使得*xx出现低于时,必须大于0;当干扰使得*xdtdx/x出现高于时,必须小于0。换句话说,也就是在这些稳定状态(上述中有三处)处,的导数(也就是相位图切线的斜率,或是*xdtdx/dtdx/()dxdtdxd/)必须小于0。也就是微分方程的“稳定性定理”。因此,上述博弈中,只有满足的导数小于0,也就是只有是该博弈复制动态进化博弈的稳定策略。*xx=dtdx/*xx=经过上面的分析,可以得到如下结论:如果贸易政策审议机制中参与博弈的博弈方地位是对称的,他们的博弈进化均衡解是DCx=*。而当选择放弃严格的审议的“不严格审议”策略给双方带来的损失越大(C越大),则均衡解的程度