信息不对称下企业投机行为的演化博弈分析摘要:运用演化博弈理论对监管部门和生产企业之间相互作用时策略行为的动态趋势和稳定性进行了分析。研究发现,这些影响博弈双方行为的要素会影响二者行为交互系统均衡点的稳定性。分析表明,企业投机行为的额外收益过高,监管部门不坚持严格监管等因素都会导致系统向不良状态演化,并在这一不良状态保持一定的稳定性,同时,还讨论了系统向良好状态演化的条件,并为管理者提出相关的政策建议。关键词:投机行为;演化博弈;复制动态;演化稳定策略中图分类号:C931文献标识码:A1引言0食品安全、环境污染等问题是可持续发展中亟待解决的难题,如不引起重视,将会严重影响经济社会的长期稳定发展。在新制度经济学的研究中,既定市场主体在信息不对称的情况下,往往怀着投机取巧的心理,利用他人的有限理性,尽一切可能的机会损害他人,以达到自身效用最大化[1]。为有效遏制这种不良行为的发生,学者们用不同方法进行了大量研究。从博弈论角度出发,学者们[2-5]利用博弈论基本原理,研究了监管部门与生产企业之间在信息不对称条件下相互制约、相互影响的博弈关系,认为监管部门对生产企业的监管非常重要。还有学者从企业治理环境的动机[6]和排污管制[7]等方面出发,提出了第三方监督机制[8]、公众参与的监管模式[9-10]等完善监管体制的措施。近年来,演化博弈理论在行为选择、市场规范和制度设计[11-14]等领域已取得很大进展。本研究通过建立监管部门与生产企业之间的演化博弈模型,分析这二者在博弈过程中的策略行为演化,以期为行为管理制度的设计研究提供理论依据。2演化博弈模型2.1演化博弈理论在传统博弈论中,一般假定博弈参与者是完全理性的,且博弈过程是在完全信息条件下进行的。但现实生活中,参与者的完全理性与完全信息的条件是很难实现的。演化博弈理论把理性经济学与演化生物学的思想结合在一起,以博弈参与者的有限理性博弈作为分析框架,认为在某一博弈群体中,由于有限理性,在博弈开始时博弈参与者往往找不到最优策略,而在博弈的过程中,博弈群体成员间通过学习和模仿他人的行为策略,并通过试错的方法不断调整、修正自己的策略,最终达到博弈均衡。在这个过程中,博弈参与者都会趋向于某个稳定策略,这被称之为演化稳定策略(EvolutionaryStableStrategy,简称ESS)[15]。运用演化博弈理论研究监管部门与生产企业之间的博弈,十分符合实际情况。通过研究这两个博弈群体随时间变化而产生的动态演化过程,分析群体趋向于某一稳定状态的原因及条件,预测其行为选择趋势,为更好的遏制企业发展中的不良行为提供参考意见。2.2基本假设由于企业在生产经营过程中的行为选择具有一定的共性,因此,笔者将企业的行为抽象为两类,一类是提倡行为,另一类是不提倡行为(如产污企业不处理污染物的行为、食品企业生产假2冒伪劣食品或非法生产转基因食品的行为、侵犯他人知识产权的行为等不提倡行为),即投机行为。本文预构建监管部门与生产企业之间的支付矩阵,为构建模型和演化博弈分析的需要,假定监管部门的行为选择是监管或不监管,生产企业的行为选择是提倡行为或投机行为,且二者都是有限理性的决策主体。设定的参数如表1所示,监管部门和企业的支付矩阵如表2所示。表1参数定义符号定义符号定义I企业的正常收益C2监管部门的监管成本C1企业进行生产的固定成本P投机行为被社会群体或上级部门发现时,监管部门受到的惩罚E企业选择投机行为时的额外收益R监管部门实施监管后有形或无形的收益S投机行为被发现时企业受到的惩罚(如名誉、上级部门的表扬和奖励等)注:I、C1、C2、E、S、P和R均大于0。表2监管部门与企业博弈时的支付矩阵监管部门监管不监管企业提倡行为I-C1,R-C2I-C1,R投机行为-C1+E-S,R-C2I-C1+E,-P2.3生产企业与监管部门的复制动态模型假设在博弈的初始阶段,从事生产经营的企业群体中选择提倡行为的企业比例为x,监管部门群体中采用不监管行为的比例为y(x、y通常是时间t的函数)。那么,企业群体选择“提倡行为”和“投机行为”的期望收益1U和2U及企业群体的平均收益U分别为:1111(1)()()UyICyICIC211(1)()()UyCyICESE12(1)UxUxU当生产企业的学习速度较慢时(即当某一企业改变策略时,其他企业学习、模仿的速度较慢时),选择提倡行为的企业比例的动态变化速度可以用式(1)的复制动态方程来表示:1()()(1)[()()]dxFxxUUxxSIESIydt(1)类似的,监管部门相关条件下的期望收益分别为:1222()(1)()VxRCxRCRC2(1)()VxxRP12(1)VyVyV选择不监管行为的监管部门比例的动态变化速度,同样可以用监管部门的复制动态方程表示,如下所示:22()()(1)[()()]dyGyyVVyyRPxRPCdt(2)33投机行为监管的演化博弈分析由式(1)、式(2)构成的微分方程组表示监管部门和企业策略选择的复制动态系统,可以用来研究监管部门与企业群体策略选择的动态演化,该系统有4个均衡点:(0,0),(0,1),(1,0),(1,1)。特别地,当0()/()ySIESI时,()Fx始终为0,这意味着所有的x都是稳定状态;当20()/()xRPCRP时,()Gy始终为0,这意味着所有的y都为稳定状态。设方程组的雅克比矩阵为J,则有2(12)[()()](1)()(1)()(12)[()()]xSIESIyxxSIJyyRPyRPxRPC将J的行列式记为DetJ,迹为Tr,有:2(12)[()()](12)[()()]TrxSIESIyyRPxRPC根据DetJ和Tr,按照文献[16]中的方法可讨论该系统的稳定性。不同条件下各均衡点的局部稳定性分析如表3-表6所示。表3S+IE,R+PC2均衡点DetJ的符号Tr符号结果(0,0)-不确定不稳定(0,1)-不确定不稳定(1,0)-不确定不稳定(1,1)-不确定不稳定表4S+IE,R+PC2均衡点DetJ的符号Tr符号结果(0,0)+-ESS(0,1)-不确定不稳定(1,0)++不稳定(1,1)-不确定不稳定当S+IE,R+PC2时,从表3的判定结果可以看出,监管部门与企业之间的博弈不存在演化稳定策略,表明博弈双方的行为策略选择具有相互依赖性。当S+IE,R+PC2时,从表4的判定结果可以看出,该博弈存在唯一的演化稳定策略**00xy,,即企业选择投机行为,监管部门选择监管。这表明,如果对投机行为者的惩罚小于投机行为带来的额外收益,通过反复长期博弈,以及企业间的学习和模仿,即使有限理性的监管部门选择监管,在暴利面前,有限理性的企业最终都趋向于选择投机行为。表5S+IE,R+PC2均衡点DetJ的符号Tr符号结果(0,0)++不稳定(0,1)+-ESS(1,0)-不确定不稳定(1,1)-不确定不稳定表6S+IE,R+PC2均衡点DetJ的符号Tr符号结果(0,0)-不确定不稳定(0,1)+-ESS(1,0)++不稳定(1,1)-不确定不稳定当R+PC2时,不论对投机行为者的惩罚力度有多大,从表5、表6可以看出,监管部门与企业所进行的博弈始终存在唯一的演化稳定策略**01xy,,即企业选择投机行为,监管部门选择不监管。这表明,如果监管部门对投机行为的监测成本过高而实施监管后的收益过小或投机行为未被发现受到的惩罚力度又过轻时,有限理性的监管部门和企业通过长期反复博弈、学习和策略调整,达到这种稳定状态。44结论笔者通过建立监管部门与企业群体之间的博弈模型,分析求解了该博弈的演化稳定策略,基于本模型的参数设置下,得到的结论是:(1)对于企业来说,当监管部门对投机行为者的惩罚力度太小、选择提倡行为的成本过高而收益太少时,在投机行为带来的额外收益面前,企业群体通过长期学习和策略调整,会逐渐趋向于选择投机行为。为此,企业需进行技术创新,降低生产成本,同时,加强政府监管,加大对选择投机行为的企业的惩罚力度,优化市场环境,从而逐步建立一个稳定良好的均衡。(2)对于监管部门来说,由于投机行为具有一定的隐蔽性,往往会造成监管成本较高,较之,实施监管后收到的收益较少以及投机行为未被发现时受到的惩罚较小,这都会使监管部门逐渐趋于不作为。因此,要加强监管人员的队伍建设,并为监管部门配备必要的监管设备,提高工作效率。实行地方政府问责制,加大对不作为部门和个人的惩罚力度,提高监管部门实施监管的效用。参考文献:[1]樊钢.市场机制与经济效率[M].上海:上海三联书店出版,1992.[2]李艳波,刘松先.食品安全供应链中政府主管部门与食品企业的博弈分析[J].工业工程,2007,10(1):35-38.[3]马琳,顾海英.信息不对称下转基因食品生产企业、监管部门的博弈分析[J].上海管理科学,2011,33(4):68-71.[4]JILLJM.Agametheoreticapproachtoorganicfoods:ananalysisofasymmetricinformationandpolicy[J].AgriculturalandResourceEconomicsReview,2000,29(1):1-9.[5]任玉珑,王恒炎,王建.企业环境污染行为的博弈分析[J].工业工程,2009,12(2):10-13.[6]王莉,徐本鑫,陶世祥.环境监管模式的困境与对策[J].环境保护,2010,(10):37-38.[7]王齐.政府管制与企业排污的博弈分析[J].中国人口·资源与环境,2004,14(3):119-122.[8]关华,齐卫娜,王胜洲,等.环境污染治理中企业政府间博弈分析[J].2014,28(6):72-75.[9]路正国,孙绍荣.基于博弈分析的公众参与环境保护的研究[J].技术与创新管理,2011,32(6):617-653.[10]周早弘.我国公众参与食品安全监管的博弈分析[J].华东经济管理,2009,23(9):105-108.[11]张术丹.演化博弈视角下不连续技术创新选择行为分析[J].2014,28(12):19-22.[12]SulinBa,AndrewB.Whinston,HanZhang.TheDynamicsoftheElectronicMarket:AnEvolutionaryGameApproach.InformationSystemsFrontiers,2000,2(1):31-40.[13]BowlesS.Microeconomics:Behavior,InstitutionsandEvolution[M].PrincetonandOxford:PrincetonUniversityPress,2004.[14]EstalakiSM,Abed-ElmdoustA,KerachianR.Developingenvironmentalpenaltyfunctionsforriverwaterqualitymanagement:applicationofevolutionarygametheory.EnvironmentalEarthSciences,2015,73:4201-4213.[15]盛昭瀚,蒋德鹏.演化经济学[M].上海:上海三联书店,2002,281-326.[16]郑君君,闫龙,张好雨,等.基于演化博弈和优化理论的环境污染群体性事件处置机制[J].中国管理科学,2015,23(8):168-176.