博弈论在物流供应链中的应用陈云华008029308市场营销(1)班2011年6月8日摘要博弈论是经济学的标准分析工具之一。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。近年来供应链管理是对从原材料采购到产成品消费整个过程所产生的各种关系、信息、物流等进行管理,以改善顾客服务和增加经济价值的流程。近年来,随着供应链中企业间的竞争与合作不断增强,博弈论作为一种分析企业间相互竞争及相互合作的工具再次被广泛应用,主要用于解决供应链管理中的库存决策、产量/价格博弈、多决策分析及供应链网络的均衡等问题。面对供应链中的竞争与合作。企业应该集中优势发展自己的核心竞争力,同时着眼于彼此长期的共同发展,建立起相互信任、相互依存、风险共担、利润共分、信息共享的密切合作伙伴关系,实现供应链合作模式下的“双赢”。当然各个环节的商人都是自私的,都是为了自身的最大利益。所以在美好的互相信任问题中存在道德等各方面的问题。只能用利益告诉商人们最佳的选择方法,所以本文以“囚徒困境”的博弈模型分析物流供应链中的制造商与供应商之间的博弈。在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’dilemma)博弈模型。该模型告诉我们:从利己目的出发,结果损人不利己,既不利己也不利他。合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。同时针对现在的社会普遍的非合作博弈均衡,利用“警察与小偷”的博弈理论进行分析改善。首先我们讨论:供应商与制造商之间的非合作博弈建立模型如下:制造商供应商高低高4,410,2低2,108,8如上图所示:从供应商的角度来说,如果制造商采用“高价“策略,则自己采用“高价“策略是理性的选择(4>2);如果制造商采用“低价“策略,则自己仍然采用“高价”策略是理性的(10>8)。所以,不论制造商采用何种策略,供应商的理性选择都是“高价”。制造商与供应商的情况完全相同,它的理性选择也是“高价”。因此该博弈的结果必然是“高价,高价”,双方得益为(44),这个结果构成了本博弈唯一的纯策略纳什均衡。显而易见这一结果并不是最佳的,“低价,低价”策略的得益远高于“高价,高价”策略的得益;甚至“一个高价,一个低价”策略的总得益也要高于“高价,高价”策略的总得益。如果整个供应链中的上、下游企业都采用“高价,高价”的博弈结果作为自己的行为选择,那么整个供应链就将处于最低效率状态。从整个社会的角度来说,这一结果也是对社会资源的极大浪费。构成上诉理论有着许多的经济前提,当然最重要的是双方都是为了达到自己的利益最大而进行定价的。同时在不合作的前提下,双方只有这一条路走。但是根据达尔文的进化论还有社会学的人的生活习性等等一系列的著作和研究表明,认识群居动物的同时还会为了同一个目的合作。所以有下面的博弈。所以还有一种情况:供应商与制造商之间的合作博弈上述博弈模型作为重复博弈的原博弈,即供应商与制造商的合作是长期的,可以看作是无限的,则可将此博弈看作是无限次重复博弈。根据博弈论的相关知识,在这种存在着唯一纯策略纳什均衡的无限次重复博弈中,博弈双方是有合作的可能的。通过采用冷酷策略、针锋相对策略等触发机制,供应商与制造商将会着眼于双方的长远利益,严格遵守事先签定的协议,共同采取帕累托最优策略实行合作博弈,以实现供应链的整体最优。在供应商与制造商合作博弈的前提下,有上图,可以显而易见的得出结论:都会选择低价从而达到最优的(8,8)。合作博弈的大前提是合作,如果供应商的某一环节出现不道德的,让大家遭受极大的损失,多有的合作就会崩溃。所以存在一个道德风险。同时可以利用制度、合约的法律效应来约束。这里就涉及到另一个博弈,如何去改善这种环境,达到合作博弈,鄙弃非合作博弈,节约社会资源。“警察与小偷博弈”——利用法律法规去约束达到合理利用社会资源的目的要改变这种现状,必须加快培育物流服务市场体系,政府部门应健全相关的法律法规,并提供相关的政策支持。在规范市场秩序和提升企业信用的过程中,应该坚持依法办事,强调法律的严肃性;加大对失信者的经济、法律惩罚力度,以规避“道德风险”。博弈论中“警察与小偷”的案例说明,一味地加大对小偷的惩罚,从长期来看对降低盗窃率不会有很明显的作用,反而会导致警察越来越懈怠而不负责任;只有同时加强对警察履行责任情况的监督,才会真正降低盗窃率。因此,在供应链管理中,也应该加强对政府相关部门的监督,加大对”行政不作为“的处罚,促使他们主动执法、维护经济秩序的稳定。附件:警察与小偷警察和小偷各只有一个机会去巡查或者偷盗A地或B地。A地的价值大于B地,那么警察应该为了保护价值大而一直保护A地吗。博弈论认为当然不是,警察的合理策略应当是有倾向于A以一定概率的随机巡查。这个概率就是:p=A地价值/AB地总价值。这种情况下才能使小偷最大得手几率降至最低。但是很不幸的是,此时的小偷谋求的是,最小得手几率的最大化。也就是说,警察的最优策略将把小偷的最差策略改良!这个便是冯·诺伊曼提出的“最小最大定律”。囚徒困境在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。表2.2囚徒困境博弈[Prisoner'sdilemma]A╲B坦白抵赖坦白-8,-80,-10抵赖-10,0-1,-1参考文献:《基于博弈论的供应链管理分析》刘晓东、张桂戌《博弈论在物流供应链中的应用——现状与趋势》张昕瑞、王恒山、袁修竹