委托代理理论中国石油大学(北京)博弈论与信息经济学报告框架绪论分析逻辑与理论模型理论的现实应用理论评述委托-代理理论发展展望中国石油大学(北京)一、绪论1•理论产生背景2•委托代理关系的含义3•主要研究内容4•主要代表人物及观点5•经典文献中国石油大学(北京)20世纪60年代末70年代初,当时的经济学家们不满于企业“黑箱”理论,开始深入研究关于企业内部信息不对称和激励问题,最终形成了委托—代理这一现代企业理论.。委托代理关系的产生,是由社会经济发展的客观需要和条件所决定的,是随着企业所有权和控制权的逐步分离而产生的。理论产生背景一、绪论中国石油大学(北京)委托—代理理论的含义隐藏行动隐藏信息事前逆向选择模型信号传递模型信息甄别模型事后隐藏行动的道德风险模型隐藏信息的道德风险注:委托—代理理论习惯上仅指“隐藏行动的道德风险模型”。中国石油大学(北京)按照詹森(Jensen)和威廉·麦克林(WilliamMeckling)定义,委托代理关系是指这样鲜明或隐含的契约,根据这个契约,一个或多个行为主体指定雇用另一些行为主体为其提供服务,并根据其提供的数量和质量支付相应的报酬。委托代理关系是一种居于信息优势与处于信息劣势的市场交易者之间的相互关系。委托代理关系的含义一、绪论中国石油大学(北京)委托代理理论的中心任务是研究在利益相冲突和信息不对称的环境下,委托人如何设计最优契约激励代理人。主要研究内容一、绪论中国石油大学(北京)主要代表人物和观点建立了动态博弈模型,强调了委托人和代理人只要有足够的耐心就能保持他们的长期契约关系,以此解决代理问题。将委托代理问题区分为道德风险和逆向选择。道德风险指代理人借事后信息的非对称性、不确定性以及契约的不完全性而采取的不利于委托人的行为。逆向选择指代理人利用事前信息的非对称性等所进行的不利于委托人的决策选择。罗宾斯泰英(Rubbinstein)K阿罗中国石油大学(北京)提出棘轮效应模型,解释委托人约束代理人的有效性。明确提出了声誉问题,经理只有通过改进自己在经理市场上的声誉,从而提高未来的收入。提出的声誉模型,将模型扩展到多重博弈,参与人因为长期利益而需要建立并维护自己的声誉,使长期间的合作得以实现。魏茨曼法玛Fama克瑞普斯Kreps主要代表人物和观点中国石油大学(北京)经典文献中国石油大学(北京)《CompetitiveBiddingWithDisparateInformationWilson》1969《famaagencyproblemsandthetheoryoffirm》《MoralHazardandObservation1979Holmstrom》《Radner1981MonitoringCoopAgreements》《malcomson1984WorkIncentives,,andInternalLaborMarkets》《代理问题和公司理论》《工作激励和内部劳动市场》二、分析逻辑与理论模型模型假设分析逻辑模型化方法具体模型中国石油大学(北京)前提假设以“经济人”假设为核心的新古典经济学研究范式,并以下面两个基本假设为前提。①委托人和代理人之间利益相互冲突;②委托人和代理人之间信息不对称。二、分析逻辑与理论模型中国石油大学(北京)分析逻辑委托人设计契约代理人根据情况选择接受(或拒绝)代理人提供努力随机因素决定现状态委托人根据结果进行支付二、分析逻辑与理论模型委托代理理论的基本路径:中国石油大学(北京)分析逻辑二、分析逻辑与理论模型分析逻辑为:在“参与约束”和“激励相容约束”两个条件下,寻找委托人设计的最优契约,让代理人的努力水平符合委托人的利益。参与约束:委托人支付给代理人报酬带来的效用不低于代理人从事其他事务所获得的效用(市场机会成本)。激励相容约束:委托人为实现自身效用最大化而要求的代理人努力程度也要使代理人自身实现效用最大化。中国石油大学(北京)模型化方法状态空间模型化方法分布函数的参数化方法一般化分布方法二、分析逻辑与理论模型中国石油大学(北京)附:模型化分析方法中各类符号的含义:A:代理人所有可能的行动组合;a∈A:代理人的一个特定行动;θ:不受代理人和委托人控制的外生变量(称为“自然状态”);Θ:是θ的取值范围;G(θ):θ在Θ上的分布函数;g(θ):θ在Θ上的密度函数;π(a,θ):行动x(a,θ)的一个货币收入;S(x):激励合同;V(π-s(x)):委托人期望效用函数;U(s(x))-c(a)。中国石油大学(北京)假定:委托人和代理人的v-N-M期望效用函数分别为v(π-s(x))和u(s(π))-c(a),那么委托人的期望效用函数可以表示如下:dgaxsavP)())),((),(()(注:委托人的问题是选择a和s(x)最大化上述期望效用函数。但是委托人在这样做的面临着来自代理人的两个约束。中国石油大学(北京)1、状态空间模型化方法uacdgaxsuIR)()())),((()(①参与约束(个人理性约束):中国石油大学(北京)②激励相容约束:AaacdgaxsuacdgaxsuIC),()())),((()()())),((()(1、状态空间模型化方法委托人的问题是选择a和s(x)最大化期望效用函数(P),满足约束条件(IR)和(IC),即:dgaxsavxsa)()),((),((max)(,uacdgaxsuIRts)()())),((()(..AaacdgaxsuacdgaxsuIC),()()())),((()()))),((()(中国石油大学(北京)1、状态空间模型化方法在状态空间模型化方法中,效用函数对自然状态θ取期望值;在参数化方法中,效用函数对观测变量x取期望值。委托人的问题可以表述如下:dxaxfxsvxsa),,())((max)(,uacdxaxfxsuIRts)(),,())(()(..AaacdxaxfxsuacdxaxfxsuIC),(),,())(()(),,())(()(2、分布函数的参数化方法中国石油大学(北京)dxxfxsvxsPp),())((max)(,upcdxxpxsuIRts)(),()(()(..PppcdxxpxsupcdxxpxsuIC~),~(),(~))(()(),())(()(中国石油大学(北京)3、一般化分布方法从上面的分析可以看出,代理人在不同行动之间的选择等价于在不同的分布函数之间的选择,则可将分布函数本身当作选择变量,将a从模型中消除。如果我们令p为x和π的一个密度函数,P为所有可选择的密度函数的集合,c(p)为p的成本函数,那么委托人的问题可以表述如下:dafxsvsa),())((max)(,uacdafsuIRts)(),())(()(..)(),())(()(),())(()(acdafsuacdafsuIC模型化方法总结:中国石油大学(北京)以上三种模型化方法中,参数化方程可以说已成为标准方法。在以后的分析中。我们将假定产出是可观测变量,并且只有π是可观测,因此x=π。此时,委托人对代理人的奖惩只能根据观测的产出π作出,委托人的问题变成:具体模型中国石油大学(北京)委托—代理理论基本模型逆向选择模型道德风险模型隐藏行为模型隐藏知识模型多层次动态模型声誉模型棘轮效应模型强制退休的模型声誉模型棘轮效应模型具体模型中国石油大学(北京)产生背景创始人核心思想模型具体介绍模型讲解思路:“一般性的声誉模型”理论背景:如果委托人不能“经济地”观测到代理人的行动选择,那么,为了激励代理人努力工作,委托人只能通过与代理人签订合约,通过某些双方都可观测的指标来对代理人行为进行奖惩的方式去激励代理人。声誉模型的提出者:Fama.Holmstrom于1982年完成了模型化工作。1.声誉模型中国石油大学(北京)声誉模型核心思想:现实中的激励问题并没有委托—代理理论中所提到的那么严重,“时间”可以解决问题。他强调代理人市场对代理人行为的约束。譬如,在竞争性经理人市场上,经理人的市场价值(收入)决定于其过去的经营业绩。在长期,经理人会对自己的行为负完全的责任。如果将委托—代理关系扩充到长期的多阶段重复博弈,则代理人必须关注未来收入。这样,即使没有显性激励,代理人也会努力工作,因为这样可以改进自己的声誉,并由此提高自己的未来收入。1.声誉模型中国石油大学(北京)模型假设:博弈有两个阶段,用2,1t表示,单阶段生产函数为:tttua2,1t其中,t为产出,ta是经理在阶段t的努力水平;是经理人的能力水平(假定它不随时间而变),tu是外生的随机变量。1.声誉模型中国石油大学(北京)模型假设:1.声誉模型中国石油大学(北京)at是经理人的私人信息,而是可观测变量。θ对于经理人市场来说也是不可观测的,但对于经理人市场是一种贝叶斯意义上的随机变量。θ和ut是独立的正态分布随机变量,均值都为零,Eθ=Eut=0.方差分别为δθ2和δu2u1与u2是独立的,即有cov(u1,u2)=0。设c(a)是经理人的单阶段“负效用”或努力的成本函数,且C’(0)=0,C’'(a)0。经理是风险中性者,且贴现金为零(贴现因子为1)。故经理人的效用函数为:其中w为经理人的总收入,其中w=w1+w2w1和w2分别为经理在阶段1和2的工资收入。在单阶段博弈中,如果博弈是一次性的,其最优努力水平为:其中s*是一次性委托—代理博弈中的最优合约。在代理人风险中性假设下,有。其中π为产出,y为委托人的固定收入,全部风险由风险中性的代理人承担。1.声誉模型中国石油大学(北京)在第二阶段动态博弈中:如果第一阶段委托人与代理人签订显性激励合约,则最优合约就为ys1*。据在这里假定的生产函数,有1a,于是有01acE1)(1ac即1a就是第一阶段中的最优努力程度,记其为ta1。1.声誉模型中国石油大学(北京)1.声誉模型中国石油大学(北京)假设在这里不存在显性激励合约。第一次性委托——代理博弈中,经理人必定不会有任何的努力,故at=0。第二阶段经理没有必要再努力工作,因为声誉已经由第一阶段的努力工作“生产”出来了,故a2=0。但在第一阶段,经理为了“生产”在第二阶段的声誉而会努力工作,因为经理在第二阶段的工资收入与经理市场或股东对经理能力的评价有关。1.声誉模型中国石油大学(北京)根据竞争性经理市场的边际生产率定价规则,在第一阶段,经理人的工资率等于第一阶段产出的期望值,第二阶段经理人的工资率也等于第二阶段的产出期望值,但由于两个阶段不是完全相互独立的,据我们的假设,经理的能力水平在两个阶段是相同的。这样,第二阶段经理人的工资率应等于给定第一阶段产出的情况下,第二阶段产出水平的期望值。于是有:进一步有:1.声誉模型中国石油大学(北京)在均衡时,经理市场知道a1与θ的关系,并根据θ的分布能计算出。于是,在均衡状态,一旦观测到π1,经理人市场就可计算出但是,经理市场不能将θ与u1区分开来,经理市场的问题是通过观测到的π1来推断θ。根据定理,统计推断的公式为:给定π1下经理市场预期的θ的期望值等于先验的期望值Eθ与事后观测值(π1)的加权平均值,经理市场在根据观测到的信息修正对经理能力水平的判断。1.声誉模型中国石油大学(北京)即:1.声誉模型中国石油大学(北京)这就是说,出于声誉的考虑,经理在第一阶段会努力工作,这在一次性博弈中是不可能的;但是,第一阶段的努力水平小于帕累托最优水平。愈大,π1传递的信息就愈多,经理人就愈愿意在第一阶段努力工作,从而在第二阶段形成愈强的声誉,故a1是的增函数。根据前面的公式:1.声誉模型中国石油大学(北京)模型的推广: