第1组计量经济学理论与方法(文章字数:9400)1解决厂商生产函数估计中的内生性问题:从参数估计到非参数估计1摘要生产函数估计中的内生性起源于联立性偏差,导致OLS估计有偏非一致。随着经济计量理论的发展、计算机运算速度的提高和数据多样性及可得性加强,先后出现了多种解决方法,工具变量,代理变量,固定效应模型,随机效应模型等等。这些方法的发展脉络表现出相互关联的两个特征,其一,模型设定的假设逐渐放松,其二,在估计中越来越多的采用半参数或非参数估计法,用经验估计替代原先的设定。本文在梳理厂商生产函数各种估计方法的基础上,重点介绍了Olley和Pakes采用半参数估计的代理变量法及其发展。本文通过对我国某一制造行业的经验分析发现,非参数估计结果具有较高的稳健性,但是要求有较大的样本量和更多的变量。关键词厂商生产函数内生性非参数估计引言生产函数是厂商理论的重要内容。早在1890年,马歇尔在他的著作《经济学原理》中已经提出了生产函数理论。对生产函数的估计一直是经济计量领域中的重要组成部分。随着学科的交叉发展,生产函数以及与生产函数相关的理论已经广泛的应用到各种学科和研究领域,因此生产函数的估计具有重要的理论价值和实践意义。内生性(endogeneity)是估计厂商生产函数需要解决的一个重要问题。厂商理论中,生产函数是厂商实现利润最大化的联立方程组中的一个结构式,所以经济学家所观察到的厂商投入决策并不是一个外生变量,而是由厂商最优化目标所决定的内生的结果。在单方程背景下,厂商所做的投入决策是一个内生变量,它与不可观测的遗漏变量(omittedvariable)2相关,因此导致结构式生产函数的OLS和ML估计有偏非一致。随着经济计量理论的发展、计算机运算速度的提高和数据多样性及可得性加强,先后出现了多种解决方法,工具变量,代理变量,固定效应模型,随机效应模型等等。这些方法的发展脉络表现出相互联系的两个特征,其一,模型设定的假设逐渐放松,如参数恒定假设与随机变量服从某一分布假设,其二,在估计中对不可观测变量越来越多的采用非参数估计法,用经验核估计(kernelestimation)替代原先的分布假设。较早的随机前沿模型(stochasticfrontiermodel)都是事先假定不可观测变量(技术效率)服从某种参数分布,如指数分布或者半正态分布,将不可观测变量显性化(observable)。在Park等(1994)随机前沿模型中,不可观测变量的分布密度是未知的,他们用半参数估计得到斜率的有效估计值。Olley和Pakes(1996)将不可观测的变量用可观测变量的函数关系来表示,即构成了模型的非参数部分,与生产函数的确定性部分构成局部线性模型,采用Robinson(1988)两步法估计斜率。他们的模型建立在厂商行为模型基础上,在估计上还处理了样本的选择性偏差,其理论基础和估计方法都具有一定前沿性。Ackerberg等(2007)对该方法进行了发展。本文首先回顾了厂商理论中内生性产生的原因和早期的解决方法,然后对当前解决生产函数中内生性问题的各种方法进行比较,第三部分介绍Olley等的估计方法,并结合Ackerberg等对模型的发展和中国实际情况,扩展了Olley模型,第四部分以中国制造企业(毛纺织业)的数据为例,进行估计,并对结果进行稳健性建议,最后给出评论和进一步研究的方向。1李玉红,女,1976年12月生,经济学博士,助理研究员,中国社会科学院数量经济与技术经济研究所。2在很多文献中,不可观测变量被认为是与厂商技术、效率或管理能力有关的变量。第1组计量经济学理论与方法(文章字数:9400)2一、厂商理论和内生性问题的回顾对微观生产函数的研究继承了经典的厂商生产理论。早在20世纪40年代,Marschak和Andrews(1944)已经在生产理论和微观经济计量方面做出了里程碑式的贡献。他们从讨论经济变量之间因果性关系开始,区分了经济学家和农田实验者(experimenter)的不同,区别最大的就是实验者可以控制投入到土地中的要素的数量,而经济学家却不能控制厂商的投入决策。对于经济学家而言,他们只能观测到厂商的投入产出行为而不能进行控制,因此他们所观察到的厂商的投入决策并不是一个外生变量,而是由厂商最优化目标所决定的内生的结果。这样,农田实验者的生产函数可以用传统的OLS估计得到无偏一致估计量,而经济学家对厂商生产函数的估计就存在联立性问题(simultaneity),传统OLS估计就是有偏而非一致。在Marschak和Andrews(简称M.A.)的模型中,假设有两种投入x1和x2,产出为y,农田实验者的生产函数为,12(,)yxx(1)但是对经济学家而言,他们只能观察到厂商的投入产出,而无法控制其中的投入决策,这样厂商的投入和产出并不像试验者的生产方程那样简单,其投入决策由利润最大化规律所决定。用p表示对应的x的价格。其边际生产率方程为,110220yxppyxpp(2)如果引入随机因素,M.A.的模型就变为,12110220(,,)(,)(,)yxxyxppyxpp(3)其中,,和分别是厂商生产函数和边际生产率条件,,和分别是函数中的随机扰动项。厂商之间的异质性归结为技术知识、意愿、努力程度以及运气等因素的不同,这些因素用技术效率(technicalefficiency)表示;边际生产率条件中的随机变量和,则是因为各种厂商投入和产出价格的不同,以及经济效率(economicefficiency)的不同,即厂商选择最优投入组合的能力、意愿或者运气的差异。估计结构方程组(3)就能够得到厂商的生产函数。但是,很多情况下研究者感兴趣的仅仅是简化式生产函数,而且由于投入和产出价格不容易得到,所以人们更喜欢估计生产函数,而不是联立方程组。如果在估计生产函数过程中,简单的把投入要素作为外生变量,显然是有问题的,如果投入要素与相关,那么OLS估计量有偏非一致。因此,需要对联立方程组中误差项做一些设定3。Hoch(1958)对方程组的扰动项关系做了分类,在极端的情况下,生产函数扰动项和要素3需要说明的是,引入随机扰动项的意义很大。如果没有随机扰动项,在利润最大化条件成立的情况下,上面的联立方程组将只有一组解,就是说,所有厂商的投入和产出数量都是相同的。这显然与现实不符,因为即使在生产相同产品的细分行业内,企业之间的规模都有很大的不同,很少看到某一个行业内部所有企业的投入决策和产出数量完全一致。不一致说明厂商之间的生产函数是不同的,而这并不是研究者所要得到的结果。如果引入随机扰动项,就可以解释这一难题。Nerlove(1966)认为,厂商之所以选择不同的投入产出组合,一方面是他们面对不同的产品需求曲线和投入供给曲线,另一方面,即使面对相同的需求和供给曲线,厂商管理能力的差异决定了相同的投入组合会有不同的产出水平。第1组计量经济学理论与方法(文章字数:9400)3需求扰动项不相关,此时生产函数不存在联立性问题;如果生产函数中的扰动项影响了投入要素的需求,那么投入要素的估计量非一致。Mundlak和Hock(1965)从只有一种投入的生产函数设定入手,把影响投入要素内生性的扰动项分为三种情况,一种是完全转移(completelytransmitted),]),,([uxfy4,此时LS估计量不一致,IV估计量一致;一种是没有转移,),(xfy,即cov(,)0x,此时LS估计量一致,IV估计量非一致;最后是一般情况,随即扰动项部分转移(partiallytransmitted),)](),,([211uxfy,此时LS和IV估计量都不一致,系数真实值比LS估计量小但比IV估计量大。Zellner,Kmenta和Dreze(1966)在Marschak和Andrews传统设定的基础上,提出了一套备选的设定和估计方法。他们认为,厂商最大化的是其期望利润,同时他们把扰动项作了具体分类,由于假设生产函数中的扰动项与投入需求的扰动项不相关,所以LS估计是一致估计量。他们还在文中给出了系数的ML估计量和贝叶思(Bayesian)分析。20世纪70年代以前,对厂商生产函数的各种特征和估计方法的理论研究比较多,由于缺乏微观数据的支持,经验研究相对较少,而且大部分研究集中在农业领域(Tintner,1944;Griliches,1957;Mundlak,1961)。70年代以后,尤其是80年代以来,政府逐渐放开了厂商统计数据,对单方程厂商生产函数的热情逐渐复苏,由联立方程所产生的内生性成为结构式生产函数估计所必需解决的难题。二、简化式生产函数中内生性的解决方法对于一个两投入厂商生产模型,假设生产函数为Cobb-Douglas形式,Hicks中性技术,函数一般形式为,0itititlititkititititylki=1,,N;t=1,,T(4)其中,下标i表示观测对象,下标t表示时间。y、l和k分别是产出、劳动和资本变量的对数形式,这是可观测的变量,系数为相应变量的产出弹性。不可观测的变量有两类,第一类是时不变变量(timeinvarying)i和t,也称为固定效应变量,i是观测对象的个体特征(individualspecific)变量,对于同一对象不随时间变化;t为时间特征(timespecific)变量,在同一时点上不随个体变化。第二类不可观测变量it称为时变(timevarying)变量,它随个体和时间同时变化5。it为随机扰动项,期望为0,方差为2it。为简化模型,忽略了其他控制变量。式(4)是一个变系数(varyingcoefficient)模型,投入要素的系数以及扰动项的方差都随着观测对象和时间的变化而变化。尽管这种设定与现实最为相符,但是待估参数个数超过了样本数,所以无法估计。为了估计这个模型,需要对模型做一些假定,假设所有观测对象同质,扰动项同方差,这样,式(4)变为,4是生产函数中的随机扰动项,u是一阶条件中的随机扰动项。5很多文献称之为生产率冲击,即厂商的技术和效率,包括管理能力等对厂商已知但是研究者未知的变量。第1组计量经济学理论与方法(文章字数:9400)40itlitkititititylk(5)这种情况下,劳动和资本的产出弹性不随观测对象和时间变化,待估参数个数大为减少,模型估计成为可能。特殊情况下,如果N为1,模型就变为时间序列模型;如果T为1,模型就成为横截面数据模型。(一)固定效应模型。综列数据(PanelData)能够解决第一类不可观测变量引起的问题。如果i和t与投入要素相关,那么差分法、LSDV或组内估计量(withinestimator)都能够得到投入系数的一致估计量6。在随机前沿分析中,随机生产模型通常设定为,0itlitkitiitylk其中,0litkititlk是生产函数随机前沿面,i是个体效应,代表厂商i的技术效率,它通常在前沿面的下方,与前沿面的距离度量了厂商技术无效的程度(inefficiency),因此为负值。如果个体效应与投入要素相关,那么固定效应模型可以估计出个体效应。但是,如果投入要素与第二类不可观测变量存在相关性,这通常是现实情况,那么固定效应模型就无能为力,否则估计结果会有两个问题,首先,如果投入要素存在度量误差,固定效应估计量可能比OLS估计量还要差。Griliches和Hausman(1986)发现,当要素的序列相关程度高于度量误差时,差分会降低解释变量的信号噪音比7。这样得到的估计量比OLS估计量的偏差还大。另外,在实践中固定效应估计量表现差强人意,资本系数通常偏低,投入弹性之和明显小于OLS方法,平衡综列数据与非平衡综列数据得到的估计值有很大差异。(二)随机效应模型。如果个体效应与投入不相关8,可以假定个体效应服从某种分布,如半正态分布或指数分布。这样,通过极大似然估计,可以得到感兴趣的参数