1我国三大经济地带就业弹性的比较①——基于面板数据模型(panel-datamodel)的实证研究张江雪(北京师范大学经济与资源管理研究所)【摘要】本文利用面板数据模型(panel-datamodel)的计量方法,对我国东中西三大经济地带1978—2003年的经济总体就业弹性和非农就业弹性进行估计,揭示了这三个区域经济增长率与就业增长率之间关系的差异,论证了东部地区总体和非农就业弹性均明显高于中西部地区,并对其差异的形成原因进行简要分析。关键词就业弹性三大经济地带面板数据模型中图分类号F241.4文献标识码AAComparisonofEmploymentElasticityinThreeEconomicRegionsofChinaAbstract:Basedontheeconometricmethodofpanel-datamodel,thispaperestimatesemploymentelasticityandnon-agricultureemploymentelasticityoftheeast,themid,thewestfrom1978to2003,poststhedifferencesofthreeeconomicregionsintherelationshipbetweenincreasingrateofeconomyandemployment,demonstratesthattheemploymentelasticityoftheeastisobviouslyhigherthanthatinthemidandthewest,andanalysesthebriefreasonsfordifferences.Keywords:EmploymentElasticity;ThreeEconomicRegions;Panel-dataModel改革开放以来,我国地区经济收入差距日益扩大。经计算,1988年东、中、西三大经济地带人均GDP基尼系数②为0.16,随后逐年上升,2003年达到0.22。地区收入的差异造成了劳动力的区域流动,特别是不发达地区农村剩余劳动力向发达地区城镇非农产业部门转移,形成了20世纪90年代以来我国日益增加的“民工潮”现象,并导致各地区就业吸纳能力发生重大变化。各地区就业吸纳能力可用就业弹性来衡量,就业弹性是指就业增长率与经济增长率的比值,该指标反映了劳动力供求关系的总量对比与结构特征。目前我国学术界对就业弹性的测①本论文得到了导师李晓西教授的指导,特此感谢,但文中的观点由我个人负责。②基尼系数是衡量居民收入差距的一个重要指标,其经济含义是:在全体居民总收入中,用以不平均分配的那部分收入占总收入的比重。基尼系数数值越大,表明居民收入差距越大,反之差距越小。2算大多采取弧弹性法③,用两个不同时点计算出的就业增长率除以经济增长率,但该方法计算的结果波动性大,而且不能对结果进行统计检验,不利于未来就业增长的预测。另外,也有一些研究者采用计量模型测算就业弹性④,这种方法的优点是估计结果比较稳定,可进行统计检验,但现有研究一般是利用经济总体时间序列数据,样本量小,估计效果不太理想。本文从研究我国三大经济地带就业弹性的差异入手,运用面板数据模型,即运用我国1978—2003年分省(市、区)的时间序列数据对东、中、西三大经济地带⑤的就业弹性进行估计,并从不同方面分析其差异形成的原因。一、运用面板数据建立分地区的就业弹性计量模型一般的就业弹性计量模型采取双对数模型,基本形式是:YLLnLn+,其中,L、Y分别代表劳动力和GDP,、分别为模型估计出的参数,对上述双对数模型两边同时微分,即可得到:YdYLdLdLnYdLnL=,从就业弹性的定义中可以看出,即为我们讨论的就业弹性。运用计量模型的方法主要有三类:第一类是只利用截面数据回归模型,第二类则是纯粹利用时间序列数据。这两类模型样本数据少,只能从单一层面说明问题,不能满足经济分析需要。本文采用第三类模型——面板数据模型,结合时间序列和截面数据,建立分地区的就业弹性计量模型。(一)面板数据模型的形式与优点面板数据模型(panel-datemodel)是从20世纪50年代开始用于解决经济问题的,它综合了时间序列和截面数据两方面的信息,在时间序列上取多个截面,在这些截面上同时选取样本观测值构成样本数据,是近几十年来计量经济学理论方法的重要发展之一,具有很好的应用价值。从理论上讲,一般的线性面板数据模型可表示为:TtNiuXititititit,2,1,2,1Y;(1)其中,itY为被解释变量,itX为解释变量,kitkitititXXXX,,,=1,K为外生变量个数,it、it为估计参数,kitititit,,,=21,itu为随机扰动项,T为时期数,N为横截面个数。由于我国三大经济地带经济发展与就业增长的关系,既受到三大经济地带内部各省(市、区)的不同影响,也受到它们不同时期的影响。结合时间序列和截面数据的面板数据模型,③龚玉泉、袁志刚(2002),张本波(2002),周月梅、刘伟、黄丽(2004)等人采用弧弹性方法计算我国经济总体就业弹性;蔡昉、都阳、高文书(2004)等人利用弧弹性计算了我国城镇就业弹性和城乡总体就业弹性;张车伟、蔡昉(2002)等人在用弧弹性方法计算我国总体和分三次产业的就业弹性的基础上,采用三年移动平均的方法克服就业弹性波动性大的情况。④李红松(2003),赵建国(2003)对我国改革开放来的平均就业弹性进行了计量分析。⑤本文按照新三分法来划分我国不同的经济区域,东部地区包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、海南等11个省(区、市);中部地区包括山西、吉林、黑龙江、安徽、江西、河南、湖北、湖南等8个省(区、市);西部地区包括重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆、广西、内蒙古等12个省(区、市)。但由于重庆市1997年才升格为直辖市,统计资料的收集上存在一定的局限。因此,本文西部地区选用除重庆外的其余11个省(市、区)作为样本。3具有以下优点:第一,面部数据模型既可以分析某一时期各省(市、区)经济增长对就业增长带动作用的差异,还考虑了时间因素的影响;第二,面板数据模型能区分各省(市、区)这些个体间的差异并进行控制,在本文中更多地体现在三大经济地带内部各省(市、区)的就业弹性能否用统一的参数表示。如果不能拒绝地带内的各省(市、区)估计参数相同的假设,那么就可以得出该地带的就业弹性;反之,我们就无法估计三大经济地带的就业弹性;第三,从统计角度看,与单纯的截面数据模型或时间序列模型相比,面板数据模型不仅大大增加了观测样本量,提高了样本自由度,使就业弹性的估计值更加可靠,而且可以减弱解释变量多重共线性的影响,降低估计误差。因此,本文利用东中西三大经济地带所包含的相关省(市、区)1978—2003年的相关数据建立模型,也就是基于“省(市、区)—时间序列”的数据组合,分别建立我国东中西三大经济地带的面板数据模型,估计它们的就业弹性。(二)就业弹性计量模型的建立本文的目的在于比较东中西三大经济地带就业弹性的差异,假定这种差异更多的体现在不同省(市、区)之间,根据双对数模型中斜率代表就业弹性的特点,可以建立以下面板数据模型:itiiuLnLLnititY+(2)其中,itL、itY分别表示第i个省(市、区)在第t年的就业人数和以1978年为基期计算的可比价格的GDP;i即为我们所要估计和分析的就业弹性。由于我国经济和就业增长的惯性等原因,各省(市、区)的时间数据存在序列相关,为减少自相关因素的影响,本文采用广义差分法,在解释变量中加入自回归项(即AR项)。三大经济地带的划分参照了各省(市、区)经济发展与行政分布的特点,虽然内部各省(市、区)的经济结构与就业结构具有较强的相似性,但也会存在一定的差异,因此在建模时要分别对三大经济地带各样本数据的系统一致性进行检验,以确定模型的设定形式,也就是检验模型参数在所有截面样本点上是否是相同的常数。根据i、i对不同省(市、区)的取值是否相同,模型的设定形式存在差异。在参数不随时间变化的情况下,截距i和斜率i有以下两种假设:假设1:斜率相同,但截距不同,模型为:itiuLnLLnititY+(3)此时,各省(市、区)经济发展对就业增长的影响在一定显著水平下相同,但是各省(市、区)存在一定差异,体现在不同的i中,包括经济与就业的初始水平、经济体制的差异等。假设2:斜率和截距都相同,模型为:ituLnLLnititY+(4)此时,各省(市、区)无显著差异,相当于多个时期的截面数据放在一起作为样本数据。检验方法采用协方差分析,通过两个F检验进行⑥。如果最终确定某一经济地带的模型形式为模型(2),则该地带内各省(市、区)经济发展对就业增长的带动作用不同,不能用统一的i表示该地带的就业弹性,也就不能估计其就业弹性;如果模型形式为(3)或(4),⑥分别构造假设1的检验统计量:1/1/1121KNNTSKNSSF;和假设2的检验统计量:1/11/1132KNNTSKNSSF;其中,1S、2S、3S分别代表模型(2)、(3)、(4)的残差平方和。在假设1和假设2的情况下,统计量F1和F2服从特定自由度的F分布。如果F2大(等)于某置信度下的同分布临界值,则拒绝假设2,继续检验,找出非齐次的来源;反之,利用模型(4)拟和样本。在已确定参数存在非齐次的基础上,如果F1大(等)于某置信度下的同分布临界值,则拒绝假设1,用模型(2)拟和样本;反之,用模型(3)拟合。4i对于该地带内的每个省(市、区)是相同的,就可以得到该地带的就业弹性估计值。此外,根据样本数据性质的不同,模型(2)、(3)有固定效应模型和随机效应模型之分,并分别对应不同的参数估计方法。前者将反映时期和个体遗漏的估计作为未知的常数看待,后者将其视为随机变量。选用哪种模型,取决于我们如何选取省(市、区)这些截面单元。如果各省(市、区)是从相应地带中随机抽取的,则总体中的个体差异服从随机分布,应采用随机效应模型;当选择的截面是总体的所有单位时,固定效应模型更合适。本文东中西三大经济地带的样本分别是各地带所包括的省(市、区),因此采用固定效应模型。二、三大经济地带就业弹性的估计(一)经济总体就业弹性的估计计划经济时期,由于劳动力配置的行政性和区域性特点,就业弹性无法真实反映经济发展与就业增长的相互关系。20世纪70年代末,劳动力与工资的市场化改革开始进行,就业弹性才逐渐反映出经济增长对劳动力的吸纳能力,所以面板数据模型的时期选择1978—2003年。首先分别估计东中西三大经济地带的经济总体就业弹性,即就业变量选择各省(市、区)全部就业人数,经济增长变量采用各省(市、区)可比价GDP。根据《新中国五十年统计资料汇编1949-1999》、2000-2004年的《中国统计年鉴》、《中国国内生产总值核算历史资料1952-1995》、《中国国内生产总值核算历史资料1996-2002》,计算整理出1978—2003年各省(市、区)的全部就业人数和1978年不变价计算的GDP。在此基础上,通过协方差分析确定模型的具体形式,有关统计量及相关结论见表1。表1全国及三大经济地带就业弹性估计的协方差分析检验地区1S2S3S1F2F结论东部地区0.27770.27990.3230—1.3753接受假设2,采用模型(4)中部地区0.06870.07930.11042.02465.3113接受假设1,采用模型(3)西部地区0.12740.14480.18531.72713.8353接受假设1,采用模型(3)全国0.41040.47180.58991.54943.0165接受假设1,采用模型(3)注:为保证矩阵可逆,全国的统计估计量采用的是1981-2003年的