职业技能培训对农村居民非农收入的影响――来自珠江三角洲的证据①王海港黄少安李琴罗凤金①王海港,中央财经大学经济学院,邮政编码:100081,电话:13264339930,电子邮箱:haigangw@gmail.com;黄少安,中央财经大学经济学院和山东大学经济研究院,邮政编码:100081,电子邮箱:shaoanhuang@sdu.edu.cn;李琴,华南农业大学广东农村政策研究中心,中山大学岭南学院博士研究生;罗凤金,国家统计局广东调查总队。感谢Urzua、Vytlacil和李雪松教授对作者使用MTE软件给予的帮助和建议,感谢珠江三角洲5区(市)统计部门的大力支持和配合,感谢在2007年夏天参加预调查的广州几所高校的同学们。本研究受李晓西教授主持的国家社科基金重大课题“我国地区间居民收入分配差距研究”(06CJY012)、国家社会科学基金(05&ZD031)、广东省自然科学基金(06300504)和中央财经大学国家重点学科“国民经济学”建设基金的资助。1职业技能培训对农村居民非农收入的影响——来自珠江三角洲的证据王海港黄少安李琴罗凤金内容提要:本文应用异质性工具变量模型方法研究了珠江三角洲农村的职业培训,发现(1)村民的不可观察变量在村民的参与决策和收入获得中发挥了重要的作用,(2)不可观察变量使得那些昀有可能参加培训的村民从培训中获得的边际收益昀低,而那些参加培训可能性不高的边际收益昀高,(3)参加者的处理效应低于平均处理效益,而后者又低于未参加者的处理效应。我们的实证结果建议政府应该吸引和动员那些不参加职业培训难以提高工资收入的村民参加培训。关键词:职业培训;异质性;选择偏差;分类收益一、引言中国昀近30年的工业化和城市化占用了大量的农田,造成了大批的失地农民。为帮助他们和农村原有的剩余劳动力向非农产业转移,近年来许多地方政府积极在农村举办各种形式的职业技能培训。以我们调查的珠江三角洲五个区(市)为例,当地政府投入了大量的资金、物力和人力为村民提供非农或农业产业化职业技能培训。五区(市)普遍建立了区(市)、镇(街道)、村(居)委三级一体化的农村剩余劳动力职业培训和就业服务网络,制定了若干年的培训计划和目标。中山市由市镇两级提供巨资为农民进行职业培训,至2007年已经培训了8万多名农村剩余劳动力,就业率达到97%。佛山市三水区政府不仅开展初级培训,还增设了中、高级培训,为参加培训者提供每人约750元的培训经费,已经有1万多人接受了各种培训,就业率达60%以上。区(市)、镇政府普遍认为在农村开展的职业培训成效显著。与政府的不遗余力和热情形成鲜明对比的是,农村居民参与培训的积极性并不高,在我们的调查样本中上述五区(市)仅有不到13%的农村劳动力参与了培训。据悉,在浙江省的一些县、市存在类似的问题,地方政府为当地农民开展了职业技能培训班,但报名参加的农民仅占总数的很小一部分(黄祖辉、俞宁,2007)。农民也是理性人,为什么他们对培训的反应相对冷落?政府开展的职业技能培训的成效如何?应如何科学地评估职业技能培训的效果?探索这些问题对有效利用培训资金,更好地帮助农民转向非农产业和提高他们的非农收入有着重要的意义。评价培训项目面临的一个棘手问题是如何计算培训的预期收益。因为在计算收益时,必须估计出参加者如果未接受培训能够得到的收入,但实际情况是一个村民要么参2加了培训,要么没有参加,因此缺少相应的数据。而且,面对培训项目,村民是根据各自不同的背景条件选择是否报名参加的。一种背景条件是研究者可以观察到的,如村民的性别、年龄、文化程度和家庭人口等,另一类是观察不到的,如村民接受新技能的能力和兴趣、接受培训时的努力程度和受动员方式的影响等。对这类涉及选择(selection)并且带有异质性的不可观测变量(heterogeneousunobservables)的政策评估(policyevaluation)问题,目前成熟的解决方法是异质性工具变量模型(instrumentalvariablemodelwithessentialheterogeneity)①。选择理论昀初由Roy(1951)发轫,后经由HeckmanandRobb(1985),BjorklundandMoffitt(1987),ImbensandAngrist(1994)以及Heckman教授团队一系列论文的倡导和发展。②Heckman,UrzuaandVytlacil(2006a)运用异质性工具变量模型研究了高中毕业对美国年轻人工资的影响,所用的工具变量是个人的兄弟姊妹数量和母亲的受教育状态。HeckmanandLi(2004)用同样的方法研究了2000年中国6省(区)城镇青年大学教育的回报率,回报率明显高于明瑟尔模型中OLS估计值。研究中国教育收益率的论文还有Xiaojunetal.(2007),该文详尽研究了上世纪90年代中后期中国居民接受高等教育由免费改为收费的政策变动对大学教育收益率和面临不同的资金约束人群的就学决策的影响。一些实证研究表明,职业培训不见得总是有成效的,特别是当接受培训者是被挑选参加时,参加培训的并不一定是受益昀大的个体。Aakvik,HeckmanandVytlacil(2005)考察了挪威社会保险部门提供的再就业(vocationalrehabilitation)培训项目对就业的影响。在控制了样本的可观察的和不可观察的因素后,他们得出了培训的平均收益为负的结论,培训项目就平均而言对再就业没有多大帮助,参加者的收益低于随机挑选一个人参加培训的收益。相似的结果也在其他的一些培训评估论文中出现,职业培训尤其对成年男性和年轻人的就业和提升工资水平作用有限,而参加强制培训计划的收益昀低,甚至不足以弥补参加培训计划的成本。③本文应用了异质性工具变量模型方法研究珠江三角洲农村的职业培训,试图回答以下几个问题:(1)职业培训对村民非农收入的增加在总体上有多大帮助?(2)哪些村民从培训中获益昀大,哪些获益较小,哪些村民没有获益?(3)在参与培训的决策中,可观察变量和不可观测变量发挥了多大的作用?①当假定异质性完全可由可观测的变量精确代理时,也用匹配模型(MatchingModel)来处理这类问题。见Heckman,UrzuaandVytlacil(2006a)。②Shu-LingTsaiandYuXie(2007)简要介绍了由选择模型发展到带有异质性选择模型及其解决方法的经过。③Friedlanderetal.(1997)和LaLonde(1995)回顾了美国自1960年代至90年代开展的多项职业培训项目,总结了各种对培训项目的评价文献,解释了自愿参加(培训项目)和强制参加对参加者就业或收入的不同影响。3在控制了村民的可观察变量后,参加培训者在2007年的平均非农收入比未参加者高了近4000元,培训收益率高达19%。使用异质性工具变量模型方法得出的结论与上述简单的对比有很大的差距。我们的结论显示表面上的成效是选择的结果,有严重的选择偏差,在控制了参加者的可观察的和不可观测的变量后,参加者从培训中的获得的平均收益远远少于这一数字。我们的结论是建议政府应该更倾向于鼓励那些没有培训很不容易提高收入的那部分村民们参加培训。本文以下各部分的内容是这样的:第二部分介绍计量模型和方法、第三部分是数据和实证分析,第四部分是结论。二、计量模型和估计方法培训对收入的影响问题,传统的方法是采用OLS模型估计。考虑如下的模型:()0iiiiiYDXUEUγβ=++=(1)这里1,2,...,in=,表示不同的个人,iY表示结果,为收入对数,iD是一个虚拟变量,如果参加了培训则1iD=,否则等于零。iX是其他解释变量向量,iU是期望为零的扰动项。在收入模型中,OLS估计的参数γ可以被解释为培训对收入的影响,或者培训的收益。模型(1)假定了变量iD,即个体是否参加培训是外生决定或随机挑选的,而且模型中培训的收益γ对所有的参与者都是相同的。但事实上,理性人是否参加培训存在自选择或被选择,收入方程中的不可观察变量(扰动项)也可能因人而异。OLS模型、常规的工具变量方法对培训收益的估计都是有偏的。这一点已由CarneiroandHeckman(2002),Carneiro(2002),HeckmanandLi(2004)证明。(一)模型我们以下的工作借助了HeckmanandVytlacil(1999,2000),Carneiro,Heckman和Vytlacil(2001),Aakvik,HeckmanandVytlacil(2005),Heckman,UrzuaandVytlacil(2006)的建立的异质性模型和半参数估计方法。HeckmanandLi(2004),Xiaojunetal.(2007)也给了我们有益的启示。就培训而言,每个个体i存在两种潜在的结果10(,)iiYY,1iY表示个体参加了培训实现的结果,0iY表示没有参加培训的结果,在本文中均是收入的自然对数,这样10iiYY−就是处理效应(treatmenteffect)。显然,这是一个数据缺失问题(missingdata4problem),在任何时候同一个人只可能在两种状态①之一,要么参加了培训,记为1iD=,要么没有参加培训,记为0iD=。因此可观察到的结果iY,10(1)iiiiiYDYDY=+−。进一步地,结果01,YY是可观察的解释变量()X和不可观察到的随机扰动项10(,)UU的函数,111000iiiiiiYXUYXUββ=+=+(2)这里假定培训项目的效果不影响一般均衡,10,iiYY相互独立,没有交叉效应。村民是否参加培训取决于这两种状态下的效用高低,假设培训决策来源于如下的潜变量模型:*iiDDiDZUγ=−(3)参与人的选择规则为**00iiiDDD⎧≥⎪⎨⎪⎩1当时=0当时这里iZ是一组我们可以观察到的控制变量(iZ可能包含部分的iX),iDZγ相当于参与培训的效用;DiU表示个体在参与决策中不可观察到的误差和异质性,可以理解为个体参与培训的静成本(netcost)②。iDZγ越大,个体从培训中获得的收益越大,参与培训的概率也越大;DiU的作用刚好相反,DiU越大,个体参与培训的不可观察的成本越大,参与培训的意愿越低。iDZγ和DiU两者决定了*D的值。*iD是潜变量,相当于决策者从选择参与培训(状态1)中获得的静效用或收益,而且如果它是正的,个体选择参与培训,否则选择不参与。当iDDiZUγ=,个体参与或不参与培训是无差异的。将方程(2)代入iY③,得到[]010010100()()()YYYYDXXXUUDUβββ=+−=+−+−+(4)将[]1010()()XXUUββ−+−记为∆,∆即处理效应。如果D对于结果Y是外生的,即参与或不参与培训的人是随机挑选的,就像是在实验中一样,那么∆对任何人都是一致的,这就是模型(1)的情形。但是,在更一般的情形下,10UU≠,即使在控制了决策人的个①可以扩展为几种状态的问题,如ordered或者countedmodel。详见Wooldridge(2002)第18章,Heckman,UrzuaandVytlacil(2006)第6部分。②对研究者而言不可观察的成本,如学习新技能所付出的努力、由于接受培训失去了其他娱乐活动的快乐等。③下文在不引起歧义的情况下省略下表i。5人特征iX以后①,∆对各个个体也是不一样的,处理效应并不为常数,这时∆被称为异质性处理效应(heterogeneoustreatmenteffect)。②(二)各种处理效应参数回到模型(3),定义参与培训的概率或者倾向分数(propensityscore)为()Pr(1|)Pr()DDPzDZzzUγ====。这样决策模型D可以写成[]1()DDPZU=(5)这里()Pr(1|)PZDZ==,即倾向分数。式(5)表示当倾向分数大于不可观察的成本时,村民选择参与培训。为理解工具变量在异质性模型中对处理效应的估计,定义边际处理效应(marginaltreatmenteffect)为: