第10卷第2期2011年1月经济学ChinaEconomicQuarterlyVol.10,No.2January,2011*郭继强,浙江大学公共管理学院,浙江大学劳动保障与社会政策研究中心(LEPP);姜俪、陆利丽,浙江大学公共管理学院。通信作者及地址:郭继强,杭州市浙大路38号浙江大学公共管理学院,310027;E-mail:jiqiangguo@163.com。作者感谢两位匿名审稿人中肯到位的评论和建议,但文责自负。作者还感谢国家社科基金重点项目“`十二五'时期调整国民收入分配结构研究”(10AZD003)、国家社科基金项目“城乡一体化进程中扩大就业的理论和对策研究”(09BJL019)、国家自科基金重点项目“城乡劳动力市场整合机理与实现机制研究”(70933001)、教育部哲学社会科学研究重大课题攻关项目“建立城乡统一的劳动力市场,实现城乡劳动者平等就业研究”(06JZD0014)以及LEPP重大项目“我国收入不平等的度量及其矫正机制研究”的资助。工资差异分解方法述评郭继强 姜 俪 陆利丽*摘 要 工资差异分解方法发展到今天,可谓均值分解和分布分解共分其天下。均值分解方法呈Oaxaca-Blinder分解及其改进、Brown分解及其改进和JMP1991分解“三足鼎立”的局面,而Oax-aca-Blinder分解则是最基础也是最经典的一种方法。分布分解方法主要由JMP1993分解、DFL分解、MM2005分解、FL1998分解、Lemieux分解、Q-JMP分解和FFL分解“七剑合璧”,其中前三种方法尤具奠基性。本文系统地梳理了这些分解方法之间的传承联结,以期形成一幅较为完整的工资差异分解方法演进的向导图。 关键词 工资差异,工资均值分解,工资分布分解,反事实工资一、引 论在工资差异分解方法的演进史上,分解工资差异源自对劳动力市场中歧视的度量。Oaxaca就是从界定歧视系数以度量歧视开始了他的工资差异均值分解。鉴于Oaxaca(1973)和Blinder(1973)差不多同时对两个组群(诸如男性与女性两个组群,抑或白人与黑人两个组群等。本文为叙述的前后一致性和一般性起见,将所考察的两个组群依据工资水平高低分别记为组群H和L)之间的工资均值差异提出了几乎相同的分解方法,学术界通常将这种分解方法称为Oaxaca-Blinder分解(间或简称Oaxaca分解)。该分解将组群之间工资均值差异分解为由个体特征差异造成的可解释部分和由特征回报差异带来的不可解释部分,并把不可解释部分归因于歧视。因而,工资差异的均值分解方法常用于测度歧视的大小程度。DOI:10.13821/j.cnki.ceq.2011.02.004364 经济学第10卷组群工资差异均值分解方法基本上是围绕着“在三个层面上应对两类问题”这一主线展开。“三个层面”是指Oaxaca-Blinder分解层面、Brown分解层面和JMP1991分解层面。如果说Oaxaca-Blinder分解层面只是关注于“同工不同酬”问题;那么,Brown分解通过吸纳和整合组群职业分布对工资差异的影响,形成了将职业分隔(occupationalsegregation)和同工不同酬纳入统一分析框架的新研究层面。前两个层面的均值分解都把工资均值差异的不可解释部分归因于歧视,但JMP1991分解却不然,而是把不可解释部分重点归因于不可观测技能差异(更一般地说是组群特异性),使得对不可解释部分成因的考察重心从歧视转变为不可观测技能差异1;另一方面,JMP1991分解将不可解释部分即残差额表达成残差标准差与标准化残差分布差异之乘积,尽管还没有完全利用分布特性进行工资分布分解,但与以往只关注经典线性回归残差均值为零的特性从而忽略残差分布的均值分解方法相比,它转向了关注残差分布,进而推动着工资差异分解从均值视角向分布视角深化。“两类问题”分别是指数基准问题以及诸如选择性偏差等计量技术问题。所谓指数基准问题(indexnumberproblem)是指这样的难题:在工资差异均值分解过程中因所选取的分解基准不同得到相异的分解结果,既无法客观准确地衡量各种因素或特性对工资差异的影响程度,也无法唯一地推断出真实的歧视程度。另一类问题是诸如样本选择问题和虚拟变量系数识别问题等一些计量技术问题。均值分解的样本选择问题是指由于对样本选择偏差纠正项差异的归因存在某种程度的主观性所导致的分解结果的多种可能性。虚拟变量系数识别问题则是指在将工资差异分解到各个单一协变量的效应时,各个虚拟变量的特征效应和系数效应会因基准组选择的不同而变化,从而导致分解结果的模糊性。这两类问题,在上述三个层面中均无法绕开。1其实,歧视和不可观测技能都会影响不可解释部分,但JMP1991分解方法仍无法识别歧视。当然,如何将不可观测技能与歧视进一步在理论和实证上区别开来,仍有待继续探索。客观地说,工资均值只能描述工资分布的集中趋势,反映分布的一个特征,而一个组群的工资状态毕竟是一种分布,特别是在组群的工资分布趋于离散的情况下,更需要对工资分布的不同区域进行针对性的逼近和刻画。此时,能够针对工资分布的不同区域进行解析的分布分解就拥有独特的优势。在工资差异的分布分解方面,Fortinetal.(2010)建立了按照反事实工第2期郭继强等:工资差异分解方法述评365 资分布的构造路径归纳工资差异分布分解方法的综述框架。2笔者以为,Fortin等的综述框架无疑具有高度概括性,但在此框架下却难以展现分解方法之间的传承联结。而本文则采取了不同的梳理思路,以分解方法的演进脉络为主线,同时考虑基本模型设定和反事实工资分布构造的差别,以递进和拓展的思路为读者提供一幅工资分解方法演进的向导图。因此,本文或许更适合那些对分布分解方法不甚熟悉却又感兴趣且期望能够较快把握工资差异分解方法的读者。2Fortinetal.(2010)归纳了构造反事实工资分布的三条路径:F(lnw;tw=1,tX=0)=∫F(lnw|X,tw=1)dF(X|tX=0). 第一条路径是直接从变换工资值着手,将t=0时期个体的工资值替换为反事实工资值,从而形成反事实工资分布。JMP1993、MM2005和Q-JMP分解都是遵循这一路径构造了反事实工资分布。第二条路径是从变换特征分布着手,将反事实工资分布作为t=1时期工资分布的重置加权形式,即:F(lnw;tw=1,tX=0)=∫F(lnw|X,tw=1)ψX(X)dF(X|tX=1),其中,ψX(X)=dF(XtX=0)/dF(XtX=1)。通过该路径构造反事实工资分布的方法有DFL分解、Le-mieux分解和FFL分解。第三条路径是从变换工资条件分布着手,将t=0时期的条件工资分布F(lnwX,tw=0)替换为F(lnwX,tw=1)。FL1998分解、Donaldetal.(2000)和Chernozhukovetal.(2009)都通过该路径构造了反事实分布。在笔者看来,迄今为止的工资差异分布分解方法的特点可大体上归结为“四类基本模型三种反事实分布”。具体说来,JMP1993分解是工资差异分布分解的一个里程碑。JMP1993分解基于经典线性回归模型(OLS估计),通过将残差分布中的分位与个体在不可观测技能分布的分位相联系,经由残差分布变换来构建反事实工资分布,将同一组群工资分布变动分解为可观测特征变动、可观测特征回报率变动和不可观测技能变动。MM2005分解利用条件分位回归模型,通过概率积分转换(probabilityintegraltransformation)构建反事实工资分布,解决了JMP1993分解中的异方差问题。不管是基于经典线性回归模型还是条件分位回归模型的分解方法,都无法避免模型参数线性设定的假定,而DFL分解基于半参模型(核密度估计),通过重置权重函数的思想构建反事实工资分布,突破了模型参数线性设定的局限。不过,前三个模型都无法将工资分布变动自然地分解至各个单一协变量特征效应,而FFL分解则基于RIF回归模型,利用DFL分解中重置权重函数构建反事实工资分布的方法,将工资分布变动成功地分解至单一协变量效应。此外,FL1998分解、Q-JMP分解以及Lemieux分解还从不同角度对工资分布分解进行了变异和拓展。概言之,工资差异分布分解的方法基本上可以归纳成以下七种:(1)基于经典线性回归的分布分解,包括JMP1993分解和FL1998分解;(2)基于半参模型的分布分解,包括DFL分解和Lemieux分解;(3)基于条件分位回归的分布分解,包括MM2005分解和Q-JMP分解;(4)基于RIF回归的分布分解,即FFL分解。366 经济学第10卷鉴于工资差异分解方法中均值分解和分布分解的区块特征非常明显,本文述评的结构安排自然要充分考虑这种状况。据此,本文的第二部分将介绍“工资差异均值分解”;第三部分考察“工资差异分布分解”;最后部分则是“评论性小结”。通过系统地梳理各种分解方法的理论基础、假设条件和适用范围,阐释各种分解方法之间的传承联结,扼要评价它们的学术贡献,本文希冀能够形成一幅较为完整准确的工资分解方法向导图。二、工资差异均值分解工资差异均值分解部分介绍四项内容:Oaxaca-Blinder分解的形成与改进、Brown分解及其修正、JMP1991分解以及对均值分解中若干计量问题的矫正。Oaxaca-Blinder分解是在承接Becker(1957)市场歧视系数之意蕴基础上的计量展开。由于Oaxaca-Blinder分解存在指数基准问题,Cotton(1988)、Neumark(1988)以及郭继强和陆利丽(2009)就是通过优化无歧视工资结构来改进工资差异的均值分解。在Brown分解层面上,本文主要介绍Brown分解和Appleton分解,后者通过矫正双重指数基准问题来深化改进Brown分解。JMP1991分解则是指Juhnetal.(1991)在均值分解中引入分布工具的一种分解方法。在计量问题的矫正方面,本文着重讨论样本选择和虚拟变量系数识别问题。(一)Oaxaca-Blinder分解的形成与改进1.Oaxaca-Blinder分解的形成3此处的X是n×k的矩阵,X则是行向量;β实际上是估计值β,本文为了表述的一致和简洁起见,将相关回归方程的估计参数中的“”(hat符)去掉。同时,本文还对相关文献中同一概念或指标用不同符号形式的表达作了统一处理。Oaxaca(1973)在其经典论文“Male-FemaleWageDifferentialsinUr-banLaborMarkets”中指出,以往对男女工资差异的研究多是描述性的,而该篇论文的目的则是要从数量上估计美国对女性工人歧视的平均程度以及各因素对男女工资差异的影响程度。如果记组群H和L在劳动力市场上的均衡工资分别为wH和wL,这两个组群分别作为子样本的个体特征(个体禀赋)矩阵各为XH和XL,相应的回归系数向量(或称工资结构)分别为βH和βL,这两个组群的半对数形式的工资估计方程(通常以Mincer工资决定方程为基础)分别是lnwH=XHβH+uH,lnwL=XLβL+uL;又记这两个组群的子样本个体特征向量的平均值分别为XH和XL,那么,根据最小二乘法(OLS)残差均值为零的性质,这两个组群的工资均值之差可表述成3:lnwH-lnwL=XHβH-XLβL.(2-1) Oaxaca承接Becker(1957)所定义的市场歧视系数的基本内核并进行一第2期郭继强等:工资差异分解方法述评367 定的变形后提出了如下形式的歧视系数(discriminationcoefficient,D):D=wH/wL-(wH/wL)0(wH/wL)0,其中,(wH/wL)0表示无歧视时的均衡工资比。被观察到的现实工资往往是存在歧视时的工资,而无歧视时的工资则需要我们根据既有实际样本的信息加以估计和逼近。4无歧视工资也是我们进行工资差异均值分解和推断歧视程度的逻辑基点。若将Oaxaca对歧视的界定写成对数形式则有5:lnwH-lnwL=ln(wH/wL)0+ln(D+1