EnvironmentandSociety环境与社会2016年第6期55DOI:10.3969/j.issn.1003-1154.2016.06.017全国总体基尼系数的地区特征研究□马万超(中国人民大学经济学院,北京100872)[摘要]基于CGSS调查数据,考察基尼系数的演变趋势,结果显示:地区间收入差距对全国总体基尼系数的影响较大;在全国层面,平均受教育年数、平均收入水平与基尼系数正相关,城市化水平与基尼系数负相关;在地区层面,基尼系数影响因素表现出明显的差异。[关键词]基尼系数;收入差距;基尼系数地区特征;CGSS调查数据[中图分类号]C915[文献标识码]A[文章编号]1003-1154(2016)06-0055-03[基金项目]国家自然科学基金面上项目(71373273)。1国家统计局公布,中国基尼系数2008年0.491,2009年0.490,2010年0.481,2012年0.474,2013年0.473和2014年0.469。2这些年份包括2004年、2007年和2009年,这些地区指青海省、新疆维吾尔族自治区、宁夏回族自治区和西藏自治区。改革开放以来,中国经历了经济的高速发展,但同时也出现了收入差距的迅速扩大。1980—1985年,中国的基尼系数很小,介于0.250~0.281[1];但是,2008—2014年,中国的基尼系数已经介于0.469~0.4911,超过了0.40的国际警戒线,而国内外的一些研究机构公布的中国基尼系数还远远高于上述官方公布的数据。这说明中国存在比较严重的收入差距,并且,中国的收入差距一直是学术界争论的热点问题。争论主要在于:一是中国收入差距究竟有多大;二是中国收入差距的演变趋势怎样。前者涉及到对测度、评价收入差距的指标和方法的选择,后者需要可靠的数据和科学的方法对中国的收入差距做出切合实际的判断。目前,基尼系数的计算方法很多,其中,根据微观调查数据直接拟合洛伦兹曲线,进而计算基尼系数,是一种科学可行的方法:不仅可以对计算出的基尼系数进行地区分解,而且可以通过构造面板数据,分别从全国总体和地区层面,实证分析基尼系数的影响因素。本文正是基于上述思路分析中国的收入差距。一、文献评述学者们采用不同的方法测算了全国总体基尼系数,探讨收入差距的原因。董静和李子奈[2]通过修正城乡加权计算了全国总体基尼系数,存在计算误差率过大的问题。尹虹潘和刘姝伶[3]根据对不同收入的分组,采用面积法近似计算了全国总体基尼系数,并预测了其演变趋势,也存在计算结果不够精确的问题。陆铭和陈钊[4]基于1987—2001年省级面板数据进行估计,得出结论,认为城市化对降低城乡居民收入差距有显著的作用,政府财政支出的结构也对城乡收入差距有显著的影响。高连水[5]实证分析了物质资本、人力资本、政府政策、全球化、城镇化和经济体制改革等诸多因素对我国居民地区间收入差距的影响程度。综上所述,以往研究中存在如下不足:一是由基尼系数计算方法导致的计算结果不够精确;二是只研究城乡之间、地区之间收入差距的原因,没有研究城乡内部、地区内部收入差距的原因。鉴于此,本文采用CGSS调查数据中个人年收入数据直接高精度拟合和估计洛伦兹曲线函数,从一个全新的角度对全国总体基尼系数进行地区分解,探讨其地区特征和演变趋势。二、基尼系数计算方法本文使用中国人民大学调查中心公布的CGSS2003—2013的个人调查数据。由于CGSS调查数据中没有一些年份和地区2的数据,故做了剔除处理。其中,2003年的数据中农村调查数据过少,样本数据不具有代表性,2006年的数据异常,因此,本文只计算和分析了2005年,2008年,2010—2013年共6年的数据。环境与社会EnvironmentandSociety56管理现代化本文采用的具体拟合方法是,令洛伦兹曲线函数为y=axα+b,记x1=xα,则y=ax1+b(1)选取α值,对(1)式进行拟合,反复尝试找到一个使得拟合优度最高的α值(一般介于1.5至3.5之间),最后根据回归结果,将回归系数代入基尼系数计算公式:G=1-2曇10L(x)dx=1-2曇10(axα+b)dx=1-2(aα+1+b)(2)计算出基尼系数。然后,借鉴程永宏[1]提出的基尼系数分解公式G=∑θiGi+∑∑αijθij曇10(Fi-Fj)2dt(3)式中,θi为亚组i在总体中的收入占比,Gi为亚组i的基尼系数,αij为亚组i和亚组j在总体中的人口占比,θij为亚组i和亚组j在总体中的收入占比,Fi为亚组i的累积收入分布函数,Fj为亚组j的累积收入分布函数,T为亚组i和亚组j中的最高收入。总体基尼系数被完全地分解成组内不平等和组间不平等。组内不平等是各亚组基尼系数的加权平均,权系数为各亚组的收入份额;组间不平等是所有亚组“两两之间”相对不平等的加权和,权系数是相应的两亚组一共在总体中的人口份额与收入份额之积。利用该公式对总体基尼系数进行分解,必须根据样本数据高精度拟合出各个亚组的收入分布函数。然而,要想找到合适的函数形式来高精度拟合出各个亚组的累积收入分布函数将是极其困难的,尤其在亚组数量较多的情况下,亚组间不平等的计算将极其复杂。但是,倘若能够求出总体和所有亚组的基尼系数,就可以间接计算出亚组间不平等。对式(3)进行简单变换得到下面公式:∑∑αijθij曇10(Fi-Fj)2dt=G-∑θiGi(4)利用该公式,可以间接推算出亚组间不平等。这种算法简单易行,避免了直接测算亚组间不平等的复杂运算。本文正是运用这种方法来间接计算地区间收入不平等,从而实现对全国总体基尼系数的地区分解。3国家统计局公布,中国基尼系数2008年0.491、2009年0.490、2010年0.481,2012年0.474,2013年0.473和2014年0.469。三、全国总体基尼系数的地区分解(一)基尼系数的演变趋势第一,各省基尼系数层面。从统计数据结果看,我国的区域经济发展极不平衡,各省的收入基尼系数差异巨大。经济发达的东部省份的基尼系数较低,呈现出一定的下降趋势,经济落后的中西部省份的基尼系数较高,有一定的上升趋势。第二,各地区基尼系数层面。从各地区基尼系数数据来看,东部地区基尼系数较低,呈现下降趋势;中部地区基尼系数在后期基本低于全国水平;西部地区基尼系数较高,有波动趋势。东部地区基尼系数一直低于全国总体基尼系数,尤其在后期,越来越低于全国水平,这对抑制全国总体基尼系数上升或促进其下降做出了重要贡献。第三,全国总体基尼系数层面。2005—2013年,除2010年外的全国总体基尼系数基本稳定,介于0.483~0.4983,主要得益于经济发展基本面的变化、农村的惠农政策、城市低收入群体补助政策、中部崛起和西部大开发战略等。(二)全国总体基尼系数的地区分解基尼系数的地区分解是重要的研究领域。本文利用分解式(4),将全国总体基尼系数分解成地区内差距和地区间差距,计算了各地区内部差距和地区间差距分别对全国总体基尼系数的贡献率。从分解结果看,东部地区对全国总体基尼系数的贡献率最高,贡献率的演变趋势为先上升后下降,介于48.94%~61.86%;中部地区贡献率先下降,后上升,介于17.86%~30.51%;西部地区贡献率呈波动趋势,先下降,后上升,最后又下降,介于13.52%~19.61%。地区间差距对全国总体基尼系数的贡献率呈现明显的上升趋势,介于1.77%~8.78%。四、实证分析(一)模型设定影响基尼系数的因素有城市化水平、教育水平、收入水平、经济体制等。本文拟以上文计算出的各年份各省基尼系数作为被解释变量,以相应的CGSS调查数据中各省城市人口占比(urb)、平均受教育年数(educm)、年平均收入(incmean)、在国有或集体所有企事业单位就业人数占比(pub)等作为解释变量,由此得到以各省基尼系数为个体,2005年、2008年、2010—2013年共6年的面板数据,实证分析各省基尼系数的影响因素。建立个体效应模型:giniit=β1·urbit+β2·educmit+β3·pubit+β4·incmeanit+μi+εit(二)基尼系数的影响因素对于面板数据,首先考虑混合效应模型,大多数个体“province”虚拟变量均很显著,并且固定效应模型回归的p值为0.0871,故认为存在个体效应。引入年份虚拟变量进行回归,发现年份虚拟变量也联合显著,存在时间效应。因此,不应使用混合效应模型。EnvironmentandSociety环境与社会2016年第6期57最后,在固定效应模型和随机效应模型之间,豪斯曼检验的p值为0.0232,应该使用固定效应模型。固定效应模型的估计结果表明(表1),随着平均受教育年数提高,基尼系数上升(p值为0.027);随着城市人口比例的提高,基尼系数下降(p值为0.000);随着平均收入提高,基尼系数上升(p值为0.043);从2011年开始,基尼系数开始显著下降。平均受教育年数与基尼系数正相关,教育对基尼系数的影响尚未越过库兹涅茨倒U型曲线的拐点。城市人口占比与基尼系数负相关,城市化水平对基尼系数的影响已经越过库兹涅茨倒U型曲线的拐点。平均收入水平与基尼系数正相关,收入水平对基尼系数的影响尚未越过库兹涅茨倒U型曲线的拐点。在国有或集体所有企事业单位就业人数占比在统计意义上对基尼系数没有显著影响。最后,根据固定效应模型回归分析发现,2011年后,时间效应非常显著(p值都小于0.01),基尼系数开始下降,平均每年下降2.45个百分点。表1基尼系数影响因素的分析混合效应模型固定效应模型稳健标准误固定效应模型随机效应模型educm-0.0045(-1.24)0.0104**(2.24)0.0104**(2.24)-0.0037(-1.27)urb-0.166***(-4.41)-0.212***(-4.18)-0.212***(-4.18)-0.161***(-4.45)incmean0.000000248(0.26)0.00000210**(2.05)0.00000210**(2.05)0.000000129(0.23)pub-0.0354(-0.63)-0.0374(-0.53)-0.0374(-0.53)-0.0267(-0.48)注:括号内为t值;*p0.1,**p0.05,***p0.01,下表同。(三)东中西部基尼系数的影响因素对全国采用固定效应模型,东部地区采用聚类稳健标准误混合效应模型,中部地区采用随机效应模型,西部地区采用随机效应模型,估计结果见表2。表2基尼系数影响因素的分地区分析全国东部中部西部educm0.0104**(2.24)0.0006(0.07)0.0035(0.53)0.0064(1.07)urb-0.212***(-4.18)-0.200**(-2.84)-0.312***(-5.43)0.0478(0.50)incmean0.0000021**(2.05)0.00000127(0.92)0.00000097(0.68)0.000000177(0.12)pub-0.0374(-0.53)-0.191**(-3.13)0.381***(4.17)-0.133*(-1.73)在东部地区,城市人口占比与基尼系数负相关(p值为0.018),在国有或集体所有企事业单位就业人数占比与基尼系数负相关(p值为0.011),其它因素影响不显著,东部地区有比较显著的时间效应,从2011年起,基尼系数开始下降;在中部地区,城市人口占比与基尼系数负相关(p值为0.000),与东部地区截然相反的是,在国有或集体所有企事业单位就业人数占比与基尼系数正相关(p值为0.000),其它因素影响不显著,时间效应不显著;在西部地区,在国有或集体所有企事业单位就业人数占比与基尼系数负相关(p值为0.083),其它因素影响不显著,时间效应不显著。五、结论和政策含义本文得出的主要结论:(1)全国总体基尼系数较高,演变趋势基本稳定,但是其内部各地区的基尼系数差异巨大,且呈现不同的演变趋势。(2)经过实证分析发现,在全国层面,平均受教