SFA方法和因子分析法综述(姬晓鹏,管理科学与工程,1009209018)1.1DEA方法和SFA方法的区别1.数据包络分析(DEA)数据包络分析(dataenvelopmentanalysis)简称DEA,采用线性规划技术,是最常用的一种非参数前沿效率分析法。它由A.Charnes和W.W.Cooper[1]等人于1978年创建的,以相对效率为基础对同一类型的部门的绩效进行评价。该方法将同一类型的部门或单位当作决策单元(DMU),其评价依据的是所能观测到的决策单元的输入数据和输出数据。输入数据是指决策单元在某种活动中所消耗的某些量,如投入资金量、原料量等,输出数据是指决策单元消耗这些量所获得的成果和产出,如产品产量、收入金额等。将各决策单元的输入输出数据组成生产可能集所形成的生产有效前沿面,通过衡量每个决策单元离此前沿面的远近,来判断该决策单元的投入产出的合理性,即技术效率[2]。一般的评价方法比较同一类型的决策单元的效率,需要先对决策单元的输入输出指标进行比较,并通过加权得到一个综合评分,然后通过各个决策单元的评分来反映其效益优劣。数据包络分析法则巧妙地构造了目标函数,并通过Charnes-Cooper变换(称为2C-变换)将分式规划问题转化为线性规划问题,无需统一指标的量纲,也无需给定或者计算投入产出的权值,而是通过最优化过程来确定权重,从而使对决策单元的评价更为客观。对建筑设计企业进行评价的问题,很适于数据包络分析法的评价模型。DEA方法也存在着一些缺点:首先,当决策单元总数与投入产出指标总数接近时,DEA方法所得的技术效率与实际情况偏差较大;其次,DEA方法对技术有效单元无法进行比较;此外,由于未考虑到系统中随机因素的影响,当样本中存在着特殊点时,DEA方法的技术效率结果将受到很大影响。彭晓英等用因子分析法对指标进行筛选和综合,再采用DEA方法进行评价,解决了DEA方法对指标数量限制的问题,并对煤炭资源型城市的生态经济发展进行了评价[3]。SFA与DEA方法都是前沿效率评价方法,它们都是通过构造生产前沿面来计算技术效率的。与DEA方法相比,SFA方法利用生产函数来构造生产前沿面,并采用技术无效率项的条件期望来作为技术效率,其结果受特殊点的影响较小且不会出现效率值相同且为1的情况,可靠性、可比性更好[4,5]。SFA方法也有一些缺点,如处理多产出的情况时不如DEA方法方便,需要将多产出合并成一个综合产出;而投入指标过多时,由于指标间的相关关系,也会对结果的可靠性产生影响。周春应等、侯强等分别采用了SFA方法对我国区域经济技术效率和辽宁省城市技术效率进行了评价[6,7]。1.1.1SFA方法的产生在经济学中,技术效率的概念应用广泛。Koopmans首先提出了技术效率的概念,他将技术有效定义为:在一定的技术条件下,如果不减少其它产出就不可能增加任何产出,或者不增加其它投入就不可能减少任何投入,则称该投入产出为技术有效的[104]。Farrell首次提出了技术效率的前沿测定方法,并得到了理论界的广泛认同,成为了效率测度的基础[105]。在实际应用中,前沿面是需要确定的。其确定方法主要两种:一种是通过计量模型对前沿生产函数的参数进行统计估计,并在此基础上,对技术效率进行测定,这种方法被称为效率评价的“统计方法”或“参数方法”;另一种是通过求解数学中的线性规划来确定生产前沿面,并进行技术效率的测定,这种方法被称为“数学规划方法”或“非参数方法”。参数方法的特点是通过确定前沿生产函数的参数来确定生产前沿面,针对不同研究对象所确定的生产函数也各不相同,技术效率的测度具有一定的针对性,而非参数方法只需通过求解线性规划来确定生产前沿面,方法简单易行,应用广泛。参数方法依赖于生产函数的选择,常用的生产函数有Cobb-Douglas生产函数、Translog生产函数等。参数方法的发展经历了两个阶段:确定型前沿模型和随机型前沿模型。Aigner等、Afriat分别提出了各自的确定型前沿模型,在不考虑随机因素影响的情况下求解前沿生产函数[106,107]。但是,由于确定型前沿模型把所有可能产生影响的随机因素都作为技术无效率来进行测定,这使得其技术效率测定结果与实际的效率水平有一定的偏差。为了消除确定型前沿模型的这一缺陷,Meeusen和VandenBroeck,Aigner、Lovell和Schmidt和Battese和Corra提出了随机前沿模型(即SFA方法),对模型中的误差项进行了区分,提高了技术效率测定的精确性[108-110]。1.1.2SFA方法简介Meeusen和VandenBroeck,Aigner、Lovell和Schmidt和Battese和Corra首次提出了随机前沿方法(StochasticFrontierApproach,简称SFA),它是一种技术效率理论的参数方法。1.SFA模型文献[108-110]中提出的SFA模型如下所示:(,)exp()exp()iiiiYfxvu,1,...,iN(4-1)其中,iY表示产出,ix表示投入,为模型参数。在他们提出的模型中,将随机扰动i分为两部分:一部分用于表示统计误差,又被称为随机误差项,用iv来表示;另一部分用于表示技术的无效率,又被称为非负误差项,用iu来表示。当模型的生产函数选择Cobb-Douglas生产函数时,式(4-1)可写成下面的线性形式:0lnlnijijiijYxvu,1,...,iN(4-2)模型有如下假设:(1)随机误差项2(0,)ivviidN,主要是由不可控因素引起,如自然灾害、天气因素等等。(2)非负误差项2(0,)iuuiidN,取截断正态分布(截去0的部分),且有iu、iv相互独立。(3)iu、iv与解释变量ix相互独立。Battese和Coelli在前人研究的基础上进行了改进,引入了时间的概念,使SFA模型可以对面板数据进行效率评价[15]。具体模型如下:(,)exp()exp()ititititYfxvu,1,...iN,1,...tT(4-3)在式(4-3)中,itY是第i个决策单元的t时期产出,itx是第i个决策单元的t时期的全部投入,为模型参数,itv为随机误差项,exp(())itiuutT为非负误差项,为被估计的参数。图4-1SFA模型的技术效率图4-1以Cobb-Douglas生产函数为例,显示了SFA模型技术效率测度的优点。图中,由Cobb-Douglas生产函数确定的生产前沿面为:01lnlniiqx,而基于这个确定生产前沿面的随机前沿模型为:01lnlniiiiqxvu,也可以表示为:01exp(ln)iiiiqxvu。A、B两点分别表示随机影响为正或为负的情况:A点表示随机影响为正,则随机误差项Av为正数,生产前沿面上移到*01exp(ln)AAAqxv,样本的技术效率为01*01exp(ln)exp(ln)AAAAAAAAxvuqTEqxv,B点表示随机影响为负,则随机误差项Bv为负数,生产前沿面下移到*01exp(ln)BBBqxv,样本的技术效率为01*01exp(ln)exp(ln)BBBBBBBBxvuqTEqxv。2.SFA效率的计算对于式(4-1),我们可以将SFA技术效率定义如下:exp()(,)exp()iiiiiYTEUfxV(4-4)所以,在iU的分布已知的情况下,我们可以计算出技术效率的平均值[exp()]iTEEU,但是,通过该方法若想计算出各样本点的技术效率值却有些困难。因为我们可以根据样本点的观测值得出模型中参数的估计值,并根据这些估计值求出残差i,但是,我们无法计算出每个iU和iV的估计值。为了能够计算出每个样本点的技术效率,文献[16]将技术效率定义为exp[()]iiiTEEU,该方法被称为JLMS技术,他们分别就半正态分布和指数分布推导了()iiEU的表达式,得出了技术效率值,解决了技术效率计算的问题。SFA方法通过极大似然法估计出各个参数值,然后用技术无效率项的条件期望作为技术效率值。与DEA方法相比,其结果一般不会有效率值相同并且为1的情况,并且SFA方法充分利用了每个样本的信息并且计算结果稳定,受特殊点影响较小,具有可比性强、可靠性高的优点。1.2因子分析法1.2.1因子分析法简介因子分析是一种比较实用的多元统计方法,它是主成分分析法的推广。因子分析法的作用是将相关性较高、关系复杂的指标变量综合成数量较少、关系简单的综合指标(在因子分析中被称为因子),并展现各因子与初始变量之间的关系。换言之,因子分析就是一种应用于存在复杂的相关关系的指标体系中,研究或探寻不能直接观察到,但对所观测变量起到支配或概括性作用的隐藏因子的多元统计分析方法[17]。一个指标体系中的每个变量的形成都是有其原因的,各个变量之间的共同原因被称为公共因子,而每个变量又存在着产生其特性的原因,被称为特殊因子。因子分析就是根据样本的数据资料,将影响每一个原始变量的公共因子和特殊因子采用线性的方式来进行表达,以达到合理解释原始变量的相关性并降低维数的目的。在采用因子分析方法时,一般使公共因子尽可能少且概括性高,并且尽可能使其具有一定专业意义,公共因子共同作用于每个变量,而特殊因子只作用于特定的变量。1.2.2因子分析的数学模型及计算方法1.因子分析的数学模型假设有p个观测变量,可以用mp个公共因子和1个特殊因子来进行表示,如下所示:1111122112211222221122nnnnqqqqnnqXaFaFaFXaFaFaFXaFaFaF(4-5)式(4-5)中,iX为观测变量,jF为公共因子,i为特殊因子,ija是因子系数(又称为因子载荷),而由因子载荷ija构成的矩阵A被称为因子载荷矩阵。因子分析模型中,假设初始变量iX、公共因子jF和特殊因子i均为标准化变量(即平均值为0,方差为1),特殊因子i服从20)(1,2,...,)iNiq(,,并且与jF之间不相关。因子载荷矩阵具有下面几个统计特征和意义:(1)因子载荷ija的意义由于初始变量、公共因子和特殊因子均为标准化变量,且各因子互不相关,通过研究可以得出,因子载荷ija实际上是变量iX与公共因子jF的相关性度量。且有1ija,其绝对值越大,表明变量iX与公共因子jF越相关,jF对iX的影响也就越大。(2)公共因子对变量iX的解释程度ik在因子分析模型中,变量iX被公共因子所解释的方差是因子载荷矩阵第i行元素的平方和,记为:221(1,2,...,)niijjkaiq(4-6)而变量iX的方差为:2211()()...()()iiinniDXaDFaDFD(4-7)由于变量iX与公共因子jF均为标准化变量,则有222211nijiiijak(4-8)由式(4-8)我们可以看出,初始变量的方差分为两部分:一部分是由公共因子进行解释,一部分是由特殊因子进行解释。而2ik体现了全部公共因子对变量iX的解释程度,ik越接近1,说明变量i几乎全部的信息都被所选择的公共因子所解释,因此,ik被称为公共因子对变量iX的解释程度。2i为特殊因子i的方差,2i越小,表明变量i损失的信息越少。(3)公共因子方差贡献的意义公共因子jF的方差贡献是因子载荷矩阵中第j列元素的平方之和。记为:21qjijiTa(4-9)它反映了公共因子jF对初始指标体系中的全部变量的解释能力。该值越大,说明公共因子j的重要程度越高。2.因子分析的计算(1)因子载荷矩阵的估计方法采用因子分析方法时,首先要根据样本数据来估计因子载荷矩阵A,相应的估计方法有主成分分析、极大似然估计法、主轴因子法、最小二乘法和广义最小二乘法等。目前,最为常用的是主成分分析,本章也采用主成分分析进行因子载荷矩阵估计。具体方法如下:首先假设主成分