因子分析在综合评价中的应用摘要:因子分析方法是一种降维、简化数据的技术。将因子分析运用于统计指标体系的综合评价中,克服了传统评价方法在处理指标高度相关和权重设定上的缺陷,但所构造的因子得分模型仅适用于对评价对象的静态比较,并不适用于动态比较。文探将深入探讨因子分析法进在综合评价的作用以及应注意的一些问题。关键词:因子分析法;综合评价在多指标综合评价方法中,传统方法对于权重的设置往往带有一定的主观随意性,将多元统计引入综合评价方法,如因子分析法,可以克服人为确定权数的缺陷,使得综合评价结果唯一,而且客观合理。许多学者在因子分析方法的运用上存在着一些问题,削弱了实证分析研究的解释力和信服力。本文试从如何正确运用因子分析法进行综合评价作一些探讨。下面将从两个方面进行介绍:一、因子分析方法的基本思想和运用因子分析法是把一些具有错综复杂关系的变量归结为少数几个无关的新的综合因子的一种多变量统计分析方法。其基本思想是根据相关性大小对变量进行分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组变量代表一个基本结构,因子分析中将之称为公共因子。假设观测系统(即评价总体),有k个评价指标,n个观测单位,因子分析的数学模型就是把n个观测单位分别表示为pk个公共因子和一个独特因子的线性加权和,即ipiiiFFFp12211...x(ni,...,2,1)(1-1)其中:PFFF,...,,21为公共因子,它是各个指标中共同出现的因子,因子之间通常是彼此独立的;i是各对应变量ix所特有的因子,称为特殊因子,通常假定2ii0~,N;系数ij是第i个变量在第j个公共因子上的系数,称为因子负荷量,它揭示了第i个变量在第j个公共因子上的相对重要性。因此,通过因子模型建立综合评价函数的步骤如下:(1)根据原始变量矩阵估计因子载荷矩阵。因子载荷阵的估计方法有很多,主成分法是其中最为普遍的方法:设原始变量)(KXXXX,...,,21的协方差阵为,0...21K为的特征根。i代表第i个主成分的方差,总方差kiii1k1i2;并且ke,...,e,e21为对应的标准正交化特征向量。利用线性代数矩阵的思想可以将分解如下:2222211...ekkeekkkkeeeee...,...,,e22112211上式的分解是公共因子与变量个数一样多的因子模型的协方差阵结构。采用因子分析方法总是希望公共因子的个数小于变量的个数即mk;当最后k-m个特征根较小时,通常略去最后k-m项222221m1m...ekkmmee对的贡献,从而得到:mmmeeeeee222112211...,...,,其中,jje是第j个公共因子的因子载荷阵。(2)将公共因子表示为变量的线性组合,得到评价对象在各个公共因子的得分。由于因子得分函数中方程的个数m小于变量个数p;因此不能精确计算出因子得分,通过最小二乘法或极大似然法可以对因子得分进行估计:kikiiijF...ˆ110(1-2)(3)以各公共因子的方差贡献率占公共因子总方差贡献率的比重作为权重进行加权汇总,建立因子综合得分函数:pjpijijjjFFFFYˆ...ˆ...ˆˆ2211(pi,...,2,1)(1-3)其中,jY是第j个评价对象的综合得分;ijFˆ表示第j个评价对象在第i个公共银子的得分;i为第i个公共因子方差贡献率占公共因子总方差贡献率的比重,即:miiii1。二、运用应用因子分析法进行综合评价应注意的问题1.原始指标是否需要转换处理若原始指标的量纲或经济意义不同,将原始指标直接求得综合得分,将很难给予一个合理的经济解释;若原始指标变量数量级差异较大,则变量值大的对综合指标(公共因子)的影响也大。例如:同样是反映生产能力的产值指标,采以元为单位和采用以万元为单位,其方差显然是完全不同的。经济意义不变,但以元为单位的产值指标不仅会增加评价指标体系中变量的总方差,也会增加该指标在总方差中的比重,从而增大它在评价指标体系中的作用。因此,在运用因子分析法时,通常需要对原始指标进行无量纲化处理。对原始指标进行无量纲化处理的方法有很多种,如标准化、均值化或极差正规化。由于标准化处理会保持原始指标数值的相对稳定性,在进行因子运算时会带来许多便捷,因此是最普遍的做法。2.什么评价指标适合运用因子分析方法因子分析方法在多元统计中属于降维思想中的一种,其目的在于简化数据,通过较少的公共因子反映复杂现象的基本结构。原始评价指标少,意义明确,能较好地反映评对象,这时,不一定要使用因子分析。如果强行运用,不仅会加大计算量,而且意义不大。使用因子分析法进行综合评价目的之一是为了避免评价指标之间的相关性所引起权重的偏倚;因此其中一个前提条件是评价指标之间应该有较强的相关关系。如果指标之间的相关程度很小,指标不可能共享公共因子,公共因子对于指标的综合能力就偏低。一般来说,可以通过对指标的相关矩阵进行检验,如果相关矩阵的大部分系数都小于0.3则不适合做因子分析。3.因子模型应选取几个因子进行分析因子分析的目的是寻求用少数的几个公共因子解释协方差结构的因子模型。选取的因子过多,应用因子分析方法就失去原有的意义;但选取的因子过少,又可能造成原始信息量的大量损失。通常有以下三种准则:(1)以主成分的特征值为标准选取公共因子。原始评价指标标准化后,由于每个指标的方差为1,假如主成分所对应的特征值小于1,意味着该主成分连一个指标的方差都无法解释,所以应选取特征值大于或接近于1的主成分作为公共因子,舍弃特征值远小于的其它主成分。(2)以主成分的方差累计贡献率为标准来选取公共因子。方差累积贡献率反映了主成分保留原始信息量的多少。一般而言,主成分累积贡献率达到85%以上就可以很好地说明和解释问题,因此可以以此为标准选取累积贡献率达到85%以上的那些主成分作为公共因子。(3)根据分析问题的需要或具体问题的专业理论来选取公共因子。在多维数据中,当维数大于3时便不能画出几何图形,但通过因子分析法选取主要的两个公共因子,画出正交因子得分图,以反映评价对象在二维平面上的分布情况,从而直观地找出各评价对象在公共因子中的地位,进而还可以对评价对象进行分类处理。4.初始公共因子是否需要旋转建立因子分析模型的目的不仅是要找出主因子,更重要的是要知道每个主因子的意义,以便对实际问题进行分析。通过式(1-1)和(1-2),只是确立初始公共因子;这些初始因子是否具有明确意义,需要进一步分析因子载荷阵才能得出。如果从每个初始因子能较好地找出所代表的原始指标,我们就可以直接赋予这些因子合理的经济解释,进行下一步的分析研究。但如果因子载荷量较为平均,难以判别哪些指标与哪个因子联系较为密切,无法从原始指标中寻求评价对象在各个因子上得分差异的原因,这时就需要进行因子旋转。因子旋转的直观意义是经过旋转后,公共因子的贡献越分散越好,使指标仅在一个公共因子上有较大的载荷,而在其余公共因子上的载荷比较小。因子旋转的方法很多,如正交旋转、斜交旋转等,正交旋转又包括方差最大化旋转、四次方最大化旋转等,但基本思路就是在寻求极值的前提下,用一个正交阵(对正交旋转)或非正交阵(对斜交旋转)右乘因子载荷阵,达到简化因子载荷阵结构的目的。由于因子旋转涉及到十分复杂的矩阵运算,一般统计软件如SPSS、SAS都可以按照研究方法和研究目的的需要,直接得出。