因子分析模型的解是标准化主成分林海明(广东商学院统计系广东广州510320)【摘要】在社会经济、管理、医学、自然科学等众多领域的多指标体系综合评价中,常应用因子分析法。但因子分析法的模型和理论在数学上存在4个问题,它们影响了因子分析法模型和理论的发展。文献[6][7]建立了因子分析模型L及其解,文献[9]用此求出了因子分析模型的解是标准化主成分,解决了因子分析模型和理论存在的4个问题,得出了因子分析模型L及其解是更好的理论,其是因子分析法经常使用的模型和解。并给出了因子分析法应用的建议。【关键词】因子分析模型解标准化主成分【中图分类号】O212【文献标识码】ATheSolutionofFactorAnalysisModelsisStandardizedPrincipalComponentLinHaiming(GuangdongUniversityofBusinessStudies,DepartmentofStatistics,GuangzhouGuangdongChina,510320)【Abstract】Factoranalysismodelsandtheoryisnotcomplete.ThispapermakesfactoranalysismodelsL’,givesthesolutionsoffactoranalysismodelsisstandardizedprincipalcomponent.Factoranalysismodelsandtheoryistobecompleted.【Keywords】Factoranalysismodels,Solutions,Standardized,Principalcomponent1引言因子分析法的模型是1904年由CharlesSpearman提出的,在社会经济、管理、医学、自然科学等众多领域的多指标体系综合评价中,常应用因子分析法。但因子分析法的模型和理论是很不完善的[1],据归纳,因子分析模型和理论在数学上存在4个问题(详见第二部分),这些问题影响了因子分析法模型和理论的发展,也使得因子分析模型的解长期以来成为一个未解之谜。2007年6月,据对美国统计学会会刊(JASA)副主编蔡天文教授的咨询,国外暂时没解决这些问题;据对中国人民大学于秀林、何晓群、杜子方等统计学教授的咨询,他们认为:以上问题较为古老,多年来,人们较多的是注重现有估计解理论的推广应用,没有注意上述问题的研究。问题的提出:如何破解因子分析模型解之谜,解决因子分析模型和理论存在的问题呢?1电子商务——市场·应用·技术文献[6][7]建立了因子分析模型L及其解,文献[9]用此求出了因子分析模型的解是标准化主成分,解决了因子分析法模型和理论存在的4个问题,得出了因子分析模型L及其解是更好的理论,其是因子分析法经常使用的模型和解。并给出了因子分析法应用的建议。2因子分析模型和理论存在的4个问题与进展设为正向化、标准化随机向量),,(1′=pxxXΛ),2(≥pR为变量X的相关系数矩阵,公因子载荷阵、公因子spijsbB×=)(),,(1′=sszzZΛ,特殊因子向量),,(1′=pεεεΛ,记是以为对角元素的对角矩阵。),,(1kccdiagΛkcc,,1Λ因子分析模型[1]求、、sBsZε,使:ε+=ssZBX,ps≤,ssIVarZ=,0=εE,==ψεVar1(ψdiag,…,pψ),,,,1,0piiΛ=≥ψ,0),cov(=εsZ这里iψ称为特殊方差,ψ称为特殊方差阵。21ijpijbv=∑=称为因子对jzX的方差贡献,iψ亦称为特殊因子iε对X的方差贡献。设R的特征值为1λ、…、rλ、0(一般假定),1λ≥…≥rλ>0(iλ达到降序排列昀大化),=r秩)(Rp≤,),,()(1pppijaAααΛ==×、这里,,,1,miRiiiΛ==αλα,0=kRα,,,1prkΛ+=pIAA=′(p阶单位阵)。设主成分,则主成分分析(Hotelling,1933)的解),,(1′=pffFΛ[1]F=XA′,(1))0,,0,,,(1ΛΛrdiagVarFλλ=。(2)取rm≤,记),,,(1mmAααΛ=,),,(1′=mmffFΛ),,(1pmmpAααΛ+−=,),,(1′=+−pmmpffFΛ,标准化主成分载荷[1]:=(…,(初始因子载荷阵),=(…,,0mB,2/111λα)2/1mmλα0εB,2/111m++mλα)2/1rrλα标准化主成分[1]:2/1110(−≅λfZm,…,=[由式(1)],)2/1′−mmfλXBdiagmm))(,,,(011211′−−−λλλΛ2/1110(−++≅mmfλε,…,=…,[由式(1)],)2/1′−rrfλ,(11−+mdiagλXBr))(01′−ελ且有[由式(2)]。rmIZVar=′′′],)[(00εC为的方差昀大化正交旋转矩阵0mB[1]。据归纳,因子分析法模型和理论在数学上存在如下4个问题:问题(1):初始因子载荷阵与公因子载荷阵没有建立关系。0mBsB问题(2):特殊因子ε与因子解估计中省略项的区别不明确,从而因子分析法使用的模型及解不明确[的主因子解、极大似然估计、的巴特莱特(Bartlett,1937)因子得分与mpmpFA−−sBsZε直接有关]。问题(3):公因子与主成分的精确关系没有建立,不能明确因子分析与主成分分析的异同(公因子个数、公因子与变量的精确关系与此直接有关)。sZF问题(4):现行降维因子个数m的确定方法有时会丢失一些被解释变量的信息。研究进展:在张尧庭和方开泰教授的文献[1](1982)中,设Xˆ为X的近似变量,建立了Xˆ、标准化主成分载荷阵、标准化主成分的关系:0mB0mZmmmmmmmIZCVarVarZZCCBZBX=′=′==000000),)((ˆ。在方积乾、何晓群、余锦华和杨维权教授的文献[2](2001)、[4](2004)、[5](2005)中,用+=mmFAXmpmpFA−−ε+≈00mmZB(3)2得出了:公因子载荷阵估计解是标准化主成分载荷阵,公因子估计解是标准化主成分。0mB0mZ在R.A.Johnson和D.W.Wichern教授的文献[3](2003)评注中,“由主成分方法估计的因子载荷,用未加权(普通的)昀小二乘过程生成因子得分解。”得出因子得分是:0mZ=。XAdiagmm′−−−),,,(2/12/122/11λλλΛ以上解的结论全部为估计的,均没有求出因子分析模型的解。3因子分析模型L及其解的建立利用式(3)的等式继续,利用方差是零的主成分为零,进行矩阵运算验证有:00000000))((εεεεBZBBZCCBFAFAXmmmmrprpmm+=+′=+=−−,rmmIZVarZCVar=′′′=′′′′],)[(],)[(0000εε,imimmCBCBtrλ100])[(=Σ=′,。),,(),(),(10000rmmdiagBBBBλλεεΛ=′由这三个表达式相应得出了昀终解决问题的因子分析模型L及其解:设为正向化、标准化随机向量),,(1′=pxxXΛ),2(≥pR为X的相关系数矩阵,=r秩,pR≤)(、mpijmbB×=)(、),,(1′=mmzzZΛrm≤、),,()(1)(′==+−×+rmmrpjmizzZbBΛεε、。因子分析模型L[6]求,使),(),(′′′==εεZZZBBBmm、εεZBZBBZXmm+==,rIVarZ=,=达到昀大。])[(mmBBtr′jmjv1=∑这里称为因子对21ijpijbv=∑=jzX的方差贡献。定理1[6]是因子分析模型L的解(旋转后解),且),(),(0000εεmmZCZBCBB′==、jmjjmjvλ11==∑=∑,rmjvjj,,1,Λ+==λ。定理2[7]是因子分析模型L的解(未旋转解),),(),(0000εεmmZZBBB==、且rjvjj,,1,Λ==λ(因子按方差贡献由大到小排顺序达到昀大化)。因子分析模型L及其解具有:降维、旋转的功能;是变量与因子的相关系数;前个因子ijbixjzmmZ对X的方差贡献达到昀大。即结论1因子分析模型L及其解具有因子分析法的对应特点和功能。通过验证,现行软件SAS、SPSS计算的因子分析主成分解(>np)是因子分析模型L的解;小样本(≤np)情形下的因子分析主成分解计算与应用见[8]。故人们经常使用的是因子分析模型L的解,不是因子分析模型的解。规则1(降维规则)如果使用旋转后解,m的选取以每行至少有一个元素绝对值≥0.6的昀小列数确定是更好的;0mZC′CBm0如果使用未旋转解,m的选取以每行至少有一个元素绝对值≥0.6的昀小列数确定是更好的。0mZ0mB规则2(旋转后解使用条件,因子分析法的优点之一)与比较,CBm00mB如果每行元素的绝对值往0或1靠近得多(较命名清晰、与CBm00mZC′0mZX相关性大),则旋转后解较未旋转解更好;0mZC′0mZ如果每行元素的绝对值往0或1靠近得多(较命名清晰、与0mB0mZ0mZC′X相关性大),则未旋转解较未旋转解更好。0mZ0mZC′定理1、定理2中的结论是解,不是估计的,下面用因子分析模型L的解求出因子分析模型的解。4因子分析模型的解3电子商务——市场·应用·技术设特殊因子ε中非零特殊因子为1tε、…、)1(pkkt≤≤ε,ktstszz++、、Λ1为1tε、…、ktε的标准化,即2/1−+=iiitttszψε),,1(kiΛ=,为第个元素为1、其余元素为0的tetp维单位列向量,有特殊因子:),,(1′=++ktstskzzHΛε,这里,),,(2/12/111kkttttkeeHψψΛ=kkHH′=ψ。由定理2,得因子分析模型与因子分析模型L解的关系:结论2、),(ksHB),,,(1′′++ktstsszzZΛ按因子方差贡献由大到小排顺序达到昀大化的解分别是:),(00εBBm、,且],)[(00′′′εmZprks≤=+。证明设按因子方差贡献由大到小排顺序达到昀大化的因子向量为:),,,(1′′++ktstsszzZΛ),,(1′=qqzzZΛ,其含有),,,(1′′++ktstsszzZΛ,ksq+=;相应因子载荷阵设为其含有,,)(qpijqbB×=),(ksHB设为中因子对jvqZjzX的方差贡献,前个因子对qZmX方差贡献和成为:达到昀大。jmjv1=∑因子分析模型成为:求的解,使qZBqq、、qqZBX=,qqIVarZ=,达到昀大。jmjv1=∑由定理2,取,],)[(),,(0000′′′==εεmqmqZZBBBrq=,rjvjj,,1,Λ==λ,是该模型的解。[证毕]。由结论2和非零特殊因子与特殊主成分[1]的关系,得:结论3[9]设X中互不相关的变量为,…,,则特殊因子解:1txktx)0(≥≥kp),,(1′=kttkxxHΛε,这里=(,…,),kH1tektekkHH′=ψ。即非零特殊因子是特殊主成分:X中互不相关的变量,…,。1txktx证明:设tε为非零特殊因子,tψ按方差贡献由大到小排序是第j个位置,由结论2和、),(00εBBm],)[(00′′′εmZ的表示式,有:2/12/12/12/1,−−+===jjtttsjjttfzeλψεαλψ,所以,,)0,,0,,0,,0(′=ΛΛjaαj为单位特征向量,有1=tja,jtλψ=,αtj由式(1),tttjjjxxaXf==′=,即为特殊主成分,因为是标准化的,所以:jftxαtjjVarfψλ===1tttsxfz=+==ε,即tε为特殊主成分。[证毕]。tx,j由规则1有,初始因子载荷阵含有非零特殊因子载荷,记的前列为,后列为,则有0mBkH0mBkm−0kmB−km−kH结论4规则1下,,相应有。),(00kkmmHBB−=],,,)[(100′′=−kttkmmxxZZΛ设,为的方差昀大化正交旋转矩阵。),(0kICdiagC=0C0kmB−采用验证法和结论3,有:定理3[9]设X中互不相关的变