主成分分析与因子分析的异同

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

主成分分析与因子分析的异同专业:金融统计学号:13610704150504姓名:解盼一、取初始因子的方法为主成分法。方向不同,直接导致主成分值、因子得分值、综合评价值和应用侧重上不同,综合评价应该分开进行,混淆在一起是不同计量值交替错误。二、避免出错的方法步骤主成分分析法和SPSS软件应用时一对一的正确步骤:(1)指标的正向化;(2)指标数据标准化(SPSS软件自动执行);(3)指标之间的相关性判定:用SPSS软件中表“CorrelationMatrix(相关系数矩阵)”判定;(4)确定主成分个数m:用SPSS软件中表“TotalVarianceExplained(总方差解释)”的主成分方差累计贡献率≥85%、结合表“ComponentMatrix(初始因子载荷阵)”中变量不出现丢失确定主成分个数m。(5)主成分Fi表达式(这是SPSS软件及其教科书中没完善的地方):将SPSS软件中表“ComponentMatrix”中的第i列向量除以第i个特征根的开根后就得到第i个主成分Fi的变量系数向量(在“transform→compute”中进行计算),由此写出主成分Fi表达式。用Fm=A′mX的A′mAm=Im检验之。(6)主成分Fi命名:用SPSS软件中表“ComponenMatrix”中的第i列中系数绝对值大的对应变量对Fi命名(有时命名清晰性低)。(7)主成分与综合主成分(评价)值(这是SPSS软件及其教科书中没完善的地方):综合主成分(评价)公式F综=∑mi=1(λi/p)Fi(在“transform→compute”中进行计算),λiΠp在SPSS软件中表“TotalVarianceExplained”下“InitialEigrnvalues(主成分方差)”栏的“%ofVariance(方差率)”中。VarF综=(∑mi=1λ3i)/p2。(8)检验:综合主成分(评价)值用实际结果、经验与原始数据做聚类分析进行检验(对有争议的结果,可用原始数据做判别分析解决争议)。(9)综合实证分析。21因子分析法和SPSS软件应用时一对一的正确步骤:(1)~(3)步骤同主成分分析步骤。(4)确定因子个数m:用SPSS软件中表“TotalVarianceExplained”特征值累计贡献率≥85%、结合表“RotatedComponentMatrix(旋转后因子载荷阵)”中变量不出现丢失确定因子个数m。(5)求因子载荷矩阵Bm:SPSS软件中表“RotatedComponentMatrix”(6)因子Zi的命名:将SPSS软件中表“RotatedComponentMatrix”因子载荷矩阵Bm的第i列绝对值大的对应变量归为Zi一类,并由此对Zi命名(命名清晰性高)。(7)求因子得分函数Zi表达式:Zi=b′iX,这里bi是SPSS软件中表“ComponentScoreCoefficientMatrix(因子得分系数矩阵)”的第i列向量。(8)求因子得分值与综合因子得分(评价)值:综合因子得分(评价)公式mZ综=∑(viPp)Zii=1在“transform→compute”中进行计算),vi/p在SPSS软件中表“TotalVarianceExplained”下“RotationSumsofSquaredLoadings(旋转后因子对X的方差)”栏的“%ofVariance”p中。用vi=∑b2ki检验,通常λ1v1,VarZ综=k=1m(∑v2i)/p2。i=1(9)检验:综合评价值用实际结果、经验与原始数据做聚类分析进行检验(对有争议的结果,可用原始数据做判别分析解决争议)。(10)综合实证分析。以上看出:使用SPSS软件时,主成分分析与因子分析是从初始因子载荷阵处分开的表现为主成分分析是通过初始因子载荷阵列向量单位化(或除相应特征值开根)得到主成分系数距阵、主成分及其值等,而因子分析是通过初始因子载荷阵进行旋转得到因子载荷阵、再通过回归得到因子得分及其值等。三、《刘文》《卢书》正确的主成分分析结果经过仔细验算《,刘文》《、卢书》是将初始因子分析结果当成了主成分分析结果。因子分析中如果方差最大正交旋转矩阵C=Im,即因子分析无旋转过程,称其为初始因子分析。表1中主成分分析与初始因子分析仍有方差、表达式与系数矩阵、回归过程、标准正交性、综合评价函数及方差5项的不同,故主成分值与初始因子得分值仍然计量不同,不能混淆。现按主成分分析法和SPSS软件应用时一对一的正确步骤给出《刘文》的主成分分析结果《,卢书》的主成分分析结果读者同理自行给出。笔者根据《刘文》给出的数据用SPSS软件Analyze菜单Factor过程进行主成分分析(通过相关系数矩阵判断变量间的相关性略),得出相关系数矩阵的特征根及主成分贡献率见表2,特征向量矩阵见表3。由于前三个主成分包含了全部的指标所具有的信息且累计方差贡献率已达到861702%,且无变量丢失,故取3个主成分就够了,但为了与《刘文》进行比较,这里仍取4个主成分。ExtractionMethod:PrincipalComponentAnalysis.第4以后的特征值省略。表3ComponentMatrix(初始因子载荷阵)Component1234x40.895-0.333-0.1820.132x130.863-0.191-0.2970.169x60.826-0.123-0.2810.421x140.728-0.6230.146-0.101表2方差解释TatalVarianceExplainedInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofCumulativeTotal%ofCumulativeVariance%Variance%16.04940.32740.3276.04940.32740.32725.81338.75479.0815.81338.75479.08131.1437.62186.7021.1437.62186.70240.8765.84092.5420.8765.84092.542x10.4070.8050.269-0.278x100.5520.7660.196-0.165x50.6140.7630.028-0.055x150.5790.7600.005-0.129x20.596-0.7270.208-0.235x80.6360.7030.0410.190x90.6190.7030.0080.147x110.654-0.6910.171-0.237x120.666-0.6850.166-0.227x70.274-0.6270.1830.285x3-0.1470.0160.8220.465主成分命名:表3中每一个载荷量表示主成分与对应变量的相关系数,且系数符号与题意相符,结合贡献率与正负相关性作用得出,X2-货物贸易占货物GDP的比重、X7-外国直接投资占国内投资总额的比重、X11-对外贸易依存度、X12-货物和服务进出口总额占GDP的比重、X14-对外金融资产负债总额占GDP的比重的综合影响是大至持平的(见后F综表达式X2、X7、X11、X12、X14的系数),因此,第一主成分F1与X4、X6、X8、X13十分显著正相关,所以我们可以称之为本国发生的全部收益占GNP的比重、对外直接投资和接受外国直接投资总额占GDP的比重、本国直接投资额占全球直接投资额的比重、国际金融总资本流量占GDP的比重综合指标;第二主成分F2与X1、X5、X8、X9、X10、X15十分显著正相关,所以我们可以称之为GDP占全球GDP的比重、本国发生的全部收益占世界发生的全部收益的比重、本国直接投资额占全球直接投资额的比重、跨国并购额占全球跨国并购额的比重、国际经济外向度、国际金融总资本流量占全球国际总资本流量的比重综合指标;第三主成分F3仅与X3十分显著正相关,所以我们可以称之为外国分支机构比重指标;而第四主成分与变量没有明显的相关性,因此不对其进行命名。从这里也可以看出前三个主成分包含了全部的指标所具有的大部分信息。四个主成分的表达式还不能从输出窗口中直接得到,因为“ComponentMatrix”是指初始因子载荷矩阵,为了得到四个主成分的表达式,以便求主成分值,还需进一步操作:将前四个因子载荷矩阵输入到数据编辑窗口(为变量B1、B2、B3、B4),然后利用“Transform→compute”,在对话框中输入“A1=B1PSQR(61049)”,即可得到主成分系数向量A1。同理,可得到A2、A3、A4。于是,四个主成分表达式如下(这里的ZXi是Xi的标准化数据):F1=011653ZX1+012424ZX2-010596ZX3+01364ZX4+012495ZX5+013357ZX6+011113ZX7+012584ZX8+012516ZX9+012244ZX10+012659ZX11+012707ZX12+013507ZX13+012961ZX14+012355ZX15F2=013341ZX1-013016ZX2+010064ZX3-01138ZX4+013163ZX5-010512ZX6-012602ZX7+0129192ZX8+012914ZX9+013176ZX10-012865ZX11-01284ZX12应用这一线性组合计算出各主成分值,最后利用综合主成分函数(κ=p=15):可以求得各个国家世界经济全球化程度的综合主成分值(见表4)。四、主成分分析与(初始)因子分析的实证比较《刘文》表2的结果为初始因子分析结果(经仔细验算确认),现将其与主成分分析结果表4进行比较。主成分分析与初始因子分析的命名依据都是初始因子载荷矩阵表3的相应列《,刘文》对初始因子分析的命名准确性不够,致使相应经济分析有些偏离实际,如《刘文》中“中国参与经济全球化程度总体水平很低,但对生产与贸易全球化依存度及投资全球化依存度很高”并不显现。实际结果表4中为:在华外国分支机构占世界全部外国分支机构的比重很高,表明中国参与经济全球化进程正受到世界各国的高度关注。表4主成分、综合主成分值国家F1排名F2排名F3排名F4排名F综排名美国329360711462-080143741英国12141161112445098-176217217德国1413151813140134-025-023105日本16121611614044185-025-123081法国15151141415087046-052045052新加坡111161311516527-626118-095-027意大利181611511317-061011-054-065-029加拿大171121111718-043-047-031000-038中国11417111219-218005300183-052巴西1131811216110-191-005-043014-081澳大利亚11011411015111-136-092-030022-091韩国11211117112112-169-045-027-061-092墨西哥1111131419113-167-068002-030-095新西兰191151813114-098-173-028073-105俄罗斯11511019110115-234-019-030-036-106印度11619113111116-2156-0110-0146-0139-1113由表4与《刘文》的表2对比可知:部分国家参与经济全球化程度综合主成分值排名中,中国的排名相差较大,在本文表4中,中国排第9,而在《刘文》中国排第6;新加坡、意大利、加拿大、韩国在本文中表4分别排第6、7、8、12,而在《刘文》中分别排第7、8、9、13;墨西哥在本文中排第13,而在《刘文》中排第12。通过表4可将综合主成分结果在等距d=(3174+1113)/4=112175下可分为四类国家。第一类国家:综合主成分值取值范围为[21523,3174]。第二类国家:综合主成分值取值范围为(11305,2

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功