SPSS因子分析实例操作步骤实验目的:引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。实验变量:以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。实验方法:因子分析法软件:spss19.0操作过程:第一步:导入Excel数据文件1.opendatadocument——opendata——open;2.Openingexceldatasource——OK.第二步:1.数据标准化:在最上面菜单里面选中Analyze——DescriptiveStatistics——OK(变量选择除年份、合计以外的所有变量).2.降维:在最上面菜单里面选中Analyze——DimensionReduction——Factor,变量选择标准化后的数据.3.点击右侧Descriptive,勾选CorrelationMatrix选项组中的Coefficients和KMOandBartlett’stextofsphericity,点击Continue.4.点击右侧Extraction,勾选ScreePlot和fixednumberwithfactors,默认3个,点击Continue.5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的LodingPlot(s);点击Continue.6.点击右侧Scores,勾选Method选项组中的Regression;勾选Displayfactorscorecoefficientmatrix;点击Continue.7.点击右侧Options,勾选CoefficientDisplayFormat选项组中所有选项,将Absolutevalueblow改为0.60,点击Continue.8.返回主对话框,单击OK.输出结果分析:1.描述性统计量DescriptiveStatisticsNMinimumMaximumMeanStd.Deviation农、林、牧、渔业113.279.737.66451.97515采矿业11.69.55.0082.7092制造业11.447.072.69002.22405电力、热力、燃气及水生产和供应业113.3615.0510.35453.22751建筑业111.7923.517.89556.18302批发和零售业112.1018.529.10185.50553交通运输、仓储和邮政业11.828.392.78912.20903ValidN(listwise)11该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。2.KMO和球形Bartlett检验KMOandBartlett'sTestKaiser-Meyer-OlkinMeasureofSamplingAdequacy..744Bartlett'sTestofSphericityApprox.Chi-Square97.122df21Sig..000该表给出了因子分析的KMO和Bartlett检验结果。从表中可以看出,Bartlett球度检验的概率p值为0.000,即假设被拒绝,也就是说,可以认为相关系数矩阵与单位矩阵有显著差异。同时,KMO值为0.744,根据KMO度量标准可知,原变量适合进行因子分析。3.因子分析的共同度CommunalitiesInitialExtractionZscore(农、林、牧、渔业)1.000.883Zscore:采矿业1.000.741Zscore:制造业1.000.974Zscore(电力、热力、燃气及水生产和供应业)1.000.992Zscore:建筑业1.000.987Zscore(批发和零售业)1.000.965Zscore(交通运输、仓储和邮政业)1.000.935ExtractionMethod:PrincipalComponentAnalysis.表格所示是因子分析的共同度。表格第二列显示初始共同度,全部为1.000;第三列是按照提取3个公因子得到的共同度,可以看到只有“采矿业”的共同度稍低,说明其信息丢失量稍严重。4.因子分析的总方差解释TotalVarianceExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsRotationSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%Total%ofVarianceCumulative%13.07943.99243.9923.07943.99243.9922.66037.99937.99922.35333.60877.6002.35333.60877.6002.34633.51771.51631.04614.94192.5411.04614.94192.5411.47221.02592.5414.4135.90598.4465.0981.39999.8456.011.15299.9977.000.003100.000ExtractionMethod:PrincipalComponentAnalysis.该表由3部分组成,分别为初始因子解的方差解释、提取因子解的方差解释和旋转因子解的方差解释。InitialEigenvalues部分描述了初始因子解的状况。第一个因子的特征根为3.079,解释7个原始变量总方差的43.992%;第二个因子的特征根为2.353,解释7个原始变量总方差的33.608%,累计方差贡献率为77.600%;第三个因子的特征根为1.046,解释7个原始变量总方差的14.941%,累计方差贡献率为92.541%,也就是说,三个变量解释了所有7各变量的90%以上,且也只有这三个变量的特征值大于1。ExtractionSumsofSquaredLoadings部分和RotationSumsofSquaredLoadings部分描述了因子提取后和旋转后的因子解。从表中看出,有三个因子提取和旋转,其累计解释总方差百分比和初始解的前三个变量相同,但经旋转后的因子重新分配各个因子的解释原始变量的方差,使得因子的方差更接近,也更易于解释。5.碎石图利用因子分析的碎石图可以更加直观的发现最优因子的数量。在碎石图中,横坐标表示因子数目,纵坐标表示特征根。从图中可以看出,前三个因子的特征跟都很大,从第四个开始,因子的特征根都小于一,且连线变得较平缓,及前三个因子对解释变量的贡献最大,6.旋转前的因子载荷矩阵该表空白处表示相应载荷小于0.3。因子载荷矩阵中给出每一个变量在三个因子上的载荷。在旋转前的载荷矩阵中所有变量在第一个因子上的载荷都较高,即与第一个因子的相关程度较高,第一个因子解释了大部分变量的信息;而后面两个因子与原始变量的相关程度较小,对原始变量的解释效果不明显,没有旋转的因子的含义很难解释。7.旋转后的因子载荷矩阵RotatedComponentMatrixaComponent123Zscore(农、林、牧、渔业).899Zscore(交通运输、仓储和邮政业)-.716-.3.41Zscore:采矿业.771.352Zscore(电力、热力、燃气及水生产和供应业).749.440.441Zscore:建筑业.985Zscore(批发和零售业).961ComponentMatrixaComponent123Zscore(电力、热力、燃气及水生产和供应业).871Zscore(交通运输、仓储和邮政业)-.860Zscore:采矿业.857Zscore(农、林、牧、渔业).704Zscore(批发和零售业).726.569Zscore:建筑业.687.364Zscore:制造业.600.793ExtractionMethod:PrincipalComponentAnalysis.a.3componentsextracted.Zscore:制造业.873ExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.该表空白处表示相应载荷小于0.3。因子载荷矩阵中给出每一个变量在三个因子上的载荷。在旋转后的载荷矩阵中可以看出,与第一产业相关的产业在第一个因子上的载荷较高,与第二产业相关的产业在第二个因子上的载荷较高,与第三产业相关的产业在第三个因子上的载荷较高。和没旋转相比,因子的含义清楚很多。8.旋转空间的因子图该图为可以看做是旋转后的载荷矩阵的图形表示。从图中又一次验证了前面旋转后的载荷矩阵对因子的解释。8.因子得分系数ComponentScoreCoefficientMatrixComponent123Zscore(农、林、牧、渔业).445.075-.350Zscore:采矿业.261-.054.093Zscore:制造业-.180.008.761Zscore(电力、热力、燃气及水生产和供应业).201.182.263Zscore:建筑业-.074.429.156Zscore(批发和零售业).071.402-.130Zscore(交通运输、仓储和邮政业)-.322.204.050ExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.ComponentScores.列出了采用回归法估算的因子得分系数,根据表中的内容可以写出因子得分函数F1=0.445*Zscore1+0.261*Zscore2-0.180*Zscore3+0.201*Zscore4-0.074*Zscore5+0.071*Zscore6-0.322*Zscore7F2=0.075*Zscore1-0.054*Zscore2+0.008*Zscore3+0.182*Zscore4-0.429*Zscore5+0.402*Zscore6-0.204*Zscore7F3=-0.350*Zscore1+0.093*Zscore2+0.761*Zscore3+0.263*Zscore4+0.156*Zscore5-0.130*Zscore6+0.050*Zscore7不仅如此,原数据文件中增加了变量FAC_1和FAC_2、FAC_3,表示3个因子在不同年份的得分值。9.总因子得分及排序附件:原始数据:标准化后的数据: