利用SPSS进行主成分分析采用数据:同一时刻所有基站,剔除了数据全为0以及基站名字重复的(实际处理是加上自行标度可区分,为方便此次直接剔除)共7个变量。操作过程:1、对数据进行标准化处理(z-score)略2、分析-降维-因子分析选择标准化处理后的7个变量单击“抽取”基于特征值大于0(也可省略,默认值为1)单击“描述”弹出如下窗口:设置好后单击确定得如下表格:解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%14.69367.04167.0414.69367.04167.0412.97613.94880.989.97613.94880.9893.71110.15891.147.71110.15891.1474.3965.65796.804.3965.65796.8045.2022.89199.695.2022.89199.6956.021.29999.994.021.29999.9947.000.006100.000.000.006100.000提取方法:主成份分析。成份矩阵a成份1234567Zscore:MeanNumberofRRCConnectionUser.871.203-.406.146-.063.101.000Zscore:MaximumNumberofRRCConnectionUser.875.208-.398.137-.052-.103.000Zscore:PRBonPUSCHChannel资源利用率.821.216.232-.397-.261.000.000Zscore:PRBonPDSCHChannel资源利用率.843-.469.213.152-.032.000.014Zscore:PRBonUplinkChannel资源利用率.562.631.473.202.147.001.000Zscore:PRBonDownlinkChannel资源利用率.847-.461.217.150-.025-.001-.014Zscore:CCEonPDCCHChannel资源利用率.867-.121-.135-.335.323.002.000提取方法:主成份。a.已提取了7个成份。3、分析(1)观察表“解释的总方差”发现提取三个主成分就达到91.147%,大于85%的一般标准,所以我们决定提取三个主成分。(2)由上可知,我们选取“成分矩阵”的前三个变量1、2、3.将数据提取到数据编辑框中,对应B1、B2、B3列:(3)由上可知选取前三个变量,通过表“解释的总方差”,我们提取前三个方差的合计值:4、获得变量与主成分之间的参数转换-计算变量利用B1、B2、B3计算主成分和7各变量的参数:在就算变量的窗口中输入A1=B1/SQR(4.693),同理可输入计算A2、A3,只是SQR()中的参数是根据3-(3)中提到的数据:0.976、0.711下图为计算A1实例:同理我们得到如下结果:5、利用matlab计算上面的步骤都是利用SPSS进行的主成分分析,此时我们需要利用matlab来进行计算。我们提取了三个主成分,暂且取名为F1,F2,F3又有A1,A2,A3。A和F,A的值一一对应了7个变量的乘法因子,每个基站最后是提取出了三个主成分来代表,而不是一开始的7个变量,举例如下:F1=0.4*X1+0.4*X2+0.38*X3+0.39*X4+0.26*X5+0.39*X6+0.4*X7;F2=0.21*X1+0.21*X2+0.22*X3+(-0.47)*X4+0.64*X5+(-0.47)*X6+(-0.12)*X7;F3=(-0.48)*X1+(-0.47)*X2+0.28*X3+0.25*X4+0.56*X5+0.26*X6+(-0.16)*X7;X1:ZMeanNumberofRRCConnectionUserX2:ZMaximumNumberofRRCConnectionUserX3:ZPRBonPUSCHChannel资源利用率X4:ZPRBonPDSCHChannel资源利用率X5:ZPRBonUplinkChannel资源利用率X6:ZPRBonDownlinkChannel资源利用率X7:ZCCEonPDCCHChannel资源利用率因此我们可以利用matlab和F的计算方法,得到每个利用三个主成分的描述的基站。利用经过主成分分析后的数据进行聚类即可。经过matlab处理如图然后将生成的新矩阵进行0-1归一化,程序如图归一化后的矩阵存入SPSS中,这就是主成分分析后的数据结果,用来对数据进行聚类的初始输入数据。