SAS主成分分析-示例

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

PROCPRINCOMP选项列表;VAR变量列表;[WEIGHT变量列表;][FREQ变量列表;][PARTIAL变量列表;][BY变量列表;]RUN;CorrelationMatrix是所有原始指标变量之间的相关系数矩阵如:GDP(x1)与固定资产投资(x3)之间的相关系数为0.9506;GDP(x1)与工业总产值(x8)之间的相关系数为0.8737;固定资产投资(x3)与工业总产值(x8)之间的相关系数为0.7919;居民消费价格指数(x6)与商品零售价格指数(x7)之间的相关系数为0.7628;货物周转量(x5)与工业总产值(x8)之间的相关系数为0.6586,等等。DATA=输入数据集,可以是原始数据集,也可以是TYPE=CORR,COV的数据集;OUT=输出包含原始数据和主成分得分的数据集;OUTSTAT=统计量输出数据集;COVARIANCE|COV要求从协方差阵出发计算主成分,缺省为从相关阵出发计算。N=要计算的主成分个数,缺省时全部计算。STANDARD|STD要求在OUT=的数据集中把主成分得分标准化为单位方差。缺省时主成分得分的方差为相应特征值。PREFIX=主成分名字的前缀,缺省时为PRIN1、PRIN2…。EigenvaluesofCorrelationMatrix给出了由相关系数矩阵计算出来的全部特征值(Eigenvalue)、相邻两个特征值的差异(difference)、每个主成分的贡献率(proportion)和累积贡献率(cumulative)。如:第一主成分对方差的贡献率为46.94%,第二主成分对方差的贡献率为27.46%,第三主成分对方差的贡献率为15.19%,之后的主成分的贡献率为0.05。前三个主成分的累积贡献率为89.58%,因此,对第四主成分以后的主成分完全可以忽略不计,用前三个主成分就可以很好地概括这组数据。Eigenvectors输出了全部特征值对应的特征向量,它们是线性无关的单位向量。第1列表示第1主成分Prin1的得分系数,第2列表示第2主成分Prin2的得分系数,以此类推。据此可以写出由标准化变量所表达的各主成分的关系式。x1*是标准指标变量.Prin1=0.46x1*+0.31x2*+0.47x3*+0.24x4*+0.25x5*–0.26x6*–0.32x7*+0.42x8*Prin2=0.26x1*–0.40x2*+0.11x3*–0.49x4*+0.50x5*+0.17x6*+0.40x7*+0.29x8*Prin3=0.11x1*+0.25x2*+0.19x3*+0.33x4*–0.25x5*+0.72x6*+0.40x7*+0.19x8*第一主成分中x3、x1、x8的系数最大,可以把第一主成分看成是由固定资产投资(x3)、GDP(x1)、工业总产值(x8)所刻画的反映经济发展水平的综合指标。Out语句输出的包含原始数据和主成分得分的数据集如:第1个样本(北京)的第一个主成分的得分是0.82827,第二个主成分的得分是-2.25758……OUTSTAT语句输出的统计量数据集,包含原始指标的均值(line1)、标准差(line2)、样本数(line3)、相关系数矩阵(n个原始指标,则共n行)、特征值和得分系数(Prin1=0.46x1*+0.31x2*+0.47x3*+0.24x4*+0.25x5*–0.26x6*–0.32x7*+0.42x8*)等。程序:libnamezcfC:\Users\Tina\Documents\SAS\zcf;procimportdatafile=C:\Users\Tina\Documents\SAS\zcf\zcf.xlsout=zcf.test1;run;procprincompdata=zcf.test1n=4out=w1outstat=w2;/*n代表主成分个数,out输出原始数据和主成分得分,outstat输出统计量数据集*/varx1-x8;/*列向量X1-X8*/run;procprintdata=w1;procprintdata=w2;run;按第一主成分和第二主成分的得分作图,又称为载荷图procplotdata=w1vpct=60;/*vpct后的数值表示图所占页面的长度*/plotprin1*prin2='*'$province//*='*'表明图中的散点用*表示,还可用#等*//*美元符号后写标签变量province代表每个点根据province变量命名*/haxis=-3.5to3by0.5HREF=-2,0,2vaxis=-3to4.5by1.5VREF=-2,0,2;/*HREF代表垂直于水平轴-2,0,2处画参考线,VREF同理*/title'主成分散点图';/*title为结果命名。Plot:主成分散点图,否则Plot:SAS系统*/run;注意:province后的/隔开plot语句的request部分和options部分隔开,是必须的,否则报错。haxis和vaxis选项可以提行写也可不提行,但中间不能用/隔开。

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功