因子分析Stata与Spss的选择•1、stata一般采用pca命令或者factor命令加上pcf选项,比如:pcf就对应spss的主成分因子分析法。•2、因子分析,应该说比较早期和权威的软件是spss,spss里面的所有方差旋转等算法非常专业和精确,同样样本,stata和spss计算的结果基本是一样的(如果不一样,一般是默认的方差旋转不一样,spss的旋转方法确实多一点。•3、因子分析之前,至少做一个球形检验。然后,stata输出的Scoringcoefficients对应的是spss的因子得分系数阵。Stata因子分析对数据的评价•estatsmc•estatkmo•Kaiser-Meyer-Olkin抽样充分性测度也是用于测量变量之间相关关系的强弱的重要指标,是通过比较两个变量的相关系数•与偏相关系数得到的。•KMO介于0于1之间。KMO越高,表明变量的共性越强。如果偏相关系数相对于相关系数比较高,则KMO比较低,主成分•分析不能起到很好的数据约化效果。•根据Kaiser(1974),一般的判断标准如下:•0.00-0.49,不能接受(unacceptable);•0.50-0.59,非常差(miserable);•0.60-0.69,勉强接受(mediocre);•0.70-0.79,可以接受(middling);•0.80-0.89,比较好(meritorious);•0.90-1.00,非常好(marvelous)。•SMC即一个变量与其他所有变量的复相关系数的平方,也就是复回归方程的可决系数。•SMC比较高表明变量的线性关系越强,共性越强,主成分分析就越合适。Stata因子分析•factorbg2cost1-bg2cost6,factors(3)pf/pcf/ipf/ml•对bg2cost1-bg2cost6六个变量进行因子分析,选择三个主因子。•pf主因子方法,用复相关系数的平方作为因子载荷的估计量(默认选项)•pcf主成分因子,假定共同度=1•ipf迭代主因子,重复估计共同度•ml极大似然因子,假定变量(至少3个)服从多元正态分布,对偏相关矩阵的行列式进行最优化求解,等价于Rao的典型因子方法Stata选择主因子数•screeplot(碎石图)•pcf方法是对相关系数阵进行特征分解。•一般来说,主成分累积方差贡献率达80%的前几个主成分。•一般来说,当特征值小于1时,就不再选作主成分,因为该主成分的解释力度还不如直接用原始变量的解释力度。-.20.2.4.6.8Eigenvalues123456NumberScreeplotofeigenvaluesafterfactor实例公共因子特殊因子特殊因子尽量小于0.6,否则为主因子提取不全因子旋转rotaterotate之前因子旋转前后的载荷图Apkbg2cost1bg2cost2bg2cost3bg2cost4bg2cost5bg2cost6-.20.2.4.6.8Factor2-.20.2.4.6.8Factor1Rotation:orthogonalvarimaxMethod:principal-componentfactorsFactorloadingsbg2cost1bg2cost2bg2cost3bg2cost4bg2cost5bg2cost6.3.4.5.6.7Factor2-.50.51Factor1FactorloadingsApk反映了f每增加1,相关增加较大的X变量,而这群X变量就是相关的。因子旋转的方法•旋转的方法有很多,正交旋转(orthogonalrotation)和斜交旋转(obliquerotation)是因子旋转的两类方法。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;如果因子对应轴相互间不是正交的,则称为斜交旋转。常用的斜交旋转方法有Promax法等。因子载荷矩阵Apk的一点理解•Apk中的Aij表示变量xi依赖Fj的程度,即f每增加1,X被动增加的大小值。Aij的绝对值越大,表明xi与Fj的相依程度越大,或称公共因子Fj对xi的载荷量越大。•因子载荷矩阵Apk的两个统计量非常重要公共因子Fj的方差贡献率,用于提炼最具影响力的公共因子变量xi的共同度,hi2大说明第i个元素对F的每一分量的共同依赖度大因子得分系数阵predictf1f2因子得分系数阵M=0;std=1的矩阵因子得分得分图scoreplot-4-2024Scoresforfactor2-4-2024Scoresforfactor1Scorevariables(factor)