SPSS因子分析大纲•基本概念理解•因子分析原理•案例解读•实例操作因子分析的数学模型x1=a11f1+a12f2+a13f3+…+a1kfk+ε1x2=a21f1+a22f2+a23f3+…+a2kfk+ε2…xp=ap1f1+ap2f2+ap3f3+…+apkfk+εp•其中x1,x2,…,xp为p个原有变量,是均值为零,标准差为1的标准化变量,F1,F2,…,Fk为k个因子变量,kp,表示成矩阵形式为:X=AF+ε。•A为因子载荷矩阵,aij是第i个原有变量在第j个因子变量上的负荷。•ε为特殊因子,表示原有变量不能被公因子所解释的部分。概念理解•因子分析•用几个少数的抽象的变量(因子)来表示其基本的数据结构。•前提:变量相关、以最少的信息丢失为前提。•目的:寻求变量基本结构、对变量进行分类、简化观测数据、用少数的变量解释研究复杂的问题。•方法:通过现在变量测量潜在抽象的变量,通过具体指标测评抽象因子的统计分析。•因子将众多的原始变量综合成较少的几个综合指标,这些综合指标就是因子。特点:•因子个数k小于原变量个数k——信息简化•因子能够反映原有变量大部分信息——因子分析的有效性•因子之间的线性关系不显著——因子之间相互独立•因子可以进行命名——有利于对因子分析结果进行解释评价因子载荷•对于因子模型:xi=ai1f1+ai2f2+…+aikfk+εi(i=1,2,3…,p)•其中,aij为因子载荷,表示第i个变量在第j个因子上的负荷。在因子不相关的前提下,因子载荷aij是变量xi与因子fi的相关系数,反映了变量xi与因子fi的相关程度,也反映了因子fj对变量xi的重要程度:因子负载越大,说明第i个变量与第j个因子的关系越密切,该因子对变量重要程度越高因子负载越小,说明第i个变量与第j个因子的关系越疏远,该因子对变量重要程度越小。共同度量•因子分析模型中,第i行因子负载(相关系数aij,j=1,2,…,k)的平方和,共同度量(Communality),记为hi²=∑aij²。原变量的方差可以由两个部分来解释:1.共同度。所有公因子对变量xi方差说明的比例,变量共同度越接近1,则全部公因子解释了变量xi的大部分方差,丢失的信息较少;2.部分特殊因子对变量方差的贡献ε²,不能被全体公因子解释的部分,ε²越小,则说明丢失的信息越少。•共同度量是评价xi信息丢失程度的重要指标。如果大部分原有变量的变量共同度均较高(如高于0.7)则说明提取的因子能够很好的反应原有变量的大部分信息(如70%以上),也可以说是衡量因子分析效果的指标。因子的方差贡献•因子分析模型中,第j列因子负载的平方和gj²称为因子fj对所有原变量的贡献。•gj²=a1j²+a2j²+…+apj²(j=1,2,3…,k)•表示同一个因子fj对个变量所提供的方差贡献总和,反映因子fj对原有变量方差的解释能力。•因子方差贡献的值越高,就说明这个因子的重要性越高。信度与效度•信度•目的:测量的是数据的可靠程度•工具:spss软件中信度检验中Cronbach‘sα系数进行内部一致性信度检验,考察的问题是否测验了相同的内容•指标:α系数大于0.7说明测量的内部一致性较高。•效度•目的:检验的是研究的效果(有效性),是否达到预期目标•工具:运用spss软件进行因子分析•前提:对数据是否能进行因子分析进行检验,采用KMO值和Bartlett球形检验。•KMO值越大,越接近于1,则说明该数据库越适合进行因子分析。•Bartlett,一般认为P0.001时,否定原假设,即认为变量间的相关矩阵不是单位矩阵,各变量间具有一定的相关性,可以进行因子分析。因子分析基本原理•用少数几个抽象的因子,去描述多个指标或者因素(原变量)之间的联系,将相互之间关系比较密切的变量归为同一个类别之中,每一类变量就变成了一个因子。•因子分析的基本步骤:1.因子分析的前提条件——信度与效度检验原因:因子分析的主要任务是对原变量进行浓缩,将原变量中的信息重叠部分提取并综合成因子。前提条件:原变量内部一致性高、原有变量存在较强的相关关系。检验方法:克朗巴哈α(Cronbach‘sAlpha)系数、KMO检验和Bartlett检验等方法2.因子提取:将原有变量综合成几个少数的因子——因子分析的核心3.使因子具有命名解释性4.计算个样本的因子得分因子分析的应用——案例•复合型文化遗产旅游产品开发路径分析_以福建马尾船政文化为例•供需双方对景区文化偏好的差异性研究_以天柱山风景区为例•家庭生命周期与旅游态度的关联研究_以长沙市居民为例•旅游目的地非功用性定位研究_以目的地品牌个性为分析指标•世界遗产地旅游企业环境行为及其驱动机制_张家界饭店企业实证•饮食旅游动机对游客满意度和行为意向的影响研究•转型期居民对城市公园免费开放的感知分析_以广州市为例旅游学刊论文实例操作•案例数据来源•***************•A1到F4关于游客公平感知的因子分析实例操作•STEP1检验是否可进行因子分析——信度与效度检验1.信度检验方法:采取布朗巴哈α系数(Cronbach‘sAlpha)操作步骤:analyze→scale→reliabilityAnalysisCaseProcessingSummaryaListwisedeletionbasedonallvariablesintheprocedure.•总个案数为377,其中有效个案356个,排除个案21个N%CasesValid35694.4Excluded(a)215.6Total377100.0ReliabilityStatistics信度检验•由信度分析结果可知,Cronbach’sα系数为0.972,系数值很高,表明问卷的内部一致性好,即信度好,该问卷(用于因子分析的数据)有很高的使用价值。Cronbach'sAlphaNofItems.97225效度检验2.效度检验目的:检验原有变量相关性方法:KMOandBartlett'sTest•KMO=0.9660.6,说明因子分析的效果很好;•Bartlett球形检验值为7994.942,P=0.0000.001,否定原假设,即认为变量间的相关矩阵不是单位矩阵,各变量间具有一定的相关性,可以进行因子分析。Kaiser-Meyer-OlkinMeasureofSamplingAdequacy..966Bartlett'sTestofSphericityApprox.Chi-Square7994.942df300Sig..000KMOandBartlett'sTestSTEP2:因子提取•操作:Analyze→DataReduction→Factor•结果分析FactAnalysisCommunalities共同度——公因子方差Initial总方差绝对值为1,Extraction提取的因子的总方差越接近于1,则,子对原有变量方差可解释的比例越大,信息丢失越少。由Communalities分析结果可知:•所有24个原始变量的共同度都超过了0.7,其中还有10个原有变量的共同度超过了0.8。•提取的因子解释了原有变量方差的大部分,超过70%,信息缺失少。Communalities共同度InitialExtractionA11.000.722A21.000.754A31.000.735A41.000.705B11.000.816B21.000.750B31.000.813B41.000.719C11.000.834C21.000.802C31.000.812C41.000.826C51.000.757D11.000.709D21.000.781D31.000.751D41.000.742D51.000.764E11.000.788E21.000.825E31.000.835F11.000.834F21.000.783F31.000.760F41.000.801因子方差贡献——主成分分析法ComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsRotationSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%Total%ofVarianceCumulative%115.02560.10160.10115.02560.10160.1014.50218.00918.00921.1364.54364.6441.1364.54364.6444.24916.99735.00631.0384.15068.7941.0384.15068.7943.16912.67747.6844.8563.42472.218.8563.42472.2182.77611.10658.7905.7422.96675.184.7422.96675.1842.67010.68269.4726.6232.49077.674.6232.49077.6742.0518.20377.6747.6062.42680.1008.5152.05982.1599.4451.78183.94010.4151.65985.59911.3811.52387.12212.3631.45488.57613.3481.39289.96814.3241.29491.26215.2651.05892.32016.2521.00893.32817.237.94994.27718.234.93795.21419.208.83296.04520.198.79296.83721.193.77197.60822.164.65498.26223.155.62198.88424.144.57699.46025.135.540100.000TotalVarianceExplainedExtractionMethod:PrincipalComponentAnalysis.•方差贡献反映因子包含信息量的多少,是衡量因子相对重要性的指标。从分析结果中可以看到:•通过主成分分析法,共提出6个因子•公共因子的最高的方差贡献率达到60.101%,累计方差贡献率最高已达到77.674%,说明转换后的因子结构保留了较多的原始信息。因子方差贡献——主成分分析法ComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsRotationSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%Total%ofVarianceCumulative%115.02560.10160.10115.02560.10160.1014.50218.00918.00921.1364.54364.6441.1364.54364.6444.24916.99735.00631.0384.15068.7941.0384.15068.7943.16912.67747.6844.8563.42472.218.8563.42472.2182.77611.10658.7905.7422.96675.184.7422.96675.1842.67010.68269.4726.6232.49077.674.6232.49077.6742.0518.20377.6747.6062.42680.1008.5152.05982.1599.4451.78183.940ScreenPlot碎石图特征值因子数STEP3:因子命名•RotatedComponentMatrix(a)旋转后的因子负载矩阵A1、A2、A3、A4可归于第3个因子;B1、B2、B3、B4归于第5个因子;C1、C2、C3、C4、C5归于第1个因子;D1、D2、D3、D4、D5归于第2个因子E1、E2、E3归于第6个因子F1、F2、F3、F4归于第4个因子Component123456A1.695