第5讲验证性因素分析王孟成中南大学Email:wmcheng2006@126.comBlog:潜变量建模与Mplus应用2012.长沙.中南大学王孟成验证性因素分析概述•验证性因素分析(Confirmatoryfactoranalysis,CFA)是结构方程模型的重要组成部分,主要处理观测指标与潜变量之间的关系,也被称作测量模型(MeasurementModel)。•在CFA中,指标与因子之间的关系是明确的。潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFA的用途•检验量表或测验的结构效度(e.g.,王孟成,戴晓阳,万娟,2009)。•检验方法学效应(e.g.,王孟成,蔡炳光,吴艳,戴晓阳,2010)。•检验测量不变性(Wang,Elhai,Dai,&Yao,2012)。潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFAvs.EFA•外显变量与潜在因子之间的关系是事先确定的还是事后推定.潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFAvs.EFA•CFA与EFA相比有如下优点(Bollen1989):•第一,更简约。•第二,为检验测验/量表跨群体或时间不变性提供可能。•第三,用于比较不同的理论模型。•第四,方法效应(MethodEffects)。•第五,其他优点。潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFA分析流程潜变量建模与Mplus应用2012.长沙.中南大学王孟成模型设定ModelSpecification•即模型表达指模型涉及变量、变量之间关系、模型参数等的设定。根据过往研究结果或依据理论,确定因子个数及条目与因子间的隶属关系。潜变量建模与Mplus应用2012.长沙.中南大学王孟成模型识别•标准的CFA模型识别规则:•a·指定测量单位。在CFA中每个因子都需要指定测量单位,否则不可识别。指定单位的方法有两种,一种是设定一个指标的负荷为1,另一种是设定因子方差为1。•b·t法则:t≤p(p+1)/2t为自由参数的个数,p为指标的个数。•c·三指标法则:每个因子至少3个指标;每个因子只在一个指标上有负荷;误差不相关。•d·两指标法则:多于一个因子;每个因子至少2个指标;每个因子只在一个指标上有负荷(指标不跨负荷);每个因子都有与之相关的因子;误差不相关。单个因子,2个指标负荷限定相等;误差不相关。潜变量建模与Mplus应用2012.长沙.中南大学王孟成•e·单指标法则:因子由单个指标测量需满足下列条件之一:•(1)指标误差方差固定为0或其他值(如,1-信度×指标方差)•(2)或在结构模型中存在额外的工具变量(InstrumentalVariable),并且指标误差与工具变量的误差不相关。•简单结构,每个条目只在一个因子上有负荷,误差不相关。•目前常用的两种指定测量单位的方法,在多数情况下产生相同的拟合和参数估计,但有时会产生不同的标准误(Gonzalez&Griffin,2001)。潜变量建模与Mplus应用2012.长沙.中南大学王孟成Mplus指定潜变量单位•固定负荷法:•F1BYy1-y5;!程序默认设置因子的第一个指标的负荷为1。•固定方差法:•F1BYy1*y2-y5;!指标后加自由估计符号“*”可以设定y1自由估计。•!“*”还可用于设定开始值。•F1@1;!使用固定参数符号@固定因子方差为1。潜变量建模与Mplus应用2012.长沙.中南大学王孟成模型估计•Mplus提供了12种参数估计的方法,ML估计法最常用。•前提条件:•连续数据。心理学研究中很少能满足此要求,但选项数在5个以上近似看作连续变量,可以得到准确的估计(Johnson&Creech,1983)。•多元正态分布。此要求很苛刻,在实践中很难满足,如何处理非正态数据见第9章。•数据独立。此前提基本多数情况下可以满足。在复杂取样设计中,变量之间独立性受到威胁时可使用MLR估计法,获得稳健卡方和误差。•大样本。潜变量建模与Mplus应用2012.长沙.中南大学王孟成数据预处理•数据分析之前都需要对数据质量进行审查,如奇异值(Bollen1987,Lee&Xu2003,Yuan&Bentler,2001)。•Yuan和Bentler(2001,p.161)指出,即使提出的模型在样本中的大部分数据中是合适的,即使小部分的奇异值也会导致估计偏差。•Lee和Xu(2003)提供了一些数据准备的技巧。•1000个优质case胜过10万个垃圾case!!潜变量建模与Mplus应用2012.长沙.中南大学王孟成模型拟合评价模型拟合评价可以分为两类(Yuan,2005):假设检验和近似拟合检验。模型拟合(ModelFit)用于评价样本方差-协方差矩阵(S)与理论模型再生的方差-协方差矩阵(E)之间的差距。潜变量建模与Mplus应用2012.长沙.中南大学王孟成假设检验卡方(Chi-Square,χ2)•如果模型隐含的方差—协方差与观测到的样本方差—协方差之间的差异达到一定显著性水平(如0.05或0.01)上的临界值,那么模型将被拒绝。•模型隐含的方差—协方差与观测方差—协方差之间的差异服从χ2分布,所以采用χ2检验来衡量这个差异是抽样误差造成的还是实际存在的。潜变量建模与Mplus应用2012.长沙.中南大学王孟成Chi-Square,χ2•卡方统计量是根据如下公式得到:T=(N–1)FML•FML为使用ML或其它估计法所得到的最小拟合函数值,N为样本量。当样本足够大,且符合多元正态分布时,(N–1)FML服从中央卡方分布(CentralChi-squareDistribution),即从样本获得的值接近于卡方真值。SEM软件会报告卡方值及显著性检验的结果。潜变量建模与Mplus应用2012.长沙.中南大学王孟成Chi-Square,χ2特性•Χ2受如下几个因素的影响:•第一,样本量。对样本量非常敏感,倾向于随样本量的增加而变大。•第二,数据分布形态。非正态分布时使用ML影响其精确性。•第三,观测指标的质量。如果观测指标之间的相关系数较高时也会高估卡方统计量(Kline,2010)潜变量建模与Mplus应用2012.长沙.中南大学王孟成Chi-Square,χ2评价•在实践中研究者往往忽略显著的卡方差异检验结果,而将近似拟合指数作为接受模型的依据,Barrett(2007)强烈反对这种做法,认为所有SEM研究都应该报告卡方检验结果并以此做为接受或拒绝模型的依据。•尽管这种观点过于偏激,但显著的卡方检验至少说明模型拟合并非完美,这一点需要引起研究者注意(Kline,2010)。潜变量建模与Mplus应用2012.长沙.中南大学王孟成近似拟合检验(ApproximateFitTests)•近似拟合指数主要有如下三类:•绝对拟合指数(AbsoluteFitIndexes)、•比较拟合指数(ComparativeFitIndexes)•简约拟合指数(Parsimony-adjustedIndex)潜变量建模与Mplus应用2012.长沙.中南大学王孟成绝对拟合指数GFI=1-Cres/Ctotal•类似于回归模型中的决定系数R2,即整个模型可以解释样本方差-协方差的程度。上式中的Cres和Ctotal分别表示样本方差-协方差矩阵中的残差和总变异。•Breivik和Olsson(2001)模拟研究发现GFI对样本量不敏感。潜变量建模与Mplus应用2012.长沙.中南大学王孟成绝对拟合指数•标准化残差均方根(StandardizedRootMeanSquareResidual,SRMR)直接对残差进行评价的指标,其取值范围在0-1之间,当值小于0.08时,表示模型拟合理想(Hu&Bentler,1999)。•SRMR易受样本量影响,在处理类别数据时,表现不佳(Yu,2002)。.10poorfit.08-.10mediocrefit.05-.08acceptablefit.01-.05closefit.00exactfit潜变量建模与Mplus应用2012.长沙.中南大学王孟成RMSEA•近似误差均方根(RootMeanSquareErrorofApproximation,RMSEA,Steiger&Lind,1980)受样本量影响小,对模型误设较敏感,同时惩罚复杂模型,是比较理想的拟合指数,被广泛使用(Jacksonetal.,2009;Marsh&Balla,1994)。•RMSEA虽对模型复杂程度进行了惩罚,但随着样本量的增加惩罚的力度递减(Mulaik,2009)。.10poorfit.08-.10mediocrefit.05-.08acceptablefit.01-.05closefit.00exactfit潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFI•比较拟合指数(ComparativeFitIndex,CFI;Bentler,1990)目前使用最广泛的指标之一(Fan,Thompson,&Wang,1999),也是最稳健的指标之一(Hu&Bentler,1999)。•CFI=1-(χ2M1-dfM1)/(χ2M0-dfM0)•CFI对样本量不敏感(Fan,Thompson,&Wang,1999),在小样本中也表现不错(Tabachnick&Fidell,2007)。.85poorfit.85-.90mediocrefit.90-.95acceptablefit.95-.99closefit1.00exactfit潜变量建模与Mplus应用2012.长沙.中南大学王孟成NNFI/TLI•非规范拟合指数(NonnormedFitIndex,NNFI)•NNFI=[(χ2M0/dfM0)–(χ2M1/dfM1)]/[(χ2M0/dfM0)–1]•由于NNFI的取值会超出0-1的范围,所以将其称为非规范拟合指数。通常将TLI.90作为可接受的标准,.95拟合较好(Hu&Bentler,1999)。.85poorfit.85-.90mediocrefit.90-.95acceptablefit.95-.99closefit1.00exactfit潜变量建模与Mplus应用2012.长沙.中南大学王孟成AIC•Akaike信息准则(AkaikeInformationCriterion,AIC;Akaike,1987)AIC1=-2logL+2tAIC2=χ2+2tAIC3=χ2-2df•logL为模型极大对数似然函数值;t为自由参数的个数;df为模型自由度。•AIC是基于信息理论发展出来的指数,倾向于支持AIC值较小的模型,常用于非嵌套模型比较(e.g.,Kline,2011;Raftery,1995;Vrieze,2012;见第9章)。•AIC考虑了模型需要估计参数的个数,因此对模型复杂程度进行了惩罚,但随着样本量的增加惩罚的力度递减(Mulaik,2009)。潜变量建模与Mplus应用2012.长沙.中南大学王孟成贝叶斯信息准则(BayesianinformationcriterionBIC;Schwartz,1978)•BIC用于模型选择最早由Raftery(1986a,1986b)提出,随后被研究者广泛采用,目前几乎所有的SEM软件都报告BIC指数,Mplus报告BIC1。BIC1=-2logL+tlog(N)BIC2=χ2-dflog(N)•式中N为样本量,t为自由参数的个数。•另外Mplus还报告一个样本校正的BIC,此时用N*=(N+2)/24取代式中的N。潜变量建模与Mplus应用2012.长沙.中南大学王孟成拟合指数评价•近似拟合指数的临界值是金标准吗?•1)推荐的临界值在研究者中间并未达成共识;有研究者完全否定近似拟合指数在模型评价中的作用(Barrett,2007;Millsap,2007;Markland,2007)。•2)理想条件获得的标准去评价实际研究存在困难;目前被广