第5讲-验证性因素分析

nono041103
1 ℃
2020-04-22

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第5讲验证性因素分析王孟成中南大学Email：wmcheng2006@126.comBlog:潜变量建模与Mplus应用2012.长沙.中南大学王孟成验证性因素分析概述•验证性因素分析(Confirmatoryfactoranalysis,CFA)是结构方程模型的重要组成部分，主要处理观测指标与潜变量之间的关系，也被称作测量模型（MeasurementModel）。•在CFA中，指标与因子之间的关系是明确的。潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFA的用途•检验量表或测验的结构效度(e.g.,王孟成,戴晓阳,万娟,2009)。•检验方法学效应(e.g.,王孟成,蔡炳光,吴艳,戴晓阳,2010)。•检验测量不变性(Wang,Elhai,Dai,&Yao,2012)。潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFAvs.EFA•外显变量与潜在因子之间的关系是事先确定的还是事后推定.潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFAvs.EFA•CFA与EFA相比有如下优点(Bollen1989)：•第一，更简约。•第二，为检验测验/量表跨群体或时间不变性提供可能。•第三，用于比较不同的理论模型。•第四，方法效应(MethodEffects)。•第五，其他优点。潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFA分析流程潜变量建模与Mplus应用2012.长沙.中南大学王孟成模型设定ModelSpecification•即模型表达指模型涉及变量、变量之间关系、模型参数等的设定。根据过往研究结果或依据理论，确定因子个数及条目与因子间的隶属关系。潜变量建模与Mplus应用2012.长沙.中南大学王孟成模型识别•标准的CFA模型识别规则：•a·指定测量单位。在CFA中每个因子都需要指定测量单位，否则不可识别。指定单位的方法有两种，一种是设定一个指标的负荷为1，另一种是设定因子方差为1。•b·t法则：t≤p(p+1)/2t为自由参数的个数，p为指标的个数。•c·三指标法则：每个因子至少3个指标；每个因子只在一个指标上有负荷；误差不相关。•d·两指标法则：多于一个因子；每个因子至少2个指标；每个因子只在一个指标上有负荷（指标不跨负荷）；每个因子都有与之相关的因子；误差不相关。单个因子，2个指标负荷限定相等；误差不相关。潜变量建模与Mplus应用2012.长沙.中南大学王孟成•e·单指标法则：因子由单个指标测量需满足下列条件之一：•(1)指标误差方差固定为0或其他值（如，1－信度×指标方差）•(2)或在结构模型中存在额外的工具变量(InstrumentalVariable)，并且指标误差与工具变量的误差不相关。•简单结构，每个条目只在一个因子上有负荷，误差不相关。•目前常用的两种指定测量单位的方法，在多数情况下产生相同的拟合和参数估计，但有时会产生不同的标准误(Gonzalez&Griffin,2001)。潜变量建模与Mplus应用2012.长沙.中南大学王孟成Mplus指定潜变量单位•固定负荷法：•F1BYy1-y5;!程序默认设置因子的第一个指标的负荷为1。•固定方差法：•F1BYy1*y2-y5;!指标后加自由估计符号“*”可以设定y1自由估计。•!“*”还可用于设定开始值。•F1@1;!使用固定参数符号@固定因子方差为1。潜变量建模与Mplus应用2012.长沙.中南大学王孟成模型估计•Mplus提供了12种参数估计的方法，ML估计法最常用。•前提条件：•连续数据。心理学研究中很少能满足此要求，但选项数在5个以上近似看作连续变量，可以得到准确的估计(Johnson&Creech,1983)。•多元正态分布。此要求很苛刻，在实践中很难满足，如何处理非正态数据见第9章。•数据独立。此前提基本多数情况下可以满足。在复杂取样设计中，变量之间独立性受到威胁时可使用MLR估计法，获得稳健卡方和误差。•大样本。潜变量建模与Mplus应用2012.长沙.中南大学王孟成数据预处理•数据分析之前都需要对数据质量进行审查，如奇异值(Bollen1987,Lee&Xu2003,Yuan&Bentler,2001)。•Yuan和Bentler(2001,p.161)指出，即使提出的模型在样本中的大部分数据中是合适的，即使小部分的奇异值也会导致估计偏差。•Lee和Xu(2003)提供了一些数据准备的技巧。•1000个优质case胜过10万个垃圾case!!潜变量建模与Mplus应用2012.长沙.中南大学王孟成模型拟合评价模型拟合评价可以分为两类(Yuan,2005)：假设检验和近似拟合检验。模型拟合(ModelFit)用于评价样本方差-协方差矩阵(S)与理论模型再生的方差-协方差矩阵(E)之间的差距。潜变量建模与Mplus应用2012.长沙.中南大学王孟成假设检验卡方(Chi-Square,χ2)•如果模型隐含的方差—协方差与观测到的样本方差—协方差之间的差异达到一定显著性水平（如0.05或0.01）上的临界值，那么模型将被拒绝。•模型隐含的方差—协方差与观测方差—协方差之间的差异服从χ2分布，所以采用χ2检验来衡量这个差异是抽样误差造成的还是实际存在的。潜变量建模与Mplus应用2012.长沙.中南大学王孟成Chi-Square,χ2•卡方统计量是根据如下公式得到：T=(N–1)FML•FML为使用ML或其它估计法所得到的最小拟合函数值，N为样本量。当样本足够大，且符合多元正态分布时，(N–1)FML服从中央卡方分布(CentralChi-squareDistribution)，即从样本获得的值接近于卡方真值。SEM软件会报告卡方值及显著性检验的结果。潜变量建模与Mplus应用2012.长沙.中南大学王孟成Chi-Square,χ2特性•Χ2受如下几个因素的影响：•第一，样本量。对样本量非常敏感，倾向于随样本量的增加而变大。•第二，数据分布形态。非正态分布时使用ML影响其精确性。•第三，观测指标的质量。如果观测指标之间的相关系数较高时也会高估卡方统计量(Kline,2010)潜变量建模与Mplus应用2012.长沙.中南大学王孟成Chi-Square,χ2评价•在实践中研究者往往忽略显著的卡方差异检验结果，而将近似拟合指数作为接受模型的依据，Barrett(2007)强烈反对这种做法，认为所有SEM研究都应该报告卡方检验结果并以此做为接受或拒绝模型的依据。•尽管这种观点过于偏激，但显著的卡方检验至少说明模型拟合并非完美，这一点需要引起研究者注意(Kline,2010)。潜变量建模与Mplus应用2012.长沙.中南大学王孟成近似拟合检验(ApproximateFitTests)•近似拟合指数主要有如下三类：•绝对拟合指数(AbsoluteFitIndexes)、•比较拟合指数(ComparativeFitIndexes)•简约拟合指数(Parsimony-adjustedIndex)潜变量建模与Mplus应用2012.长沙.中南大学王孟成绝对拟合指数GFI=1－Cres/Ctotal•类似于回归模型中的决定系数R2，即整个模型可以解释样本方差-协方差的程度。上式中的Cres和Ctotal分别表示样本方差-协方差矩阵中的残差和总变异。•Breivik和Olsson(2001)模拟研究发现GFI对样本量不敏感。潜变量建模与Mplus应用2012.长沙.中南大学王孟成绝对拟合指数•标准化残差均方根(StandardizedRootMeanSquareResidual,SRMR)直接对残差进行评价的指标，其取值范围在0-1之间，当值小于0.08时，表示模型拟合理想(Hu&Bentler,1999)。•SRMR易受样本量影响，在处理类别数据时，表现不佳(Yu,2002)。.10poorfit.08-.10mediocrefit.05-.08acceptablefit.01-.05closefit.00exactfit潜变量建模与Mplus应用2012.长沙.中南大学王孟成RMSEA•近似误差均方根(RootMeanSquareErrorofApproximation,RMSEA,Steiger&Lind,1980)受样本量影响小，对模型误设较敏感，同时惩罚复杂模型，是比较理想的拟合指数，被广泛使用(Jacksonetal.,2009;Marsh&Balla,1994)。•RMSEA虽对模型复杂程度进行了惩罚，但随着样本量的增加惩罚的力度递减(Mulaik,2009)。.10poorfit.08-.10mediocrefit.05-.08acceptablefit.01-.05closefit.00exactfit潜变量建模与Mplus应用2012.长沙.中南大学王孟成CFI•比较拟合指数(ComparativeFitIndex,CFI;Bentler,1990)目前使用最广泛的指标之一(Fan,Thompson,&Wang,1999)，也是最稳健的指标之一(Hu&Bentler,1999)。•CFI=1－(χ2M1－dfM1)/(χ2M0－dfM0)•CFI对样本量不敏感(Fan,Thompson,&Wang,1999)，在小样本中也表现不错(Tabachnick&Fidell,2007)。.85poorfit.85-.90mediocrefit.90-.95acceptablefit.95-.99closefit1.00exactfit潜变量建模与Mplus应用2012.长沙.中南大学王孟成NNFI/TLI•非规范拟合指数(NonnormedFitIndex,NNFI)•NNFI=[(χ2M0/dfM0)–(χ2M1/dfM1)]/[(χ2M0/dfM0)–1]•由于NNFI的取值会超出0-1的范围，所以将其称为非规范拟合指数。通常将TLI.90作为可接受的标准，.95拟合较好(Hu&Bentler,1999)。.85poorfit.85-.90mediocrefit.90-.95acceptablefit.95-.99closefit1.00exactfit潜变量建模与Mplus应用2012.长沙.中南大学王孟成AIC•Akaike信息准则(AkaikeInformationCriterion,AIC;Akaike,1987)AIC1=－2logL+2tAIC2=χ2+2tAIC3=χ2－2df•logL为模型极大对数似然函数值；t为自由参数的个数；df为模型自由度。•AIC是基于信息理论发展出来的指数，倾向于支持AIC值较小的模型，常用于非嵌套模型比较(e.g.,Kline,2011;Raftery,1995;Vrieze,2012；见第9章)。•AIC考虑了模型需要估计参数的个数，因此对模型复杂程度进行了惩罚，但随着样本量的增加惩罚的力度递减(Mulaik,2009)。潜变量建模与Mplus应用2012.长沙.中南大学王孟成贝叶斯信息准则(BayesianinformationcriterionBIC;Schwartz,1978)•BIC用于模型选择最早由Raftery(1986a,1986b)提出，随后被研究者广泛采用，目前几乎所有的SEM软件都报告BIC指数，Mplus报告BIC1。BIC1=－2logL+tlog(N)BIC2=χ2－dflog(N)•式中N为样本量，t为自由参数的个数。•另外Mplus还报告一个样本校正的BIC，此时用N*=(N+2)/24取代式中的N。潜变量建模与Mplus应用2012.长沙.中南大学王孟成拟合指数评价•近似拟合指数的临界值是金标准吗？•1)推荐的临界值在研究者中间并未达成共识；有研究者完全否定近似拟合指数在模型评价中的作用(Barrett,2007;Millsap,2007;Markland,2007)。•2)理想条件获得的标准去评价实际研究存在困难；目前被广