结构方程模型(StructuralEquationModeling,SEM)概念介绍基本原理案例分析实际操作01020304目录CONTENTS01概念介绍1.基本概念结构方程模型(StructuralEquationModeling,SEM)是一种验证性多元统计分析技术,是应用线性方程表示观测变量与潜变量之间,以及潜变量之间关系的一种多元统计方法,其实质是一种广义的一般线性模型。SEM假定一组潜变量之间存在因果关系,潜变量可以分别用一组显变量表示,是某几个显变量中的线性组合。通过验证显变量之间的协方差,可以估计出线性回归模型的系数,从而在统计上检验所假设的模型对所研究的过程是否合适,如果证实所假设的模型合适,就可以说假设潜变量之间的关系是合理的。SEM包括:因子分析(验证性因子分析、探索性因子分析)、回归分析、路径分析、t检验、方差分析、潜变量因果模型(全模型)、高阶因子分析、多质多法分析、潜变量增长模型01概念介绍2.产生发展①20世纪70年代,一些学者(Joreskog,1973;Wiley,1973)将因子分析、路径分析等统计方法整合,提出结构方程的初步概念。②Joreskog与其合作者进一步发展矩阵模型的分析技术来处理共变结构的分析问题,提出测量模型与结构模型的概念,促成SEM的发展。③Ullman(1996)定义结构方程为“一种验证一个或多个自变量与一个或多个因变量之间一组相关关系的多元分析程式,其中自变量和因变量既可以是连续的,也可以是离散的”,突出其验证多个自变量与多个因变量之间关系的特点。3.应用领域SEM在心理学、社会学、行为科学等领域均得到广泛使用①在心理学领域,SEM可以应用于检验心理测量的信度、效度及解释测量中的一些问题,为检验观察数据与基木行为结构之间的关系提供了一种有效的方法。②在社会科学及管理学等领域,许多变量是人们为了理解和研究问题而建立的假设概念,是不能直接测量的,也不存在直接的测量方法。利用一些可观测变量作为潜在变量的“标识”时,又往往包含大量的测量误差。运用SEM能够使研究人员在分析中处理测量误差,探求潜在变量之间的结构关系。③在市场研究领域,SEM可以用于消费者满意度研究、对产品或服务的偏好以及购买行为研究、行为和态度动机的探索、生活方式研究等。④新的应用:多重样本分析、交互作用效应的检验、均数差异检验、纵向设计01概念介绍程开明.结构方程模型的特点及应用01概念介绍4.SEM的优点①同时处理多个因变量。②容许自变量和因变量含测量误差。③同时估计因子结构和因子关系。④容许更大弹性的测量模型。⑤估计整个模型的拟合程度。5.SEM常用软件①LISREL设计:KarlJöreskog和DagSörbom代理:ScientificSoftwareInternational②AMOS设计:JamesArbuckle代理:SPSS③EQS设计:PeterM.Bentler代理:MultivariateSoftware④Mplus设计:BengtMuthén和LindaMuthén(自理)01概念介绍6.SEM的技术特性①具有理论先验性。②同时处理因素的测量关系和因素之间的结构关系。③以协方差矩阵的运用为核心。④适用于大样本分析(样本数100,分析不稳定;一般要200)。⑤包含不同的统计技术。⑥重视多重统计指标的运用。7.SEM的样本规模①资料符合常态、无遗漏值及例外值(Bentler&Chou,1987)下,样本比例最小为估计参数的5倍、10倍则更为适当。②当原始资料违反常态性假设时,样本比例应提升为估计参数的15倍。③以最大似然法(MaximumLikelihood,ML)评估,Loehlin(1992)建议样本数至少为100,200较为适当。④当样本数为400~500时,此法会变得过于敏感,而使得模式不适合。1.模型构建构建研究模型,具体包括:观测变量(指标)与潜变量(因子)的关系,各潜变量之间的相互关系等。2.模型拟合对模型求解,其中主要是模型参数的估计,求得参数使模型隐含的协方差距阵与样本协方差距阵的“差距”最小。3.模型评价①路径系数/载荷系数的显著性;②各参数与预设模型的关系是否合理;③各拟合指数是否通过。4.模型修正模型扩展(使用修正指数)或模型限制(使用临界比率)。02基本原理02基本原理1.模型构建——变量①观测变量:能够观测到的变量(路径图中以长方形表示)。②潜在变量:难以直接观测到的抽象概念,由测量变量推估出来的变量(路径图中以椭圆形表示)。③内生变量:模型总会受到任何一个其他变量影响的变量(因变量;路径图会受到任何一个其他变量以单箭头指涉的变量。④外生变量:模型中不受任何其他变量影响但影响其他变量的变量(自变量;路径图中会指向任何一个其他变量,但不受任何变量以单箭头指涉的变量)。1.模型构建——变量⑤中介变量:当内生变量同时做因变量和自变量时,表示该变量不仅被其他变量影响,还可能对其他变量产生影响。⑥内生潜在变量:潜变量作为内生变量。⑦外生观测变量:外生潜在变量的观测变量。⑧外生潜在变量:潜变量作为外生变量。⑨外生观测变量:外生潜在变量的观测变量。⑩中介潜变量:潜变量作为中介变量。11中介观测变量:中介潜在变量的观测变量。02基本原理。1.模型构建——参数“未知”和“估计”①潜在变量自身:总体的平均数或方差。②变量之间关系:因素载荷,路径系数,协方差。参数类型:①自由参数:参数大小必须通过统计程序加以估计。②固定参数:模型拟合过程中无须估计。02基本原理1.模型构建——路径图路径分析的最有用的一个工具,用图形形式表示变量之间的各种线性关系,包括直接的和间接的关系。(1)常用记号:①矩形框表示观测变量;②圆或椭圆表示潜在变量;③小的圆或椭圆,或无任何框,表示方程或测量的误差:单向箭头指向指标或观测变量,表示测量误差;单向箭头指向因子或潜在变量,表示内生变量未能被外生潜在变量解释的部分,是方程的误差;④单向箭头连接的两个变量表示假定有因果关系,箭头由原因(外生)变量指向结果(内生)变量;⑤两个变量之间连线的两端都有箭头,表示它们之间互为因果;⑥弧形双箭头表示假定两个变量之间没有结构关系,但有相关关系;⑦变量之间没有任何连接线,表示假定它们之间没有直接联系。02基本原理1.模型构建——路径图(2)路径系数路径分析模型的回归系数,用来衡量变量之间影响程度或变量的效应大小(标准化系数、非标准化系数)。分为反映外生变量影响内生变量的路径系数和反映内生变量影响内生变量的路径系数路径系数的下标:第一部分所指向的结果变量,第二部分表示原因变量。(3)效应分解①直接效应:原因变量(外生或内生变量)对结果变量(内生变量)的直接影响,大小等于原因变量到结果变量的路径系数。②间接效应:原因变量通过一个或多个中介变量对结果变量所产生的影响,大小为所有从原因变量出发,通过所有中介变量结束于结果变量的路径系数乘积。③总效应:原因变量对结果变量的效应总和。总效应=直接效应+间接效应02基本原理1.模型构建——路径图X为外生观测变量,y为内生观测变量。ξ为外生潜变量,η为内生潜变量。δ为外生观测变量x的误差,ε为内生观测变量y的误差,ζ为方程的误差。λ为潜变量对观测变量影响的路径系数,β为反映内生潜变量之间影响的路径系数,γ为反映外生潜变量对内生潜变量影响的路径系数。02基本原理(1)和(2)是测量模型方程,(3)是结构模型方程。Λx—外生观测变量与外生潜变量直接的关系,是外生观测变量在外生潜变量上的因子载荷矩阵;Λy—内生观测变量与内生潜变量之间的关系,是内生观测变量在内生潜变量上的因子载荷矩阵;В—表示内生潜变量之间的关系,路径系数矩阵;Г—表示外生潜变量对内生潜变量的影响,路径系数矩阵;ζ—结构方程的残差项,反映了η在方程中未能被解释的部分。1.模型构建——矩阵方程式xx(1)yy(2)B(3)02基本原理1.模型构建——矩阵方程式11111xx123xxxx112131xxxx12311111yy123yyyy1234561221000B11测量模型:反映潜在变量和观测变量之间的关系方程式:112131425262000000yyyyyyy22112112结构模型:反映潜在变量之间因果关系方程式:111111121yy02基本原理02基本原理2.模型评价——参数估计(1)假设条件①测量模型误差项δ,ε的均值为零②结构模型的残差项ζ的均值为零③误差项ε,δ与因子η,ξ之间不相关,误差项ε与δ不相关④残差项ζ与ξ,η,δ之间不相关(2)参数估计策略①加权最小平方策略(WLS)②最大概似法(ML)③无加权最小平方法(ULS)④一般化最小平方法(GLS)⑤渐进分布自由法(ADF)02基本原理3.模型拟合——主要拟合度指标(1)基本拟合标准基本拟合标准是用来检验模型的误差以及误输入等问题。主要包括:①不能有负的测量误差;②测量误差必须达到显著性水平;③因子载荷必须介于0.5-0.95之间;④不能有很大的标准误差。(2)模型内在结构拟合度模型的内在结构拟合度是用来评价模型内估计参数的显著程度、各指标及潜在变量的信度。主要包括:①潜变量的组成信度(CR),0.7以上表明组成信度较好;②平均提炼方差(AVE),0.5以上为可以接受的水平。02基本原理3.模型拟合——主要拟合度指标(3)整体模型拟合度整体模型拟合度是用来评价模型与数据的拟合程度。主要包括:①绝对拟合度,用来确定模型可以预测协方差阵和相关矩阵的程度;②简约拟合度,用来评价模型的简约程度;③增值拟合度,理论模型与虚无模型的比较。02基本原理3.模型拟合——主要拟合度指标(3)整体模型拟合度a)χ2卡方拟合指数检验选定的模型协方差矩阵与观察数据协方差矩阵相匹配的假设。原假设是模型协方差阵等于样本协方差阵。如果模型拟合的好,卡方值应该不显著。在这种情况下,数据拟合不好的模型被拒绝。b)RMR是残差均方根。RMR是样本方差和协方差减去对应估计的方差和协方差的平方和,再取平均值的平方根。RMR应该小于0.08,RMR越小,拟合越好。c)RMSEA是近似误差均方根RMSEA应该小于0.06,越小越好。d)GFI是拟合优度指数,范围在0和1间,但理论上能产生没有意义的负数。按照约定,要接受模型,GFI应该等于或大于0.90。e)PGFI是简效拟合优度指数。它是简效比率(PRATIO,独立模式的自由度与内定模式的自由度的比率)乘以GFI。PGFI应该等于或大于0.90,越接近1越好。f)PNFI是简效拟合优度指数,等于PRATIO乘以NFI。PNFI应该等于或大于0.90,越接近1越好。g)NFI是规范拟合指数,变化范围在0和1间,1=完全拟合。按照约定,NFI小于0.90表示需要重新设置模型。越接近1越好。h)TLI是Tucker-Lewis系数,也叫做Bentler-Bonett非规范拟合指数(NNFI)。TLI接近1表示拟合良好。i)CFI是比较拟合指数,其值位于0和1之间。CFI接近1表示拟合非常好,其值大于0.90表示模型可接受,越接近1越好。02基本原理4.模型修正(1)参考标准①模型所得结果是适当的。②所得模型的实际意义、模型变量间的实际意义和所得参数与实际假设的关系是合理的。③参考多个不同的整体拟合指数。(2)修正原则①省俭原则a)两个模型拟合度差别不大的情况下,应取两个模型中较简单的模型;b)拟合度差别很大,应采取拟合更好的模型,暂不考虑模型的简洁性;c)最后采用的模型应是用较少参数但符合实际意义,且能较好拟合数据的模型。②等同模式用不同的方法表示各个潜在