结构方程模型结构方程模型的原理一、结构方程模型概述1结构方程模型是应用线性方程表示观测变量与潜变量之间,以及潜在变量之间关系的一种多元统计方法,其实质是一种广义的一般线性模型。2发展历程①20世纪70年代,一些学者(Joreskog,1973;Wiley,1973)将因子分析、路径分析等统计方法整合,提出结构方程初步概念。②Joreskog与其合作者进一步发展矩阵模型的分析技术来处理共变结构的分析问题,提出测量模型与结构模型的概念,促成SEM的发展。③Ullman(1996)定义结构方程为“一种验证一个或多个自变量与一个或多个因变量之间一组相关关系的多元分析程式,其中自变量和因变量既可以是连续的,也可以是离散的”,突出其验证多个自变量与多个因变量之间关系的特点。3SEM与几种多元方法的比较①SEM与传统多元统计方法(多元统计)传统多元统计方法:检验自变量和因变量的单一关系(多元方差分析可以处理多个,但是关系也是单一的)SEM:综合多种方法,验证性分析,允许测量误差的存在②SEM与典型相关分析(多个自变量与多个因变量之间关系)典型相关分析:两组随机变量(定性或定量)之间线性密切程度;高维列联表各边际变量的线性关系;探索性分析SEM:估计多元和相互关联的因变量之间的线性关系;处理不可观测的假设概念;说明测量误差③SEM与联立方程模型(联立方程组、变量之间双向影响)联立方程模型:方程数量取决于内生变量的数量;只能处理有观察值的变量,假定不存在测量误差SEM:处理测量误差;分析潜在变量之间结构关系④SEM与人工神经网络(针对不可观测或潜在变量建模)人工神经网络:执行数据分析时,模型的隐含层接点仍然没有被明确标识出来;数据从输入层通过隐含变量流向输出层(输出向输入回流的网络拓扑结构)SEM:数据分析之前,已经标识潜在变量并构建起假设路径;观测变量都与中心潜在变量相关,潜在变量之间也可能发生关系。⑤SEM与偏最小二乘法(PLS)(集成多种分析方法,对因变量进行测量)PLS:对观测变量协方差矩阵的对角元素拟合较好,适用于对数据点的分析,预测准确度较高SEM:对观测变量协方差矩阵的非对角元素的拟合较好,适合于对协方差结构的分析,参数估计更准确4SEM的技术特性①具有理论先验性②同时处理因素的测量关系和因素之间的结构关系③以协方差矩阵的运用为核心④适用于大样本分析(样本数100,分析不稳定;一般要200)⑤包含不同的统计技术⑥重视多重统计指标的运用5样本规模大小资料符合常态、无遗漏值及例外值(Bentler&Chou,1987)下,样本比例最小为估计参数的5倍、10倍则更为适当。当原始资料违反常态性假设时,样本比例应提升为估计参数的15倍。以ML法评估,Loehlin(1992)建议样本数至少为100,200较为适当。当样本数为400~500时,此法会变得过于敏感,而使得模式不适合。二、结构方程模型的基本原理(一)模型构成1变量观测变量:能够观测到的变量(路径图中以长方形表示)潜在变量:难以直接观测到的抽象概念,由测量变量推估出来的变量(路径图中以椭圆形表示)内生变量:模型总会受到任何一个其他变量影响的变量(因变量;路径图会受到任何一个其他变量以单箭头指涉的变量外生变量:模型中不受任何其他变量影响但影响其他变量的变量(自变量;路径图中会指向任何一个其他变量,但不受任何变量以单箭头指涉的变量)中介变量:当内生变量同时做因变量和自变量时,表示该变量不仅被其他变量影响,还可能对其他变量产生影响。内生潜在变量:潜变量作为内生变量外生观测变量:外生潜在变量的观测变量外生潜在变量:潜变量作为外生变量外生观测变量:外生潜在变量的观测变量中介潜变量:潜变量作为中介变量中介观测变量:中介潜在变量的观测变量2参数(“未知”和“估计”)潜在变量自身:总体的平均数或方差变量之间关系:因素载荷,路径系数,协方差参数类型:自由参数:参数大小必须通过统计程序加以估计固定参数:模型拟合过程中无须估计(1)为潜在变量设定的测量尺度①将潜在变量下的各观测变量的残差项方差设置为1②将潜在变量下的观测变量的因子负荷固定为1(2)为提高模型识别度人为设定限定参数:多样本间比较(半自由参数)3路径图(1)含义:路径分析的最有用的一个工具,用图形形式表示变量之间的各种线性关系,包括直接的和间接的关系。(2)常用记号:①矩形框表示观测变量②圆或椭圆表示潜在变量③小的圆或椭圆,或无任何框,表示方程或测量的误差单向箭头指向指标或观测变量,表示测量误差单向箭头指向因子或潜在变量,表示内生变量未能被外生潜在变量解释的部分,是方程的误差④单向箭头连接的两个变量表示假定有因果关系,箭头由原因(外生)变量指向结果(内生)变量⑤两个变量之间连线的两端都有箭头,表示它们之间互为因果⑥弧形双箭头表示假定两个变量之间没有结构关系,但有相关关系⑦变量之间没有任何连接线,表示假定它们之间没有直接联系(3)路径系数含义:路径分析模型的回归系数,用来衡量变量之间影响程度或变量的效应大小(标准化系数、非标准化系数)类型:①反映外生变量影响内生变量的路径系数②反映内生变量影响内生变量的路径系数路径系数的下标:第一部分所指向的结果变量第二部分表示原因变量(4)效应分解①直接效应:原因变量(外生或内生变量)对结果变量(内生变量)的直接影响,大小等于原因变量到结果变量的路径系数②间接效应:原因变量通过一个或多个中介变量对结果变量所产生的影响,大小为所有从原因变量出发,通过所有中介变量结束于结果变量的路径系数乘积③总效应:原因变量对结果变量的效应总和总效应=直接效应+间接效应x3矩阵方程式(1)和(2)是测量模型方程,(3)是结构模型方程是外生观测变量向量,为外生潜在变量向量,外生观测变量在外生潜在变量上的因子负荷矩阵,外生观测变量的残差项向量;为内生观测变量向量,为内生潜在变量向量,为内生观测向量在内生潜在变量上的因子负荷矩阵,为内生观测向量的残差项向量;和都是路径系数,表示内生潜在变量之间的关系,表示外生潜在变量对内生潜在变量的影响,为结构方程的误差项xx(1)yy(2)B(3)xyyBB11111xx123xxxx112131xxxx12311111yy123yyyy1234561221000B11测量模型:反映潜在变量和观测变量之间的关系方程式:112131425262000000yyyyyyy22112112结构模型:反映潜在变量之间因果关系方程式:111111121yy结构方程模型的八种矩阵概念符号代表意义结构模型矩阵B内生潜在变量被内生潜在变量解释之回归矩阵(回归系数)内生潜在变量被外生潜在变量解释之回归矩阵(回归系数)测量模型矩阵外生观测变量被外生潜在变量解释之回归矩阵(因素载荷)内生观测变量被内生潜在变量解释之回归矩阵(因素载荷)外生潜在变量之协方差矩阵(因素共变)残差矩阵内生潜在变量被外生潜在变量解释之误差项协方差矩阵(解释残差)外生观测变量被外生观测变量解释之误差项协方差矩阵(X变量残差)内生观测变量被内生潜在变量解释之误差项协方差矩阵(Y变量残差)xy(二)模型识别1模型整体识别性(1)t法则数据资料点数DP=(p+q)*(p+q+1)/2(p+q)表示观测变量个数待估参数数目(自由参数)t=参数总数–固定参数tDP,模型过度识别tDP,模型识别不足t=DP,模型充分识别(2)虚无B矩阵模型中没有任何内生变量去影响其他内生变量,无结构关系假设,没有任何结构参数()的估计,B矩阵为0,模型自动识别。(3)递归法则B矩阵呈现三角形状态(对称矩阵,所有变量间的结构参数均加以估计),而呈现对角线状态(仅估计干扰项的方差,干扰项的相关不列入估计),此时为递归模型且为饱和模型,模型自动识别2测量模型的识别性只有一个潜在变量,至少要有三个测量变量,其因素载荷必须不等于0,测量残差之间没有任何相关假设超过一个以上的潜在变量,每一个潜在变量只要有至少三个测量变量来估计,每一个测量变量只用以估计单一一个潜在变量,残差之间没有共变假设潜在变量只以两个测量变量来估计,残差无相关,每一个测量变量只用以估计单一一个潜在变量且没有任何一个潜在变量的共变或方差为03结构模型的识别性虚无B矩阵法则递归法则每一个方程式至少要有(q-1)个变量不属于非递归模型用以计算标准误的讯息矩阵必须可以被完全估计,并可以求出倒置信息矩阵(三)参数估计1假设条件测量模型误差项,的均值为零结构模型的残差项的均值为零误差项,与因子,之间不相关,误差项与不相关残差项与,,之间不相关2共变推导(1)协方差协方差:利用两个变量间观测值与其均值离差的期望观测两个变量间的关系强弱。(2)运算定理2222(,)()(,)(,)(,)(,)(,)()(,)(,)(,)2(,)()(,)(,)CovXXVarXCovaXbYcZdUacCovXZadCovXUbcCovYZbdCovYUVaraXbYCovaXbYaXbYaCovXXbCovYYbcCovXYVaraXbYaCovXXbCovYY①②③④(3)导出矩阵两个具有相关的潜在变量的CFA图(3)导出矩阵观测变量方程式:1111VFE2222VFE4444VFE121112121211112211121211121112(,)(,)(,)(,)(,)(,)(,)(,)CovVVCovFEFECovFFCovFECovEFCovEECovFFVarFF1411142414141144121414121421(,)(,)(,)(,)(,)(,)(,)CovVVCovFEFECovFFCovFECovEFCovEECovFF11111112114111111112211111()(,)(,)(,)(,)(,)()()VarVCovFEFECovFFCovFECovEFCovEEVarFVarE同一潜在变量的两个观测变量的协方差:不同潜在变量的两个观测变量的协方差:观测变量的方差:121231323414243451525354561626364656()(,)()(,)(,)()(,)(,)(,)()(,)(,)(,)(,)()(,)(,)(,)(,)(,)()VarVCovVVVarVCovVVCovVVVarVCovVVCovVVCovVVVarVCovVVCovVVCovVVCovVVVarVCovVVCovVVCovVVCovVVCovVVVarV211212222132333214212421342144215212521352145552162126213621465666逐一计算六个观测变量的方差与配对协方差,参数的方差与协方差导出矩阵()S矩阵:样本观测值的方差与协方差矩阵(6*6)残差矩阵=S–估计协方差矩阵与观测协方差矩阵的差异极小化(4)参数估计策略加权最小平方策略(WLS)拟合函数:表示估计协方差矩阵与观察协方差矩阵的差异最大概似法(ML)基本假设:观察数据都是从总体中抽取得到的数据,且所抽取的样本必须是所有可能样本中被选择的几率最大者无加权最小平方法(ULS)一般化