1引言袁振国在译完威廉·维尔斯曼的教育研究方法导论》后在其前言中评论道“总觉得教育研究方法过于传统,研究的手段也比较落后。而在世纪年代中期由瑞典统计学家—心理测量学家提出的结构方程模型(简称SEM)则提供了一种新的统计方法和研究思路。它能有力地解决教育研究中的问题,应当引起教育界的重视,理应成为教育研究的有力工具。注:袁振国,教育部社会科学司副司长,北京师范大学教育学院教授、博士生导师。23结构方程模型(SEM)入门云南大学高等教育研究院解亚宁SEM4导言-1心理学或教育学研究的一个主要目的是通过分析变量与变量之间的关系来揭示心理或教育现象的发展以及变化规律与特点,如相关分析。X2X1r相关分析(CorrelationalAnalysis)5导言-2在相关分析基础上,进一步把变量分为自变量与因变量两部分,并以自变量来解释因变量。该模型假设自变量是原因,因变量是由这些原因引起的结果,如回归分析模型。yx1β1eexy+=1b简单线性回归模型(SimpleLinearRegression)6导言-3进一步的多元线性回归,包含多个自变量与一个因变量。(MultipleLinearRegression)yx1ex2exxy++=2211bbβ1β27x1y1y2e1e2x2路径分析(PathAnalysis)在回归分析基础上,还发展了路径分析,进一步把变量之间复杂关系,例如因果交错关系。8问题提出但是,现实中变量之间的关系要复杂得多,各自变量之间可能存在因果关系,因变量也可能是某个或某几个自变量的原因,有时需要处理多个原因和多个结果的关系。特别是会遇到不可直接观测的变量,这种变量称为潜在变量(LatentVariables),诸如社会经济地位、智力等都不能准确、直接地加以测量。社会经济地位智力潜在变量9问题提出对于潜变量,可用一些外显指标(Observableindicators)来间接测量它们。如用收入高低、教育水平作为社会经济地位()的测量指标。SEM主要特点在于能反映潜在变量(Latentvariables)与外显变量(Manifestvariable)之关系。收入高低教育水平社会经济地位外显指标潜在变量10方法的进步与革命常常导致相应学科的进步与革命。就统计方法而盲,回归分析是相关分析的深人,而结构方程模型(SEM)则是对回归分析的深入。11一、结构方程模型的概念结构方程模型(structuralequationmodeling,简称SEM),早期称为线性结构关系(LinearStructuralRelationships,简称LISREL),是评价理论模型与经验数据一致性的统计方法。潜在变量也称为隐变量。外显变量也称观测变量(Observablevariable)或测量变量(Measurementvariable)。SEM主要特点在于能反映潜在变量(Latentvariables)与外显变量(Manifestvariable)之关系。12导例1314x1x3x2δ1δ2δ3ξλ1λ2λ3误差观测变量负荷量潜在变量典型的结构方程模型与参数示意图结构方程模型是用来检验观测变量与潜在变量之间假设关系及测量误差的一种统计技术,或者说是模型构建与检验的方法。结构方程模型是通过观测变量集合的间的协方差结构和相关结构出发,从定量的角度建立模型来研究变量间的因果关系的一种方法。15例2误差观测变量负荷量潜在变量16专栏:结构方程模型的构图与模式17SEM的模式测量模式(measurementmodel)测量模式旨在建立测量变量与潜在变量间之关系,主要透过验证性因素分析(CFA)以考验测量模式的效度结构模式。y1y3y2e1e2e3f1y4y6y5e4e5e6f2验证性因素分析(ConfirmatoryFactorAnalysis,CFA)18y1y3y2e1e2e3f1y4y6y5e4e5e6f2fr1r2二阶验证性因素分析(2ndorderConfirmatoryFactorAnalysis)19SEM的模式结构模式(structuralmodel)结构模式旨在考验潜在变项间之因果路径关系,主要针对潜在变量进行径路分析,以考验结构模式的适配性。潛在变量路徑分析(PathAnalysiswithLatentVariables,PA-LV)2021例3:研究生研究论文222324252627模型假设28293031二、结构方程模型分析步骤示意图首先针对研究问题,根据已有的研究资料提出多个假设模型,然后收集数据、进行分析,通过模型与实际数据的拟合情况和模型比较的结果,确定最终的结果模型。•根据LISREL的分析程序,SEM大体分为建立模型、识别模型、估计模型,评估模型和修正模型五个步骤。32模型界定模型的界定必须来自健全理论的建构。模型界定的步骤有三。首先由研究者整理文献与相关理论,提出建立模型的双向结构表,然后由专家对结果进行论证,最后根据确定的结构设计可能的项目。33三种模型策略SEM的基本假设是观测变量的共变数矩阵是一组参数的函数,而检验一个共变数矩阵有三种模型策略。34验证模型策略即根据搜集的经验资料严格检验研究者界定的理论模型,以确定所检验理论模型是接受还是拒绝,所谓严格检验是指当模型被拒绝时,不再寻找接受模型的可能线索。35竞争模型策略即研究者事先界定多个可替代的理论模型,再搜集一组经验资料以检验哪一个理论模型与经验资料最匹配。譬如对智力既可用Spearman的二因素理论解释,也可用Thurstone的群因素理论解释,还可以用卡特尔的简明层次论解释等,对于哪一种解释方式最好,以往的统计技术难以处理,SEM却可以有效地处理这类问题,采用竞争模型更符合实际情况。36模型的发展策略即研究者先利用理论界定出一个起始模型,再搜集一组资料检验其匹配程度。如果不是相当匹配,可运用SEM统计中的某种指数了解需要修正的地方,如果需修正处有着健全的理论可解释则将其修正,这是一般研究者常用的策略。37模型识别模型的识别分为低识别、恰好识别和过度识别三种。对SEM理论不十分清楚的研究者,往往会忽略模型识别的问题,只是将其交给统计软件处理,即不知其中存在诸多复杂的问题,对此应当阅读有关书藉,详细了解模型识别的问题。38模型的估计用观测资料估计模型的参数方法有很多,最常用的有三种,即最大概似法、广义最小平方法和渐近分布自由法。39拟合概念当我们测试某一模型时,其实是在研究自己所提的模型(即哪些变量之间有关,哪些则没有)是否与数据拟合。40三、分析过程与结果示例例題:學生智力測驗成績之前分析建立在兩因子模型下,且能提供良好適合度,本例題測試在單因子模型下是否能提供更加適合度?樣本數:145個學生指標變數:文章閱讀,造句能力,字彙能力,加法能力,計數能力潛伏變數:語言,數學41路徑圖:學生智力測驗成績(P.192)語言文章閱讀χ2、GFI、AGFI、數學造句能力字彙能力加法能力計數能力=1採用Singledimensionδ1δ2δ3δ4δ542TitleConfirmatoryFactorAnalysisforstudenttestperformanceObservedVariables文章閱讀造句能力字彙能力加法能力計數能力CorrelationMatrix=10.72210.7140.68510.2030.2460.17010.0950.1810.1130.5851SampleSize=145LatentVariables語言數學Relationships:文章閱讀=語言造句能力=語言字彙能力=語言加法能力=數學計數能力=數學SETtheCovarianceof語言and數學to1PathDiagramLISRELOUTPUTSETVRSMI相關矩陣指標變數潛伏變數定義指標變數與潛伏變數之關係軟體操作:學生智力測驗成績(P.192)定義潛伏變數之間的關係相關係數為1,不具區別效度輸出指令SE:標準誤TV:t檢定RS:常態化殘差與Q圖MI:修飾指標43軟體操作:學生智力測驗成績(P.192)44軟體操作:學生智力測驗成績(P.192)參數最大概似估計、標準誤、t值:語言:相關性較大、標準誤0.07、t值顯著2數學:相關性小、標準誤0.09、t值2不顯著兩潛伏變數之間的相關係數為1殘差變異數估計、標準誤、t值45軟體操作:學生智力測驗成績(P.192)卡方值χ2=59.47GFI=0.880.90AGFI=0.630.80RMR=0.140.05(皆低於可接受水準)模型配適度不佳46學生智力測驗成績-綜合比較二因子模型單因子模型卡方值2.9359.47GFI0.990.88AGFI0.970.63單因子模型下:GFIAGFI皆低於可接受水準,故潛伏變數兼具區別性,應採二因子模型較合適。47四、模型拟合度指标(一)基本拟合标准:①不能有负的误差变异;②误差变异需有统计意义;③估计参数之间相关的绝对值不能太接近1;④因素负荷量不能太低或太高,最好介于0.50~0.95之间;⑤标准误不能太大。48指標名稱與性質範圍判斷值適用情形卡方檢驗2test理論模型與觀察模型的契合程度-P.05說明模型解釋力2/df(Wheatonetal.)考慮模式複雜度後的卡方值-2不受模式複雜度影響適合度指標GFI(Bentler,1983)假設模型可以解釋觀察資料的比例0-1.90說明模型解釋力AGFI(Bentler,1983)考慮模式複雜度後的GFI0-1*.90不受模式複雜度影響PGFI(Mulaik,1989)考慮模式的簡約性0-1.50說明模型的簡單程度NFI(Bentler&Bonett,1980)比較假設模型與獨立模型的卡方差異0-1.90說明模型較虛無模型的改善程度NNFI(Bentler&Bonett,1980)考慮模式複雜度後的NFI0-1*.90不受模式複雜度影響(二)整体模型拟合度指标数值范围及临界值49(二)整体模型拟合度指标数值范围及临界值5051五、结构方程模型的用途(一)李茂能(2007)1、考验理论模式(testoftheory)2、考验测量工具的建构信度(constructreliability)或因素结构效度(validityoffactorialstructure)信度:观测变量与潜在变量之间相关程度(0.7)效度:可分为下列两种收敛效度(convergentvalidity):对相同特性(construct,concept,orresearchvariables)使用不同衡量方法(Likertscale,Stapelscale,orsemanticdifferential),所得结果高度相关。区别效度(discriminantvalidity):不同建构(construct,即研究变数或称concept)彼此之间确实不相同。52五、结构方程模型的用途(二)侯杰泰(1999)a、验证性因素分析b、高阶因子分析c、路径及因果分析d、多时段(multiwave)设计e、单形模型(SimplezsModel)f、多组比较53五、结构方程模型的用途(三)范晓玲(2007)SEM在心理学研究的应用,主要有两方面。1、测验编制理论结构建立。因素分析虽然也应用于测验编制之中,但却只能用初步探讨结构而无法检验其理论建构。SEM却不同,其功用颇丰。1-1项目分析,即估计每个项目,把项目分析的概念融合于因素结构的检验中;检验每个项目的测量误差,把测量误差从项目变异中抽取出来,使因素负荷量具有较高的精确度,并根据理论,预先确定项目所属的因素。1-2根据理论,检验某些因素之间相关或不相关,确定各因素之间的关系;1-3对整体因素模型进行评估,确定以理论建构的因素模型与搜集资料之间的符合程度。因此,结构方程模型属于检验理论模型的统计方法,为研究者用于量化与理论检验提供一种综合模型。2、是研究各种复杂心理现象之间的关系。譬如,心理学中,研