SEM的AMOS实现——以CSI为例谨以此文档献给热爱SEM及AMOS的非专业人士!©2007阮敬博士北京经济数据处理与计算机仿真实验室Build20070423DraftV1.01ruanjing@msn.com感谢SPSSChina提供AMOS7.0软件试用SEM的AMOS实现——以CSI为例©2007RUANJingEmail:ruanjing@msn.com1结构方程建模包含内容颇多,貌似复杂得很,如何快速掌握常用的建模方法并用软件准确实现,尽快产生研究成果和经济效益亦曾是本人十分头疼的问题。因此,试图撰写本文档的想法由来已久,无奈限于时间和知识水平不能付诸实践。借《社会经济统计理论、方法与技术》一书编撰之机,本人对于SEM的肤浅认识有幸得以借题发挥,请广大同仁不吝指正。当然,转载请注明出处!SEM的AMOS实现——以CSI为例©2007RUANJingEmail:ruanjing@msn.com2目录§0引子..........................................................................................................................3§1模型的设定..............................................................................................................6§1.1基本概念...............................................................................................................6§1.2模型表示...............................................................................................................6§1.3模型分类.............................................................................................................10§1.4模型识别.............................................................................................................13§2结构方程模型的常用求解方法..............................................................................16§2.1模型参数估计.....................................................................................................16§2.2模型拟合与评价.................................................................................................19§3结构方程建模的AMOS实现................................................................................24SEM的AMOS实现——以CSI为例©2007RUANJingEmail:ruanjing@msn.com3§0引子在实际生活中,人们对于某一个事件或某一个研究对象总有一个大体的印象。如当你在大街上看到一位美女的时候就会觉得眼前一亮,颇有好感。但是这种印象严格说来应该是比较模糊的潜在判断,现实中没有十分准确的数量指标来衡量其程度。但是通常情况下我们可以把这个大体印象通过多个侧面进行考察,如容貌、皮肤、身材、年龄甚至言谈举止等,用不同侧面进行具体观察得到一个综合结论,这些各个不同的方面我们是可以通过具体的观察去得到具体的数值或表现来进行准确衡量(如芳邻几许,高矮胖瘦几何等)的,是我们在现实中接触得到一些比较明显的判断指标,它们对于前面提到的潜在判断是有直接或间接影响的,此外它们自身之间也会发生相互作用。类似的,很多社会科学研究中所涉及的研究对象或变量都不能准确、直接的测量,这种变量可以统称为隐变量(LV,LatentVariable),如顾客满意度、学习动机以及上面的美女好感程度等。但是隐变量并不是主观判断和臆造,对于这些隐变量而言,我们可以用一些能够直接进行观测和测量的具体指标从不同侧面去反映它,从而间接测量出隐变量,这些所谓的具体指标就叫做显变量(MV,ManifestVariable),如身高、年龄、容貌等作为美女好感(隐变量)的显变量,以产品质量、服务质量等作为顾客满意度(隐变量)的显变量等。本文档所介绍的结构方程建模(SEM,StructureEquationModeling)就是妥善处理这些隐变量之间的关系以及隐变量和显变量之间相互影响关系的一种常用社会经济统计分析技术。它是基于变量的协方差矩阵来分析变量之间关系的一种统计方法,也可称之为协方差结构分析。其思想起源于20世纪20年代的SewllWright提出的路径分析概念,有人称其为联立方程模型、因果模型等等。结构方程模型发展过程中较大的一个突破就是发展了隐变量的概念,目前普遍应用于社会学、经济学、心理学、统计学、管理科学等多种学科和社会调查领域。结构方程模型主要讨论的是变量之间的关系,我们根据统计学所学过的知识已经知道,变量之间的关系根据性质可以分为因果关系和相关关系,根据表现形式又可以分为线形关系和非线性关系。本文档主要讨论变量之间的线性关系,既包括线性因果关系,也包括线性相关关系,即线性结构方程模型(LISREL,LInearSEM的AMOS实现——以CSI为例©2007RUANJingEmail:ruanjing@msn.com4StructureRELationship)。与其他多元统计方法相比,结构方程模型具有以下几个显著的特点:第一,隐变量可以通过一个或多个显变量进行测量。在结构方程模型中,不可观测的隐变量往往是通过可以观测的显变量来综合测量的,可以理解为隐变量可以从可测度的若干个方面来考察。隐变量是事先可以根据研究目的确定下来的研究对象的特征,研究人员只要根据相关理论找出这些特征可以从哪些方面进行测度或反映即可,该过程是一个自上而下的研究过程;而我们常见的因子分析中,通过可观测的显变量我们同样也可以提取出变量之间的共同信息作为因子来对研究对象进行分析,但是通过因子分析提取的因子事先是不确定的,其所对应的显变量也不是根据现有相关理论得来的,而是通过数理上的特征根或方差贡献率大小进行判断的,该过程是一个自下而上的过程。第二,根据可观测的显变量可以计算出不可观测的隐变量之间的相互关系。回归分析主要研究的是显变量之间的关系,对于隐变量而言,通常是通过设计若干显变量去间接测量隐变量,进而根据结构方程模型的具体计算方法产出隐变量的所谓观测值,然后再将计算出来的隐变量作为显变量去进行回归分析。第三,结构方程模型允许自变量和因变量含测量误差。对于一些诸如态度、行为、感知等隐变量往往含有误差,也不能简单地用单一指标来测量,在结构方程模型中则允许这些自变量和因变量均含测量误差来进行测度,并可以通过显变量与隐变量之间的测量方程排除这些误差。第四,结构方程模型可以同时估计隐变量与显变量的关系及隐变量之间的关系。隐变量与其对应的显变量之间的关系可以称之为因子结构,主要衡量了各个显变量对它们共同反映的隐变量的影响;隐变量之间的关系也可称之为因子关系,主要考察经过显变量计算出来的隐变量之间的相互关系,这种关系包括相关关系和因果关系。第五,结构方程模型既可以用图形也可以用数学模型进行描述。用来表示结构方程模型的图形称作路径图,标示有变量之间相互影响程度大小的路径图即为路径系数图;此外结构方程模型还可以用方程组来表示。本文档主要从结构方程模型的设定、模型求解方法、模型拟合以及模型修正等方面来介绍结构方程模型的基本方法,通过实际的顾客满意度(CSI)测评案SEM的AMOS实现——以CSI为例©2007RUANJingEmail:ruanjing@msn.com5例,并利用SPSSAMOS(AnalysisofMOmentStructure)软件作为技术实现工具,以达到快速掌握SEM相关原理和熟悉AMOS软件的目的。SEM的AMOS实现——以CSI为例©2007RUANJingEmail:ruanjing@msn.com6§1模型的设定§1.1基本概念本文档所要考察的线性结构方程模型是一般化线性模型(GLM,GeneralLinearModel)的一个拓展,既可以进行传统的线性模型分析,也可以进行验证性因子分析和时间序列分析。在进行结构方程模型的设定之前,我们必须首先明确它的一些基本概念。显变量:人们可以直接进行观测的变量,如年龄、身高、价格、收入等;隐变量:不可直接进行观测但可以被显变量反映的变量,如顾客感满意度、社会地位、学术成就等。隐变量不但受到其对应的显变量的影响,不同隐变量之间也会发生相互影响,这些隐变量之间的影响又可以分为因果关系和相关关系;内生变量:受系统的影响且具有测量误差的变量,既包括隐变量也包括显变量,如在经济发展过程中,人们收入的变动往往受到经济增长和收入分配政策的影响,则收入变动即为内生变量;外生变量:影响系统且不具有测量误差的变量,既包括隐变量也包括显变量,如上述的经济发展三变量模型中,收入分配政策变量可记为外生变量。§1.2模型表示结构方程模型中隐变量之间的影响关系、隐变量与显变量之间的对应关系通常可用路径图来表示。各种常用的路径图的图标及含义如下:表1.1结构方程模型常用的图标及其含义标识含义矩形,表示显变量椭圆或圆,表示隐变量单项箭头,表示单项影响或因果关系双向箭头,表示相关关系或协方差SEM的AMOS实现——以CSI为例©2007RUANJingEmail:ruanjing@msn.com7AMOS软件中可以很方便的按照表1.1的图例绘制出结构方程模型,并且可以快速的设定隐变量之间的影响关系以及隐变量与显变量之间的对应关系,这些模型的绘制和设定影响关系我们只需要点击软件左边的工具栏对应的图标,然后在右边的空白处直接绘图即可(详见§3)。【例1.1】中学生的考试成绩大体上可以分为文科成绩和理科成绩,这两个成绩均是隐变量,因为它们不能通过直接的观测得到。但是文科成绩可以用诸如语文、英文、历史等课程的成绩来衡量,理科成绩可用数学、物理、化学等课程的成绩来衡量,则这些具体的科目是可以直接进行观测并得到数值的显变量。现在要考察学生文科成绩和理科成绩之间的相互影响,我们可以用结构方程模型的路径图把上述变量之间的关系描述出来,如图1.1:图1.1学生成绩的结构方程路径图在图1.1中,文科和理科用椭圆表示,为隐变量;文科和理科成绩之间的相关关系用双向箭头表示;从隐变量指向显变量的单向箭头表示隐变量与显变量的反映(Reflective)关系,如文科隐变量可以用语文、英语、历史三门课程的成绩来测量;从误差指向变量的单向箭头表示该变量的误差或残差。因为误差或残差本身也是无法进行观测的特殊隐变量,所以也用圆来表示。在AMOS绘制的路径图中有些路径或箭头标记着数字“1”,这意味着该路径系数(即影响系数)的数值固定为1。对于结构方程模型而言,有两种情况要将该元素固定:第一种情况是希望某两个变量(显变量或隐变量)之间没有关系,则将代表该关系的元素固定为0;第二种情况则是需要设定隐变量的度量单位。因为显变量所反映的隐变量本身是没有