第十一章路径分析内容:1.路径分析概述2.路径系数与残值路径系数的计算3.因果效应的分解4.路径分析的检验第一节、路径分析概述1.回归分析与路径分析x4x1x2x3x4x1x2x3图11.1直接因果关系与递归的因果关系线性回归:各个自变量所处的地位是一样的,它们对因变量的作用都是直接的,自变量之间不存在相互作用,反映的是多因一果的直接关系。路径分析:在现实中,一个变量既可能是自变量而影响另一个变量,有可能是因变量受到其他变量的影响,变量之间不仅有直接的关系,也有间接的关系,形成递归关系在线性回归中,因果关系的设定取决于研究者对问题的理解和理论的分析,统计分析只是揭示变量之间的数量联系,比如:探讨收入与消费。在路径分析中递归因果模型也不是由统计方法决定,而是根据研究者理论分析出来的。路径分析就是要验证假设的合理性。形象的说,路径分析的任务就是在变量之间的连线上“填上数据”,用数据说明变量之间的影响程度在路径分析中,存在多个因变量,因此存在多个回归方程,构成一组回归方程,称为路径方程.例如图11.1的右图可以表示为路径方程:x2=b20+b21x1+b2ee2x3=b30+b32x2+b3ee3x4=b40+b41x1+b42x2+b43x3+b4ee4所以:路径分析是回归分析的延伸,无非是将一个回归方程变成多个回归方程,也可认为路径分析是几个回归分析的组合。但是回归分析的原理和解释方式、有关统计量的含义等仍旧不变。2.路径分析模型和假设条件1)路径分析模型单向路径分析模型:各个变量之间的因果关系都是单一的不可逆的非单向路径分析模型:变量之间存在互为因果的直接或间接的关系。单向路径分析模型一般采用路径图和结构方程组两种形式表示:可以配合以下方程组:X3=a3+b31x1+b32x2+b3e3e3X4=a4+b41x1+b42x2+b43x3+b4e4e4e4x1x2x3x4e3r12p31p41p32p42p43pe3pe4图11.2单向路径分析模型图在路径分析中,为了分析的简明,一般采用变量的标准形式zi,即:z3=p31z1+p32z2+p3e3e3z4=p41z1+p42z2+p43z3+p4e4e4说明:a:双箭头弧线指两个变量相关,但不存在因果关系b:pij为路径系数,表明变量之间的因果关系程度的强弱。C:路径系数下标中前一个数字表示结果标量,后一个数字表示原因变量;单向的箭头表示变量之间的因果方向;d:外生变量、内生变量和先决变量2)路径分析模型假设条件变量之间的关系是线性的、可加的每个变量都是定距变量内生变量的先决变量与该内生变量的残值项之间是独立,各个残值项之间也是独立的满足以上的条件,实际上也就是满足线性回归条件,因此可以通过对每个内生变量进行线性回归分析的方法计算路径系数第二节路径系数与残值路径系数的计算路径分析模型是研究者根据一定的理论提出的一组假设。路径分析的目的就是确定变量之间的因果关系是否存在。因果关系的存在通过路径系数反映出来,假设某一路径系数很小,说明该路径反映的因果关系可能不存在,因此计算路径系数和残值路径系数是路径分析的主要内容,确定了路径系数和残值路径系数也就确定力路径方程。1)路径系数的计算路径系数与相关系数、回归系数和标准回归系数关系。(其实路径系数就是标准回归系数))epzpzp(zn1zzn1r3e323213113113312323131e321321131rppezn1pzzn1pzzn1p3同样可以计算:12313223rppr可以解出:2121312233221213121331r1rrrpr1rrrp2)残值项路径系数的计算残值路径系数表述的是所有自变量都不能解释的因变量的变异部分。定义残值路径系数为:2iieR1p一个理想的路径模型,残值路径系数应当很小,如果其很大,可能意味这路径方程中遗漏了某个重要的变量需要重新评价因果路径例题1:对7-18青少年儿童用一份试卷进行测试,总共调查三个变量:成绩、身高和年龄,研究三者之间的关系年龄z1身高z2成绩z3p21p31p32e2e3pe2pe3Z2=p21z1+pe2e2Z3=p31z1+p32z2+pe3e3由于路径方程就是回归方程,路径系数可以直接从线性回归中得到路径系数和残值路径系数:年龄z1身高z2成绩z3P21=0.900P31=0.931p32=0.057e2e3Pe2=0.436Pe3=0.184Z2=0.900z1+0.436e2Z3=0.931z1+0.057z2+0.184e3第三节因果效应的分解一、直接效应与间接效应的分解是当其他变量不变时,变量xj对变量xi作用。在路径图中表现为两个变量之间的直接因果作用途径,除此之外,xj还会以间接的方式影响xi,即通过若干个中间变量间接的作用于变量xj。例如ijpZ2=p21z1+pe2e2Z3=p31z1+p32z2+pe3e3Z3=(p31+p32p21)z1直接效应间接效应二、相关系数的分解在路径模型中,还可以以相关系数的形式对变量质检单相互作用进行分解相关系数的分解比起直接效应和间接效应的分解更深一步,并且包含了直接效应和间接效应的分解。下面以例题1来进行分解。模型中有三个变量,利用路径方程对相关系数进行分解。1.对r12分解:将Z2=p21z1+pe2e2代入r12表达式,21112e212112e12112112pezpzzn1pepzpzn1zzn1r若某一项只有一个路径系数,则该项就是直接作用项。2.将r13分解r13=p31+p32r12r13=p31+p32p21直接作用项间接作用项在若干个路径系数的乘积中,如果每个路径系数与其相邻路径系数的下标中都有一个重叠的数字,并且全部下标从右到左能够排成一个由小到大的连续顺序,该项为间接作用项3.将r23分解r23=p31p21+p32在若干个路径系数的乘积中,凡是其全部下标从右向左不能排成一个由小到大的连续顺序的,则称该项为虚假相关。4.如果将模型的假设条件略微改变一下,这分析的结果也会有说不同r23=p31r21+p32例题2.计算相关系数r=0.7380.708年龄z1工龄z2工作业绩z4工作态度z3目前工资z5e4e5e30.0360.3410.028-0.0691.3310.2590.7530.365-0.6910.9250.095第四节路径分析的检验整体检验(理论不成熟)路径系数的检验