通径分析(PathAnalysis)--简介

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章通径分析(PathAnalysis)第一节因果模型与通径分析第二节通径模型的设置第三节通径模型的分类第四节分解简单回归系数第五节分解简单相关系数第六节通径模型的整体检验第七节研究实例参见郭志刚主编,《社会统计分析方法—SPSS软件应用》第五章中国人民大学出版社1999因果关系模型明确设置自变量和因变量,通过模型分析,检查自变量对因变量的作用方向、作用强度和解释能力。简单回归系数是一个自变量对因变量作用的“毛”测量(grossmeasure)多元分析的偏回归系数则是自变量作用的一种“净”测量(netmeasure)通径分析的主要功能之一是将毛作用分解为直接作用(相当于上述的净作用)和各种形式的间接作用,使我们对整个模型系统中变量的因果关系有更为具体的深入理解第一节因果模型与通径分析图1多元回归模型因果关系示意图yx1x2by2.1by1.2图2通径模型的因果结构示意图z1p31p21z2z3p32与回归分析的异同各个自变量被假设处于相同的地位,多元回归分析得到的回归系数(或标准化的回归系数)表示在控制其他自变量的条件下每个自变量对于因变量单独的净作用但是,往往变量之间的因果作用是更复杂的传递过程,一个变量对于某些变量可能是原因变量,而对于另外一些变量则可能是结果变量•通径分析的目的:分解回归系数(或相关系数)•通径分析可视为多环节的一组回归分析。•通径模型代表理论假设。通径分析的特点通径分析的有关概念:1、通径(path)、通径系数(如P32)2、相关关系(略)3、外生变量(exogenousvariable)4、内生变量(endogenousvariable)5、误差(error)(略)6、最终结果变量(ultimateresponsevariable)通径模型的结构方程组23213131212zzzzzpppˆˆ通径模型既可以用结构方程组的形式来表示,也可以用通径图来表示为了表达和分析上的简明,一般在通径分析中采用标准化的变量,并按照因果序列给出相应的下标第二节通径模型的设置z2=p21z1z3=p31z1+p32z2z2z1p32p31p21z3{在通径图中以通径(即图中那些带有箭头的直线)表达因果关系。对于因果关系的强度,是用通径系数来表达的,如p21为了区别不同通径系数,一般用该通径箭头所指的结果变量的下标作为通径系数的第一下标,而用该通径的原因变量下标作为通径系数的第二下标。1、一类是外生变量,即由模型中没有注明它的变化是由什么因素造成的2、另一类是内生变量,即由模型中另外一些变量所影响的那些变量此外,我们可以将通径模型内不影响其他变量的内生变量称为最终结果变量z2z3z3z1第三节通径模型的分类递归模型:因果关系结构中全部为单向链条关系、无反馈作用的模型通径模型—递归与非递归非递归结构类型示意z1z2z1z3z2p22z1z3z2a.两个变量直接反馈b.某些变自反馈c.某些变量间接循环通径模型—递归与非递归递归通径分析假定条件和基本性质递归通径模型分析的假定条件通径模型中各变量之间的关系为线性、可加的因果关系内生变量的误差项不得与其前置变量(或其他内生变量误差项)相关模型中因果关系必须为单向,不得包括各种形式的反馈作用模型中各变量均为间距测度等级各变量的测量不存在误差重要第四节分解简单回归系数1、计算一个自变量对最终反映变量的直接影响、间接影响、总影响。2、在间接影响中还可以分解出以不同通径传递的间接影响。3、在控制某些变量的条件下,完成上面两项工作。4、统计检验:包括对各通径的检验,以及对过度识别模型(over-identifiedmodel)的整体检验。主要功能1、计算一个变量对最终反应变量的各种影响如,结构方程组(1)代入(2)后:式(2’)为式(2)的简化形模型。括号内各项代数和=z3和z1的简单回归系数(2)zpzpz(1)zpz23213131212ˆˆ)(zpppzppzpz1213231121321313'2ˆz1p31p21z2z3p32最终反应变量完全以某一个外生变量的函数的形式来加以描述包括直接影响和间接影响总效应=直接效应+间接效应(简单回归系数)(直接计算的偏回归系数)(通径系数的乘积)例题•当我们考察个人年收入与年龄的关系•1、可以直接计算相关系数r=0.003•2、我们认为年龄不仅直接影响收入,还跟教育有关,而教育也影响收入,于是我们考虑有变量关系:年龄p31p21上学收入p32结构方程:上学=p21年龄收入=p31年龄+p32上学年龄P310.053P21-0.295上学收入P320.196对结构方程求解(spss)上学=-0.295年龄收入=0.053年龄+0.196上学根据标准化回归系数分解,收入与年龄的实际关系为:0.003=0.053+(-0.295*×0.196)=0.053-0.057注意:1、直接效应为正,间接效应为负。相互抵消,总效应值很小——虚假无关2、标准化回归系数不考虑符号3、存在计算误差)(zpppzppzpz1213231121321313'2ˆ2、以不同通径传递的间接影响(3)zpzpzpz(2)zpzpz(1)zpz343242141423213131212ˆˆˆ)(zpppzppzpz1213231121321313'2ˆz4z1p41p21z2p42z3p32p31p43(1)代入(2):(1)(2’)代入(3):)(zppppppppzppppzppzpz12132433143214241121323143121421414'3ˆ直接效应间接效应从一个简单回归模型到一个有较多中间变量的通径分析模型,外生变量对最终结果变量的总影响不变•其实质做法与前面并无差别,只不过模型更复杂而已!3、在控制某些变量的条件下的总影响的分解工作(3)zpzpzpz(2)zpzpz(1)zpz343242141423213131212ˆˆˆ(2)代入(3):不经过z2的效应经过z2的效应通径分析中的控制,指控制变量处被阻断以后,原因变量还能发挥哪些作用z4z1p41p21z2p42z3p32p31p43)(3'zpppzpppzpzppzpzpz23243421314341232131432421414)()()(ˆ式(3’)在通径分析中称为偏简化式(partialreducedform)。分解的目的:将z2的作用集中表达,这就是控制,看看抽离了z2影响后,z1的影响构成情况4、标准化与非标准化的通径系数)(xpppapxppapxpxpapxpx1213231232121322321311212321313'2aaaˆ333(1)代入(2):(2)xpxpx(1)xpx2321313121232aˆaˆ非标化回归x3p32x1p31p21x2(2)old309.0income235.0874.7DRC(1)ncomei907.0391.2ldoCoefficientsa8.614.045(Constant)INCOMEBDependentVariable:CDRa.income045.0613.8income280.0235.0739.0874.7income907.0309.0235.0391.2309.0874.7RDˆC两种方式的优缺点优点:1、通径方程简单;2、有可比性。但是,标准化系数有特定样本(samplespecific)的性质,不能用于不同情况或不同总体之间的比较。因为,标准化系数所反映的不仅是自变量对因变量的影响强度,而且还反映了模型中各变量的方差以及它们之间的协方差,以及寓于误差项之内的未包括在模型中的那些变量的方差。标准化系数非标准化的系数优点:1、实际意义明确的测量单位;2、系数值在不同情况保持相对稳定,可用于不同总体中比较。但是,各变量的非标准化系数之间不能相互比较。另外,采用非标准化系数时,通径分析分解工作量将变得比较大。两个外生变量的简化形和原模型z4p*42=-0.1p*41=0.7(1)简化模型z1z2p32=-0.6p31=0.8p42=0.2p43=0.5p41=0.3(2)原模型z4z1z2z35、用列表法报告各种影响作用分解作用分解表变量作用类型模型(2)符号系数值x1直接作用p410.3间接作用p43p310.4总作用p*410.7x2直接作用p420.2间接作用p43p32-0.3总作用p*42-0.1x3直接作用p430.5p32=-0.6p31=0.8p42=0.2p43=0.5p41=0.3z4z1z2z3例人均GDPTFR-0.718总和生育率人均国内生产总值e3z1p32p31p21z3z2e2z4e4p42p43p41人均GDP初中及以上比例节育率总和生育率通径图z1z3z2e2z4e4-0.0350.248-0.3010.772-0.431-0.3760.5290.6360.975直接影响间接影响总影响-0.416=0.772*(-0.431)+0.248*(-0.376)+0.772*(-0.035)*(-0.376)Z2-0.4310.013=(-0.035)*(-0.376)-0.418Z3-0.376-0.376Z1-0.301-0.717各因素的影响第五节分解简单相关系数的通径分析在分解相关系数时,不仅要考虑内生变量的误差项,而且还要考虑外生变量的误差项两个标准化的变量之间的相关系数等于其未标准化之前的原变量之间的相关系数,同时也等于标准化的回归系数一、相关系数r的计算原理•定距变量之间的相关是从两个变量共变的角度来界定的•••是两个变量以平均数为基准的平均共变程度指标,称为协方差,也称一致性度量nyyxx))((•但是,因为x、y都是具有一定测量单位的绝对量值,所以,协方差也是一个绝对量值,无法直接表示x、y之间的相关•为此,人们用协方差除以各自的标准差Sx和Sy,得到没有实际单位的相对量值r,称为相关系数zzssssryxyxyxxynyyxxnnyyxx1)()(1))((•也即:相关系数就是两个变量z分数之积的平均数z3z2z1z3z1z2e1e2e1e2e2e3e3p31p31p32p32z1z2z3e1e3p31p32p21模型1模型2模型3二、模型分解z1z2z3e1e3p31p32p21ezpzpzezpzez321313231212211e2①②③未列入模型的各个变量的影响模型1021rennnnezzzpezpzzzr211121212112112)(11rrrjiijii1根据相关系数的特性:pr2112并由路径分析的假设条件:内生变量与外生变量的残差项无关,因此有最终,两变量的相关系数可以表达为:将②代入,则有:•此过程说明了为什么在通径分析中可以将标准化系数直接用作通径系数•因为对于两个标准化的变量来说,其回归系数、标准化回归系数和相关系数完全相等ppprppezzzpzzpezpzpzzzrnnnnn2132311232312121321131323213113113)(11Z1对Z3的直接作用Z1通过中介变量Z2对Z3的间接作用将③代入,则有:pppprpezzzpzzpezpzpzzzrnnnnn3221313212313222321231323213123223)(11虚假相关将③代入,则有:Z2对Z3的直接作用为什么会产生虚假相关?•看模型z1z2z3e1e3p31p32p21e2变量2和3有共同的前置变量(共同影响因素)模型1模型2分解ezpzpzezez321313232211①②③•因为Z1、Z2为独立

1 / 62
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功