通径分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

通径分析在科学研究中常常要研究相关变量间的线性关系。研究二个相关变量间的线性关系时可采用直线回归分析与相关分析。在研究多个相关变量间的线性关系时:如研究y(单株产量)与x1(每株穗数)、x2(每穗粒数)、x3(粒重)的关系,可采用多元线性回归分析与偏相关分析。还可以采用本章新介绍的通径分析。通径分析具有精确、直观的优点,在分析相关变量关系中,有着十分重要的应用。一、通径系数的定义(一)通径、相关线与通径图设有三个相关变量:y,x1,x2,其中y—后果(依变量);x1、x2—原因(自变量)。若x1、x2相互独立(r12=0),可图示为x1父本y例如子代父、母无亲缘关系x2母本若x1、x2彼此相关(r12≠0),可图示为x1体长yx3例如黄牛体重饲料x2胸围用x1x2代替x1x2x3,改画为x1yx2通径——箭形图中的单箭头“”,表示变量间呈因果关系,方向由原因到结果。相关线——箭形图中的双箭头“”,表示变量间呈平行关系。一条相关线相当于两条尾端相联的通径。通径图——表示相关变量间呈因果关系或平行关系的箭形图。(二)通径系数与决定系数通过作通径图,形象直观地表达了相关变量间的关系,但这是定性地表达。仅定性表达还不够,还须进一步用数量表示因果关系中原因对结果影响的相对重要程度与性质,平行关系中变量间相关的相对重要程度与性质。换句话说还须用数量表示“通径”与“相关线”的相对重要程度和性质,也就是将“通径”、“相关线”、“通径图”数量化。表示“通径”相对重要程度和性质的数量叫通径系数。表示“相关线”相对重要程度和性质的数量叫相关系数。生物统计学已给出了计算相关系数的方法,即:若二相关变量x1、x2有n组观测值,则x1与x2的相关系数r12的计算公式为:下面给出通径系数的确切定义与数学表达式。设y与x1、x2间存在线性关系x1回归方程:=b0+b1x1+b2x2y或y=b0+b1x1+b2x2+e(2-1)x2e(图9-1)其中。表示这三个相关变量间关系的通径图见图(9-1)2222112211)()(/))((/212121xxxxxxxxSSSSSPrxxxxxxyˆ0,0,ˆeeyye且由于b1、b2带有单位,不便于由b1、b2比较x1、x2对y影响的重要程度。现将y,x1,x2,e用标准差标准化,变为不带单位的相对数,再研究标准化变量的线性关系。由(9-1)得(9-2)(2-1)式-(2-2)式(9-3)(9-3)÷σ0①:记yˊ、x1ˊ、x2ˊ、eˊ为y、x1、x2、x3、e的标准化得或22110xbxbby)()(222111exxbxxbyy02220221110110exxbxxbyyeeexxxxxxyyy,,,222211110exbxbye02022101120221011ˆxbxby022011bb0e是变量标准化的偏回归系数,分别称为x1、x2、e到y的通径系数。分别表示x1、x2对y影响的相对重要程度和性质;表示误差e对y影响的相对重要程度和性质,定义的推广:若=b0+b1x1+b2x2+b3x3或y=b0+b1x1+b2x2+b3x3+erij≠0,通径图如(图2-2)所示则x1x2yx3e(图9-2)202.020333.020222.020111.00.00333.00222.00111.0,)()(,)(,,,eeeedbdbdbdPbPbPbP小结:1.通径系数是表示相关变量间因果关系的一个统计量;2.通径系数是标准化变量的偏回归系数,是没有单位的偏回归系数;3.在一定条件下,通径系数是自变量与依变量之间的相关系数;4.就通径系数所表示的因果关系来说,具有回归系数的性质;就通径系数是不带有单位的相对数来说,又具有相关系数的性质。所以可以说通径系数是兼有回归系数与相关系数性质的一个统计量。三、通径系数的性质定理1若=b0+b1x1+b2x2x1或y=b0+b1x1+b2x2+eyx2且r12≠0,通径图如图(9-3)所示。e则(一)r10=P0.1+r12P0.2(图9-3)r20=P0.2+r21P0.1(二)d0.1+d0.2+d0.e+2P0.1r12P0.2=1yˆ证明(一):(9-4),求和,再除以(n-1):∵x1与e无关,Cov(x1,e)=0∴r10=P0.1+r12P0.2证毕。111)49(xx211111122110.10.20.2011121()()()()()()(1)(1)(1)(1)iiiiiieexxyyxxxxxxxxePPPnnnn11210.10.20.011212cov(,)cov(,)cov(,)(1)(1)(1)exyxxxePPPnnneeePxxPxxPyy.02222.01111.00~~220()(),11iijjiijyyxxnn同样可证r20=P0.2+r21P0.1通径分析:对于r10=P0.1+r12P0.2直接通径:x1yP0.1——直接作用间接通径:x1x2yr12P0.2——间接作用通径链指间接通径(包括直接通径)。并定义通径链系数为组成该通径链的全部通径与相关线系数的乘积。表明:x1与y的相关系数r10等于x1与y间的直接通径系数P0.1与间接通径系数r12P0.2之和,即x1与y的相关系数r10被剖分为x1对y的直接作用与x1通过x2对y的间接作用的代数和。对r20=P0.2+r21P0.1可作同样分析。将(一)改写为:此为通径系数P0.1、P0.2正规方程组,其矩阵形式为:20100.20.12112PP11rrrr202.01.021102.0121.0rPPrrPrP证明(二)(9-5)(9-5)式平方、求和再除以(n-1):∵x1、x2与e独立无关;Cov(x1,e)=0,Cov(x2,e)=0得σ02=b12σ12+b22σ22+σe2+2b1b2Cov(x1,x2)(9-6)即d0.1+d0.2+d0.e+2P0.1r12P0.2=1证毕。222222112211221212112212()()()()()211111()()2211iiiiiiiyyxxxxxxxxebbbbnnnnnxxexxebbnn0222121011202e20222220212120),(2bb1:)69(bxxCovb111222()()iiiyybxxbxxe2P0.1r12P0.2可当成是相关原因x1、x2共同对结果y的相对决定程度,叫做相关原因x1、x2共同对结果y的决定系数,记为d0.12,于是得d0.1+d0.2+d0.12+d0.e=1d0.e=1-(d0.1+d0.2+d0.12)eedP.0.0又(标准化变量的回归平方和)RSS)()()()()21()21(2R202.0101.01.0122.02.02.0121.01.02.0121.022.02.0121.021.012.02.012.01.012.02.01.0rPrPPrPPPrPPPrPPPrPPddddddd所以把P0.1r10,P0.2r20分别称为x1、x2对回归可靠程度R2的总贡献。(SSr——标准化变量的离回归平方和,以后证明:SSy=1)rReSSSSdddd1)(112.02.01.0.0推广:若y=b0+b1x1+b2x2+…+bmxm或y=b0+b1x1+b2x2+…+bmxm+e且rij≠0,通径图如(图2-4)所示。x1则(一)x2y┆xme(图9-4)此为通径系数P0.1、P0.2、…、P0.m的正规方程组,其矩阵形式为:若记正规方程组的系数矩阵为R、未知元列向量为P、常数项列向量为B,则0.02.021.0120.022.01.02110.012.0121.0mmmmmmmmrPPrPrrPrPPrrPrPrP020100.m0.20.121221112PPP111mmmmmrrrrrrrrrBRP1(二)d0.1+d0.2+…+d0.m+d0.12+…+d0.(m-1)m+d0.e=1即  而所以从而有。1.0.0.01eijjiimiddd2.0.01RddijjiimieeijjiimiedPRddd.0.02.0.01.01)(1(三)P0.irio(i=1,2,…,m)为xi对回归可靠程度R2的总贡献。定理5两个结果的相关系数等于连接它们的全部通径链系数之和。例如y1=b0+b1x1+b2x2+b3x3y2=b0ˊ+b2ˊx2+b3ˊx3+b4x4x1且r23≠0,r12=r13=r14=r34=0y1通径图如(图9-10)所示。x2因为y1与y2间有四条连接通径链x3y1x2y2,y1x3y2y2y1x2x3y2,y1x3x2y2x4所以(图9-10)2.23.13.22.13.23.12.22.1213223yyyyyyyyyyPrPPrPPPPPr又如y1=b0+b1x1+b2x2+b3x3+b4x4y2=b0′+b2′x2+b3′x3+b4x4+b5x5x1且r23≠0,r24≠0,r34≠0;r12=r13=r14=r15=r25=r35=r45=0y1x2通径图如(图9-11)所示。x3因为y1与y2间共有九条连接通径链x4y1x2y2,y1x3y2y2y1x4y2;y1x2x3y2x5y1x3x2y2y1x2x4y2(图9-11)y1x4x2y2y1x3x4y2y1x4x3y2所以3.24.14.23.12.24.14.22.12.23.13.22.14.24.13.23.12.22.121433442243223yyyyyyyyyyyyyyyyyyyyPrPPrPPrPPrPPrPPPPPPPPPPr一般,若y1与y2有m个公共原因:x1,x2,…,xm且两两相关,即rij≠0,则注意本节从定理3开始不再涉及误差项,这是因为误差项与各自变量独立,考虑误差项与不考虑误差项结论相同。但在进行性状相关的通径分析时,则须考虑误差项。利用定理5可以计算任意两个结果间的相关系数。定理5在遗传育种的理论研究上有着十分重要的应用。jiiiyijyjimmyymiyyPrPPPr.2.1.2.1211能否正确地找出连接二个变量间的全部通径链是利用通径分析计算变量间相关系数的关键。确定通径链有如下几条原则:1.通径链的方向只能先退后进,决不能先进后退如(图9-12)中,x1y1x2y2是一条正确的通径链;y1x2而x1y1x2是一条错误的通径链。y2(图9-12)2.通径链可以是连续后退或连续前进,也可以是先连续后退再连续前进,中途仅改变一次方向。如(图9-13)中y1x1x2x3x4y2x5(图9-13)y1x1x2x3,x3x4y2y1x1x2x3x4y2是正确的通径链;而y2x5x4x3是错误的通径链。3.由于一条相关线相当于一次方向的改变,所以(1)邻近的通径必须以尾端与相关线相连;(2)一条通径链中最多只能包含一条相关线;(3)不同的通径链可以通过同一条相关线。如(图9-14)中:y1x1y2x2x3x4(图9-14)y1与y2间的全部正确的通径链为:y1x1y2,y1x2y2y1x1x2y2,y1x2x1y2,

1 / 44
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功