第九章典型相关分析第一节引言第二节典型相关的基本理论第三节样本典型相关分析第四节典型相关分析应用中的几个问题第五节实例分析与计算实现第一节引言典型相关分析(CanonicalCorrelation)是研究两组变量之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在联系。相关系数可以衡量两个随机变量之间的线性相关关系;复相关系数衡量一个随机变量和多个随机变量的线性相关关系两组变量之间的相关关系研究生理指标与训练指标的关系居民生活环境与健康状况的关系阅读能力变量(阅读速度、阅读才能)与数学运算能力变量(数学运算速度、数学运算才能)是否相关?第一节引言1936年霍特林(Hotelling)最早就“大学表现”和“入学前成绩”的关系、政府政策变量与经济目标变量的关系等问题进行了研究,提出了典型相关分析技术Cooley和Hohnes(1971),Tatsuoka(1971)及Mardia,Kent和Bibby(1979)等人对典型相关分析的应用进行了讨论,Kshirsagar(1972)则从理论上给出了最好的分析典型相关分析的目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析第二节典型相关的基本理论一典型相关分析的基本思想二典型相关分析原理及方法一、典型相关分析的基本思想首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此继续下去,直到两组变量之间的相关性被提取完毕为止被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数典型相关系数度量了这两组变量之间联系的强度一、典型相关分析的基本思想设是两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量Ui、Vi,使得每一个综合变量是原变量的线性组合,即()(1)()(1)()(1)()(1)1122iiiiiPPUaXaXaXaX()(2)()(2)()(2)()(2)1122iiiiiqqVbXbXbXbX(1)(1)(1)(1)12(,,,)pXXXX、(2)(2)(2)(2)12(,,,)qXXXX一、典型相关分析的基本思想为了确保典型变量的唯一性,我们只考虑方差为1的(1)X、(2)X的线性函数()(1)iaX与()(2)ibX,求使得它们相关系数达到最大的这一组。若存在常向量(1)a,(1)b,在(1)(1)(1)(2)()()1DDaXbX的条件下,使得(1)(1)(1)(2)(,)aXbX达到最大,则称(1)(1)aX、(1)(2)bX是(1)X、(2)X的第一对典型相关变量。求出第一对典型相关变量之后,可以类似的求出各对之间互不相关的第二对、第三对等典型相关变量。这些典型相关变量就反映了(1)X,(2)X之间的线性相关情况。这里值得注意的是,我们可以通过检验各对典型相关变量相关系数的显著性,来反映每一对综合变量的代表性,如果某一对的相关程度不显著,那么这对变量就不具有代表性,不具有代表性的变量就可以忽略。这样就可以通过对少数典型相关变量的研究,代替原来两组变量之间的相关关系的研究,从而容易抓住问题的本质。二、典型相关分析原理及方法设有两组随机向量,(1)X代表第一组的p个变量,(2)X代表第二组的q个变量,假设p≤q。令(1)(2)(1)(2)11221221Cov(),Cov(),Cov(,)ΣΣΣΣXXXX(1)1(1)2(1)(1)(2)()1(2)1(2)2(2)ppqqXXXXXXXXX一、典型相关分析的基本思想()()()()1112Cov(,)2122pppqqpqqΣΣΣΣXX根据典型相关分析的基本思想,要进行两组随机向量间的相关分析,首先要计算出各组变量的线性组合——典型变量,并使其相关系数达到最大。因此,我们设两组变量的线性组合分别为:(1)(1)(1)(1)1122ppUaXaXaXaX(2)(2)(2)(2)1122qqVbXbXbXbX一、典型相关分析的基本思想易见(1)(1)(1)11(2)(2)(2)22(1)(2)12121122()()Cov(,)()()(,)Cov(,)Cov(,)Cov(,)Corr(,)()()DUDDVDCovUVUVUVDUDVΣΣΣΣΣΣaXaXXaaabXbXXbbbaXXbababaabb我们希望寻找使相关系数达到最大的向量a与b,由于随机向量乘以常数时并不改变它们的相关系数,所以,为防止结果的重复出现,令1122()1()1DUDVΣΣaabb一、典型相关分析的基本思想那么,12121122Corr(,)UVΣΣΣΣababaabb(9.2)问题就成为在(9.1)式的约束条件下,求使12Corr(,)UVΣab,达到最大的系数向量a与b。根据条件极值的求法引入Lagrange乘数,将问题转化为求121122(,)(1)(1)22ΣΣΣababaabb(9.3)的极大值,其中λ,ν是Lagrange乘数。根据求极值的必要条件得1211212200ΣΣΣΣbaaabb(9.4)一、典型相关分析的基本思想将(9.4)方程组的二式分别左乘a与b则得1211212200aΣbaΣabΣabΣb即有12112122aΣbaΣabΣabΣb因为2112()bΣaaΣb,所以12aΣb,知为线性组合U,V的相关系数。用代替方程组中的,则(9.4)方程组写为:1211212200ΣbΣaΣaΣb(9.5)一、典型相关分析的基本思想假定各随机变量协差阵的逆矩阵存在,则由方程组(9.5)式中的第二式,可得:122211bΣΣa(9.6)将(9.6)式代入方程组(9.5)式的第一式,得11222211110ΣΣΣaΣa即有12122221110ΣΣΣaΣa(9.7)同理,由方程组(9.4)式可得12211112220ΣΣΣbΣb(9.8)一、典型相关分析的基本思想用111Σ和122Σ分别左乘(9.7)和(9.8)式,得112111222211122221111200ΣΣΣΣaaΣΣΣΣbb(9.9)即1121112222111222211112()0()0pqΣΣΣΣIaΣΣΣΣIb(9.10)由此可见,1111122221ΣΣΣΣ和1122211112ΣΣΣΣ具有相同的特征根2,a,b则是其相应的特征向量。为了表示方便,令1111122221AΣΣΣΣ1122211112BΣΣΣΣ其中A为p×p阶矩阵,B为q×q阶矩阵。一、典型相关分析的基本思想因为12(,)CorrUVaΣb,求(,)CorrUV最大值也就是求的最大值,而求的最大值又转化为求A和B的最大特征根。可以证明,A和B的特征根和特征向量有如下性质:1.A和B具有相同的非零特征根,且所有特征根非负。2.A和B的特征根均在0~1之间。3.设A和B的非零特征根为22212r,()rrankA()rankB,(1)(2)(),,,raaa为A对应于22212,,,r的特征向量,(1)(2)(),,,rbbb为B对应于22212,,,r的特征向量。一、典型相关分析的基本思想由于我们所求的是最大特征根及其对应的特征向量,因此,最大特征根21对应的特征向量(1)(1)(1)(1)12(,,,)paaaa和(1)(1)(1)(1)12(,,,)qbbbb就是所求的典型变量的系数向量,即可得(1)(1)(1)(1)(1)(1)(1)(1)11122PPUaXaXaXaX(1)(2)(1)(2)(1)(2)(1)(2)11122qqVbXbXbXbX我们称其为第一对典型变量,最大特征根的平方根1即为两典型变量的相关系数,我们称其为第一典型相关系数。一、典型相关分析的基本思想如果第一典型变量不足以代表两组原始变量的信息,则需要求得第二对典型变量,即(2)(1)2(2)(2)2UVaXbX显然,要求第二对典型变量也要满足如下约束条件:(2)(2)211(2)(2)222()1()1DUDVaΣabΣb(9.11)除此之外,为了有效测度两组变量的相关信息,第二对典型变量应不再包含第一对典型变量已包含的信息,因而,需增加约束条件:(1)(1)(2)(1)(1)(2)1211(1)(2)(2)(2)(1)(2)1222(,)(,)0(,)(,)0CovUUCovCovVVCovaXaXaΣabXbXbΣb(9.12)一、典型相关分析的基本思想在(9.11)和(9.12)式的约束条件下,可求得其相关系数22(,)CorrUV(2)(2)12aΣb的最大值为上述矩阵A和B的第二大特征根22的平方根2,其对应的单位特征向量(2)a,(2)b就是第二对典型变量的系数向量,称(2)(1)2UaX和2V(2)(2)bX为第二对典型变量,2为第二典型相关系数。类似地,依次可求出第r对典型变量:()(1)rrUaX和()(2)rrVbX,其系数向量()ra和()rb分别为矩阵A和B的第r特征根2r对应的特征向量。r即为第r典型相关系数。一、典型相关分析的基本思想综上所述,典型变量和典型相关系数的计算可归结为矩阵A和B特征根及相应特征向量的求解。如果矩阵A和B的秩为r,则共有r对典型变量,第k对(1)kr典型变量的系数向量分别是矩阵A和B第k特征根2k相应的特征向量,典型相关系数为k。典型变量具有如下性质:1.()1,()1(1,2,,)kkDUDVkr(,)0,(,)0()ijijCovUUCovVVij2.0(,1,2,,)(,)0()0()iijijirCovUVijjr第三节样本典型相关分析一样本典型相关变量及典型相关系数的计算二典型相关系数的显著性检验一、样本典型相关变量及典型相关系数的计算在实际分析应用中,总体的协差阵通常是未知的,往往需要从研究的总体中随机抽取一个样本,根据样本估计出总体的协差阵,并在此基础上进行典型相关分析。设(1)(2)XXX服从正态分布(,)pqNμΣ,从该总体中抽取样本容量为n的样本,得到下列数据矩阵:(1)(1)(1)11121(1)(1)(1)21222(1)(1)(1)(1)12ppnnnpXXXXXXXXXX一、样本典型相关变量及典型相关系数的计算(2)(2)(2)11121(2)(2)(2)21222(2)(2)(2)(2)12qqnnnqXXXXXXXXXX样本均值向量(1)(2)XXX其中(1)(1)11nnXX,(2)(2)11nnXX样本协差阵11122122ˆˆˆˆˆΣΣΣΣΣ一、样本典型相关变量及典型相关系数的计算其中()()()()11ˆ()(),,1,21nkkllkljjjklnΣXXXX由此可得矩阵A和B的样本估计:1111122221ˆˆˆˆˆAΣΣΣΣ1122211112ˆˆˆˆˆBΣΣΣΣ如前所述,求解ˆA和ˆB的特征根及其相应的特征向量,即可得到所要求的典型相关变量