第三章矩阵分析和线性矩阵不等式第三章矩阵分析和线性矩阵不等式本章介绍本书中所用到的必要矩阵论方面数学知识,集中建立和证明一些常用的矩阵方程,不等式以及与线性矩阵不等式(LMI)有关的基本公式,这些公式与引理在后续各章中均有引用。3.1矩阵运算基础3.1.1矩阵运算本小节给出矩阵运算中得一些基本定理和算法。定理3.1.1考虑一般的阶分块方阵mn+⎥⎦⎤⎢⎣⎡=22211211AAAAA(3.1.1)式中和分别为阶和阶可逆矩阵,则有如下两个矩阵求逆公式,即11A22Anm111211121112122121111111211221211][][−−−−−−−−+=−AAAAAAAAAAAAA(3.1.2)和122121211221211112111212212111][][−−−−−−−=−AAAAAAAAAAAA(3.1.3)证明:略。定理3.1.2(矩阵求逆引理)111111][][−−−−−−+−=+CABCAIBAABCA(3.1.4)证明:在(3.1.2)式中,令IACABAAA====22211211,,,,便得(3.1.4)式。定理3.1.3如果A是按式(3.1.1)分块划分,则有]Adet[detdet21-122121122AAAAA−⋅=(3.1.5)和]Adet[detdet12-111212211AAAAA−⋅=(3.1.6)证明:因为⎥⎦⎤⎢⎣⎡−=⎥⎦⎤⎢⎣⎡−⎥⎦⎤⎢⎣⎡−−−−IAAAAAAAAAIAAAA00122122112212111222112222211211(3.1.7)所以有]det[detdet211221211122AAAAAA−−−=⋅注意到22122det1detAA=−,便得(3.1.5)式。类似地可证(3.1.6)式。定理3.1.4)det()det(CBIBCI+=+(3.1.8)证明:考虑矩阵,将⎥⎦⎤⎢⎣⎡=ICBIAA分别代入(3.1.5)和(3.1.6)式便可证明其结果。定理3.1.5(3.1.9)11][][−−+=+CBIBBBCI证明:由(3.1.4)得))(()()(111CBCBIIBCBCBIBBBBCI−−−+−=+−=+11)()()(−−+=−++=CBIBCBCBICBIB3-1第三章矩阵分析和线性矩阵不等式矩阵的迹也是一个非常重要得概念,下面是部分常用到得计算公式。∑==niiiaAtr1][①][][TAtrAtr=②][][][2121AtrAtrAAtr+=+③][][BAtrABtr+④yAxAxyAxytrAxytrTTTTT===][][⑤若A为同幂矩阵,则rankAAtr=][3.1.2矢量与矩阵的微分运算在鲁棒控制理论和系统建模中,矢量与矩阵的微分运算是非常重要的。本节我们不加证明地给出一些常用到得运算定理和公式。为了叙述方便,采用下列约定。1)标量对向量求导定义为行向量。若J为标量,,则nR∈θ],,,[21nJJJJθθθθ∂∂∂∂∂∂=∂∂L(3.1.10)2)向量对向量求导定义为矩阵。若,,则mRx∈nR∈θ⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡∂∂∂∂∂∂∂∂=∂∂nmmnxxxxxθθθθθLMML1111(3.1.11)3)矩阵对向量求导定义为增维矩阵。若nnRA×∈,,则nR∈θ],,,[21nAAAAθθθθ∂∂∂∂∂∂=∂∂L(3.1.12)4)标量对矩阵求导仍为矩阵。设为标量,JM为矩阵,则MJ∂∂是以ijmJ∂∂为第ij元素的矩阵,其中表示ijmM矩阵的第ij元素。在上述约定下,有如下一些结果:1)TTaxax=∂∂)(;2)AAxAxxxTT,2)(=∂∂为对称矩阵;3)TMMM−=∂∂detlog;4)111−−−∂∂−=∂∂MxMMxM;5)TBAxxBAxtrx)(][111−−−−=∂∂。3-2第三章矩阵分析和线性矩阵不等式3.1.3矩阵的最大秩分解与正交补的计算公式如果矩阵,令0,≠∈×ARAnm)0()(=rrArank,那么总可以找到矩阵rmRB×∈和,使得:nrRC×∈BCA=(3.1.13)成立,且)()()(CrankBrankArank==(3.1.14)上式被称为最大秩分解。可以证明,矩阵的最大秩分解总是存在的。令矩阵,可以分解为:0≠A⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡=×2121000VVPUUArr(3.1.15)式中为1UA阵不为零特征值对应的特征向量,为2UA阵零特征值对应的特征向量。那么A阵的正交补矩阵可由下式得出2TUA=⊥(3.1.16)其中T为任意的满秩矩阵。利用该方法可以得到矩阵]0[0QP=⎥⎦⎤⎢⎣⎡⊥(3.1.17)其中Q是满足的任意矩阵。0QQT3.1.4矩阵的广义逆与线性方程组的解对任意矩阵A都有其广义逆存在,且满足:−AAAAA=−(3.1.18)上式一般都作为矩阵广义逆的定义公式。一般来说,对于任意矩阵的广义逆存在但并不唯一,且有:)()(ArankArank≥−(3.1.19)成立。根据前面的论述,任意矩阵A都有最大秩分解BCA=,那么可以证明由下式定义的矩阵是A阵的广义逆矩阵,而且唯一。(3.1.20)TTTTBBBCCCA11)()(−−+=由于该逆比较重要,所以单独命名为伪逆矩阵或称之为Moore-Penrose伪逆矩阵。这种伪逆矩阵在后面的滤波分析章节中有应用。考虑线性矩阵方程组:YAX=当A是非奇异矩阵时,YAX1−=是方程组的唯一解。当A是奇异矩阵时,若)(),(ArankYArank=,称方程组是相容的,此时它有无数个解,解的通式为:3-3第三章矩阵分析和线性矩阵不等式ZAAIYAX)(−−−+=(3.1.21)其中Z为任意矩阵向量。当A是奇异矩阵时,且)(),(ArankYArank≠,称方程组是不相容的,此时线性矩阵方程组无解。但有使YAX−最小的最小二乘解,而且该解始终存在,其通式为:ZAAIYAX)(++−+=(3.1.22)其中Z为任意矩阵向量。而且YAX+=是所有最小二乘解中使XXT最小的唯一解。3.1.5奇异值及奇异值分解本小节介绍矩阵的奇异值分解,它不仅是矩阵理论和矩阵计算的最基本和最重要的工具之一,而且在控制理论、系统辨识、信号处理等许多领域都被广泛地应用。我们首先引入矩阵奇异值的定义,然后讨论它的许多性质。这里所有的引理和定理都不加证明,读者可以在许多参考书中找到。一、奇异值分解引理3.1.1设,则nmCA×∈(3.1.23))()()(ArankAArankAArankHH==引理3.1.2设,则nmCA×∈(1)与的特征值均为非负实数;AAHHAA(2)与的非零特征值相同,并且非零特征值的个数(重特征值按重数计算)等于。AAHHAA)(Arank定义3.1.1设,如果存在非负实数nmCA×∈σ和非零向量,使得nCu∈mCv∈uvAvAuHσσ==,(3.1.24)则称σ为A的奇异值,u和v分别称为A对应与奇异值σ的右奇异向量和左奇异向量。由式(3.1.24)可得(3.1.25)uvAAuAHH2σσ==(3.1.26)vAuvAAH2σσ==因此是的特征值,也是的特征值,而u和分别是和对应于特征值的特征向量。2σAAHHAAvAAHHAA2σ定理3.1.6设,且nmCA×∈rArank=)(,则存在阶酉矩阵V和阶酉矩阵U使得mn(3.1.27)⎥⎦⎤⎢⎣⎡Σ=000AUVH其中),,(1rdiagσσL=Σ,且01≥≥rσσL(3.1.27)称为矩阵A的奇异值分解。从定理3.1.6可见,U的列向量是的标准正交特征向量,U的前AAHr列向量是对应于AAHr个非零特征值的标准正交特征向量;而V的列向量是的标准正交特征向量,从的选取,有221,,rσσLHAA111−Σ=AUV(3.1.28)211121111Σ=Σ=ΣΣ=Σ=−−VAUAUAUAAVAAHH3-4第三章矩阵分析和线性矩阵不等式这表明V的前r列向量恰是对应于特征值的标准正交特征向量。HAA221,,rσσL二、矩阵奇异值的性质设,并且nmCA×∈σ表示最大奇异值,σ表示最小奇异值,则有(1)mHnHIAAAIAAA∗≤∗≤)(,)(22σσ;(2))()()(AAAiσλσ≤;(3)AxxAxAAxxAxAxxxxxx100100minmin)(,maxmax)(=≠≠=≠≠====σσ;(4)1)(≤Aσ当且仅当或;0≥−AAIH0≥−HAAI(5)A满秩当且仅当0)(Aσ;(6)如果A可逆,则)()(1−=AAσσ;(7)对于标量C∈β,有)()(AAiiσββσ=;(8)设,则nmCAA×∈21,)()()(2121AAAAσσσ+≤+;(9)设则有nqqmCBCA××∈∈,)()()(BAABσσσ≤和)()()(BAABσσσ≥;(10)设A可分块为则有⎥⎦⎤⎢⎣⎡=22211211AAAAA2,1,),()(=≥jiAAijσσ。三、奇异值与其它矩阵量的关系(1)范数由矩阵的奇异值分解定理,并注意到矩阵A的范数2L2A是酉不变的,故22122/11122rHminjijAVUaAσσ++=Σ==⎥⎦⎤⎢⎣⎡=∑∑==L(3.1.29)即是说,任何一个矩阵的范数等于该矩阵所有非零奇异值平方和的正平方根。2L考虑矩阵A的秩k近似,并将其记作,其中kA()Arankrk=。定义如下:rA,1∑=××=kiHiiirvuAσrk则A与秩为k的任一矩阵B之差的和范数分别为1L2L()111min+==−=−kkkBrankAABAσ(3.1.30)和3-5第三章矩阵分析和线性矩阵不等式()2212222minrkkkBrankAABAσσ++=−=−+=L(3.1.31)这一重要结果是许多概念和应用(例如总体最小二乘、数据压缩、图像增强、动态系统实现理论。以及的求解需要用一个低秩矩阵近似bAx=A的各类问题)的基础。(2)行列式设A是方矩阵。由于酉矩阵的行列式之绝对值等于1,所以由定理6.2.1有:nn×nAσσσL21detdet==∑(3.1.32)若所有iσ都不等于零,则0det≠A,这意味着A是非奇异的;若至少有一个(rii)σ等于零,则,即0det=AA是奇异的。这就是之所以把全部iσ值统称为奇异值的原因。综合式(3.1.31)和式(3.1.32),对于一个矩阵nn×A,下列不等式成立:⎭⎬⎫⎩⎨⎧≥≥≥≥≥≥≥≥≥≥≥−−nnnnnnnnnnnnnnAAnAAAAAAAAAn/121212/1/1/1111121det/1,1max/det//detdetdetdetdetσσσσσσσσσσ(3.1.33)这些不等式虽然是粗略的评价,但有时是有用的。(3)条件数对于一个矩阵nn×A,其条件数也可以利用奇异值定义为(),/1hAcondσσ=()nmh,min=(3.1.34)由定义式(3.1.34)可以看出,条件数是一个大于或等于1的正数。条件数小的矩阵叫做“良性”矩阵,反之叫做“病态”矩阵。显然,一个奇异矩阵的条件数为无穷大,而条件数虽然不是无穷大,但却很大时,就称是接近奇异的;这意味着,在这种情况下的行向量或列向量的独立性很弱。另由1)(−=AAAcond易知,正交或酉矩阵V是“理想条件”的。式(3.1.34)也可用作的评价式。()Acond考虑超定方程。此时,由于的奇异值分解为bAx=AAH(3.1.35)HHVVAA2Σ=即矩阵的最大和最小奇异值分别是矩阵AAHA的最大和最小奇异值的二倍,故()()[2221AcondAAcondnH==σσ](3.1.36)换言之,矩阵的条件数是矩阵AAHA的条件数的平方倍。(4)特征值设方矩阵nn×A的特征值为()nnλλλλLL11,,,奇异值为3-6第三章矩阵分析和线性矩阵不等式()011≥≥nnσσσσLL,,,则,1niσλσ≥≥ni,,1L=()nAcondλλ/1≥特别值得指出的是,奇异值分解提供了在实际控制信号处理中发生的一些重要问题的定量答案。问题1:一矩阵与低秩矩阵是如何接近的?答案:如果具有奇异值nmCA×∈011===≥≥≥+nrr