第五章特征值估计及极性知识要点:•特征值的估计;•广义特征值问题;•特征值的极小极大原理;•特征值和奇异值的扰动;•广义特征值分析的应用。§5.1特征值的估计一、特征值的界1.定理5.1:设A=(aij)Rn×n,若表示A的任一特征值,则其中。2)1(|)Im(|nnM2||max,1srrsnsraaM2.推论实对称矩阵的特征值都是实数。3.引理1:设BCn×n,yCn为单位列向量,则||max||||||,1ijnjimHbnBAyy证明:设B=(bij)n×n,,则Tny),,,(21||||jiijHaAyy||||||1,njijiijanjijiijnjia1,2,12||||||max2||max,1nnaijnjimB||||4.定理5.2:设ACn×n,则A的任一特征值满足(1)||||A||m(2)|Re()|0.5||A+AH||m(3)|Im()|0.5||A-AH||m。证明:设A属于的单位特征向量为y,则有Ay=y,即yHAy=yHy=,因此yAyHHH由引理,于是有mA||||||mHAA||||21|)Re(|mHAA||||21|)Im(|例:估计矩阵特征值的上界。05.08.01A5.推论Hermite矩阵的特征值都是实数,反Hermite矩阵的特征值为零或纯虚数.解:由定理5.2,对A特征值,有:||2,|Re()|2,|Im()|1.3,由定理5.1,知其虚部的另一逼近为:65.02)12(23.15.0|)Im(|其特征值为:)6.01(212,1j632456.0||2,15.0|)Re(|2,1327898.0|)Im(|2,16.定义5.1设A=(aij)Cn×n,记Rr=sr|ars|,r=1,…,n,如果|arr|>Rr(r=1,2,…,n),则称矩阵A按行严格对角占优;如果|arr|Rr(r=1,…,n),且有lron,使得|aroro|Rro成立,则称矩阵A按行(弱)对角占优。7.定义5.2设ACn×n,如果AT按行严格对角占优,则称A按列严格对角占优;如果AT按行(弱)对角占优、则称A按列(弱)对角占优。二、特征值的包含区域1.定义5.3设A=(aij)Cn×n,称区域Gi:|z-aii|Ri为矩阵A的第i个盖尔圆,其中Ri=ji|aij|称为盖尔圆Gi的半径(i=l,…,n)。2.定理5.6矩阵A=(aij)Cn×n的一切特征值都在它的n个盖尔圆的并集之内。证明:设λ为其特征值,为对应特征向量,且为其绝对值最大者,则有即Tn),,,(21iininiiiiiaaaa2211||||||111111niniiiiiiiiiiaaaaa3.定理5.7由矩阵A的所有盖尔圆组成的连通部分中任取一个,如果它是由k个盖尔圆构成的,则在这个连通部分中有且仅有A的k个特征值(盖尔圆相重时重复计数.特征值相同时也重复计数).证明思路:考虑由A的对角线元素构成的矩阵D=diag(a11,a22,…,ann),定义矩阵B(u)=(1-u)D+uA则其特征值变化连续依赖于参数u,D的盖尔圆连续变化成为A的盖尔圆。||||111111ininiiiiiiiiiiiiaaaaa因此iikikikikikiiRaaa|||||||||例:讨论矩阵的特征值的分布。解:A的盖尔圆分别为|z-1|≤0.8和|z|≤0.5,这两个盖尔圆为连通的,因此包含两个特征值。其特征值为不在盖尔圆|z|≤0.5内。05.08.01A)6.01(212,1j考虑满秩对角阵则矩阵DAD-1与A具有同样的特征值,因此有•若将Ri改作ri=ji(|aij|i/j),则两个盖尔定理仍然成立,其中i都是正数。11211212222111211211nnnnnnnnaaaaaaaaaDAD),,,(21ndiagDnnnnnnnnnnaaaaaaaaa22112222122111211211隔离矩阵特征值原则•选取的一般方法是:观察A的n个盖尔圆,欲使第i个盖尔圆Gi的半径变大(或小)些,就取i>1(或i<1).而取其它正数=1。•此时,B=DAD-1的第i个盖尔圆的半径变大(或小),而B的其余盖尔圆的半径相对变小(或变大).•但是,这种隔离矩阵特征值的办法还不能用于任意的具有互异特征值的矩阵.比如主对角线上有相同元素的矩阵.•如果矩阵A按行(列)严格对角占优,则detA0。例:隔离矩阵A=的特征值.•A的3个盖尔圆为G1:|z-20|5.8,G2:|z-10|5,G3:|z-10j|3。G1与G2相交;而G3孤立,其中恰好有A的一个特征值,记作3(见左图).选取D=diag(1,1,2),则B=DAD-1的三个盖尔圆为G1’:|z-20|5.4,G2’:|z-10|4.5,G3’:|z-10j|6。易见,这是3个孤立的盖尔圆,每个盖尔圆中恰好有B的(也是A的)一个特征值(见右图).定理5.11:设矩阵A=(aij)Cn×n的,0α1,λ是A的任一个特征值,则存在i使得|λ–aii|[Ri(A)]α[Ri(AT)]1-α例:讨论矩阵的特征值的分布。解:R1(A)=0.8,R2(A)=0.5;R1(AT)=0.5,R2(AT)=0.8.取α=0.5,则A的特征值λ满足不等式|λ–1|[R1(A)]1/2[R1(AT)]1/2=0.41/2=0.6324|λ|[R2(A)]1/2[R2(AT)]1/2=0.41/2=0.632405.08.01A§5.2广义特征值问题•定义:称Ax=Bx的特征值问题为(对称)矩阵A相对于(对称)矩阵B的广义特征值问题,称数为矩阵A相对于矩阵B的特征值;而与相对应的非零解x称之为属于的特征向量.•广义特征值由det(A-B)=0的根给出。一、广义特征值问题的等价形式1.等价形式1:B可逆时B-1Ax=x,等价地化为非对称阵B-1A的普通特征值问题。2.等价形式2:B正定时B=GGT使得Sy=y,其中y=GTx,对称阵S=G-1AG-T。等价地转化为对称矩阵S的普通特征值问题),,,(211nTTdiagPAGGP因此,当B=GGT正定时有正交矩阵P,使得令Q=G-TP,则有AQQTIPGGGGPBQQTTTT1设A与B为正定对称阵,则A+B仍为正定对称阵,由以上结论,存在可逆矩阵Q,使得AQQTIQBAQT)(因此有IBQQT二、特征向量的共轭性1.在等价的普通特征值问题Sy=y中,特征向量系y1,y2,…,yn是完备的标准正交系。令xj=G-Tyj,j=1,2,…,n,则有xiTBxj=xiTGGTxj=(GTxi)T(GTxj)=yiTyj=ij,向量系x1,…,xn称为按B标准正交化向量系。2.按B标准正交化向量系的性质:•性质1xj0(j=1,2,…,n)(j=1,…,n);•性质2x1,…,xn线性无关。§5.3对称矩阵特征值的极性一、实对称矩阵的Rayleigh商的极性1.定义:设A是n阶实对称矩阵,x∈Rn.称为矩阵A的Rayleigh商.2.Rayleigh商的性质:•性质1R(x)是x的连续函数.•性质2R(x)是x的零次齐次函数.即,对任意的实数0,有R(x)=R(x)=0R(x)0xxxAxxxRTT)(•性质3xL(x0)(x00)时,R(x)是一常数.•性质4R(x)的最大值和最小值存在,且能够在单位球面S={x|xRn,||x||2=1}上达到.证:S是闭集,在S上R(x)=xTAx连续,所以必有x1,x2S,使得minxSR(x)=R(x1)maxxSR(x)=R(x2)任取0yRn,令y0=y/||y||2,则y0S,根据性质3,有R(y)=R(y0),从而R(x1)R(y)R(x2)。实对称矩阵A的特征值(都是实数)按其大小升序排列:12…n,对应的标准正交特征向量系设为P=[p1,…,pn],则有•定理:设A为实对称矩阵,则minxSR(x)=1,maxxSR(x)=n证:任取xS,则x=Pc,||c||=1,Ax=APc=PcR(x)=xTAx=cTc1R(x)n,Api=ipiR(pi)=i。•推论1:在S上p1和pn分别是R(x)的一个极小点和极大点,即R(p1)=1,R(pn)=n•推论2若1=…=k(1kn).则在||x||2=l上R(x)的所有极小点为[p1,…,pk],||||2=1。•定理:设xL(pr,…,ps),1rsn,则有minxR(x)=r,maxxR(x)=s•Courant-Fischer定理:设实对称矩阵A的特征值按升序排列,则A的第k个特征值其中Vk是Rn的任意—个k维子空间,1<k<n。}1||||,|max{min2xVxAxxkTVkkCourant-Fischer定理的证明•构造Rn的子空间Wk=L(pk,…,pn),则dimWk=n-k+1.由于Vk+WkRn,所以ndim(Vk+Wk)=dim(Vk)+dim(Wk)-dim(VkWk)=n+1-dim(VkWk)dim(VkWk)1故存在x0=[pk,…,pn]VkWk,||||2=1满足||x0||2=1使得xTAx=Tk,即max{xTAx|xVk,||x||2=1}k根据Vk的任意性,可得:kkTVxVxAxxk}1||||,|max{min2•令Vk=L(p1,…,pk),取x=[pk,…,pn]Vk满足||x||2=l,则有xTAxk,即max{xTAx|xVk,||x||2=1}k于是kkTVxVxAxxk}1||||,|max{min2二、广义特征值的极小极大原理1.定义:设A,B为n阶实对称矩阵,且B正定,xRn.称R(x)=(xTAx)/(xTBx),x0为矩阵A相对于矩阵B的广义Rayleigh商..2.广义Rayleigh商可以只在椭球面SB={x|xRn,xTBx=1}上讨论。3.定理:非零向量x0是R(x)的驻点的充要条件是x0为Ax=Bx的属于特征值的特征向量。4.推论若x是Ax=Bx的特征向量,则R(x)是与之对应的特征值。.5.定理:设Vk是Rn的任意一个k维子空间,则广义特征值问题Ax=Bx的第k个特征值和第n-k+1个特征值具有下列的极小极大性质6.推论1设Vk是Rn的任意一个k维子空间,则实对称矩阵A的第k个特征值和第n-k+1个特征值具有极性质}|)(max{minkVkVxxRk}|)(min{max1kVknVxxRk}|)(max{minkVkVxxRk}|)(min{max1kVknVxxRk7.推论2设Vn-k+1是Rn的任意一个n-k+1维子空间,则}|)(max{min11knVkVxxRkn}|)(min{max111knVknVxxRkn三.矩阵奇异值的极小极大性质1.实矩阵A的奇异值(A)和实对称半正定矩阵ATA的特征值(ATA)有关系2.定理:设A的奇异值排列为0=1=…=n-rn-r+