第5章矩阵及其特征值计算第5章矩阵及其特征值计算1•1特征值性质及其估计•2幂法及反幂法2幂法及反幂法•3QR方法•3QR方法矩阵计算的基本问题线性方程组解¾线性方程组解¾超定方程组的二乘解bAx=2||||bAxmin¾超定方程组的二乘解¾矩阵特征值和特征向量xAxλ=2||||bAx−min¾矩阵特征值和特征向量xAxλ=一、问题一、问题矩阵的特征值与特征向量理论有着非常广泛的应用,矩阵的特征值与特征向量理论有着非常广泛的应用,如工程技术领域中的振动问题和稳定性问题,数学领域中方阵的对角化、偏微分方程组的求解等问题都会用到该理论。该理论。4矩阵特征值AλxAxλ=求绝对值最大的特征值求全部特征值5设为阶方阵,如果存在数和维非零向量二、特征值与特征向量设A为n阶方阵,如果存在数λ和n维非零向量X则称数λ为方阵A的特征值,非零使得AX=λX,向量X称为A的属于特征值λ的特征向量。注意(1)特征值λ可以为零;比如,若X是矩阵A的属于特征值λ0的特征向量,(2)属于同一个特征值的特征向量不是惟一的。比如,若X是矩阵A的属于特征值λ0的特征向量,则也是A的属于特征值λ0的特征向量。)0(≠kXk6定义1定义1⑴已知n阶矩阵A=(aij),则(ij)⎞⎛λdet)det()(2222111211⎟⎟⎟⎞⎜⎜⎜⎛−−−−−−aaaaaaAInnλλλλϕLLdet)det()(21⎟⎟⎟⎠⎜⎜⎜⎝−−−=−=aaaAIλλλϕLMOMM)2()(1221121的项次数−≤++++−=⎠⎝−naaaaaannnnnnnnλλλL称为A的特征多项式.A的特征方程一般有个根实的或复的,重根按重数计算称为的A的特征方程)1.1(0)det()(=−=AIλλϕ一般有n个根(实的或复的,重根按重数计算)称为A的特征值.用λ(A)表示A的所有特征值的集合.特征值用()表示的所有特征值的集合注:当A为实矩阵时,ϕ(λ)=0为实系数n次代数方程,其复根是共轭成对出现.8⑵设λ为A的特征值,相应的齐次方程组⑵设λ为A的特征值,相应的齐次方程组)2.1(0)(=−xAIλ)()(的非零解x称为矩阵A的对应于λ的特征向量.9例1求A的特征值及特征向量,其中⎟⎞⎜⎛012例1求A的特征值及特征向量,其中⎟⎟⎟⎠⎞⎜⎜⎜⎝⎛=210131A⎟⎠⎜⎝210解矩阵A的特征方程为131012)det()(−−λλλλAI解矩阵的特征方程为210131)det()(−−−−−=−=λλλλϕAI.0)4)(2)(1(814723=−−−=−+−=λλλλλλ求得矩阵A的特征值为:求得矩阵A的特征值为:.4,2,1===λλλ对应于各特征值矩阵A的特征向量分别为:对应于各特征值矩阵A的特征向量分别为:111⎟⎞⎜⎛⎟⎞⎜⎛⎟⎞⎜⎛.12,10,11321⎟⎟⎟⎠⎜⎜⎜⎝=⎟⎟⎟⎠⎜⎜⎜⎝−=⎟⎟⎟⎠⎜⎜⎜⎝−=xxx111⎠⎝⎠⎝⎠⎝计算问题关于计算矩阵A的特征值问题,当n=2,3时,我们还可按行列式展开的办法求ϕ(λ)=0的根.但当n较大们还可按行列式展开的办法求ϕ(λ)0的根.但当n较大时,如果按展开行列式的办法,首先求出ϕ(λ)的系数,再求的根,工作量就非常大,用这种办法求矩阵再求ϕ(λ)的根,工作量就非常大,用这种办法求矩阵的特征值是不切实际的,由此需要研究求A的特征值的特征值是不切实际的,由此需要研究求的特征值及特征向量的数值解法.下面叙述有关特征值的一些结论:三、基本性质定理1设λ为A∈Rn×n的特征值,且Ax=λx(x≠0),下面叙述有关特征值的一些结论:则有⑴λ为的A特征值(≠0为常数);⑵λ-p为A-pI的特征值,即(A-pI)x=(λ-p)x;⑴cλ为的cA特征值(c≠0为常数);⑵λ-p为A-pI的特征值,即(A-pI)x(λ-p)x;⑶λk为Ak的特征值,即Akx=λkx;⑶为的特征值,即;⑷设A为非奇异矩阵,那么λ≠0,且λ-1为A-1的特征值,即A-1x=λ-1x.定理2设λi(i=1,2,L,n)为n阶矩阵A=(aij)的特征值,则有则有)(Atraniiinii==∑∑==11λ⑴称为A的迹;ii==11⑵.nAλλλL21=定理3设A∈Rn×n,则有定理3设A∈R,则有.)()(AATλλ=定理4设A为分块上三角矩阵,即定理4设A为分块上三角矩阵,即⎥⎤⎢⎡mAAAL11211,⎥⎥⎥⎥⎢⎢⎢⎢=mAAAMOL222⎥⎦⎢⎣mmA其中每个对角块Aii均为方阵,则.)()(iiniAAλλU1==15定理5设A与B为相似矩阵(即存在非奇异矩阵P使B=P-1AP),则使BP-AP),则⑴A与B有相同的特征值;⑵如果是的特征向量,则是的特征向量⑵如果y是B的特征向量,则Py是A的特征向量.定理5说明,一个矩阵A经过相似变换,其特征值不变值不变.定理6⑴A∈Rn×n可对角化,即存在非奇异矩阵定理6⑴A∈Rn×n可对角化,即存在非奇异矩阵P使⎤⎡λ⎥⎥⎥⎤⎢⎢⎢⎡=−APPλλ211,⎥⎥⎦⎢⎢⎣=nAPPλO的充分必要条件是A具有n个线性无关的特征向量.⎦⎣n⑵如果A∈Rn×n有m个(m≤n)不同的特征值λ1,λ2,L,λm,则对应的特征向量x1,x2,L,xm线性无关.定理7(对称矩阵的正交约化)设AR×为对称定理7(对称矩阵的正交约化)设A∈Rn×n为对称矩阵,则⑴A的特征值均为实数;⑵A有n个线性无关的特征向量;⑶存在一个正交矩阵P使的⎥⎤⎢⎡λλ1⑵A有n个线性无关的特征向量;,⎥⎥⎥⎥⎢⎢⎢⎢=TAPPλO2且λλλ为A的特征值,而P=(uuu)列向量⎥⎦⎢⎣nλ且λ1,λ2,L,λn为A的特征值,而P=(u1,u2,L,un)列向量uj为A的对应于λj的单位特征向量.下面讨论矩阵特征值界的估计四、特征值估计定义3设n阶矩阵A=(a),令下面讨论矩阵特征值界的估计.定义3设n阶矩阵A(aij),令)(niarnL21==∑⑴;).,,(niarijjijiL211==∑≠=⑴;⑵集合称为复平面上以a为圆心,以r为半径的n阶矩阵A的n{}),,,(,|niCzrazzDiiiiL21=∈≤−=为复平面上以aii为圆心,以ri为半径的n阶矩阵A的n个Gerschgorin(格什戈林)圆盘.定理8(Gerschgorin圆盘定理)定理8(Gerschgorin圆盘定理)⑴设n阶矩阵A=(a),则A的每一个特征值必属n⑴设n阶矩阵A=(aij),则A的每一个特征值必属于下面某个圆盘之中).,,(niaranijjijiiiL211==≤−∑≠=λij≠或者说A的特征值都在n个圆盘的并集中.⑵如果A有个圆盘组成一个连通的并集S,且S⑵如果A有m个圆盘组成一个连通的并集S,且S与余下n-m个圆盘是分离的,则S内恰包含A的m个特特别地,如果A的一个圆盘Di是与其它圆盘分离征值.特别地,如果A的一个圆盘Di是与其它圆盘分离(即孤立圆盘),则Di中精确地包含A的一个特征值.这说明,A的每一个特征值必位于A的一个圆盘中,并且相应的特征值λ一定位于第k个圆盘中(其中k中,并且相应的特征值λ一定位于第k个圆盘中(其中k是对应特征向量x绝对值最大的分量的下标).21利用相似矩阵性质,有时可以获得A的特征值进一步的估计,即适当选取非奇异对角阵一步的估计,即适当选取非奇异对角阵111⎟⎟⎞⎜⎜⎛−−α,121⎟⎟⎟⎟⎜⎜⎜⎜=−DαO1⎟⎟⎠⎜⎜⎝−nα并做相似变换适当选取jijaADD−⎟⎟⎞⎜⎜⎛α1)21(niL=α并做相似变换.适当选取可使某些圆盘半径及连通性发生变化.nnijjADD×⎟⎟⎠⎜⎜⎝=α1),,2,1(niiL=α例估计矩阵的特征值范围,其中014⎟⎞⎜⎛例2估计矩阵A的特征值范围,其中.411101⎟⎟⎟⎠⎜⎜⎜⎝−=A411⎟⎠⎜⎝−解矩阵A的3个圆盘为.24:,2:,14:321≤+≤≤−λλλDDD).,,(niaranijiiiL21==≤−∑λ).,,(niaraijjijiii211≤∑≠=λ由定理,可知的个特征值位于个圆盘的并由定理8,可知A的3个特征值位于3个圆盘的并集中,由于D1是孤立圆盘,所以D1内恰好包含A的一集中,由于D1是孤立圆盘,所以D1内恰好包含A的一个特征值λ1(为实特征值),即53≤≤λ.531≤≤λ的其它两个特征值包含在的并集中A的其它两个特征值λ2,λ3包含在D2,D3的并集中.24现在取对角阵现在取对角阵0100011⎟⎟⎞⎜⎜⎛D,9.0000101⎟⎟⎠⎜⎜⎝=−D做相似变换014⎟⎞⎜⎛.490900191011⎟⎟⎟⎠⎜⎜⎜⎝−−==→−ADDAA49.09.0⎠⎝矩阵A1的3个圆盘为.8.14:,919:,14:321≤+≤≤−λλλEEE显然,3个圆盘都是孤立圆盘,所以,每一个圆盘都包含A的一个特征值(为实特征值),且有估计盘都包含A的一个特征值(为实特征值),且有估计⎪⎧≤≤,531λ⎪⎪⎪⎨⎧≤≤−,919919,21λ⎪⎪⎩−≤≤−.2.28.5993λ定义4设A∈Rn×n为对称矩阵,对于任一非零向量x,称,)(),()(xAxxR=),(xx为对应于向量x的瑞利(Rayleigh)商.为对应于向量的瑞利(yg)商定理9设A∈Rn×n为对称矩阵(其特征值次序记定理9设A∈Rn×n为对称矩阵(其特征值次序记为λ1≥λ2≥L≥λn),则1.(对任何非零x∈Rn);1λλ≤≤),(),(xxxAxn2.;),(),(maxxxxAxxRxn01≠∈=λx0≠3..),(),(minxxxAxxRxnn0≠∈=λx0≠28•1特征值性质及其估计•2幂法及反幂法2幂法及反幂法•3QR方法•3QR方法幂法与反幂法都是求实矩阵的特征值和特征向量幂法与反幂法都是求实矩阵的特征值和特征向量的向量迭代法,幂法是计算矩阵的主特征值(矩阵按模最大的特征值称为主特征值,其模就是该矩阵的谱半径)和相应特征向量的一种向量迭代法,反幂法则是计算非奇异可逆矩阵按模最小的特征反幂法则是计算非奇异(可逆)矩阵按模最小的特征值和相应特征向量的一种向量迭代法下面分别介值和相应特征向量的一种向量迭代法.下面分别介绍幂法与反幂法.一、幂法(又称乘幂法)设实矩阵A=(aij)有一个完全的特征向量组,即A有n个线性无关的特征向量,设矩阵A的特征值为A有n个线性无关的特征向量,设矩阵A的特征值为λ1,λ2,L,λn,相应的特征向量为x1,x2,L,xn.已知A的主特征值λ1是实根,且满足条件)12(||||||λλλ≥≥),,2,1(nixAxiiiL==λ)1.2(|,|||||21nλλλ≥≥L现讨论求λ1及x1的方法.),,2,1(nixAxiiiλ实例:实例:⎤⎡31A矩阵⎤⎡⎤⎡⎥⎦⎤⎢⎣⎡=,22A矩阵:⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡.23-111-4,:;它对应的特征向量为,特征值:⎦⎣⎦⎣,21机向量我们对矩阵乘以一个随⎥⎦⎤⎢⎣⎡−=55x假如:32⎦⎣5110531⎤⎡⎤⎡⎤⎡−⎤⎡,011001055223101⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡−⎥⎦⎤⎢⎣⎡==Axx,15.02020100102231022⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡==xAx617010311200223⎥⎤⎢⎡⎤⎡⎤⎡⎤⎡⎦⎣⎦⎣⎦⎣⎦⎣,7670607020102231033⎥⎥⎦⎢⎢⎣=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡==xAx,26252602507031044⎥⎤⎢⎡=⎥⎤⎢⎡=⎥⎤⎢⎡⎥⎤⎢⎡==xAx33,126260260602204⎥⎥⎦⎢⎢⎣⎥⎦⎢⎣⎥⎦⎢⎣⎥⎦⎢⎣xAx¾幂法是利用矩阵的高次幂乘上一个向量,它一般将随着幂次的增大而转化成特征向量。随着幂次的增大而转化成特征向量。¾幂迭代的动机是通过乘以一个矩阵来把向量朝主特征向量方向移动。征向量方向移动。34幂法的基本思想是:任取非零的初始向量v0由矩幂法的基本思想是:任取非零的初始向量v0,由矩阵A构造一向量序列{vk},201⎪⎪⎧===vAAvvAvv)2.2(......................,01