上页下页第8章矩阵特征值计算•8.1特征值性质和估计•8.2幂法及反幂法•8.3正交变化与矩阵分解•8.4QR方法上页下页8.1特征值性质和估计工程技术中有多种振动问题,如桥梁或建筑物的振动,机械零件、飞机机翼的振动,及一些稳定性分析和相关分析在数学上都可转化为求矩阵特征值与特征向量的问题.下面先复习一些矩阵的特征值和特征向量的基础知识及性质.上页下页8.1.1特征值问题及性质求A的特征值问题(1.1)等价于求A的特征方程设矩阵ARn×n,特征值问题是求C和非零向量xRn,使()det()0(1.2)pIA的根.在5.1.3节已经给出特征值的一些性质,下面再补充一些基本性质.Ax=x(1.1)其中是矩阵A的特征值,x是矩阵A属于特征值的特征向量.本章讨论计算矩阵特征值的数值方法,在科学和工程技术中很多问题在数学上都归结为求矩阵的特征值问题.上页下页定理1设为A∈Rn×n的特征值,且Ax=x,x0,则有(2)-为A-I的特征值,即(A-I)x=(-)x;(1)c为的cA特征值(c0为常数);(3)k为Ak的特征值,即Akx=kx;(4)设A为非奇异矩阵,那么0,且-1为A-1的特征值,即A-1x=-1x.上页下页定理2(1)设矩阵A∈Rn×n可对角化,即存在非奇异矩阵P使的充分必要条件是A具有n个线性无关的特征向量.(2)如果矩阵A∈Rn×n有m个(m≤n)不同的特征值1,2,,m,则对应的特征向量x1,x2,,xm线性无关.121,nPAP上页下页定理3(对称矩阵的正交约化)设A∈Rn×n为对称矩阵,则(3)存在一个正交矩阵P使的且1,2,,n为A的特征值,而P=(u1,u2,,un)的列向量uj为A的对应于j的单位特征向量.12,TnPAP(1)A的特征值均为实数;(2)A有n个线性无关的特征向量;上页下页定义设A∈Rn×n为对称矩阵,对于任一非零向量x0,称,),(),()(xxxAxxR为对应于向量x的瑞利(Rayleigh)商.定理4设A∈Rn×n为对称矩阵(其特征值依次记为12n),则(1).(对任何非零x∈Rn);1(,)(,)nAxxxx(2).;(1.3)10(,)max(,)nxRxAxxxx0(,)min.(,)nnxRxAxxxx上页下页证明只证(1),关于(2)自己作练习.由于A为实对称矩阵,可将1,2,,n对应的特征向量x1,x2,,xn正交规范化,则有(xi,xj)=δij,设x0为Rn中任一向量,则有.0,1221niiniiixxx于是.),(),(11212niiniiinxxxAx从而(1)成立.结论(1)说明瑞利商必位于n和1之间.上页下页8.1.2特征值估计与扰动定义1设n阶矩阵A=(aij),令).,,(niarnijjiji211(1);(2)集合称为复平面上以aii为圆心,以ri为半径的n阶矩阵A的n个格什戈林(Gerschgorin)圆盘.|,(1,2,,)iiiiDzzarzCin上页下页定理5(Gerschgorin圆盘定理)特别地,如果A的一个圆盘Di是与其它圆盘分离(即孤立圆盘),则Di中精确地包含A的一个特征值.1(1,2,.).(1.4)niiiijjjiarain(1)设n阶矩阵A=(aij),则A的每一个特征值必属于下面某个圆盘之中(2)如果A有m个圆盘组成一个连通的并集S,且S与余下n-m个圆盘是分离的,则S内恰包含A的m个特征值.或者说A的特征值都在n个圆盘的并集中.上页下页证明只就(1)给出证明.设为A的特征值,即.1knkjjkjkkraaAx=x,其中x=(x1,x2,,xn)T0.或记,考虑Ax=x的第k个方程,即0max1xxxinik,1knjjkjxxa,)(kjjkjkkkxaxa于是即,kjkjkkjjkjkkkaxxaxa上页下页这说明,A的每一个特征值必位于A的一个圆盘中,并且相应的特征值一定位于第k个圆盘中(其中k是对应特征向量x绝对值最大的分量的下标).利用相似矩阵性质,有时可以获得A的特征值进一步的估计,即适当选取非奇异对角阵,112111nD并做相似变换.适当选取可使某些圆盘半径及连通性发生变化.nnijijaADD1),,2,1(nii上页下页.411101014A例1估计矩阵A的特征值范围,其中解矩阵A的3个圆盘为.24:,2:,14:321DDD由定理8,可知A的3个特征值位于3个圆盘的并集中,由于D1是孤立圆盘,所以D1内恰好包含A的一个特征值1(为实特征值),即.531A的其它两个特征值2,3包含在D2,D3的并集中.上页下页现在取对角阵,9.0000100011D做相似变换.49.09.00101491011ADDAA矩阵A1的3个圆盘为.8.14:,919:,14:321EEE上页下页显然,3个圆盘都是孤立圆盘,所以,每一个圆盘都包含A的一个特征值(为实特征值),且有估计.2.28.5,919919,53321上页下页定理6(Bauer-Fike定理)设是A+I∈Rn×n的一个特征值,且P-1AP=D=diag(1,2,,n),则有1()min,(1.5)pppAPPI其中||·||p为矩阵的p范数,p=1,2,.证明由于σ(A)时显然成立,故只考虑̄σ(A).这时D-I非奇异,设x是A+I对应于的特征向量,由(A+I-I)x=0左乘P-1可得111()()()(),DIPxPIPPx1111()()(),PxDIPIPPx而对角矩阵(D-I)-1的范数为1()1(),min,pADImm所以有1.pppPIPm这就得到(1.5)式.这时总有σ(A)中的一个取到m值.上页下页由定理6可知||P-1||||P||=cond(P)是特征值扰动的放大系数,但将A对角化的相似变化矩阵不是唯一的,所以取cond(P)的下确界112()inf()(,,,),(1.6)nAcondPPAPdiag称为特征值问题的条件数.只要v(A)不很大,矩阵微小扰动只带来特征值的微小扰动.但是v(A)难以计算,有时只对一个P,用cond(P)代替v(A).特征值问题的条件数和解线性方程组时的矩阵是两个不同的概念,对于一个矩阵A,两者可能一大一小,例如二阶矩阵A=diag(1,10-10),有v(A)=1,但解线性方程组的矩阵条件数cond(A)=1010.上页下页关于计算矩阵A的特征值问题,当n=2,3时,我们还可按行列式展开的办法求特征方程p()=0的根.但当n较大时,如果按展开行列式的办法,首先求出p()的系数,再求p()的根,工作量就非常大,用这种办法求矩阵特征值是不切实际的,由此需要研究A的特征值及特征向量的数值方法.本章将介绍一些计算机上常用的两类方法,一类是幂法及反幂法(迭代法),另一类是正交相似变化的方法(变化法).上页下页8.2幂法及反幂法幂法与反幂法都是求实矩阵的特征值和特征向量的向量迭代法,所不同的是幂法是计算矩阵的主特征值(矩阵按模最大的特征值称为主特征值,其模就是该矩阵的谱半径)和相应特征向量的一种向量迭代法,特别适用于大型稀疏矩阵.而反幂法则是计算非奇异(可逆)矩阵按模最小的特征值和相应特征向量的一种向量迭代法,特别是计算海森伯格阵或三对角阵的对应一个给定近似特征值的特征向量的有效方法之一.下面分别介绍幂法与反幂法.上页下页8.2.1幂法(又称乘幂法)现讨论求1及x1的方法.),,2,1(nixAxiii设实矩阵A=(aij)有一个完全的特征向量组,即A有n个线性无关的特征向量,设矩阵A的特征值为1,2,,n,相应的特征向量为x1,x2,,xn.已知A的主特征值1是实根,且满足条件)1.2(|,|||||21n上页下页)3.2(),0(122110axaxaxavnn设幂法的基本思想是:任取非零的初始向量v0,由矩阵A构造一向量序列{vk}称为迭代向量,由假设,v0可唯一表示为)2.2(.........................,......................,,011021201vAAvvvAAvvAvvkkk上页下页)3.2(),0(122110axaxaxavnn设于是).()/(1112111122211101kkniikiiknknnkkkkkxaxaxaxaxaxavAAvv其中.)/(21niikiikxa由假设故从而),,,3,2(1/1nii,0limkk)4.2(.lim111xavkkk为1的特征向量.上页下页所以当k充分大时,有)5.2(,111xavkk即为矩阵A的对应特征值1的一个近似特征向量.用(vk)i表示vk的第i个分量,则当k充分大时,有)7.2(.11ikikvv即为A的主特征值1的近似值.)6.2(,111111kkkkvxaAvv由于这种由已知非零向量v0及矩阵A的乘幂Ak构造向量序列{vk}以计算A的主特征值1(利用(2.7)式)及相应特征向量(利用(2.5)式)的方法就称为(乘)幂法.上页下页迭代公式实质上是由矩阵A的乘幂Ak与非零向量v0相乘来构造向量序列{vk}={Akv0},从而计算主特征值1及其对应的特征向量,这就是幂法的思想.).(11kvvikik的收敛速度由比值,12r来确定,r越小收敛越快,但当r1时收敛可能很慢.总结上述讨论,有下面的定理.上页下页定理7设A∈Rn×n有n个线性无关的特征向量,主特征值1满足|1||2||n|,则对任何非零向量v0(a10),(2.4)式和(2.7)式成立.又设A有n个线性无关的特征向量,1对应的r个线性无关的特征向量为x1,x2,,xr,则由(2.2)式有如果A的主特征值为实的重根,即1=2==r,且|r||r+1||n|,,)/(11110nriikiiriiikkkxaxavAv上页下页).0(lim111riiiriiikkkxaxav设为1的特征向量,这说明当A的主特征值是实的重根时,定理7的结论还是正确的.应用幂法计算A的主特征值1及其对应的特征向量时,如果|1|1(或|1|1),迭代向量vk的各个不等于零的分量将随k→而趋向于无穷(或趋向于零),这样在计算机实现时就可能“溢出”.为克服这个缺点,就需要将迭代向量加以规范化.上页下页设有一向量v0,将其规范化得向量为其中max(v)表示v的绝对值最大的分量.即如果有,)max(vvu,max1iniqvv则max(v)=vq,且q为所有绝对值最大的分量中的最小下标.在定理7的条件下幂法可这样进行:任取一初始向量v00(a10),构造规范化向量序列为上页下页.)max()max(,)max(............)max()max(,)max()max()max(,0001010202222