浅谈测量平差中的总体最小二乘法【摘要】本文主要讨论了总体最小二乘法的基本原理,常见的奇异值分解解算方法以及基于此方法的数值算法。【关键词】最小二乘;总体最小二乘;奇异值分解;TLS算法张衍林,男,研究方向为建筑工程管理。最小二乘法是测量平差中最为经典的数据处理方法,其总是认为测量误差只是包含在观测向量当中,而系数矩阵是不包含任何误差的常系数矩阵。这个默认的假设不符合实际情况,由于模型误差、测量误差以及人为误差等等情况造成系数矩阵也包含有误差,这便是统计学中常说的EVI模型。TLS基本原理在19世纪就已经提出[1,2],但直到20世纪70年代末80年代初才由G.Golub和C.VanLoan将其命名为totalleastsquares(TLS),即总体最小二乘法[3,4],这便开始了TLS问题在数字分析领域的发展。最近几年TLS在测量数据处理中得到了快速的发展,可参看文献[5,6]。介于此,本文分析了总体最小二乘问题的基本原理以及解算方法以及对应的算法。1.总体最小二乘基本原理总体最小二乘是经典最小二乘在考虑系数矩阵受误差因素影响条件下的一种自然扩展。经典最小二乘就是利用m个观测值在误差平方和最小原则下求取n个参数和m个观测值本身的最可靠值。如下:Ax=bA是m×n维不受误差影响的系数矩阵,b是m×1维受到误差影响的观测矢量,根据如下准则来求取x的最可靠值,b-b’=min·指的是欧式空间距离,b’是b的最佳估计值。通常将方程(2)转换成其相容方程(3):AAx=Ab此时如果A为满秩矩阵(R(A)=n)便可解得x的唯一最佳可靠值,即:=(AA)Ab。这便是最经典的最小二乘理论。要获得解唯一解,经典LS作了如下的假设:方程(1)是线性方程;仅观测量b含有误差;观测量之间相互独立并且是等精度观测;误差服从标准正态分布以及前面提及A必须是满秩矩阵。如果观测量之间不是等精度观测,则必须在方程(2)中加入观测权,则变为:P(b-b’)=min,此时P=diag(p,…….p)的对角矩阵。同时如果A不是满秩矩阵,则方程(3)就不能直接求逆,必须用矩阵的广义逆求解,得:x=(APA)APb(APA)为带权最小二乘最小范数逆。如果n=1则是经典的单变量问题,更常见的情况是n1的情况。以下的总体最小二乘法就只考虑当n1的情况。根据[2][3][4]可以将总体最小二乘问题定义如下:(A+E)x=b+r如果b+r在A+E的列矢量空间范围内(即,(b+r)∈R(A+E)),有如下准则存在根据准则(6)求得[;],则任何x都满足x=,这便是方程的TLS解,用x表示。E和r分别代表矩阵A和观测量b的误差,·表示Frobenius范数准则。2.总体最小二乘的解算方法总体最小二乘法最常见的解算方法为奇异值分解法(singularvaluedecompositionSVD),详细内容可参考。设C=[A,b],△=[E,r]则公式(5)可改写为:(C+△)x’-1=0x’表示最佳估计值。对C做奇异值分解C=U∧V∧=diag(σ,...,σ)U=[u,...,u]∧V=[v,...,v],U和V分别是m和n+1列的正交矩阵,u∈R和v∈R,σ≥σ≥…≥σ≥σ≥0是C的奇异值,这便是奇异值分解。在方程(7)中如果(C+△)的秩为n+1或σ≠0,则(7)不是(8)的相容方程,也就是说方程(7)没有非零解。要使(7)有非零解,(C+△)的秩就必须小于n+1,即是rank(C+△)n+1。根据Eckart-Young-Mirsky矩阵近似理论,给出rank(C)=r时对C∈R进行SVD分解以后的C=σuv。如果rank(C)=p<r,且C=σuv,则C-C=根据此理论,C的最佳逼近值C’取得的情况即是当p=n时,即是将C降秩为n的情况,[A’,b’]=C’=U∧’V=diag(σ,...,σ,0)σ=[A,b]-[A’,b’]=△=E,r因此,[A,b]-[A’,b’]=[△A’,△b’]=σuv所以[A’,b’]x’-1=0就变成原方程的相容方程,并且解的结果只与v有关,即V的最后一列。并且解的结果x’-1必与v平行,由于解的最后一个元素为负,所以在v中所有元素都除以-v得到整体最小二乘解(用x替换x’):x-1=-最后得到x的唯一最小二乘解,x=-[v,......,v]3.算法分析根据前面计算方法,现给原始最小二乘的算法Algorithm1:第一步,首先给定系数矩阵A∈R和观测量b∈R;第二步,对矩阵C=[A,b]进行SVD分解,C=U∧V;第三步,判断V的最后一个元素v是否等于零,如果等于零则计算退出程序,并输出方程无解;如果不等于零,则计算x=-1v[v,......,v]并输出最小二乘解的结果。4.结论文中讨论了TLS方法的基本原理,基于奇异值分解的解算方法和算法。通过这些分析我们会发现TLS方法模型理论更加严密,理论上数据处理精度更高。但是由于考虑了系数矩阵的误差,TLS解算的稳定性不如LS方法好。除此讨论的经典TLS方法外还有很多TLS的扩展模型,比如当模型无解或是有无穷解的情况以及考虑A的特殊结构的结构总体最小二乘问题等等。【参考文献】[1]R.Adcock.Noteonthemethodofleastsquares.TheAnalyst,4,1877,183-184.[2]R.Adcock,J.AProblemInTheLeastSquares.TheAnalyst5,1878,53-54.[3]G.GolubandC.VanLoan.Totalleastsquares,inSmoothingTechniquesforCurveEstimation,T.GasserandM.Rosenblatt,eds.Springer-Verlag,NewYork,1979,69-76.[4]G.GolubandC.VanLoan.Ananalysisofthetotalleastsquaresproblem.SIAMJ.Numer.Anal.1980,883-893.[5]陈义,陆珏,郑波.总体最小二乘方法在空间后方交会中的应用[J].大地测量与地球动力学,2008,28(12).[6]鲁铁定,陶本藻,周世健等.基于整体最小二乘法的线性回归建模和解法[J].武汉大学学报(信息科学版),2008,33(5).[7]Golub,G.H.Somemodifiedmatrixeigenvalueproblems.SIAMRev.15,1973,318-334.