总第242期计算机与数字工程Vol.37No.122009年第12期Computer&DigitalEngineering151对数字图像处理中正交变换的研究*刘承承吴刚(第二炮兵指挥学院研究生3队武汉430012)摘要在数字图像处理中,正交变换因其独特的性质而广泛运用,它是信号处理中最重要的一类变换。介绍了正交变换的重要性质,讨论了在数字图像处理中采用正交变换的意义,重点研究了正交变换的标准基,并以DCT为例,利用MATLAB绘出了标准基图像。任意一副数字图像正交变换过后,得到的就是诸多标准基图像的权重,在变换域处理的就是这些标准基图像的权重。对数字图像处理中正交变换理论的学习和教学有很大帮助。关键词数字图像处理正交变换标准基图像中图分类号TP391.41ResearchonOrthogonalTransformationinDigitalImageProcessingLiuChengchengWuGang(PostgraduateTeam3,TheSecondArtilleryCommandCollege,Wuhan430012)AbstractIntheprogressofdigitalimageprocessing,becauseofitsspecialproperty,theorthogonaltransformationisusedextensively.Itisthemostimportanttransformationindigitalsignalprocessing.Theimportantpropertyoforthogonaltransformationhasbeenintroduced,andthemeaningofusingorthogonaltransformationindigitalimageprocessinghasbeendiscussed.Wepaidmoreattentiononstandardradix,anddisplayedthestandardradiximageoftheDCTwhichistakenasanexample.Theresultoforthogonaltransformationofeverydigitalimageisthesumofmanystandardradiximageswithcoefficient.Thisisveryusefulforstudyingandteachingorthogonaltransformation.Keywordsdigitalimageprocessing,orthogonaltransformation,standardradiximageClassNumberTP391.411引言正交变换是信号处理中最重要的一类变换。在数字图像处理中有两类主要方法,一个是在空间域处理的方法,一个是在变换域处理的方法。目前,在数字图像处理中,正交变换因其独特的性质广泛运用于图像特征提取、图像增强、图像复原、图像识别及图像编码等处理中。将一个实际的物理信号分解为有限或无限小的信号细胞是信号分析和处理中常用的方法[1]。这些细胞是具有特殊性质的已知物理信号。分析处理这些已知信号和它的权重或系数,就可以帮助我们了解信号在变换域中特殊的性质,提取有用的信息。这是对信号采取变换处理的普遍意义。另外,由于正交变换的标准基具有正交性,正交基是不相关的,对信号进行分解就有助于去除信号中的冗余(如时间冗余,空间冗余),也就是去除信号中的相关性。2正交变换的定义及分类2.1信号的正交分解完备的内积空间称为希尔伯特空间。折X为一希尔伯特空间,1,2,!,n是X空间中的一组向量,如果它们是线性独立的,则称之为空间X中的一组基。某一信号x就可以按这样的一组基向量作分解,即Nx=∀ann(1)n=1式中a1,a2,!,an是分解系数,它们是一组离散*收稿日期:2009年9月7日,修回日期:2009年9月30日作者简介:刘承承,男,硕士研究生,研究方向:模式识别与数字图像处理。吴刚,男,硕士研究生,研究方向:人工智能与数字图像处理。152刘承承等:对数字图像处理中正交变换的研究第37卷值。假设1,2,!,n是一组两两互相正交的向量,则式(1)称为x的正交展开,或正交分解。系数a1,a2,!,aN是x图1信号的正交分解在各个基向量上的投影[1],若N=3,其含义如图1所示。2.2正交变换的重要性质正交变换保证变换前后信号的能量不变。文献[1]中给出了说明,可以看到只有正交变换才满足Parseval定理。这个重要性质使得信号变换后没有能量上的变化,让我们使用正交变换变得可行。将原始信号经正交变换后得到的系数a1,a2,!,aN,能将原始信号的能量集中到少数几个系数上,减少信号中个分量的相关性,去除冗余。我们选择的基函数将决定去除冗余的程度和能量集中的程度。2.3正交变换的分类正交变换总的可分为两大类[3],即非正弦类正交变换和正弦类正交变换。我们经常使用的离散傅立叶变换(DFT)、离散余弦变换(DCT)、离散正弦变换(DST)等属于正弦类变换,其中还包括离散Hartley变换(DHT)及离散W变换(DWT)等。非正弦类变换包括Walsh#Hadamard变换(WHT)、Haar变换(HRT)等。由于正弦类变换在理论价值和应用价值上都优于非正弦类变换,从而在正交变换中占据主导地位[2]。除了正弦类和非正弦类正交变换,还有两种特殊的正交变换,KL变换和正交小波变换。KL变换去除信号中的相关性最彻底,且有着最佳的统计特性,被称为最佳变换。但是KL变换的基函数依赖与原始数据,没有固定的变换核,限制了它的普遍应用。小波变换能够具有很高的时频分辨率,进行局部化分析,通过伸缩平移运算对信号进行多尺度细化,达到高频处时间细分,低频处频率细分。但是小波正交基的结构复杂,具有紧支集的小波正交基不可能具有对称性。随着小波理论及算法的成熟,必将大有作为。3正交变换的标准基傅立叶变换是正交变换中最常用的变换,以它为例来讨论正交变换标准基具有普遍意义。3.1一维DFT的标准基首先从傅立叶级数进行考虑。假设函数f(t)满足收敛定理,则函数f(t)的傅立叶级数为a0∃+∀(ancosnt+bnsinnt)(2)2n=1a0,a1,b1,!是函数f(t)的傅立叶系数。例如,一矩形波f(t)是周期为2的周期函数,在[-,)上f(t)=-1-%t0(3)10%t由下式求得傅立叶系数,an=1&f(t)cosntdt-&n=1f(t)sinntdt(4)b-得到矩形波f(t)的傅立叶级数展开为:411f(t)=sint+sin3t+!+sin(2k+1)t+!32k+1(-∃t∃;t∋0,(,(2,!)(5)上面得到的展开式表明:矩形波是由一系列不同频率的正弦波乘以一个权值叠加而成。这些波的频率依次为基波频率的奇数倍。可以看到,求傅立叶系数的过程相当于傅立叶变换的过程,把原始信号展开,相当于傅立叶逆变换的过程。实际上,任意满足收敛的一个波、一个信号都可以分解成无穷多个不同频率的信号。这里说的这些无穷多的不同频率的信号就是标准基波。在DFT中也是类似的意思。假设有限长序列f(x)(x=0,1,!,N-1),一维DFT变换对如下:N-1F(u)=∀f(x)Wuxu=0,1,!,N-1(6)x=0N-1f(x)=1∀F(u)W-uxx=0,1,!,N-1(7)Nu=0其中W=e-j2N称为变换核。将式(6)写成矩阵形式F=W)f即:W0W0W0!W0F(0)f(0)F(1)=W0W1∗1W2∗1!W(N-1)∗1)f(1)(8)F(N-1)W0W1∗(N-1)W2∗(N-1)!W(N-1)∗(N-1)f(N-1)W是正交变换矩阵,矩阵元素是变换核函数以看出F(u)是角频率为2u/N信号的加权系数,不同次幂构成。W是正交矩阵,有W-1=WT。可也就是它在原始信号中分量的大小。如此诸多标第37卷(2009)第12期计算机与数字工程153准基波乘以其各自系数再求和得到了原始信号,这也就是离散傅立叶反变换。3.2二维DFT一幅数字图像可以用一个二维矩阵来表示,f(i,j)表示i行j列这个像素点的灰度值。数字图像处理主要是二维数据处理。假设f(x,y)(x=0,1,!,M-1;y=0,1,!,N-1)是一幅M∗N图像,则二维离散傅立叶变换为:M-1N-1uxvy-j2+F(u,v)=NN∀∀f(x,y)ex=0y=0u=0,1,!,M-1;v=0,1,!,N-1(9)逆变换为:1M-1N-1uxvy∀∀F(u,v)ej2+f(x,y)=NNMNu=0v=0x=0,1,!,M-1;y=0,1,!,N-1(10)其中,e-j2Nux+Nvy称为正交变换核。在二维DFT中同样可以将式(9)写成矩阵形式:F=W)f)WT(11)其中f是原始的二维矩阵,F是二维DFT系数矩阵,W是正交变换矩阵。从式(11)就可以得到逆变换的矩阵形式,两边左乘W-1,右乘W得:f=W-1)F)(WT)-1=W-1)F)W(12)因为整段数据或整幅图像的相关性小,相对冗余度低,所以如果对整段数据或整幅图像进行DFT,很难保证能量较大的系数处在相对集中的位置。这不符合我们正交变换的目的。为了消除对16∗16的小方块来做。一幅图像在空间上作周期性变化,则该周期的倒数称为空间频率。在图像中,空间频率的大小表征图像明暗变化的快慢,决定着图像的细节是否丰富[1]。灰度变化缓慢的区域频率低,而物体边缘或噪声对应高频。F(u,v)表示在对应(u,v)的频率点的标准基上的分量大小。这里的标准基类似一维DFT的标准基,一维DFT中标准基是特定频率的波,在二维DFT中每个标准基就应该是一幅图像,将在3.3节中详细描述标准基图像。考虑二维离散傅立叶逆变换,IDFT就是将原始图像表示成各个标准基图像的加权和。在图像压缩中常用的就是舍去能量小的标准基图像,只取主分量。以此来达到数据压缩的目的。这样压缩后的图像对视觉效果的影响一般不是很明显,略去的只是细节。但如果舍去的阈值设置过高,就会造成图像模糊。3.3正交变换的标准基图像由于DFT得到的变换矩阵元素是复数,matlab图像显示工具不能显示复数数值,所以选择了DCT为例来绘制标准基图像。如前面的讲述,取8∗8的小方块来进行二维DCT变换。假设F(u,v)对应的标准基图像是Nuv,它也是8∗8的二维矩阵。则有M-1N-1f(x,y)=∀∀F(u,v)Nu,v(13)u=0V=0整幅图像进行DFT带来的大能量系数不能集中的设G=WT,则式(11)变为:f=G)F)W。将问题,在实际应用中一般都将图像划分为8∗8或右边前两个矩阵乘积展开有:+G(1,:),F(:,1),+G(1,:),F(:,2),!+G(1,:),F(:,7),f(x,y)8∗8=+G(2,:),F(:,1),+G(2,:),F(:,2),!+G(2,:),F(:,7),)W8∗8(14)+G(7,:),F(:,1),+G(7,:),F(:,2),!+G(7,:),F(:,7),这里的+G(i,:),f(:,j),表示G的第i行与F将上式与式(13)比较可以发现,这里的F(i,的第j列所有元素对应相乘再求和。实际上就是j)就是在(i,j)位置对应频率上的分量,G(x0,j))矩阵相乘得到新矩阵中在(i,j)位置的元素。即:W(j,y0)就是F(i,j)对应的标准基图像Nij中(x0,8y0)位置的元素数值,即:+G(i,:),F(:,j),=n=∀1G(i,n))F(n,j)(15)Nij(x0,y0)=G(x0,i))W(j,y0)(17)再设T=WT)F,则f(X,Y)中任意位置其中i从1到8,j从1到8得到64个标准基图像(x0y0)的值有:的二维矩阵,每个矩阵中又有x0从1到8,y0从1f(x0,y0)=+T(x0,:),W(:,y0),到8得到8∗8个矩阵元素。8=∀T(x00)经过上面讨论,得到了标准基图像的表达式。,j))W(j