离散余弦变换DCT介绍离散余弦变换(DCT)是一种基础的变化,是实数函数和实数函数变换到正交余弦域的基础。DCT的正式定义为:还有其他在不同基向量下定义的DCT变换。上面的定义是在一维单变量条件下。通常使用的二维DCT的基向量定义如下:定理1nN,在的N矢量形成一个为RN正交基。证明回忆下列余弦公式:证明用到如下等式:用余弦身份(1)和局部几何系列证明公式(1.1)是正确的,埃尔南德斯和韦斯证明了(1.1)。以下我们证明基向量是正交的:(i)和的规则是一样的(ii)正交与(iii)正交与第(i)部分利用余弦如下标识(2):的模为1:这样,=1+0=1余弦项是评估让K=2l,l取1,...,N-1和适用公式1.1。有规范1:第(二)由公式1.1:为了证明为正交的对照,这只是必要表明,是一个常数,方程1.1决定,上述是真实的。第(三)部分能被余弦定义(3)和公式1.1证明。我们必须证明出是正交于,k不等于l且通过认证(3)第二行可以使用公式1.1由于L+K和ll-kl必须介于1和N-1之间鉴于这个条件,K如前所述。有了这三个条件满足,证明已完成。现在我们有一个标准正交基,这组基有如下特征:(1)的IDCT(反变换公式):(2)Parseval关系:如果C是DCT变换,然后z,w=CZ,CW。(3)Plancheral关系:如果C是DCT变换,则DCT的优势与劣势DCT变换的优点和缺点离散余弦变换类似于傅里叶信号变换,它将把信号从空间和时间领域变换到频领域,就好像在准备去压缩一幅图像。正如傅里叶变换可以利用FFT用很少的数量计算来完成,离散余弦变换所用到的复杂计算也会减少很多。有种方法被称为快速余弦变换,或者叫FCT,当N=2q时它可以被使用,这里N是一个需要变换的向量数值,q是一个整数元素,这样复杂性就会降低很多,就像用快速余弦变换,从N2计算到很多Nlog2N的计算。傅里叶变换其实就是离散余弦变换的基础。变换的过程是这样的:假设一个一般的F(m)是一个需要被转换的函数。让m=0,1…N-1。所有的m都在这个范围里面,让Xm=F[(2m+1)/2N],由于周期性的基础函数,扩展m的值到[-N,N-1]。X(-m)=Xm-1,这里m=0,1…,N。现在考虑经过一个类似过程的特殊的函数f,除了下面这种情况:XL=f(e-2πik1/(2N)),这里L在[-N,N-1]。f的离散傅里叶变换就如以下所示:这里离散傅里叶变换yk`s跟1/2*(eπi/(2N))倍的对应的离散余弦函数是平等的。如果快速傅里叶变换用来获取yk`s,上述的复杂性就会减少很多。这个过程就是快速余弦变换。对于应用目使用DCT有多种优势相对快速傅立叶变换。DCT第一个主要优点是它的效率。由于图像的大小要生产的增加,在FFT变成在一个日益复杂得多的迅速增长,并且不减小效率。相反,在转换到频域,一类DCT叫做块DCT被使用,它用更有效的方式执行相同的任务。变换为整个应用于nxn的阵列,大小通常在图像压缩中的8X8。然而,计算一分块DCT实际上并不需要手动图像分离如FFT,但是这是DCT的一种内在功能。实际DFT必须在预算每个单独块并且计算复杂度没有降低N2计算结果仍然需要。但相反,因为DCT可以根据面积划分的,行可以被分解成长度为n,DCT可应用于这些领域。然而,列块的DCT破坏了系统的不变性,因为列块频率不能承担了实现到傅立叶(或频率)域图像频率简单关系。因此,从任何线性比例因子时域不会携带到频域多使用,因为如果阻塞线性不再保留。这是一个值得注意的问题,因为某些高频成分往往是在抑制量化步长(即将进一步讨论),乘以一个比例系数,以提高他们的表达是无益的,因为没有举行的因素是整个过程中不断。DCT的另一个优点是,它的基础上组成的向量是完全实数部分。因此,在图像压缩方面,所有的像素值都用实数表示。此外,像素本身不相互影响。在傅立叶分析,缺点之一是,每一个像素会影响其他的,但如果是用DCT的DFT的,而是来的像素值直接从变换的时域值。上述步骤的量化是图像的压缩过程的一部分,和发生后的图像是由DCT压缩准备。在量子化,代表一个转化数量值的数量减少了,因此也降低了位代表金额以电子。有几种方法来进行减少的数据。一种方法是简单的四舍五入:实数变成整数。一更具体的量化第一个“砝码“上作出的贡献为基础的价值形象,乘以加权系数它之前四舍五入。第三种方法消除了频率,至少准确地代表一个像素值。例如,往往是最高的频率将被淘汰,由于其体积小,小信号能量的贡献,如在案件,低通滤波量化对于有些应用中,是一个预定义的量化矩阵,基本上因素给出了图像像素的权重。DCT的应用数学领域之外的大多数人可能从来没有听说过离散余弦变换(DCT),但大多数计算机用户经常间接性地用到离散余弦变换。甚至为那些不热衷于JPEG图像文件和MPEG视频文件的技术爱好者所熟悉。包含图片的网页用JEPG格式压缩时间只有不压缩时间的10%。MPEG压缩格式在家庭观看时允许单个包含完整长度的DVD电影,比VHS(家用录像系统)能提供更高的画面质量。这两种压缩算法在DCT上用不同频率分离。下面我们将以DTC在现实中的应用为例来讨论JPEG压缩的基本过程。在普通背景下,JEPG图像压缩依靠把图像分成一个个8*8像素的小块来传输,明白这些非常重要。这个标准在JPEG的发展阶段因为两个主要的原因被采纳。首先,较大块的处理被计算机执行比较缓慢。其次,专家们观察到利用大块并没有产生明显更大的压缩。在这一点上,我们已经讨论了一维DCT变换,但是对于图像压缩中的应用,我们将使用二维DCT。二维DCT可以很容易地从一维DCT计算出来,计算公式如下:其中u是包含在区间[0,n-1],V是包含在[0,m-1]。数学家在一般情况下使用的时候,DCT是表达了上述公式。然而,在计算机程序中使用时,它建立的DCT矩阵进行转换更有效。事实上,电脑可以通过1/8的DCT计算和1/4的数量增加来。给出的DCT矩阵为:结论总之,离散余弦变换提供了一个数学和空间数据计算方法,到不同区域划分它的重要性关于视觉质量,并准确和全面的高品质压缩,DCT的傅里叶变换的性质很多,如正交性和相应的关系,遵循Parseval's和Plancheral关系规则。它的逆变换IDCT,允许一帧图像重建,已编码的DCT变换,因此转换回时域。尽管它与傅立叶变换相似,但是已证明DCT申请用途是更为实际和有效的,它通常是图像压缩的JPEG和MPEG文件的灵魂。参考书目埃尔南德斯,欧金尼奥和Guido魏斯。关于小波课程。博卡拉顿,佛罗里达州:CRC出版社,1996。第20-30,432-442页。林,埃德蒙Y.和约瑟夫W·古德曼。“离散余弦变换域对散焦图像复原。“应用光学。37,6213-6218(1998)。米切尔,琼湖和威廉B彭纳贝克。MPEG视频压缩标准。纽约,纽约:查普曼和霍尔,1997。第33-49页。纳尔逊,马克和Jean-Loup的凯丽。数据压缩书。纽约NY:图书,1996。326-344页。沃森,安德鲁。“图像压缩技术,离散余弦变换。“美国航空航天局艾姆斯研究中心。Wickerhouser,姆拉登胜利者。改编自小波理论分析软件。纽约:支AK彼得斯有限公司,1994。83-101页。