DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.WoodsChapter8图像压缩DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.WoodsChapter8图像压缩图像压缩探讨减少表示数字图像所需之数据量的问题。减数据量的基本原则是移去冗余的数据。以数学的观点,这等于是一个2维像素数组转换成统计上不相关的数据集。图像的储存或传输前都要先转换。之后,压缩图像就被解压缩以重建原始图像或它的近似。在本章中我们将讨论图像压缩处理的理论与实现。8.1到8.3节构成基础的介绍,而此基础整合起来就形成此领域的理论。8.4到8.6节讨论图像压缩的实际面。DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods8.1背景基础数据压缩(datacompression)这术语是指降低表示一个所给信息量所需之数据量的一种处理。我们必须弄清楚数据(data)与信息(information)的区别。其实数据是传递信息的载体,同样的信息量可能可以用各种不同的数据量来代表。例如,一个喜欢喋喋不休的人与另一个总是简短扼要讲话的人来讲同样的故事。这些数据(或言语)不是提供一些无关紧要的信息就是重述一些早已知道的东西。因此说它含有数据冗余性(dataredundancy)DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods8.1背景基础信息与图像的关系!DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods数据冗余性是数学上可定量描述的实体。如果用与代表用来表示同一个信息之两组数据的信息载体单位个数,则第一组数据集合(用字母表示者)的相对数据冗余性(relativedataredundancy)可定义成(8.1-1)其中通常称为压缩率(compressionratio)(8.1-2)RDCR11RC1n2n1nDR21nnCRDigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.WoodsDigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods在数字图像压缩中,有三种基本的数据冗余性可以被确认与利用:编码(coding)冗余性、像素间(interpixel)冗余性及心理视觉(psychovisual)冗余性。当减少或消除这些冗余性的一种或多种时,就可达成数据压缩的效果。DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods8.1.1编码冗余性与第三章一样,让我们再次假设在区间[0,1]中的离散随机变数代表一图像的灰阶,且每个出现的机率为(8.1-3)式中L为灰阶数,为第k个灰阶在图像中出现的次数,而n为图像中像素的总数。如果用来表示每个值的位数是,则表示每一个像素所需的平均位数为(8.1-4)krkr)(krrp1,,2,1,0)(Lknnrpkkrknkr)(krl)()(10krLkkavgrprlLDigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods也就是说,指定给各种不同灰阶之码字的平均码长是代表每一个灰阶的位数与该灰阶出现之机率乘积的和。因此,对一个图像编码所需要的总位数为。用m位的自然二进码来代表图像的灰阶(常数),代入(8.1-4)可得式右边简化为m位。NMavgMNLDigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woodskr范例8.1可变长度编码的一个简单例证一幅八阶图像有表8.1中所示的灰阶分布。如果用三位的自然二进码(code1)来表示八种可能的灰阶,则因为对所有的都有,所以是3位。不过如果用表8.1中的code2,则对该图像编码所需要的平均位数就降为3)(1krlavgLDigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods099.011.11111.17.237.2)02.0(6)03.0(6)06.0(5)08.0(4)16.0(3)21.0(2)25.0(2)19.0(2)()(702DRkrkkavgRCrprlL位元DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods图8.1说明应用code2能达到数据压缩的道理。图中同时显示了图像的直方图与。因为这两函数成反比,故code2中的最短码字被分配给图像中最常出现的灰阶。)(2krlDigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods在上面的例子中,对出现机率较大的灰阶比出现机率较小者分配以较少的位数,达到了数据压缩的目的。这个过程常称为可变长度编码(variable-lengthcoding)编码冗余是基于图像灰度级出现的可能性。DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods8.1.2像素间冗余性考虑图8.2中所示的图像。因为这些图像中的灰阶值不是等机率分布,故用可变长度编码可以从像素的直接或自然二进制码中降低编码冗余性。不过编码过程并不改变图像内各像素间的相关程度。换言之,用来代表每一图像灰阶值的码并未涉及到像素之间的相关性。这些相关性来自图像中各物体间的结构或几何关系。8.2(e)与(f)分别显示每一幅图像沿一列所计算出来的自相关系数(autocorrelationcoefficient)。DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods这些相关系数是用(4.6-30)式的正规化版本所计算出的:(8.1-5)式中(8.1-6))0()()(AnAnnNynyxfyxfnNnA10),(),(1)(DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods(1)45和90个样本分开的像素之间的高度相关;(2)当n=1时,高的相关性DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods这些图例反映了数据冗余性的另一个重要形式-与图像内像素间一种冗余性。由于任一已知像素的灰阶值都可以从其近邻的值合理的预测出,所以各别像素所携带的信息量相当小。为了减少图像中的像素间冗余性,一般用于人类视觉和理解的二维像素数组必须转换成更有效(但通常是非视觉)的形式(如相邻像素之间的差异用来描绘图像)。此种类型的转换称为映射(mapping)。如果原始图像元素可以从经转换的数据集合重建就称为可逆的映射(reversiblemapping)DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods8.1.3心理视觉冗余性在正常的视觉处理中,某些信息比起其他信息相对不那么重要,则我们称此信息是心理视觉冗余的(psychovisuallyredundant)。它可以被消除而使图像质量感受无明显损伤。心理视觉冗余性不像编码和像素间冗余,而与真实的或可定量的视觉信息有关。只有当信息本身对一般视觉处理并不重要时才可以被删去。因为心理视觉冗余数据被删去造成定量信息的损失,所以通常称之为量化(quantization)。因为它是一个非可逆的运算,故量化导致有失真的数据压缩。DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods范例8.3:量化压缩考虑图8.4(a)显示一幅有256可能灰阶的黑白图像(b)显示经过4位或16种可能灰度级后的结果,注意在本来平滑区域中出现假轮廓(利用人眼对灰度不敏感压缩)。(c)所得的压缩率为2:1。说明利用人类视觉系统特性的量化使图像有很大改善的可能。用来产生此种结果的方法称为改进灰阶(IGS,improvedgray-scale)量化。DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods这个方法认为人类眼睛对边缘有特有的灵敏度,因此对每一个像素加上一个虚拟随机数以打散这些边缘,其中虚拟随机数是由量化以前之相邻像素的低位产生。因为低位数相当随机,这就相当于对伴随于假轮廓的人造边缘加上一定量的随机性。表8.2说明这个方法。一个总和起初设定为零,接着从目前的8位灰阶值与前一个产生总和的最低4位相加形成总和。不过如果目前像素值最高四位为1111,则用0000代替去相加。所得总和的最高4位作为编码的像素灰阶值。DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.WoodsDigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods重点DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods8.1.4保真度准则正如在前面所谈到的,心理视觉冗余数据的移除会导致真实的或可定量之视觉信息的损失。因为感兴趣的信息可能丢失,所以很需要有一个可重复或再现的方法以衡量信息丢失的特性与程度。这种评估的基本准则通常有两大类:(1)客观保真度准则(objectivefidelitycriterion)(2)主观保真度准则(subjectivefidelitycriterion)当信息损失的程度可以表示成原始的或输入图像与经过压缩及解压缩的输出图像的函数时,就说这是根据客观的保真度准则(objectivefidelitycriterion)DigitalImageProcessing,2nded.©2002R.C.Gonzalez&R.E.Woods输入与输出图像之间的均方根(rms)误差就是个好例子。假设代表输入图像,对输入图像经过压缩与解压缩所得的图像代表