第8章图像压缩8.1基本概念8.2图像压缩模型8.3信息论基础8.4无损压缩8.5有损压缩8.6图像压缩标准8.7视频压缩标准8.5有损压缩概述牺牲图像复原的准确度以换取压缩能力的增加;如果产生的失真可以容忍,则压缩能力的增加是有效的;压缩率较大,有损压缩编码技术可达100:1压缩率,并且做到10:1~50:1之间,图像无本质区别(单色图像);8.5.1有损预测编码8.5.2变换编码8.5.1有损预测编码在各类编码方法中,预测编码是比较易于实现的,如微分(差分)脉冲编码调制(DPCM)方法。在这种方法中,每一个象素灰度值,用先前扫描过的象素灰度值去减,求出他们的差值,此差值称为预测误差,预测误差被量化和编码与传送。接收端再将此差值与预测值相加,重建原始图像象素信号。由于量化和传送的仅是误差信号,根据一般扫描图像信号在空间及时间邻域内个象素的相关性,预测误差分布更加集中,即熵值比原来图象小,可用较少的单位象素比特率进行编码,使得图象数据得以压缩。有损预测编码:直接对像素在图像空间进行操作,称为空域方法。与无损预测编码的不同之处在于:是否存在量化器。8.5有损压缩+-符号编码压缩图像enfnfn量化器预测器ne(,)fxy(,)gxyˆnnneff预测编码器量化器将预测误差映射成有限范围内的输出,确定了与有损预测编码相联系的压缩量和失真量。ne8.5.1有损预测编码符号编码压缩图像+-en输入图像fn量化器预测器fn++修正后的预测编码器nenfˆ(8.5.1)nnnfef++符号解码预测器解压缩图像压缩图像fn预测解码器nenfˆniifaf8.5.1有损预测编码3.预测编码/解码步骤:•编码步骤①压缩头处理②对每一个符号:,由前面的值,通过预测器,求出预测值③求出预测误差④对误差编码,作为压缩值。⑤重复②、③、④步•解码步骤①对头解压缩②对每一个预测误差的编码解码,得到预测误差。③由前面的值,得到预测值。④误差,与预测值相加,得到解码。⑤重复②、③、④步),(ˆyxfˆ(,)(,)(,)exyfxyfxy),(ˆyxf),(ˆyxf8.5.1有损预测编码(,)fxy(,)exy(,)exy(,)exy(,)fxy例8.16Delta调制1ˆ(8.5.2)nnff预测器量化器0(8.5.3)nnee其它1,6.5这里:颗粒噪声斜率过载缓变区快变区8.5.1有损预测编码失真对所有有损预测编码都是很普遍的。失真的严重性取决于所使用的量化和预测方法之间互相作用。一般,预测器和量化器在设计中独立进行的。预测器在设计中认为量化器没有误差。而量化器在设计中则需要最小化自身的误差。预测器•预测器基本思想:–选择最小化均方预测误差作为预测的最佳准则miininnnnnnnnnfafffefeftsffEeE122ˆ)2ˆˆ)1.}]ˆ{[}{min上述限制并不是必需的,但它们都极大地简化了分析,也减少了预测器的计算复杂性.基于上述条件的预测编码方法称为差值脉冲码调制法(DPCM)8.5.1有损预测编码最优准则是最小化均方预测误差,设量化误差可以忽略(),并用m个先前像素的线性组合进行预测nnee差值脉冲码调制法(DPCM)2211{}[](8.5.7)minnniEeEff8.5.1有损预测编码就是选择m个预测系数以使上式最小化,对上式每个系数求导并令其等于0,并设均值为0,方差为得到:nf21(8.5.8)Rr111212111212{}{}{}{}{}{}[{}{}{}][,]nnnnnnmnnnmnnmnmTnnnnnnmTmEffEffEffEffREffEffrEffEffEff——自相关系数阵可推导出,最优时,预测误差的方差为:2221{}(8.5.11)mTenniiirEff上述表达式形式简单,但要获得R,r所需的自相关计算需很困难。实际中逐幅图像计算预测系数的方法很少用,一般都假设1个简单的图像模型,并将其对应的自相关代入R,r,α表达式中以计算全局(所有图)系数。8.5.1有损预测编码例如:考虑1个具有可分离自相关函数的2-D马尔可夫信源:2{(,)(,)}(8.5.12)ijvhEfxyfxiyj其中是图像的水平和垂直相关系数。,hv用4阶线性预测器:12341ˆ(,)(,1)(1,1)1(1,)(1,1).miifxyfxyfxyfxyfxyst(以保证预测器的输出落在灰度级允许的范围内,并减少传输噪声)来预测;则最优系数为:12340hvvv,,,减小DPCM解码器对输入噪声的敏感性是很重要的,因为单个差错会传播到所有以后的输出。这样,解码器的输出会变得不稳定例8.17:预测技术的对比0.97(,1)ˆ(,)0.97(1,)fxyhvfxyfxy其它(1,)(1,1)(,1)(1,1)hfxyfxyvfxyfxyˆ(,)0.97(,1)fxyfxyˆ(,)0.5(,1)0.5(1,)fxyfxyfxy预测器3:预测器4:预测器2:最佳预测器:选择最小化均方预测误差为最佳准则水平梯度垂直梯度考虑对单色图像进行DPCM编码产生的预测误差假设量化误差为0,定义下列4个线性预测器,并使用其中1个:8.5.1有损预测编码预测器1:ˆ(,)0.75(,1)0.75(1,)0.5(1,1)fxyfxyfxyfxy例:预测技术的对比1阶3阶结论:随着预测器阶数的增加误差减少了2阶4阶ˆ(,)(,)(,)nnnexyfxyfxy8.5.1有损预测编码•量化器基本思想:–减少数据量的最简单的办法是将图像量化成较少的灰度级,通过减少图像的灰度级来实现图像的压缩。–这种量化是不可逆的,因而解码时图像有损失。t=q(s)是s的奇函数断点定义了函数的不连续性,被称为量化器的判决和重构级①阶梯量化函数量化器8.5.1有损预测编码1(,]iiiistssst映射——判别电平;——重构电平;内,②最优量化函数量化器的设计就是要在给定优化准则和输入概率密度函数p(s)的条件下选择最优的si和ti。优化准则可以是统计的或心理视觉的准则8.5.1有损预测编码如果用最小均方量化误差作为准则,且p(s)是个偶函数,2()iEst那么最小误差条件为:1()()0,1,2,,(8.5.20)2iisisLstpsdsi1001,2,,1(8.5.21)(8.5.22)222iiiiiiiittLsissttLi判定电平si是2个重构电平的中值q是一个奇函数的结果对于任意的L,满足上列公式的si和ti在均方误差意义下是最佳的;相应的量化器称为L层的Lloyd-Max(劳埃德·马克斯)量化器重建电平ti是给定判别区间内p(s)曲线下面积的重心Lloyd_Max量化器8.5.1有损预测编码1)要达到最小误差的条件有两个:a)每个决策级si正好落在两个相邻重构级ti、ti+1的中点。b)每个重构级ti落在两个相继决策级si区间的p(s)(概率密度函数)的质心上。1001,2,,1(8.5.21)(8.5.22)222iiiiiiiittLsissttLiinputs1s2=6S(L/2)-1outputstt1t2=4t(L/2)-t(L/2)S-[(L/2)-1]t=q(s)t3=82,2,10)()(1Lidssptsiissi2)以上两个条件构成一个方程组,必须通过迭代才能求解决策级si和重构级ti。3)对于任何满足两个最小误差条件有的L、si和ti,在均方误差意义上是最优的,相应的量化器被称为:L级Lloyd_Max量化器4)由于对于多数p(s),得到一个符合最优量化两个条件的解是困难的,因此这些解可通过数字来产生。单位方差的拉普拉斯概率密度函数的劳埃德-马克斯量化器(2、4、8级)这三个量化器分别给出1、2、3bit/pixel固定输出率。对于重建值方差的情况,用表中给的数据乘以它们的概率密度函数的标准差即可。表中步长111iiiiSStt8.5.1有损预测编码总结最优量化实际应用表明,2级量化器(例如:delta调制)所产生的由于斜率过载而造成的解码图中边缘模糊的程度比4级和8级量化器的程度要高具有步长θ的最优均匀量化器在具有相同输出可靠性的条件下能提供比固定长度编码的Lloyd-Max量化器更低的码率Lloyd-Max量化器和最优均匀量化器都不是自适应的,但如果根据图像局部性质调解量化值也能提供效率可以较细量化缓慢变化区域而较粗量化快速变化区域。这可同时减少颗粒噪声和斜率过载,且码率增加很少。这也会增加量化器的复杂性例8.18量化和重构的例子DPCM结果图像使用3阶预测器fx,y0.75fx,y10.75fx1,y0.5fx1,y12层Lloyd-Max量化器4层Lloyd-Max量化器8层Lloyd-Max量化器2层自适应量化器4层自适应量化器8层自适应量化器自适应量化方法:在4个可能的量化器中选择最好的一个标定过的DPCM结果图像例8.18量化和重构的例子表8.11给出了用预测器和量化器的不同组合对同一幅图像编码所得的均方根误差。图a到f中差异图像的rms误差注明了不同的预测器和量化器2层自适应量化器的均方误差与4层Lloyd-Max量化器相近4层自适应量化器的均方误差小于8层Lloyd-Max量化器图a图b图c图d图e图f8.5.2变换编码变换编码的基本原理是将原来在空域描述的图像信号,变换到另外一些正交空间中去,用变换系数来表示原始图像,并对变换系数进行编码。8.5有损压缩预测编码技术直接对象素在图像空间进行操作,故也称为空域方法。图像变换会使图象信号能量在空间重新分布,其中低频成分占据能量的绝大部分,而高频成分所占比重很小,根据统计编码的原理,能量分布集中,熵值最小,可实现平均码长最短。一般来说在变换域里描述要比在空域简单,因为图像的相关性明显下降。尽管变换本身并不带来数据压缩,但由于变换图像的能量大部分只集中于少数几个变换系数上,采用量化和熵编码则可以有效地压缩图像的编码比特率。基于图像变换的编码方法。称为频域方法用可逆的线性变换(如傅里叶变换)将图像映射成1组变换系数,然后将这些系数量化和编码大多数图像变换得到的系数值都很小,这些系数可以较粗地量化,或忽略不计虽然失真很小,信息仍然不能完全复原,所以还是有损压缩8.5有损压缩8.5.2变换编码子图分解图像变换量化编码变换编、解码系统模型:对每子图像的象素进行‘解相关’或‘用少量的系数’包含尽量多的信息’原则:‘粗量化’包含少量信息的系数通常使用‘变长编码’8.5.2变换编码①图像变换8.5.2变换编码•图像变换通常是一种二维正交变换。一般要求:1.正交变换必须是可逆的;2.正变换和反变换的算法不能太复杂;3.正交变换的特点是在变换域中图像能量将集中分布在低频率成分上,边缘、线状信息反映在高频率成分上,有利于图像处理•因此正交变换广泛应用在图像增强、图像恢复、特征提取、图像压缩编码和形状分析等方面•常用的变换编码所使用的正交变换有离散傅立叶变换(DFT)、离散余弦变换(DCT)和沃尔什-哈达马变换(WHT)。变换后图象能量更加集中,在量化和编码时,结合人类视觉心理因素等,采用“区域取样”或“阈值取样”等方法,保留变换系数中幅值较大的元素,进行量化编码,而大多数幅值小或某些特定区域的变换系数将全部当作零处理。变换选择111100001211(,)(,)(,,,)(8.5.24)(