第7章图像的编码和压缩ImageCodingandCompression图像压缩(ImageCompression)的概念数据压缩的研究内容包括数据的表示、传输、变换和编码方法,目的是减少存储数据所需的空间和传输所用的时间。图像压缩就是在一个可以接受的还原状况的前提下用尽可能少的比特数来表示源信号,即把需要存储或传输的图像数据的比特数减少到最少程度。图像压缩是通过编码实现的。概述图像数据压缩的必要性图像数据的特点之一是信息量大。海量数据需要巨大的存储空间。如多媒体中的海量图像数据,不进行编码压缩处理,一张600M字节的光盘,只能存放20秒左右的640×480像素的视频。没有编码压缩,多媒体信息保存有多么困难是可想而知的。在现代通信中,图像传输已成为重要内容之一。采用编码压缩技术,减少传输数据量,是提高通信速度的重要手段。可见,没有图像编码与压缩技术的发展,大容量图像信息的存储与传输是难以实现的,多媒体、信息高速公路等新技术在实际中的应用会遇到很大困难。概述图像数据压缩的可能性概述从信息论观点看,描述图像信源的数据由有用数据和冗余数据两部分组成。duDI信息量数据量冗余量冗余量是可以压缩的,在实际应用中应尽量保证去除冗余量而不会减少信息量,即压缩数据在一定条件可以近似恢复。数据冗余(DataRedundancy)编码冗余(CodingRedundancy)等长编码平均码长为3变长编码平均码长为2.7数据冗余像素间冗余(InterpixelRedundancy)图像是由按一定规则排列起来的像素组成,图像中相邻像素的灰度往往相同或相近,这就称为像素间冗余或空间冗余。数据冗余心理视觉冗余(PsychovisualRedundancy)175K1.46M受生理和心理上的影响,人眼对黑白和彩色信息的分辨率是有限的。光学上不一致的图像在视觉上可能是一样。图像压缩系统模型信源信源编码器信道编码器通信线路或存储介质信源解码器信道解码器信宿压缩的有效性编码的可靠性图像包含大量的数据,但这些数据是高度相关的静止图像往往含有大量的空间冗余信息;动态图像不但含有大量的空间冗余信息还含有大量的时间冗余信息。目的消除各种冗余并在给定畸变下使用尽量少的比特率表示和重建图像,以便更好地传输和存储图像二值图像传真、静态图像传输、可视电话、会议电视、VCD、DVD、常规数字电视、高清晰度电视、多媒体可视通信、多媒体视频点播与传输等…...应用领域评价准则客观保真度主观保真度图像信息信息论要素(ElementsofInformationTheory)熵(Entropy)MkkkPPH12logMkkkPR1根据Shannon无干扰信息保持编码定理,若对原始图像数据的信息进行无失真图像编码,压缩后平均码长存在一个下限,这个下限是图像信息熵H。理论上最佳信息保持编码的平均码长可以无限接近图像信息熵H。但总是大于或等于图像的熵H。平均码长(AverageCodeLength)平均信息量度,图像中各灰度级比特数的统计平均值。M:灰度级数Pk:灰度级Wk出现的概率出现的概率灰度级制代码的位数)对应的码字长度(二进灰度级kkkkWPW::编码效率CodingEfficiency冗余量Redundancy熵编码目的:使R尽量减少至H信息论要素(ElementsofInformationTheory)1)()(xHxRrrxRxH11)()(例题设一离散信源如下:00211WX01412W10813W11814W信源概率编码求信源X的熵、平均码长和编码效率。解:412logkkkPPH熵:4781log8181log8141log4121log212222比特平均码长:编码效率:比特281281241221241kkkPR%5.8787247RH变长最佳编码定理对概率大的消息符号赋予短码字,而对概率小的信息符号赋予长码字,则编码的平均码长一定最短。如:WmWnPmPnPm:概率低Pn:概率高tmtntm:长码tn:短码22nmmnmmnntPtPtPtP02222222222mnmnmnmnmnttPPtPPtPPnmmnmmnntPtPtPtP符合定理的平均码长不符合定理的平均码长唯一可译编码所编码字序列能唯一地译出来。单义性、非续长码是唯一可译编码。单义性代码:任意一个有限长的码字序列只能被唯一地分割成一个个码字。非续长代码:集合中的码字不能由其他码字在后面添加码元构成。如:信源概率码I码II码III码IVW11/20000W21/4011001W31/8100110011W41/810111110111码I:非单义性、续长码如:00110W1W2W3W4W1W1W3W3W1W1W1W3W3W2码II:非单义性、续长码如:010011W1W2W3W4W1W2W1W1W4W1W2W1W3W2W2W1W2W1W1W2W2码III:单义性、非续长码如:010110111W1W2W3W4码IV:单义性、续长码如:0010110111W1W2W3W4单义非续长代码平均码长最短单义代码的充要条件:D:代码中的码元种类;n:代码中的码字个数;ti:第i个码字的码长;如上例:11nitiD单义码:码单义码:码非单义码:码非单义码:码11615222221222221232222214722222432141332141221141211141ititititiiiiIVIIIIII应用分类信息保持型数据压缩—无损压缩压缩图像的比特数和冗余信息,主要用于图像信息保存,要求图像存储能保持信息并能快速存取图像保真度型数据压缩传送的图像能够适应通信的通道限制,压缩图像过程中允许丢失一些人感觉不到的信息即允许微量失真,主要用于图像传输、数字电视和多媒体中。特征保持型数据压缩—有损压缩对于不需要图像的全部细节和灰度细节的图像,压缩过程中可仅保存图像中的感兴趣的特征信息,压缩其不相干和冗余信息,主要用于计算机的特征识别、分析与控制。数据域分类压缩技术空间域编码变换域编码其他方法图像压缩编码技术实现无损压缩PCM编码-脉冲编码调制对连续图像信号的空间进行采样、幅值量化并用适当码字将其量化编码。编码方法有等长和变长编码两种。DPCM编码-差分脉冲编码调制空间域中最成熟也是最通用的编码技术。其结构和语音信号中使用的线性预测编码完全相同。与PCM不同的是它编码的是图像像素值和其预测值的差分。该编码系统会引起斜率过载、颗粒噪声和轮廓噪声。将模拟图像信号变为数字图像信号的基本手段预测编码Huffman编码是1952年由Huffman提出的一种编码方法。这种编码方法是根据信源数据符号发生的概率进行编码的。哈夫曼编码(HuffmanCoding)思想:在信源数据中出现概率越大的符号,编码以后相应的码长越短;出现概率越小的符号,其码长越长,从而达到用尽可能少的码符表示信源数据。它在无损变长编码方法中是最佳的。1.把输入符号按出现的概率从大到小排列起来,接着把概率最小的两个符号的概率求和;2.把它(概率之和)同其余符号概率由大到小排序,然后把两个最小概率求和;3.重复2,直到最后只剩下两个概率为止。在上述工作完毕之后,从最后两个概率开始逐步向前进行编码。对于概率大的消息赋予0,小的赋予1。在反向进行的过程中,若概率不变,保留原码字;若概率分裂为两个,前几位保留原码字,最后一位一个赋“0”,另一个赋“1”码。编码方法:符号集x1x2x3x4x5x6概率分布0.400.200.120.110.090.08Huffman编码符号集经排序的概率分布第一次合并后排序第二次合并后排序第三次合并后排序第四次合并后排序第五次合并后排序x10.400.400.400.400.601x20.200.200.230.370.40x30.120.170.200.23x40.110.120.17x50.090.11x60.08符号集经排序的概率分布第一次合并后排序第二次合并后排序第三次合并后排序第四次合并后排序第五次合并后排序x10.400.400.400.400.601x20.200.200.230.370.40x30.120.170.200.23x40.110.120.17x50.090.11x60.0801100010100000111100000000101001101001100100011符号集x1x2x3x4x5x6概率分布0.400.200.120.110.090.08Huffman编码100001001100100011用二叉树方法实现Huffman编码方法也较为便利。计算该信源的熵、编码后的平均码长,并思考对于同一图像采用Huffman编码,编码是否唯一??0.230.4x10.60.11x410100.370.20x20.08x60.09x50.171010100.12x3行程编码RLE(Run-lengthEncoding)思想:有些图像具有许多颜色相同的图块,在这些图块中,许多连续的扫描行都具有同一颜色,或者同一扫描行上有许多连续的像素都具有相同的颜色值。这种情况下就可以不需要存储每一个像素的颜色值,而仅仅存储一个像素值以及具有相同颜色的像素数目。基本原理:用一个符号值和串长代替具有相同值的连续符号(连续符号构成了一段连续的“行程”。行程编码因此得名),使符号长度少于原始数据长度。不足:如果图像中每两个相邻点的颜色都不相同,用行程编码不但不能压缩,反而数据量增加一倍。适用性单一图像—二值图像;打印文件;地图;工程图;等高图...适合行程编码的图像无损压缩-行程编码适合行程编码的图像无损压缩-行程编码(一)一维行程编码对图象进行行扫描时,行内各像素的灰度级可组成一个整数序列x1,x2,…,xN。在行程编码中,可将这个序列映射成整数对(gk,lk),其中gk表示灰度级,lk表示行程长度,等于具有相同灰度级的相邻像素的数目。无损压缩-行程编码(二)二维行程编码一维行程编码只考虑消除每行内像素(或水平分解元素)的相关性,未考虑行间像素(垂直分解元素)的相关性。二维行程编码考虑两个方向分解元素之间的相关性。无损压缩-行程编码(1)预测微分量化编码(PDQ)分解元素阵列→整数对(Δ1,Δ2)序列Δ1——相继行行程起始点之间的差值Δ2——相继行行程长度之间的差值l2-l1它们与“新起始”和“消失”标志符一起,用来表示亮面积的开端和结束;然后对它们进行编码预测微分量化编码图示l2l1Δ1新起始新起始消失Δ2=l2-l1无损压缩-行程编码(2)双重增量编码(DDC)对Δ1和Δ3进行编码Δ3——后边界在相继行上的差分无损压缩-行程编码(二)二维行程编码双重增量编码图示Δ1新起始新起始消失Δ3一般用B码对PDQ、DDC编码。无损压缩-行程编码变换本身被压缩图像的性质变换核选择有损压缩-变换域编码变换图像编码—图像变换后删去那些接近于零的系数,粗量化那些较小的系数,由此将传输和存储的数据集中到那些包含图像主要信息的系数上。在重构图像中,重要内容很少会有损失。图像正交变换图像编码技术应用FFT,DST,DCT,斜变换,哈尔变换,K-L变换…变换域编码-K-L变换K-L变换编码求图像向量X的K_L变换,就是求图像协方差矩阵[Cx]的特征向量i,也称特征向量变换。图像像素变换成非相关的系数;变换系数能按方差大小排列;用M个变换系数重建图像可得到最小均方差。优点操作复杂缺陷为了减少运算量,通常将一幅图像分成若干等尺寸块,如果图像是平稳的随机图像,该图像所有子图像的协方差矩阵都相同,求得任意一个子图像的K-L变换图像,然后,可以由该变换图像的前M个元素重建该子图像。