图像压缩编码技术研究

dariusone
2 ℃
2020-06-06

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1图像压缩编码技术的应用研究方超南京信息工程大学信息与控制学院仪器科学与技术系，南京210044摘要：在满足一定图像质量的条件下，我们可以对图像的数据进行变换、编码和压缩,去除冗余数据来减少表示数字图像时所需要的数据量，以方便图像的存储和传输。研究最佳的编码压缩的数学模型和方法，是人们不断追求的目标。本文介绍了数字图像压缩技术的分类和基本原理，给出了霍夫曼编码、DPCM编码、DCT编码、JPEG编码和小波编码等几种方法对静止图像压缩的具体实现，并总结了各种方法的优劣和今后的发展趋势。关键词：静止图像；图像编码；图像压缩一、绪论1.1图像压缩编码的研究意义以通信技术和计算机为主的信息技术高速发展]25[，信息技术的广泛使用正在悄悄改变着人们的生活和生产方式。在未来的信息世界中，大部分的信息是以数字化的方式来表示、存储和传输的，而在这些数字化信息中绝大部分是图像信息。数字化的图像占的空间是非常大的，例如，一幅普通的未经压缩的图片大概要占到几兆的存储空间，仅仅1秒钟没有压缩的数字视频图像所占的存储空间将达到上百兆的字节，这对于目前存储空间和传输宽带来说是难以承受的。为了能对图像信息进行有效的处理，对数字图像信息进行压缩是大势所趋。数字图像压缩技术被广泛应用到多媒体、通讯、医学等各个领域，在未来的科技领域，它必然具有强大的生命力和无限的发展空间。静止图像压缩不仅是各种媒体压缩和传输的基础，也是影响媒体压缩效果好坏的关键因素。基于这种考虑，本文主要研究静止图像的压缩技术。1.2图像压缩编码的研究现状和发展图像数据是众多数据类型中的一种，也是数据压缩的一个关键部分，因为图像具有与文字、语音等其他数据不同的特点，所以需要特别加以研究。图像压缩编码的目的]21[是为了减少原始数据的数据量，即以最少的比特数来表示原来的图像，同时又要能保持原图像的质量，满足设定的要求。压缩编码减少了数据的存储空间，这样无论是在数据传输还是在数据处理的时候都会给我们带来非常大的便利。我们从信息源得到的数据是含有冗余数据的，如果去掉这些冗余数据，就可以使得数据量减少，而且数据之间也具有一定的相关性，如果去掉这些相关性，然后对数据进行恰当的编码，那么，也可以减少原始数据的数据量；如果再在一定的程度上损失一些关系并不是很大的数据，同样也能使原始数据的数据量2减少。信息论为数据的压缩提供了理论基础，信息论认为每个信源中都或多或少的含有自然冗余度，这些冗余度有的来自于信源本身的相关性，又有的来自于信源概率分布的不均匀性中。只要能够找到改变概率分布不均匀性和去除相关性的相关方法和手段，就可以有效的实现数据的压缩。图像压缩14指的就是图像压缩编码，或者简称图像编码，在本论文的后面部分中，就不再区分几个概念，它们的含义都是相同的。图像编码属于信源编码的范畴，真正从科学的角度上对图像编码进行研究的历史相对来说并不长，只有差不多六十年的时间。对它的分类根据研究问题的出发点不同，可以有不同的分类方法。从压缩的角度分类，可以分为无损压缩编码和有损压缩编码，有损压缩也可以称为统计压缩；从现有的具有实用性的编码方法来看，可以划分为三大类编码方法：统计编码、预测编码和变换编码。从技术发展的角度，Kunt提出过第一代、第二代图像编码的概念，他把1948年－1988年40年中研究的基于去除冗余度的编码方法称为第一代编码，如PCM、DPCM、DM、亚取样编码法等，变换领域的DFT、DCT、沃尔什－哈达玛（DWHT）变换编码等，以及以此为基础的混合编码法均属于经典的第一代编码法。第二代编码方法多是80年代以后提出的新的编码方法，如金字塔编码、分形编码、基于神经网络的编码、小波变换编码、模型基编码、分形压缩等15。1991年，国际电报咨询委员会(CCITT)和国际标准化组织(ISO)联合组成的专家组，共同制定了静止图像的数码率压缩标准（1994年正式通过），即JPEG（TheJointPhotographicExpertGroup），它采用了DCT变换，而最近才提出的新的国际标准JPEG2000则已经采用了小波变换。1.3本课题的主要工作本课题为“图像压缩编码技术的应用研究”，首先对目前流行的多种图像压缩编码算法进行详细的分析，并给出多种编码算法对图像进行压缩的具体实现程序，为以后研究各种编码算法的优劣打下基础。工作的重点是研究各种编码算法具体实现图像压缩是的优劣，具体从图像压缩前后的质量对比以及实现压缩所需要的时间两个方面进行比较。为了实现以上目标，本文主要做了以下的工作：（1）编译合适的程序，对于每种编码算法都编译对应的压缩程序，以期达到良好的压缩效果，为以后评比个压缩编码算法的优劣做准备。（2）编译出用于图像压缩前后质量客观评定的程序，即求出压缩前后图片的PSNR（峰值信噪比），均方根误差（mse）,程序运行时间，图像压缩比。（3）搜集图像压缩前后质量主观评定的数据，即把压缩前后的图片让观察者打分，根据图像压缩质量主观评定准则打分，然后根据公式给出每种编码的具体得分。（4）从客观和主管两个方面来评定上述几种编码压缩方式的优劣。3二、图像压缩编码概述20世纪30～40年代开始形成图像压缩编码的理论23，1948年香农提出能使信源与信道匹配的香农编码，1949年香农在《有噪声时的通信》一文中提出了信道容量的概念和信道编码定理，为信道编码奠定了理论基础。香农的编码定理告诉我们只要信息传输速率小于信道容量，就存在一类编码，使信息传输的错误概率可以任意小，即在不产生任何失真的前提下，通过合理的编码，对每一个信源符号分配不等长的码字，平均码长可以无限接近信源的熵。在这个理论框架下出现了几种不同的无失真信源编码方法，如霍夫曼编码，算术编码，字典编码等，这些方法应用于一幅数字图像，压缩率一般不超过2。随着科学技术的发展，人们对压缩率的要求越来越高，现在出现了更多的编码方法，主要有KTL编码，分形编码，模型编码，子带编码，基于小波的编码等。2.1图像压缩编码的必要性和可能性一方面，近年来计算机技术、微电子技术和和网络技术的迅猛发展为多媒体的发展创造了优越的条件，多媒体已经被人们广泛的应用于生活的各个领域。多媒体是指文字、声音、图形和图像等各种媒体，它能比单纯文字传输更多、更生动的信息，与此同时他的数据量也比文字要大得多，例如一幅分辨率为1024×768、颜色24位的图像将占到2.3MB的存储空间，1秒钟没有任何压缩的数字视频图像需要上百兆字节的存储空间，这是目前的存储空间和传输宽带不能承受的。采用数据压缩技术去除不必要的冗余数据以减少所需传输的数据量是必然的选择。另一方面，图像数据中确实存在大量的冗余数据。一般情况下，图像数据中可能存在着以下几种冗余：①空间冗余（像素间冗余、几何冗余）：这是图像数据中所经常存在的一种冗余。在同一幅图像中，规则物体和规则背景（所谓规则是指表面是有序的而不是完全杂乱无章的排列）的表面物理特性具有相关性，这些相关性的光成像结果在数字化图像中就表现为数据冗余。②时间冗余：在序列图像（电视图像、运动图像）中，相邻两帧图像之间有较大的相关性。③信息熵冗余：也称为编码冗余，如果图像中平均每个像素使用的比特数大于该图像的信息熵，则图像中存在冗余，称为信息熵冗余。④结构冗余：有些图像存在较强的纹理结构，如墙纸、草席等图像，称之存在结构冗余。⑤知识冗余：有许多图像的理解与某些基础知识有相当大的相关性，例如人脸的图像有固定的结构，比如说嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于正脸图像的中线上等等，这类规律性的结构可由先验知识和背景知识得到，称此类冗余为知识冗余。⑥心理视觉冗余：人类的视觉系统对于图像场的注意是非均匀和非线性的，特别是视觉系统并不是对于图像场的任何变化都能感知，即眼睛并不是对所有信息都有相同的敏感度，有些信息在通常的视觉感觉过程中与另外一些信息相比来说并不那么重要，这些信息可认为是心理视觉冗余的，去除这些信息并不会明显地降低所感受到的图像的质量。4从信息论的观点上来看，用于描述图像信源的数据是由有效信息和冗余数据两个部分组成的。去除冗余数据能够节省存储和传输中的数据，同时又不会损坏图像信源的有效信息。在有些时候，是允许一定限度的失真的，例如人的眼睛对图像灰度分辨的局限性，监视器显示分辨率的限制等，然而这些失真并不妨碍图像的实际应用，利用这些也可以对图像信源作一定程度上的压缩。数据压缩起源22于人们对概率的认识。当我们对文字信息进行编码时，如果为出现概率较高的字母赋予较短的编码，为出现概率较低的字母赋予较长的编码，总的编码长度就能缩短不少。图像编码主要就是研究压缩数码率。早期，对图像压缩的研究还仅局限于静止图像。进入20世纪80年代以来，数字信号处理、计算机科学、多媒体技术和数字通信飞速发展，对图像编码的研究从静止图像扩展到了运动图像。有关国际组织相继定义了一些算法和压缩标准，如由国际标准化组织（InternationalStandardOrganization,ISO）和国际电报电话协商委员会（ConsultativeCommitteeforInternationalTelegraphandTelephone,CCITT）组织的联合影像专家小组就提出了面向连续色调静止图像的DCT（DiscreteCosineTransform,离散余弦）编码，进一步推动了图像数据处理和编码压缩工作。2.2图像编码压缩方法分类1948年，奥立弗提出了第一个编码理论-脉冲编码调制（PulseCodingModulation,PCM）;就在同一年，香农在其经典论文《通信的数学原理》中首次提出并建立了信息率失真函数的概念；1959年，香农进一步确立了码率失真理论。以上工作奠定了信息编码的理论基础。脉冲编码调制实际上就是连续模拟信号的数字采样。PCM只是将模拟信号转换为数字信号，没有对信号进行任何压缩。下文讨论的编码方式都是在多媒体模拟信号经过PCM编码后再进行的。编码压缩方法有许多种，从不同的角度出发有不同的分类方法。1.应用在多媒体中的图像压缩编码方法，从压缩编码算法原理上可分为3类：①无损压缩编码种类。哈夫曼编码算术编码行程编码Lempelzev编码②有损压缩编码种类。预测编码：DPCM，运动补偿频率域方法：正交变换编码（如DCT），子带编码空间域方法：统计分块编码，模型基编码基于重要性：滤波，子采样，比特分配，向量量化③混合编码。有JBIG，H261，JPEG，MPEG，小波等技术。52.按压缩技术所依据和采用的数学理论和计算方法分类25，可以分为统计编码、预测编码和变换编码。①统计编码统计编码是根据消息出现概率的分布特性而进行的压缩编码,它有别于预测编码和变换编码。这种编码的宗旨在于,在消息和码字之间找到明确的一一对应关系,以便在恢复时能准确无误地再现出来,或者至少是极相似地找到相当的对应关系,并把这种失真或不对应概率限制到可容忍的范围内。常用的编码有：霍夫曼编码（Huffman）、行程编码（Shannon－Famo）、算术编码等。②预测编码它是利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。通常用的方法是差分脉冲编码调制(DPCM)和自适应差分脉冲编码调制(ADPCM)。③变换编码该方法将图像光强矩阵(时域信号)变换到频域空间上进行处理。在时域空间上具有强相关的信号,反映在频域上是某些特定的区域内能量常常被集中在一起,我们只需将主要注意力放在相对小的区域上,从而实现压缩。一般采用正交变换,如离散余弦变换(DCT)、离散傅立叶变换(DFT)、Walsh-Hadamard变换(WHT)和小波变换(WT),来实现压缩算法。2.3图像编码质量的评价对于编码压缩算法，应该有一个评价标准，能够对压缩后的图像质量给予正确的评价。常用的评价标准有两种：一种是客观准则；另一种是主观准则20。2.3.1图像质量评价的客观准则客观准则是对压缩还原后的图像与原始图像的误差进行定量计算，一般是对整个图像或图像中一个指定区域进行某种平均