第5讲-多媒体数据压缩编码方法

ronysit
1 ℃
2020-02-15

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第5讲多媒体数据压缩和信息编码内容提要多媒体数据压缩基本特征和方法图像统计特性无损数据压缩编码方法有损数据压缩编码方法多媒体数据压缩基本特征和方法1.数据压缩的处理过程：编码过程：对原始数据进行压缩，便于存储和传输。解码过程：对压缩数据进行解压，恢复成可用数据。2、数据压缩技术的性能指标评价一种数据压缩技术的性能好坏有三个关键指标：压缩比、再现质量、压缩和解压的速度。此外，还要考虑压缩算法所需要的软件和硬件。压缩比：输入数据量/输出数据量再现质量：与压缩类型有关无损压缩系统不担心图像（音频）质量；有损压缩系统压缩前后图像（音频）不完全一样，但不影响视（听）觉。压缩和解压的速度：速度越快越好动态视频15帧/s，全动态视频25帧/s和30帧/s。客观尺度：均方误差、信噪比（SNR）、峰值信噪比（PSNR）3、数据冗余的类型与压缩方法分类A:数据冗余的类型空间冗余、时间冗余、信息熵冗余、视觉冗余、听觉冗余和其他冗余B:数据压缩方法的分类根据解压后数据压缩的保真度，数据压缩技术分为无损压缩编码和有损压缩编码两大类。•无损压缩编码：解压后数据与原始数据相同，无任何偏差。特点：压缩比比较低，一般在2:1～5:1。常用编码方法：行程编码（利用相关性）、霍夫曼编码和算术编码（利用概率分布）等。应用：传真机，文本文件传输等。•有损压缩：解压后数据与原始数据有一定偏差，但仍可以保证一定的视听效果。特点：压缩比最高可达100:1,压缩比越高，解压后视频、音频质量越差。常用编码：预测编码、正交变换编码、向量量化编码、分层编码、子带编码等应用：图像、声音、动态视频的压缩。多媒体技术侧重于有损压缩，并出台了一系列的国际标准图像统计特性•图像的信息量信源符号Si概率：符号Si的信息量：•离散信源•图像的信息熵niinnSpSpSpSpSSSX121211)(,)(...,),(),(...,,,10()1,()1niiipSpS22()log(1/())log()iiiISpSpS211()()()()log()1nniiiiiiHXpSISpSpS无损压缩编码方法无损编码（无失真编码）：又称统计编码，包括行程编码、LZW编码、霍夫曼编码、算术编码等。根据信息出现的概率的分布特性而进行的压缩编码。•A:行程编码RLC：主要检测重复的比特或者字符序列，并用他们出现的次数取而代之，它计算信源符号出现的行程长度，然后将行程长度转换为代码。•B:霍夫曼编码霍夫曼(Huffman)在1952年提出了对统计独立信源能达到最小平均码长的编码方法。霍夫曼码通常称为最优码。编码的基本思想：是根据信源符号出现的概率大小进行排序，出现的概率大的符号分配短码，反之分配长码。在分配代码过程中，需要建立一个n阶二叉树。编码过程如下：①对信源符号按其出现的概率进行递减排序；②将两个最小的概率相加，其和作为新符号的概率；③重复①和②，直到概率之和达到1为止；④每次合并消息时，将被合并的消息赋予1和0或者0和1；⑤寻找从每个信源符号到概率为1处的路径，记录下路径上的1和0；⑥从树根节点到叶子节点，对每个信源符导列出0、1序列。有一幅39个象素组成的灰度图像，灰度共有5级，分别用符号A、B、C、D和E表示，39个象素中出现灰度A的象素数有15个，出现灰度B的象素数有7个，出现灰度C的象素数有6个等等，如下表所示。如果用3个位表示5个等级的灰度值，也就是每个象素用3位表示，编码这幅图像总共需要117位。符号ABCＤＥ出现的次数157665概率15/397/396/396/395/39熵编码－建立在随机过程的统计特性基础上S=（A，B，C，D，E）符号出现的次数(Pi)log2(1/pi)分配的代码需要位数A15(0.3846)1.38015B7(0.1795)2.4810021C6(0.1538)2.7010118D6(0.1538)2.7011018E5(0.1282)2.961111501ABC0110DE01这幅图像的熵为:H（S）=(15/39)log2(39/15)+(7/39)log2(39/7)+(7/39)log2(39/7)+(6/39)log2(39/6)+(5/39)log2(39/5)=2.1859这说明每个符号可用2.1859位表示，39个象素需用85.25位。在编码中以N表示编码器输出码字的平均码长，用熵值衡量是否最佳编码，即：当NH（S）有冗余，不是最佳；NH(S)，不可能；N≈H（S）（N稍大于H（S）），是最佳编码。本例中，N稍大于H，是最佳：N=1*0.3846+3*(0.1795+0.1538+0.1538+.1282)=2.2305总结：（1）N要稍大于H（2）保证解码的唯一性，短码不构成长码的前缀，编码不唯一。（3）接收端与发送端保存相同的霍夫曼码表，编码效率一致。•C:算术编码：算术编码是另一种最佳编码方式，它与霍夫曼编码一样，也是对出现概率较大的符号采用短码，对概率较小的符号采用长码。但是它的编码原理却与霍夫曼编码很不相同，也不局限于仅使用整数码，编码效率比霍夫曼编码高。•基本思想：把一个信源集合表示为实数线上的0到1之间的一个区间，这个集合中的每个元素都用来压缩这个区间。信源集合的元素越多，所得到的区间就越小，当区间变小时，就需要一些更多的数位来表示这个区间。算术编码首先假设一个信源的概率模型，然后用概率来缩小表示信源的区间。•二进制编码，信源符号只有两个。因此在算术编码初始阶段可预置一个大概率Pe和小概率Qe，然后对被编码比特流符号进行判断。设编码初始化子区间为[0，1]，Qe从0算起，则Pe＝1-Qe.随着被编码数据流符号的输入，子区间逐渐缩小。有损压缩编码方法有损压缩（有失真编码）：允许一定失真，压缩比提高。利用失真函数度量失真程度。失真度量：均匀误差；绝对误差代表的编码方法：预测编码、变换编码、分析合成编码A、预测编码根据原始离散信号之间存在着一定的相关性，利用前面的一个或多个信号对下一个信号进行预测，然后对实际值和预测值的差值进行编码。ⅠPCM•PCM（脉冲调制编码）是将原始模拟信号经过时间采样，然后对每一样值进行量化，作为数字信号传输。•广泛应用的语音编码技术，也是数字传输的标准接口信号。•主要优点：①编码方法简单，数据压缩不需要复杂的信号处理技术，无任何信号延迟：②基于对话音信号波形采样的瞬时处理，具有较高的信噪比。PCM组成原理框图S(k)量化器预测器++Se(k-1)+Se(k-1)++dq(k)Sr(k)d(k)-下图是DPCM的工作示意图，其中d(k)是输入信号S(k)和预测器输出的估算值Se(k-1)之差。Se(k-1)是S(k)的预测值。Sr(k)是差分信号dq(k)与过去的样本信号的估算值求和得到。•Ⅱ:DPCM编码：Ⅲ:ADPCM编码进一步改善量化性能和压缩数据率的方法是采用自适应量化或自适应预测。电话通信网中，32kb／sADPCM主要用于扩充现有的PCM信道传输容量，把两个30路PCM信号合并成一个2Mb／s的60路ADPCM信号。简化的ADPCM编解码器原理框图a）ADPCM编码器b）ADPCM解码器变换编码是一种有失真的编码，是对信号进行某种函数变换，将信号从一种信号空间变换到另一种信号空间，为数据压缩提供必要的基础。变换编码的三个步骤：变换、变换域采样和量化。变换原理：通过变换编码将信号从时域变换到频域，分离出低频分量和高频分量，然后通过量化，使大多数高频分量变成零值。最后经过熵编码压缩掉这些零值序列．从而达到数据压缩的目的。——人的视觉和听觉对高频成分不敏感，如果去除图像或声音信号中的一些高频分量．对图像或声音质量的影响将是很微弱的。B、变换编码数据压缩对变换矩阵的选择有两方面要求:一、准确再现信源向量，即要求再现误差尽量小；二、尽可能除去相关性。常见的变换方法有：离散傅立叶变换(DFT)编码、离散余弦变换(DCT)编码等。离散余弦（DCT）变换DCT编码方法普通使用在JPEG、MPEG和H．261等标准中。音频信号压缩采用一维DCT编码，图像压缩则采用二维DCT编码。FDCTIDCT图像的DCT编码：对某一8×8灰度图像像素块进行变换，编码器进行FDCT变换，输出64个DCT系数，空间频率为0的系数称为直流系数（DC）它是块中所有像素的平均值，其余63个系数称为交流系数（AC）。大多数信号集中在低频区。解码器实行IDCT重建8×8数据块。•这类编码方法突破了经典数据压缩编码理论的框架，实质上都是通过对原数据的分析，将其分解成一系列更适合于表示的“基元”或从中提取若干具有更本质意义的参数，编码仅对这些基本单元或特征参数进行。而译码时则借助于一定的规则或模型，按照一定的算法将这些基元或参数再综合成原数据的一个逼近。•分为四类：量化编码、小波变换编码、分形编码、子带编码C、分析—合成编码量化编码：•矢量量化编码是在图像、语音信号编码技术中研究得较多的新型量化编码方法，它不仅仅是作为量化器设计而提出的，更多的是将它作为压缩编码方法来研究的。标量量化：在传统的预测和变换编码中，首先将信号经某种映射变换变成一个数的序列，然后对其一个一个地进行标量量化编码。矢量量化：把输入数据几个一组地分成许多组，成组地量化编码，即将这些数看成一个k维矢量，然后以矢量为单位逐个矢量进行量化。矢量量化是一种限失真编码，其原理仍可用信息论中的率失真函数理论来分析。而率失真理论指出，即使对无记忆信源，矢量量化编码也总是优于标量量化。矢量量化编码的原理框图衡量两个矢量之间接近程度的度量标准子带编码：•语音及图像编码中应用•基本思想：输入信号分解为若干子频带，分别对其按不同统计特性编码，降低码率。•优点:利于控制量化误差方差；量化噪声互不影响；各子带采样率降低。小波变换：用于多分辨率图像描述，起始于1945年。小波图像分解思想属于子带分解的一个特例。小波分解是完备的、正交的，且多分辨率的分解。空间域里，小波分解将信号分解为不同层次分解运算的同时形成了频率域中的多层次分解。频率域中，高频分量与低频分量的分布与原数据中频率分布的方向有关。小波变换原理：将原图像信号分解成不同的频率区域，持续的压缩编码方法根据人的视觉、图像的统计、细节和结构等特性，对不同的频率区域采取不同的压缩编码手段，从而使数据量减少。•小波变换编码方式是子带编码的改进型，原因：•其一，大多数语音和图像信号倾向于非均匀频谱，只集中在某一时间段的某一频段，小波包基表示信号时正好有这种自适应性，可通过选定一个阈值将这此时间段和频段的相应系数保留编码而丢弃其他时间段和频段上的小幅值的系数；•其二，小波包基的每次分解都把信号分成低频和高频两部分，而多数的语音和图像信号的统计特性表明大幅值的系数往往集中在低频区内，这样可给那些小幅值系数分配很少的比特数，甚至可以不传输或存储，从而压缩了数据。分形编码：•分形：描述经典几何学无法处理的不规则曲线。例图•分形编码原理：通过将原始图像分割为若干子图，在分形集中对于查找此类子图，分形集中存储的是迭代函数，不是图像，所需数据量很小，从而实现高压缩比。•分形编码难点：图像分割方法；迭代函数系统建模模型编码：•采样图像分析及描述的图像编码方法。•应用于编码对象的自相似性不显著的压缩情况。•与传统波形编码差异：利用图像中景物内容和知识来实现数据的大比例压缩。