多媒体数据压缩编码技术

hirosiryu
0 ℃
2020-10-17

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第四章多媒体数据压缩编码技术•概述：本章主要讲述了图像和视频图像的处理技术。大致可分为四个部分：1、数据压缩编码的重要性和可能性；2、数据压缩方法的介绍3、静态图像压缩编码的国际标准（JPEG）；4、运动图像压缩编码的国际标准（MPEG）。★本章为本书的重点之一第四章多媒体数据压缩编码技术•本章要重点掌握的知识点：多媒体数据压缩的必要性和可能性，数据压缩方法分类，常用的压缩编码和算法（统计编码、预测编码、变换编码）数据压缩编码的国际标准JPEG、MPEG等。★哈夫曼编码、JPEG第四章多媒体数据压缩编码技术•(1)为什么要进行数据压缩•多媒体信息包括了文本、数据、声音、动画、图形、图像以及视频等多种媒体信息。虽然经过数字化处理后其数据量是非常大的，如果不进行数据压缩处理，计算机系统就无法对它进行存储和交换。另一个原因是图像、音频和视频这些媒体具有很大的压缩潜力。因为在多媒体数据中，存在着空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。它们为数据压缩技术的应用提供了可能的条件。因此在多媒体系统中必须采用数据压缩技术，它是多媒体技术中一项十分关键的技术。数据压缩方法的分类（1）根据质量有无损失可分为有损失编码和无损失编码。（2）按照其作用域在空间域或频率域上分为：空间方法、变换方法和混合方法。（3）根据是否自适应分为自适应性编码和非适应性编码。数据压缩方法的分类依据压缩算法分类：（1）脉冲编码调制（2）预测编码（3）变换编码（4）统计编码（5）混合编码（1）脉冲编码调制•脉冲编码调制实际上是连续模拟信号的数字采样表示。脉冲编码调制（PCM）编码器和解码器位于一个图像编码系统的起点和终点。下面几种编码方法都是在多媒体数据模拟信号经过PCM编码后再进行的压缩编码方法。（2）预测编码•编码器记录与传输的不是样本的真实值，而是它与预测值的差。这一方法称为差值脉冲编码调制（DPCM）方法。（3）变换编码•变换编码的主要思想是利用图像块像素值之间的相关性，把图像变换到一组新的基上，使得能量集中到少数几个变换系数上，通过存储这些系数而达到压缩的目的。•在变换编码中，由于对整幅图像进行变换的计算量太大，所以一般把原始图像分成许多个矩形区域子图像独立进行变换。•常用的有离散余弦变换（DCT）（4）统计编码•最常用的统计编码是Huffman编码。它对于出现频率大的符号用较少的位数来表示，而对出现频率较小的符号用较多的位数来表示。其编码效率主要取决于需编码的符号出现的概率分布，越集中则压缩比越高。•另外还有算术编码、游程编码。（5）混合编码•混合编码是指合并变换和预测技术的编码，通常有两种编码形式。量化的基本原理量化的作用是在图像质量或声音质量达到一定保真度的前提下，舍弃那些对视觉或听觉影响不大的信息。量化的过程是模拟信号到数字信号的映射。模拟量是连续量，而数字量是离散量，因此量化操作实质上是用有限的离散量代替无限的连续模拟量的多对一的映射操作。量化的基本原理•量化概念主要来自于从模拟量到数字量的转换，即A/D转换，也就是通过采样把连续的模拟量离散化。量化过程预先设置一组判决电平和一组重建电平，各个判决电平覆盖一定的区间，所有判决电平将覆盖整个有效取值区间。量化时将模拟量的取样值同这些电平比较，若采样值幅度落在覆盖区间之上，则取这个量化级的代表值，称为码字。一个量化器只能取有限多个量化级，因此量化过程不可避免地存在量化误差。量化器的设计要求通常设计量化器有下述两种情况：•（1）给定量化分层级数，满足量化误差最小。•（2）限定量化误差，确定分层级数，满足以尽量小的平均比特数，表示量化输出。信息、信息量、信息熵•（1）信息：信息是用不确定性的量度定义的。一个消息的可能性愈小，其信息愈多；而消息的可能性愈大，则其信息愈少。信息、信息量、信息熵•（2）信息量：所谓信息量是指从N个相等可能事件中选出一个事件所需要的信息度量或含量，也就是在辩识N个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数信息、信息量、信息熵•（3）熵：如果将信源所有可能事件的信息量进行平均，就得到了信息熵(entropy)。熵就是平均信息量。最佳编码定理•在变字长码中，对于出现概率大的信息符号编以短字长的码，对于出现概率小的信息符号编以长字长的码，如果码字长度严格按照符号概率的大小的相反顺序排列，则平均码字长度一定小于按任何其它符号顺序排列方式得到的码字长度。Huffman编码Huffman编码的步骤：（1）概率统计，得到n个不同概率的信息符号；（2）将n个信源信息符号的n个概率，按概率大小排序；（3）将n个概率中，最后两个小概率相加，这时概率个数减为n-1个；（4）将n-1个概率，按大小重新排序；（5）重复（3），将新排序后的最后两个小概率相加，相加和与其余概率再排序；（6）如此反复重复n-2次，得到只剩两个概率序列；（7）以二进制码元（0，1）赋值，构成哈夫曼码字，编码结束。010.39010.35010.611000.261010.11a1a2a3a4a5a6a70.200.190.180.170.150.100.01101100000101001100111信源符号概率Huffman码编码过程Huffman编码过程x1x2x3x4x5x6x70.350.200.150.100.100.060.040.350.200.150.100.100.100.350.200.200.150.100.350.250.200.200.400.350.250.600.40信源符号概率编码过程第一步第二步第五步第四步第三步输入输入Huffman编码步骤图4.8Huffman码字的构成x1x2x3x4x5x6x70.350.200.150.100.100.060.040.350.200.150.100.100.100.350.200.200.150.100.350.250.200.200.400.350.250.600.40第一步第二步第五步第四步第三步码长输入哈夫曼码22333440010010011110111011110010010011110111001011010011000110111000101x1x2x3x4x5x6x70.350.200.150.100.100.060.04码长哈夫曼码2233344001001001111011101111信源符号概率编码过程010.25010.60010.4001010.20010.10pelbitsLPLPNjjjjnjj/55.24)04.006.0(3)10.010.015.0(2)20.035.0()(711码字的平均码长N按下式计算：Pj：信源符号Xj出现的概率Lj：编码长度0.350.200.150.100.100.060.04码长2233344001001001111011101111概率哈夫曼码pelbitsxPxPxPxPHjjjjnjj/13.2]04.0log04.006.0log06.02)10.0log10.0(15.0log15.020.0log20.035.0log35.0[)(log)()(log)(22222227112熵：对数的换底公式：8...0.301029995...2.408239962log256logloglogloglog2562abba预测编码概念（P114）•预测编码是根据某一模型利用以往的样本值对于新样本进行预测，然后将样本的实际值与预测值相减得到一个误差值，对这一误差值进行编码。帧间预测编码（P119）•帧间预测编码技术的对象是序列图象。随着大规模集成电路技术的发展，已有可能把几帧的图象存起来作实时处理，利用帧间的时间相关性进一步消除图象信号的冗余度，提高压缩比。帧间编码的技术基础是预测技术。★JPEG标准（P135）•JPEG算法被确定为JPEG国际标准，它是国际上彩色、灰度、静止图像的第一个国际标准。•JPEG标准是一个适合范围广泛的通用标准。它不仅适于静图像的压缩，电视图像序列的帧内图像的压缩编码也常采用JPEG压缩标准。•JPEG的目的是为了给出一个适用于连续色调图象的压缩算法。JPEG算法具有四种操作方式（P135）•（1）顺序编码；•（2）累进编码；•（3）无失真编码；•（4）分层编码。JPEG编码的原理简化框图如下图所示：压缩的图象数据表说明表说明编码器①把图像分成8×8的块②DCT正变换③量化器④熵编码器什么是信息“熵”和熵编码？信息“熵”是信源随机变量的平均信息量；熵编码是无失真数据压缩编码，在编码过程中不丢失信息量，熵编码是建立在随机过程的统计特性基础上的。JPEG标准采用了哪些混合编码方法？JPEG标准采用了：•预测编码•变换编码•熵编码详述JPEG静态图像压缩编码原理及其实现技术。JPEG的工作原理如下图所示恢复图像信道DCT变换量化器熵编码器量化表熵编码表IDCT逆变换逆量化器熵解码器量化表熵编码器源图像数据88块•首先把一幅图像（单色图像的灰度值或彩色图像的亮度分量、色差分量信号）分成8×8的块•离散余弦正变换（FDCT）•量化（查表）•熵编码（查表）•传输或存储•解码•逆量化•离散余弦逆变换（IDCT）JPEG建议使用两种熵编码方法：哈夫曼(Huffman)编码和自适二进制算术编码。（P138）运动图像压缩编码标准MPEG•MPEG标准是针对全活动视频的压缩标准。该标准包括：MPEG系统、MPEG视频、MPEG音频、MPEG测试和验证四大部分。(P159)MPEG将图像分成三种类型（P152）•I图像（IntraPicture帧内图）•P图像（PredictedPicture预测图）•B图像（BidirectionalPicture双向预测图）。MPEG视频压缩技术（P152）•MPEG视频压缩技术是针对运动图象的数据压缩技术。为了提高压缩比，帧内图象数据压缩和帧间图象数据压缩技术必须同时使用。第四章习题解答在MPEG中为了提高数据压缩比，采用了哪些方法：（A）运动补偿与运行估计（B）减少时域冗余与空间冗余（C）帧内图象数据与帧间图象数据压缩（D）向前预测与向后预测第四章习题解答在JPEG中使用了哪两种熵编码方法：（A）统计编码和算术编码（B）PCM编码和DPCM编码（C）预测编码和变换编码（D）哈夫曼编码和自适应二进制算术编码第四章习题解答简述MPEG和JPEG的主要差别。答：MPEG视频压缩技术是针对运动图象的数据压缩技术。为了提高压缩比，帧内图象数据和帧间图象数据压缩技术必须同时使用。MPEG通过帧运动补偿有效地压缩了数据的比特数，它采用了三种图象，帧内图、预测图和双向预测图。有效地减少了冗余信息。对于MPEG来说，帧间数据压缩、运动补偿和双向预测，这是和JPEG主要不同的地方。而JPEG和MPEG相同的地方均采用了DCT帧内图象数据压缩编码。在JPEG压缩算法中，针对静态图象对DCT系数采用等宽量化，而是MPEG中视频信号包含有静止画面（帧内图）和运动信息（帧间预测图）等不同的内容，量化器的设计不能采用等宽量化需要作特殊考虑。从两方面设计，一是量化器综合行程编码能使大部分数据得到压缩；另一方面是通过量化器、编码器使之输出一个与信道传输速率匹配的比特流。第四章习题解答简述预测编码的基本原理(4)答：预测编码原理是从相临像素之间有强的相关性特点考虑的。比如当前像素的灰度或颜色信号，数值上与其相临的像素总是比较接近的，除非处于边界状态，那么，当前像素的灰度或颜色信号的数值就可以用前面出现的像素的值进行预测，得到一个预测值并将实际值与预测值进行求差，对这个差值进行编码、传送，这种编码方法就是预测编码方法。第四章习题解答JPEG编码的原理简化框图如下，则①、②、③。．①DCT正交变换、②量化器、③熵编码器第四章习题解答信息熵H（X）是指。在编码中常用H（X）来衡量编码是否为最佳，编码器输出码字的平