2020/1/181第4章多媒体数据压缩编码技术4.1多媒体数据压缩技术概述4.2统计编码4.3预测编码4.4变换编码2020/1/1824.1多媒体数据压缩技术概述数据压缩技术是多媒体技术的关键技术,也是多媒体技术发展的基础。在多媒体技术发展到的今天,大家已经知道数据是可以压缩的,但数据为什么要压缩?为什么能够实现数据压缩?理论基础与原理是什么?实现数据压缩的具体方法有哪些?目前世界通用的数据压缩标准是什么?其规范与实现的途径又有哪些?2020/1/1834.1多媒体数据压缩技术概述什么是数据压缩数据压缩就是在一定的精度损失条件下,以最少的数码表示信源所发出的信号2020/1/1844.1多媒体数据压缩技术概述4.1.1数据压缩的必要性多媒体信号的数据量巨大,如:一幅1024*1024真彩图有3MB5分钟的CD音乐有50.47MB90分钟的PAL视频数字化后有203.68GB为了节省存储空间和传输带宽,进行实时高质的多媒体通信,必须对多媒体数据进行压缩编码多媒体信源引起了“数据爆炸”,如果不进行数据压缩,传输和存储都难以实用化。多媒体数据2020/1/1854.1多媒体数据压缩技术概述1分钟数字音频信号需要的存储空间2020/1/1864.1多媒体数据压缩技术概述1分钟数字视频信号需要的存储空间2020/1/1874.1多媒体数据压缩技术概述数据压缩的好处时间域压缩──迅速传输媒体信源频率域压缩──并行开通更多业务空间域压缩──降低存储费用能量域压缩──降低发射功率2020/1/1884.1多媒体数据压缩技术概述4.1.2多媒体数据压缩的可能性压缩的可能空间冗余:在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。如当一幅图象中同一种颜色不止一个象素点,若相邻的象素点的值相同,象素点间(水平、垂直)有冗余;当图象的一部分包含占主要地位的垂直的源对象时,相邻线间存在冗余。时间冗余:时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。音频的前后样值之间也同样有时间冗余。如运动序列帧间的图象稳定或只有轻微的改变,则它们之间存在冗余。2020/1/1894.1多媒体数据压缩技术概述听觉冗余:人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。视觉冗余:人眼对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为26灰度等级,而一般图像的量化采用的是28灰度等级,即存在着视觉冗余。2020/1/18104.1多媒体数据压缩技术概述信息熵冗余:信源编码时,当分配给第i个码元类的比特数b(yi)=-logpi,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知,比特分配不能达到最佳。实际单位数据量dH(S),即存在信息冗余熵。其它冗余:包括结构冗余、知识冗余等。2020/1/18114.1多媒体数据压缩技术概述4.1.3数据压缩技术的性能指标有三个关键参数评价一个压缩系统:压缩比图象质量压缩和解压的速度另外,也必须考虑每个压缩算法所需的硬件和软件。2020/1/18124.1多媒体数据压缩技术概述压缩比压缩性能常常用压缩比定义输入数据和输出数据比〖例〗一幅512×480pixels图像,24bit/pixel输入=512×480×(24/8)=737280byte输出15000byte压缩比=737280/15000=492020/1/18134.1多媒体数据压缩技术概述图象质量无损压缩:图象质量不变。有损压缩:失真情况很难量化,只能对测试的图象进行估计。模拟图象质量的指标:信噪比、分辨率、颜色错,但必须在观察了实际图象以后。2020/1/18144.1多媒体数据压缩技术概述压缩/解压速度在许多应用中,压缩和解压缩可能不同时用,所以,压缩、解压速度分别估计。静态图象中,压缩速度没有解压速度严格;动态图象中,压缩、解压速度都有要求,因为需实时地从摄像机或VCR中抓取动态视频。2020/1/18154.1多媒体数据压缩技术概述硬、软件系统有些压缩、解压工作可用软件实现。一般地讲,设计系统时必须充分考虑:算法复杂-压缩解压过程长算法简单-压缩效果差目前有些特殊硬件可用于加速压缩/解压。硬接线系统速度快,但各种选择在初始设计时已确定,一般不能更改。因此在设计硬接线压缩/解压系统时必须先将算法标准化。2020/1/18164.1多媒体数据压缩技术概述4.1.4数据压缩技术分类数据压缩(datacompression)与信号编码(signalcoding)往往含义相同压缩(compress)解压缩/还原/重构(decompress)编码(encode/coding)解码/译码(decode)相关学科:信息论、数学、信号处理、数据压缩、编码理论和方法2020/1/18174.1多媒体数据压缩技术概述根据解码后数据与原始数据是否完全一致可以分为两大类:有损压缩和无损压缩。有损压缩(有失真压缩):是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。大多数图像、声音、动态视频等数据的压缩是采用有失真压缩。2020/1/18184.1多媒体数据压缩技术概述无损压缩(无失真压缩):是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。由于不会失真,多用于文本、数据的压缩,但也有例外,非线性编辑系统为了保证视频质量,有些高档系统采用的是无失真压缩方法。2020/1/18194.1多媒体数据压缩技术概述数据压缩技术的分类2020/1/18204.1多媒体数据压缩技术概述从信息语义角度分为:熵编码、源编码和混合编码熵编码(entropyencoding)(也称平均信息量编码)熵编码是一种泛指那些不考虑被压缩信息的性质的无损编码。它是基于平均信息量的技术把所有的数据当作比特序列,而不根据压缩信息的类型优化压缩。也就是说,平均信息量编码忽略被压缩信息的语义内容。如RLE(runlengthencoding行程编码)、LZW(Lempel-Ziv-Walch基于词典的编码算法)、Huffman编码。2020/1/18214.1多媒体数据压缩技术概述源编码(SourceCoding)源编码的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等。源编码比严格的平均信息量编码的压缩率更高。当然压缩的程度主要取决于数据的语义内容,比起平均信息量编码,它的压缩比更大。简而言之,利用信号原数据在时间域和频率域中的相关性和冗余进行压缩的有语义编码。如:预测编码:DM、ADPCM变换编码:DCT、DWT分层编码:如子采样、子带编码其他编码:如矢量量化、运动补偿、音感编码2020/1/18224.1多媒体数据压缩技术概述混合编码(hybridcoding)混合编码=熵编码+源编码大多数压缩标准都采用混合编码的方法进行数据压缩,一般是先利用信源编码进行有损压缩,再利用熵编码做进一步的无损压缩。如H.261、H.263、JPEG、MPEG等。2020/1/18234.1多媒体数据压缩技术概述当然,也可根据不同的依据对数据的压缩算法进行其它不同的分类,如:按作用域在空间域或频率域:空间方法、变换方法、混合方法按是否自适应:自适应性编码和非适应性编码2020/1/18244.1多媒体数据压缩技术概述4.1.5量化原理量化处理是使数据比特率下降的一个强有力的措施。脉冲编码调制(PCM)的量化处理是采样之后进行,从理论分析的角度,图像灰度值是连续的数值,而我们通常看到的是以(0~255)的整数表示图像灰度,这是经A/D变换后的以256级灰度分层量化处理了的离散数值,这样可以用log2256=8比特表示一个图像像素的灰度值,或色差信号值。2020/1/18254.1多媒体数据压缩技术概述数据压缩编码中的量化处理,不是指A/D变换后的量化,而是指以PCM码作为输入,经正交变换、差分、或预测处理后,熵编码之前,对正交变换系数、差值或预测误差的量化处理。量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,希望量化后的数值用较少的比特数便可表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。量化处理总是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不可逆过程,量化处理中有信息丢失,或者说,会引起量化误差(量化噪声)。2020/1/18264.1多媒体数据压缩技术概述标量量化器的设计量化器的设计要求通常设计量化器有下述两种情况:给定量化分层级数,满足量化误差最小。限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。2020/1/18274.1多媒体数据压缩技术概述量化方法有标量量化和矢量量化之分,标量量化又可分为:均匀量化非均匀量化自适应量化标量量化时,可在随机变量X出现概率比较高的间隔内,选择较小的判决间隔,而在其他区域内选择较大的间隔,这样可以以较小的量化均方误差进行量化。2020/1/18284.1多媒体数据压缩技术概述均匀量化曲线图非均匀量化曲线图2020/1/18294.1多媒体数据压缩技术概述矢量量化矢量量化编码是近年来图像、语音信号编码技术中颇为流行的一种新型量化编码方法。矢量量化编码方法一般是有失真编码方法。矢量量化的名字是相对于标量量化而提出的。对于PCM数据,一个数一个数地进行量化叫标量量化。若对这些数据分组,每组K个数构成一个K维矢量,然后以矢量为单元,逐个矢量进行量化,称矢量量化。矢量量化编码解码框图矢量量化基于语义编码,其基本思想是采用非线性量化器,即对空间频率及能量分布较大的系数分配较多比特数;反之分配较少的比特数,从而达到压缩的目的。2020/1/18304.1多媒体数据压缩技术概述标量量化时,可在随机变量X出现概率比较高的间隔内,选择较小的判决间隔,而在其他区域内选择较大的间隔,这样可以以较小的量化均方误差进行量化。矢量量化基于语义编码,其基本思想是采用非线性量化器,即对空间频率及能量分布较大的系数分配较多比特数;反之分配较少的比特数,从而达到压缩的目的。2020/1/18314.1多媒体数据压缩技术概述4.1.6编码的过程一、编码准备数模转换(A/D)A/D连续模拟信号离散数字信号采样/量化预处理:对得到的初始数字信号进行必要的处理,包括过滤、去噪、增强、修复等,以达到除去数据中的不必要成分、提高信号的信噪比、修复数据的错误等目的。2020/1/18324.1多媒体数据压缩技术概述二、编解码的过程2020/1/18334.2统计编码4.2.1信息论中的几个概念数据冗余单纯的数据集中可能存在多余的数据,去掉这些多余数据并不会丢失任何信息,这种冗余称为数据冗余。数据可被压缩的依据是数据本身存在冗余,所有无损压缩算法的共同点都是利用数据本身的冗余性,其差别主要体现在压缩比上,压缩比越高表示冗余数据消除的越多,压缩比的上限是由数据集的熵限定的。2020/1/18344.2统计编码决策量在有限数目的互斥事件集合中,决策量是事件的对数值,在数学上表示为:H0=Log2(n)其中,n是事件数。决策量可使用的单位包括:Sh(Shannon):用于以2为底的对数Nat(Naturalunit):用于以e为底的对数Hart(Hartley):用于以10为底的对数1Sh=0.693Nat=0.301Hart2020/1/18354.2统计编码信息量信息量是具有确定概率事件的