MPEG标准2.3.3MPEG视频压缩标准视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率。由于视频是连续的静态图像,因此其压缩编码算法与静态图像的压缩编码算法有某些共同之处。但是运动的视频还有其自身的特性,因此在压缩时还应考虑其运动特性才能达到高压缩的目标。视频信息经过数字化处理后其数据量是非常大的,如果不进行数据压缩处理,计算机系统就无法对它进行存储和交换。5.2.1视频压缩编码的基本概念1.有损和无损压缩无损压缩指压缩前和解压缩后的数据完全一致。适合于由计算机生成的图像,它们一般具有连续的色调。但是无损算法一般对数字视频和自然图像的压缩效果不理想,因为其色调细腻,不具备大块的连续色调。几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。丢失的数据与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差。2.帧内和帧间压缩帧内压缩也称为空间压缩。当压缩一帧视频时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。帧间压缩也称为时间压缩,它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是有损的。采用帧间压缩基于许多视频或动画的连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。3.对称和不对称编码对称意味着压缩和解压缩占用相同的计算处理能力和时间。对称算法适合实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好的实时回放,即以不同的速度进行压缩和解压缩。一般来说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。2.3.3MPEG标准概述目前有多种视频压缩编码方法,但其中最有代表性的是MPEG数字视频格式和AVI数字视频格式。MPEG(MovingPictureExportGroup)是1988年联合成立的一个专家组,它的工作是开发满足各种应用的运动图像及其伴音的压缩、解压缩和编码描述的国际标准。一般来说,MPEG标准分为MPEG视频、MPEG音频和MPEG视音频三个部分。到2004年为止,开发和正在开发的MPEG标准有:MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21。MPEG系列国际标准已经成为影响最大的多媒体技术标准,对数字电视、视听消费电子产品、多媒体通信等信息产业中的重要产品将产生深远的影响。lMPEG-1:运动图像数字压缩标准,1992年正式发布。lMPEG-2:运动图像数字压缩标准。LlMPEG-3:已于1992年7月合并到高清晰度电视(High-DefinitionTV,HDTV)工作组。lMPEG-4:运动图像数字压缩标准及多媒体应用标准(1999年发布)。lMPEG-5:直至1998年9月还没有见到定义。lMPEG-6:直至1998年9月还没有见到定义。lMPEG-7:多媒体内容描述接口标准。lMPEG-21:多媒体框架和综合应用方面的框架。该标准致力于在大范围的网络上实现透明的传输和对多媒体资源的充分利用。5.2.3MPEG-1标准MPEG-1的标准名称为“信息技术——用于数据速率高达大约1.5Mb/s的数字存储媒体的电视图像和伴音编码。它处理的是标准图像交换格式的电视,即NTSC制为352像素×240行/帧×30帧/秒,PAL制为352像素×288行/帧×25帧/秒,压缩的输出速率定义在1.5Mb/s以下。1.MPEG-1标准简介由五个部分组成:(1)MPEG-1系统:规定了运动图像数据、声音数据及其他相关数据的同步。(2)MPEG-1视频:规定了视频数据的编码和解码。(3)MPEG-1音频:规定了声音数据的编码和解码。(4)MPEG-1一致性测试:说明如何测试比特数据流和解码器是否满足MPEG-1前3个部分中所规定的要求。(5)MPEG-1软件模拟:这部分内容是一个技术报告,给出了用软件执行MPEG-1标准前3个部分的结果。2.运动图像的压缩依据运动图像数据压缩主要根据下面两点:(1)运动图像序列中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;(2)人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到了压缩数据的目的。利用前一个事实的压缩技术就是无损压缩技术,利用后一个事实的压缩技术就是有损压缩技术。实际的图像压缩是综合使用各种有损和无损压缩技术来实现的。运动图像压缩技术的基本方法主要表现在:(1)在空间方向上,图像数据压缩采用JPEG(JointPhotographicExpertsGroup)压缩算法来去掉冗余信息。(2)在时间方向上,图像数据压缩采用移动补偿(MotionCompensation)算法来去掉冗余信息。3.运动图像分类及排序为保证图像质量基本不降低而又能够获得高的压缩比,MPEG标准定义了三种图像:帧内图(IntrapicturesI),预测图(PredictedPicturesP)和插补图,即双向预测图(BidirectionalPredictionB)。图像压缩首先需要处理I帧图像,然后是对应的前向预测图像P,在两者的基础上才处理B图像。MPEG编码器算法允许选择I图像的频率和位置。I图像的频率是指每秒钟出现I图像的次数,位置是指时间方向上帧所在的位置。一个典型的I、P、B图像安排如图所示。编码参数为:帧内图像I的距离为N=15,预测图像P的距离为M=3。MPEG-1Video图像的压缩编码器输出时的图像序列:帧类型:IPBBPBBPBBPB..序列:142375610891311..4.帧内图像I的压缩编码基本的过程如下:1将图像进行颜色空间变换。如将RGB空间转换为YCrCb空间表示的图像。2将图像划分成宏块,每个宏块包含16×16个像素点,每个宏块根据图像子采样进一步划分成8×8的图块。如采用4:1:1的图像子采样,则一个宏块包括4个Y块,1个Cr块和1个Cb块。3对每个图块进行离散余弦变换(DCT)。DCT变换后经过量化的交流分量系数按照Z字形排序,然后再使用无损压缩技术进行编码。DCT变换后经过量化的直流分量系数用差分脉冲编码(DPCM),交流分量系数用行程长度编码(RLE),形成中间编码格式。4最后用哈夫曼(Huffman)编码或者用算术编码。5.对P和B图像的压缩编码求差值YCrDCT+量化+RLE…最佳匹配移动矢量d(dxdy)霍夫曼编码Cb010011006448MPI编码图像参考图像过去的参考图像编码图像将来的参考图像DCT+量化+RLE霍夫曼编码移动矢量-0.5×+=011010…MPI预测图像的编码也是以宏块为基本编码单元。预测图像P编码需要两种类型的参数:如图,假设编码图像宏块MPI是参考图像宏块MRJ的最佳匹配块,它们的差值就是这两个宏块中相应像素值之差。对所求得的差值进行彩色空间转换,并作4:1:1的子采样得到Y、Cr和Cb分量值,然后仿照JPEG压缩算法对差值进行编码,计算出的移动矢量也要进行哈夫曼编码。•当前要编码的图像宏块与参考图像的宏块之间的差值•宏块间的移动矢量。双向预测图像B的压缩编码框图如下图。具体计算方法与预测图像P的算法类似。6.MPEG解码过程由于运动图像的视频和音频需要同步,所以MPEG压缩算法应该对两者综合考虑,最后产生一个电视质量的视频和音频形式的位速率约为1.5Mb/s的MPEG单一位流。图中MUX-1是多路复合/分离器。单一数据流经过多路分离器,分离出移动矢量、宏块类型、量化步长和数据流。视音频数据流经过逆量化、逆DCT变换,结合宏块类型和运动向量产生视音频数据。MPEG-1的应用领域包括:光盘、数字音频磁带(DAT)、磁带设备、温彻斯特硬盘以及通信网络(如ISDN和局域网等)。其典型的应用是VCD,99%的VCD都是用MPEG-1格式压缩的,使用MPEG-1的压缩算法,可以把一部120分钟长的电影(未压缩视频文件)压缩到1.2GB左右大小。为了支持多种应用,可由用户来规定多种输入参数,包括灵活的图像尺寸和帧频。MPEG-1标准提供了一些录像机的功能,包括正放、图像冻结、快进、快倒和慢放,此外,还提供了随机存取的功能。MPEG-1的应用领域5.2.4MPEG-2标准MPEG-2标准MPEG工作组制定的第二个国际标准,标准号是ISO/IEC13818。它是一个直接与数字电视广播有关的高质量图像和声音编码标准。和MPEG-1相比增加了隔行扫描电视的编码,提供了位速率的可变性能(scalability)功能。MPEG-2要达到的最基本目标是:位速率为4Mb/s~9Mb/s,最高达15Mb/s。MPEG-2包含9个部分:(1)MPEG-2系统(1994年)规定电视图像数据、声音数据及其他相关数据的同步。(2)MPEG-2视频(1994年)规定了视频数据的编码和解码算法。(3)MPEG-2音频规定了声音数据的编码和解码,是MPEG-1Audio的扩充,支持多个声道。(4)MPEG-2一致性测试。(5)MPEG-2参考软件。(6)MPEG-2数字存储媒体命令和控制扩展协议。(7)MPEG-2高级音频编码是多声道声音编码算法标准。(8)MPEG-2系统解码器实时接口扩展标准。这是与传输数据流的实时接口(Real-TimeInterface,RTI)标准,它可以用来适应来自网络的传输数据流,如图。(9)MPEG-2DSM-CC一致性扩展测试。MPEG-2Video图像的压缩MPEG-2与MPEG-1的比较:压缩编码方案基本相同。技术指标的差异:1.视频格式:MPEG-2:720×576×25(PAL)720×480×30(NTSC)MPEG-1:360×288×25(PAL)360×240×30(NTSC)MPEG-2Video图像的压缩2.数据码率:MPEG-2:4~9Mbit/s,MPEG-1:高1.5Mbit/s。3.图像编码:MPEG-2:按“帧”和“场”MPEG-1:按帧”编码4.预测方式:MPEG-2:“帧”间或“场”间MPEG-1:“帧”间MPEG-2Video图像的压缩5.VLC(可变长度编码)分辨率:MPEG-2:8bit、9bit、10bitMPEG-1:8bit6.量化:MPEG-2:非线性MPEG-1:线性7.信号调制方式:MPEG-2:8to16MPEG-1:8to14+3MPEG-2Video图像的压缩8.纠错码方式:MPEG-2:里德-索罗门乘积(RS-PU)MPEG-1:里德-索罗门交积交错码(CIRC)MPEG-2可以说是MPEG-1的扩充,因为它们的基本编码算法都相同。但MPEG-2增加了许多MPEG-1所没有的功能::(1)MPEG-2有“按帧编码”和“按场编码”两种模式。在MPEG-1中是没有电视帧的概念,只支持逐行扫描,不支持隔行扫描。在MPEG-2中,针对隔行扫描的常规电视图像专门设置了“按帧编码”模式,相应的运动补偿算法也有扩充,分为“按帧运动补偿”和“按场运动补偿”,其编码效率显著提高。(2)MPEG-2的类与等级。MPEG-2提出了配置与等级的概念。配置是按视频编码技术的简单还是复杂而确定的;对每个配置,根据编码参数的不同,即图像格式的简单还是复杂,进一步划分为不同的等级。MPEG-2标准中规定了5种配置4个等级。5个类依次为简单类、主类(MainProfile)、信噪比可伸缩类(SNRProfile)、空间分辨率可伸缩类(SimpleProfile)、高级类(HighProfile)。4个等级由低到高为低等级(LowLevel)、主等级(MainLevel)、1440等级(High–1440Level)和高等级(HighLevel)。配置和等级之间可能的组合如表。配置等级简单配置主要配置信噪比可变配置空间可变配置高级配置高等级##1440等级###主等级#