XIDIAN国际视频压缩标准简介多媒体技术第七讲2主要内容•视频压缩标准发展历史•H.26X系列压缩标准简介•MPEG系列压缩标准简介3视频压缩标准发展历史ITU:ISO/IEC:H.261H.262H.263H.263+H.264MPEG1MPEG2MPEG4(Part2)MPEG7MPEG21MPEG4(Part10)4视频压缩标准对比H.261p×64kb/s视频编码标准时间1990年12月输入176×144(QCIF)352×288(CIF)帧速率可变=30输出p×64kb/s(p=1,2,…,32)压缩率20~30小于MPEG1压缩算法运动补偿帧间预测与分块DCT相结合的混合编码应用可视电话、视频会议等对称应用5视频压缩标准对比(续)MPEG1数据传输速率为1.5Mb/s的数字存储媒体运动图像及其伴音编码标准时间1993年8月输入视频:352×240×30,352×288×25音频:32、44.1、48kHz的线性PCM输出1.5Mb/s、32-384Kb/s(音频)压缩率20~30压缩算法运动补偿帧间预测(单向预测+双向预测)+DCT应用VCD、MP3、局域网视频传输6视频压缩标准对比(续)MPEG2H.262运动图像及其伴音通用编码标准时间1994年11月输入352×288~1920×1152采用频率为16、22.05、24、32、44.1、48kHz的线性PCM、支持5.1声道输出1.5-80Mb/s、8-640Kb/s(音频)压缩率30-40压缩算法运动补偿帧间预测(单双向预测)+DCT、可伸缩性、前向兼容应用DVD、DVB、HDTV7视频压缩标准对比(续)H.263H.263+甚低码率通信的视频编码标准时间1996年3月、1998年1月输入QCIF、CIF、128×96(SubQCIF)、704×576(4CIF)、1408×1152(16CIF)输出30kb/s~压缩率H.263+H.263MPEG2压缩算法运动补偿帧间预测(单双向预测)+DCT局部算法改进可伸缩性应用通用电话交换网、局域网的视频通信8视频压缩标准对比(续)MPEG4(Part2)MPEG4Visual甚低码率活动图像及其伴音编码标准时间1999年输入≧176×144的多种分辨率格式输出4.6Kb/s~64Kb/s压缩率≧100压缩算法基于对象的新一代编码技术,注重交互性,即可包含自然对象,又可包含人工合成对象应用可应用范围很广、目前多用于因特网视频传输、流媒体应用9视频压缩标准对比(续)H.264MPEG4(Part10)MPEG4AVC时间2003年5月输入多种分辨率格式输出压缩率压缩率最高的视频压缩标准,比MPEG4Visual节约50%的码率压缩算法基于传统框架的混合编码系统,只是做了局部优化。更注重编码效率和可靠性应用视频广播、视频通信和存储媒体(CDDVD)等多种应用10MPEG-1视频压缩标准MPEG-1标准号为ISO/IEC11172,它由五部分组成:•MPEG-1系统(MPEG-1Systems):规定视频数据、声音数据及其他相关数据的同步合成技术•MPEG-1视频编码标准(MPEG-1Video)•MPEG-1音频编码标准(MPEG-1Audio)•MPEG-1一致性测试:详细说明如何测试比特数据流和解码器是否满足MPEG-1前3个部分(Part1,2和3)中所规定的要求。•MPEG-1软件模拟:一个技术报告,给出了软件执行MPEG1前3个部分的运行结果。11MPEG-1视频压缩标准输入、输出指标:MPEG视频编码器352×288×25×8×1.5352×240×30×8×1.530Mb/s1.15Mb/s26:112MPEG1视频压缩算法运动补偿帧间预测(temporal)+DCT(spatial)13Frame114Frame215ResidualFrame16象素运动轨迹17Block-basedMotionEstimationandCompensation18Block-basedMotionEstimationandCompensation1916×16BlockSize208×8BlockSize214×4BlockSize22Sub-pixelMotionEstimationandCompensation子像素运动估值与补偿23Sub-pixelMotionEstimationandCompensation24MPEG1视频编码器框架25MPEG1视频编码器框架分块26MPEG1视频压缩算法运动图像序列图片组(GOP)IBBPBBP…图片条(Slice)宏块MacroBlock1616块(Block)88分割:27MPEG1视频压缩算法GOP的组成:一个内帧是一个随机访问点。B图像不能作为其它图像的参考帧。I:内帧P:单向预测帧B:双向预测帧28MPEG1视频压缩算法视频类型IPB平均MPEG-1CIF150000b50000b20000b38000bMPEG-2601400000b200000b80000b130000b为了在图像质量和数据速率之间作出调整,MPEG编码器允许(1)选择内帧I的频率和位置,(2)选择I和P之间双向预测帧B的数目。29MPEG1视频压缩算法运动补偿技术在宏块一级工作。宏块分为四类:•帧内宏块,简称I块•前向预测宏块,简称F块•后向预测宏块,简称B块•平均宏块,简称A块I图像只包含I块,P图像只包含I块和F块,B图像可以包含4种类型的宏块。30MPEG1视频压缩算法I图像帧的压缩算法:在空间方向上(内帧),MPEG-1压缩采用JPEG压缩算法来去掉冗余信息。31MPEG1视频压缩算法P图像帧的压缩算法:对于P宏块,MPEG-1采用运动补偿帧间预测算法来去掉时间轴上的冗余信息。32MPEG1视频压缩算法运动矢量的概念33MPEG1视频压缩算法基于块的运动矢量估值算法——块匹配法34MPEG1视频编码算法块匹配法(BlockMatchingAlgorithm)需要解决两个关键问题:(1)匹配准则(2)搜索算法35MPEG1视频编码算法BMA中常用的匹配准则:绝对值:均方误差:平均绝对帧差:36MPEG1视频编码算法BMA常用搜索算法—二维对数搜索法:37MPEG1视频编码算法BMA常用搜索算法—三步搜索法:38MPEG1视频编码算法BMA常用搜索算法—对偶搜索法:39MPEG1视频编码算法B图像帧的压缩算法:4041MPEG-1音频压缩标准•输入、输出指标:MPEG音频编码器32kHz,44.1kHz,48kHz16位PCM32kb/s~384kb/s层次压缩率数据速率kb/s延迟(ms)14:138419/5026:1~8:1192~25635/100310:1~12:1112~12859/15042MPEG-1音频压缩算法•听觉系统的感知特性:听阈-频率曲线43MPEG-1音频压缩算法•听觉系统的感知特性:一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽44MPEG-1音频压缩算法•听觉系统的感知特性:一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽在时间上相邻的声音之间也有掩蔽现象,称为时域掩蔽。时域掩蔽又分为超前掩蔽和滞后掩蔽。45MPEG-1音频压缩算法•感知子带压缩算法算法以心理声学模型为基础,主要利用了听觉阈值和听觉掩蔽特性46MPEG-1音频压缩算法•感知子带压缩算法1、将音频信号用滤波器组分成32个子带;2、用FFT将子带变换到频率域3、根据心理声学模型估计各个子带的感知阈值4、根据对感知阈值的估计对各个子带进行比特分配和量化。MP3采用了与MP1、MP2不同的滤波器和心理声学模型。47MPEG-1音频压缩算法MPEG-1Audio层1和层2编码器和解码器的结构48MPEG-1音频压缩算法MPEG-1Audio层3编码器和解码器的结构49H.261概述•H.261也称P×64,这是ITU-T(前身为CCITT)最早制定的关于视频编码的国际标准。考虑到ISDN的传输码率以64kbps为单位,因此以p×64kbps(p=1~30)作为为H.261的标准码率。H.261标准主要用于电视电话和电视会议。它支持QCIF(p=1、2)、CIF(p2)两种图像输入格式。50H.261解决的问题•第一是编码算法问题。确立了一种合理的、保证图像质量且为各国图像编码专家所公认的统一的算法。算法必须能够实时操作,解码延时要短。•第二是与PCM标准兼容的问题。编解码器以64~1920kb/s的工作速率去覆盖N-ISDN或PCM一次群的通道。•第三,解决电视制式不同的问题。为了使同一标准既能用于PAL(625)和NTSC(525)两种电视制式系统,源编码基于中间格式CIF格式,所以输入输必须经转换到CIF或QCIF格式再进行源编码。51视频编码图像格式一览表采用标准CCIR601ISO/MPEG-1CCITTH.261参数PALNTSCSIFCIFQCIF每秒帧数2530253029.97Y每帧行数CrCb5762882884802402402881441442401201202881441441447272Y每行象素CrCb720360360360180180352176176176888852H.261的信源编码框架53H.261的信源编码算法•一、将预测误差或输入图像划分成为8*8的象素块。进一步,将4个亮度像块和两个在空间位置上与之重叠的色差像块符合成一个16*16的宏块(MB)。•二、对于帧序列中的第一副图像或景物变换后的第一副图像,采用帧内变换编码:利用8*8的DCT实现。各DCT系数经过线性量化、变长编码后进入缓冲器,根据缓冲器的上溢和下溢,来反馈调节量化器的量化步长,以控制视频编码位流使之与信倒速率相匹配。54H.261的信源编码算法•帧间预测采用混合方法:利用运动补偿预测,当预测误差超过某个门限后,对误差做DCT、视觉加权量化及熵编码。运动矢量信息编码后也送到缓冲器中。DCT去除空间冗余度,而使用有运动补偿的帧间预测来去除时间上的冗余。这是一个典型的帧内/帧间自适应预测加DCT变换的混合算法。55H.261的图像复用编码•H.261源编码后进行图像复用编码,实际上是把比特流分成图像(Picture),像块组(GOB:Groupofblocks),宏块(MB:Macroblock)和像块(Block),并附加相应的信息。按照CIF格式,每帧CIF图像包含12个GOB,每个GOB包含33个MB,每个MB包含4个亮度数据块和各1个Cb、Cr色度块,每个B包含8*8象素。56H.261的图像复用编码H.261数据流结构57H.261视频压缩算法•利用二维DCT减少图像的空间域的冗余度;•利用运动补偿预测减少图像的时间域冗余度;•利用视觉加权量化减少图像灰度域的冗余度;•利用熵编码来减少图像的频率域的冗余度。58H.261与MPEG-1的对比59MPEG-2通用视频压缩标准MPEG-2的标准号为ISO/IEC13818,它主要由以下几部分组成:•MPEG-2系统(MPEG-1Systems)•MPEG-2视频编码标准(MPEG-2Video)•MPEG-2音频编码标准(MPEG-2Audio)•MPEG-2高级音频编码标准(MPEG-2AAC)与MPEG-1一样,MPEG-2只规定了码流结构和解码器算法规则,而把实际编码器模型向设计者开放,以提供更多的选择性和自由度。60MPEG-2VideoMPEG-2Video与MPEG-1的基本编码算法相同,只是增加了如下功能:(1)能够在很宽的范围内对不同分辨率和不同输出比特率的图像信号有效的进行压缩。(2)处理隔行扫描的视频信号的能力。(3)多样化的取样模式:4:2:0,4:2:2,4:4:4(4)可伸缩(Scalable)的视频编码模式:Ⅰ编码时可以在图像质量和数据速率之间作出调整Ⅱ解码时只对码流的一部分进行解码和对码流的全部进行解码能够分别获得不同质量