第五章MPEG压缩技术MPEG(MovingPictureExpertGroup)是在1988年由国际标准化组织(InternationalOrganizationforStandardization,ISO)和国际电工委员会(InternationalElectrotechnicalCommission,IEC)联合成立的专家组,负责开发电视图像数据和声音数据的编码、解码和它们的同步等标准。这个专家组开发的标准称为MPEG标准,到目前为止,已经开发和正在开发的MPEG标准有:MPEG-1:数字电视标准,1992年正式发布。MPEG-2:数字电视标准。MPEG-3:已于1992年7月合并到高清晰度电视(High-DefinitionTV,HDTV)工作组。MPEG-4:多媒体应用标准(1999年发布)。MPEG-7:多媒体内容描述接口标准(正在研究)。主要应用范围•光盘存储•数字视频的传播•交换式数字视频•HDTV•网络多媒体MPEG-1和-2典型的编码参数MPEG-1MPEG-2(基本型)标准化时间1992年1994年(DIS)主要应用CD-ROM上的数字电视,VCD数字TV,DVD空间分辨率CIF格式(1/4TV),288×360像素TV,576×720像素时间分辨率25-30帧/秒50-60场/秒位速率1.5Mbit/s15Mbit/s质量相当于VHS相当于NTSC/PAL电视压缩率20~3030~405.1MPEG-1数字电视标准MPEG-1处理的是标准图像交换格式(StandardInterchangeformat,SIF)或者称为源输入格式(SourceInputFormat,SIF)的电视,即NTSC制为352像素240行/帧30帧/秒,PAL制为352像素288行/帧25帧/秒,压缩的输出速率定义在1.5Mbit/s以下。这个标准主要是针对当时具有这种数据传输率的CD-ROM和网络而开发的,用于在CD-ROM上存储数字影视和在网络上传输数字影视。MPEG-1的标准号为ISO/IEC11172,标准名称为“信息技术——用于数据速率高达大约1.5Mbit/s的数字存储媒体的电视图像和伴音编码”Informationtechnology—Codingofmovingpicturesandassociatedaudiofordigitalstoragemediaatuptoabout1.5Mbit/s)。它已于1991年底被ISO/IEC采纳,由五个部分组成:①MPEG-1系统,写成MPEG-1Systems,规定电视图像数据、声音数据及其他相关数据的同步,标准名是ISO/IEC11172-1:1993Informationtechnology—Codingofmovingpicturesandassociatedaudiofordigitalstoragemediaatuptoabout1.5Mbit/s—Part1:Systems。②MPEG-1电视图像,写成MPEG-1Video,规定电视数据的编码和解码,标准名是ISO/IEC11172-2:1993Informationtechnology—Codingofmovingpicturesandassociatedaudiofordigitalstoragemediaatuptoabout1.5Mbit/s—Part2:Video。③MPEG-1声音,写成MPEG-1Audio,规定声音数据的编码和解码,标准名是ISO/IEC11172-3:1993Informationtechnology—Codingofmovingpicturesandassociatedaudiofordigitalstoragemediaatuptoabout1.5Mbit/s—Part3:Audio。④MPEG-1一致性测试,写成MPEG-1Conformancetesting,标准名是ISO/IEC11172-4:1995Informationtechnology—Codingofmovingpicturesandassociatedaudiofordigitalstoragemediaatuptoabout1.5Mbit/s—Part4:Conformancetesting。这个标准详细说明如何测试比特数据流(bitstreams)和解码器是否满足MPEG-1前3个部分(Part1,2和3)中所规定的要求。这些测试可由厂商和用户实施。⑤MPEG-1软件模拟,写成MPEG-1Softwaresimulation,标准名是ISO/IECTR11172-5Informationtechnology—Codingofmovingpicturesandassociatedaudiofordigitalstoragemediauptoabout1.5Mbit/s—Part5:Softwaresimulation。实际上,这部分的内容不是一个标准,而是一个技术报告,给出了用软件执行MPEG-1标准前3个部分的结果。MPEG-1译码器的方框图5.2MPEG-2数字电视标准MPEG-2标准从1990年开始研究,1994发布DIS。它是一个直接与数字电视广播有关的高质量图像和声音编码标准。MPEG-2可以说是MPEG-1的扩充,因为它们的基本编码算法都相同。但MPEG-2增加了许多MPEG-1所没有的功能,例如增加了隔行扫描电视的编码,提供了位速率的可变性能(scalability)功能。MPEG-2要达到的最基本目标是:位速率为4~9Mbit/s,最高达15Mbit/s。MPEG-2的标准号为ISO/IEC13818,标准名称为“信息技术电视图像和伴音信息的通用编码(Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation)”。MPEG-2包含9个部分:①MPEG-2系统,写成MPEG-2Systems,规定电视图像数据、声音数据及其他相关数据的同步,标准名是ISO/IEC13818-1:1996Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation:Systems。这个标准主要是用来定义电视图像数据、声音数据和其他数据的组合,把这些数据组合成一个或者多个适合于存储或者传输的基本数据流。数据流有两种形式,一种称为程序数据流(ProgramStream,PS),另一种称为传输数据流(TransportStream,TS)。程序数据流是组合一个或者多个规格化的即包化基本数据流(PacketisedElementaryStreams,PES)而生成的一种数据流,用在出现错误相对比较少的环境下,适合使用软件处理的应用;传输数据流也是组合一个或者多个PES而生成的一种数据流,它用在出现错误相对比较多的环境下,例如在有损失或者有噪声的传输系统中。MPEG-2的系统模型②MPEG-2电视图像,写成MPEG-2Video,规定电视数据的编码和解码,标准名是ISO/IEC13818-2:1996Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation:Video。为了适应各种应用,这个标准定义了电视图像的各种规格,称为配置(profile)。表中的“X”符号表示MPEG-2支持的配置。有些人认为使用4:2:0子采样格式的图像质量还不够好,因此在1996年的标准中增加了4:2:2子采样格式的图像。多视角配置(MultiviewProfile,MVP)是附加的配置。③MPEG-2声音,写成MPEG-2Audio,规定声音数据的编码和解码,是MPEG-1Audio的扩充,支持多个声道,标准名是ISO/IEC13818-3:1998Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation—Part3:Audio。配置等级Simple(简化型)Main(基本型)SNRscalable(信噪比可变型)Spatialscalable(空间分辨率可变型)High(高级型)Multiview(多视角型)4:2:2Highlevel(高级)XXHigh-1440level(高级1440)XXXMainlevel(基本级)XXXXXXLowlevel(低级)XXMPEG-2电视图像配置④MPEG-2一致性测试,写成MPEG-2Conformancetesting,标准名是ISO/IECDIS13818-4Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation—Part4:Conformancetesting。⑤MPEG-2软件模拟,写成MPEG-2Softwaresimulation,标准名是ISO/IECTR13818-5:1997Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation—Part5:Softwaresimulation。⑥MPEG-2数字存储媒体命令和控制扩展协议,写成MPEG-2ExtensionsforDSM-CC,标准名是ISO/IECDIS13818-6Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation—Part6:ExtensionsforDSM-CC。⑦MPEG-2先进声音编码,写成MPEG-2AAC,是多声道声音编码算法标准。这个标准除后向兼容MPEG-1Audio标准之外,还有非后向兼容的声音标准。标准名是ISO/IEC13818-7:1997Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation—Part7:AdvancedAudioCoding(AAC)。⑧MPEG-2系统解码器实时接口扩展标准,标准名是ISO/IEC13818-9:1996Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation—Part9:Extensionforrealtimeinterfaceforsystemsdecoders。⑨MPEG-2DSM-CC一致性扩展测试,标准名是ISO/IECDIS13818-10Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation—Part10:ConformanceextensionsforDigitalStorageMediaCommandandControl(DSM-CC)。5.3MPEG-4多媒体应用标准MPEG-4从1994年开始工作,它是为视听(audio-visual)数据的编码和交互播放开发算法和工具,是一个数据速率很低的多媒体通信标准。MPEG-4的目标是要在异构网络环境下能够高度可靠地工作,并且具有很强的交互功能。为了达到这个目标,MPEG-4引入了对象基表达(object-basedrepresentation)的概念,用来表达视听对象(audio/visualobjects,AVO);MPEG-4扩充了编码的数据类型,由自然数据对象扩展到计算机生成的合成数据对象,采用合成对象/自然对象混合编码(S