GY中华人民共和国广播电影电视行业标准GY/T281—2014音频扩展文件格式MBWF/RF64AnextendedfileformatforaudioMBWF/RF642014-12-03发布2014-12-03实施国家新闻出版广电总局发布GY/T281—2014I目次前言................................................................................II 1范围..............................................................................1 2术语、定义和缩略语................................................................1 3概述..............................................................................2 4基本用户需求......................................................................2 5RF64文件格式定义..................................................................2 附录A(规范性附录)RIFF/WAVE和RF64/WAVE结构的形式化描述............................8 参考文献............................................................................14 GY/T281—2014II前言本标准按照GB/T1.1-2009给出的规则起草。本标准依据EBU-TECH3306:2009《MBWF/RF64:音频扩展文件格式》起草。本标准由全国广播电影电视标准化技术委员会(SAC/TC239)归口。本标准起草单位:国家新闻出版广电总局广播电视规划院。本标准主要起草人:张建东、邓向冬、肖辉。GY/T281—20141音频扩展文件格式MBWF/RF641范围本标准规定了专业广播领域内的一种超过4G字节大小的数字音频文件格式要求。本标准适用于数字音频文件的录制、归档和交换。2术语、定义和缩略语2.1术语和定义下列术语和定义适用于本标准。2.1.1环绕声数字音频编码audiocodinggeneration3;AC-3在ETSITS102366标准中定义的数字音频压缩编解码标准。2.1.2广播音频扩展broadcastaudioextension;bext一种音频数据块,用于定义音频资料文件交换所需的基本参数,如创作者姓名、创作日期等。2.1.3MPEG-2AAC在ISO/IEC13818-7标准中定义的数字音频压缩编解码标准。2.1.4数字影院系统digitaltheatersystems;DTS一种数字音频压缩编解码系统。2.1.5DolbyE一种数字音频压缩编解码系统,可用于音频信号的馈送和分配环节。2.1.6RF64一种基于64位的资源交换文件格式。2.2缩略语下列缩略语适用于本标准。GY/T281—20142BWF广播波形格式(BroadcastWaveFormat)GUID全球唯一标识符(GloballyUniqueIdentifier)MBWF多声道广播波形格式(MultichannelBroadcastWaveFormat)MPEG运动图像专家组(MovingPictureExpertsGroup)PCM脉冲编码调制(PulseCodeModulation)RIFF资源交换文件格式(ResourceInterchangeFileFormat)WAVE波形音频文件格式(Waveformaudiofileformat)3概述RF64文件格式能够满足多声道声音节目在广播和归档应用中的长期需求。RF64文件格式在RIFF/WAVE文件基本规范的基础上进行了以下扩展:z文件大小超过4G字节;z扩展了WaveFormatExtensible中多声道参数的定义,可承载昀多至18个环绕声道、立体声下混声道和非PCM编码数据比特流信号。RF64文件格式作为RIFF/WAVE格式和BWF及其补充数据块的一种可兼容扩展格式,扩展了RIFF/WAVE和BWF的昀大文件容量,以满足多声道声音节目广播和音频归档的应用需求。RF64可应用于从声音采集、编辑到播出的整个节目生产过程,以及多声道文件的短期或长期归档。本标准中将包含bext块的RF64文件定义为MBWF(MultichannelBWF)文件,术语“RF64”与“MBWF”可视为同义。4基本用户需求音频扩展文件格式应满足如下的基本用户需求:z文件格式应开放且基于已发布的规范;z保持与BWF和RIFF/WAVE的兼容;z支持线性PCM信号的存储;z支持超过4G字节的文件;z至少支持8声道信号存储(5.1+双声道立体声);z适用于包含在单个文件中的5.1声道和双声道立体声信号的同步播出;z支持音频码流的存储;z适用于音频信号编辑;z适用于从文件中直接导出浏览版本(文件格式元数据);z包含播放所需的技术元数据(如杜比元数据);z适用于经济易用的软件播放器;z易于软件开发者和制造商实现。此外,根据实际系统的运行经验,节目制作和归档中通常需要在单个文件中存储和传送PCM和/或非PCM音频数据,因此在RF64格式中增加了容纳非PCM音频流(如:AC-3和DTS)的机制。5RF64文件格式定义5.1WaveFormatExtensible声道模板GY/T281—20143WaveFormatExtensible的声道模板包含的前18个“#define”定义,用于指定不同的扬声器位置(声道分配),还有一个“#define”设置为“SPEAKER_ALL”,表示开启所有扬声器(声道)。WaveFormatExtensible声道模板的扬声器位置/声道分配定义及标识见表1。表1WaveFormatExtensible声道模板扬声器位置/声道分配定义标识#defineSPEAKER_FRONT_LEFT0x00000001#defineSPEAKER_FRONT_RIGHT0x00000002#defineSPEAKER_FRONT_CENTER0x00000004#defineSPEAKER_LOW_FREQUENCY0x00000008#defineSPEAKER_BACK_LEFT0x00000010#defineSPEAKER_BACK_RIGHT0x00000020#defineSPEAKER_FRONT_LEFT_OF_CENTER0x00000040#defineSPEAKER_FRONT_RIGHT_OF_CENTER0x00000080#defineSPEAKER_BACK_CENTER0x00000100#defineSPEAKER_SIDE_LEFT0x00000200#defineSPEAKER_SIDE_RIGHT0x00000400#defineSPEAKER_TOP_CENTER0x00000800#defineSPEAKER_TOP_FRONT_LEFT0x00001000#defineSPEAKER_TOP_FRONT_CENTER0x00002000#defineSPEAKER_TOP_FRONT_RIGHT0x00004000#defineSPEAKER_TOP_BACK_LEFT0x00008000#defineSPEAKER_TOP_BACK_CENTER0x00010000#defineSPEAKER_TOP_BACK_RIGHT0x00020000#defineSPEAKER_ALL0x80000000为满足第4章列出的用户需求,RF64需要对基本WaveFormatExtensible的声道模板进行扩展。声道模板的标识使用一个32位变量存储,因此,还可定义另外13个“#define”来满足新增的用户需求。5.2PCM双声道立体声下混定义扩展WaveFormatExtensible中不包含PCM双声道立体声信号的定义,因此在声道模板中增加以下定义:#defineSPEAKER_STEREO_LEFT0x20000000#defineSPEAKER_STEREO_RIGHT0x40000000使用此定义,可满足在单一文件中包含一个多声道“X.1”信号和一个双声道立体声下混信号。5.3控制数据定义扩展增加了两个“#define”用于定义控制数据:#defineSPEAKER_CONTROLSAMPLE_10x08000000#defineSPEAKER_CONTROLSAMPLE_20x10000000控制数据可以存储在文件中,技术或内容元数据定位的方法预留定义。GY/T281—201445.4非PCM比特流数据定义扩展符合IEC61937-1、IEC61937-3、IEC61937-5、IEC61937-6、SMPTE337M、SMPTE338M、SMPTE339M和SMPTE340M标准的比特流信号包含以各种方式编码的非PCM多声道音频数据。通过文件格式中的比特流存储方式,AC-3、DolbyE、DTS、MPEG-1和MPEG-2(包括所有三个层)、MPEG-2AAC编码的音频数据,与线性PCM信号的存储方式类似,以数据帧的方式存储于文件中。文件格式中比特流音频信号的嵌入结构,类似于线性PCMRIFF/WAVE或BWF文件中两个交织立体声音频声道的结构。RIFF文件中仅有一个格式块,用于定义音频数据块中所有交织声道的通用参数。如果同一个文件中还存在其他PCM音频,则比特流声道格式必须遵从文件中其他多声道PCM或双声道立体声PCM的声道格式。在文件的接收端,只有通过AES3或SPDIF接口解码比特流时,方可获知非PCM音频编码的类型,因此将来有必要增加一个新的块定义来指示文件中包含的比特流格式。对WaveFormatExtensible声道模版新增以下4个“#define”定义,用于承载两种非PCM格式:#defineSPEAKER_BITSTREAM_1_LEFT0x00800000#defineSPEAKER_BITSTREAM_1_RIGHT0x01000000#defineSPEAKER_BITSTREAM_2_LEFT0x02000000#defineSPEAKER_BITSTREAM_2_RIGHT0x040000005.5支持超过4G字节的文件4G字节文件大小限制源于RIFF/WAVE和BWF格式中的32位寻址方式,使用32位的昀大寻址范围为4294967296字节(即4G字节),为支持超过4G字节的文件,本标准使用64位寻址方式。如果仅将BWF中每个字段的长度改为64位,显然将生成一个与标准RIFF/WAVE格式不兼容的文件。标准RIFF/WAVE文件格式见图1,其中除fmt块数据和音频数据外,其余字段长度均为32位。图1标准RIFF/WAVE格式因此,本标准定义了一种新的基于64位的资源交换文件格式(ResourceInterchangeFileFormat),称为RF64。RF64与原有的RIFF/WAVE格式基本相同,不同之处如下所述:z文件起始的四个字节,以“RF64”标识替代“RIFF”;z文件中定义了一个必须包含的“ds64”(datasize64)块,该块须紧接在“RF64”块之后。“ds64”块包括三个必选的64位整型值,替代RIFF/WAVE格式中原有的三个32位字段:zRIFF块大小;zdata块大小;GY/T281—20145zfact块中的样本计数值。对RIFF/WAVE格式中上述三个32位字段应用以下替代规则:如果字段的32位值不是“-1”(即十六进制的0