GY中华人民共和国广播电影电视行业标准GY/T262—2012节目响度和真峰值音频电平测量算法Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel(ITUBS.1770-2:2011,IDT)2012-08-07发布2012-08-07实施国家广播电影电视总局发布GY/T262—2012I目次前言................................................................................II 引言...............................................................................III 1范围..............................................................................1 2术语和定义........................................................................1 3多声道响度客观测量算法............................................................1 4真峰值电平测量算法................................................................5 附录A(资料性附录)多声道响度测量算法描述............................................8 附录B(资料性附录)关于准确测量数字音频信号峰值电平的考虑事项.......................16 GY/T262—2012II前言本标准按照GB/T1.1-2009给出的规则起草。本标准使用翻译法等同采用ITU-RBS.1770-2:2011《节目响度和真峰值音频电平测量算法》。本标准由全国广播电影电视标准化技术委员会(SAC/TC239)归口。本标准起草单位:国家广播电影电视总局广播电视规划院。本标准主要起草人:张建东、邓向冬、崔俊生、覃毅力、宁金辉、韦安明、董文辉。GY/T262—2012III引言考虑到:a)现代数字音频技术支持传输动态范围非常大的音频节目;b)现代数字音频节目制作和传输技术支持单声道、立体声和多声道格式的混合应用,因此以这三种格式制作的声音节目并存;c)受众希望不同来源和不同类型的节目声音在主观响度上保持一致;d)音频电平的测量方法有很多,但在节目制作中,现有测量方法不能提供主观响度指示;e)为在节目交换中实施响度控制,提高受众满意度,有必要规定一个唯一的节目主观响度的客观测量算法;f)将来基于心理声学模型的复杂算法,可能为多种多样的音频节目提供与主观感觉更一致的响度客观测量;g)应避免数字媒体在记录中突然出现的过载,即便是瞬时的过载。进一步考虑到:a)通用的音频信号处理,如滤波处理或者比特率压缩,可能导致信号峰值电平的增加;b)由于信号的真峰值可能出现在两个采样点之间,现有的测量技术没有反映出包含在数字信号中的真峰值电平;c)目前的数字信号处理技术,使得实现一种算法来近似地估算信号的真峰值电平成为可能;d)使用真峰值算法可以准确地指示出数字音频信号的峰值电平和削波电平之间的余量;e)广播电视有使用指示节目响度和真峰值电平的仪表的需求。建议:a)为利于节目传送和交换而有必要对音频通道或节目的响度进行客观测量时,应采用本标准第3章规定的算法;b)在节目制作和后期制作中用来测量节目响度的方法,可以本标准第3章规定的算法为基础;c)当需要指示数字音频信号的真峰值电平时,测量算法应基于本标准第4章的规定,或者其他能给出类似或更准确测量结果的方法。进一步建议:a)进一步扩展第3章定义的算法,以适应对短期响度的测量;b)如果证实新的响度测量算法的性能明显优于第3章规定的算法性能,可考虑更新本标准。GY/T262—20121节目响度和真峰值音频电平测量算法1范围本标准规定了一至五个声道节目音频的响度客观测量算法以及音频信号真峰值电平的测量算法。本标准适用于在电视节目或广播节目的收录、制作、交换、传送和监测环节,对节目响度和真峰值电平的测量,也适用于响度和真峰值测量仪表的研究和开发。2术语和定义下列术语和定义适用于本标准。2.1绝对响度单位LKFSabsoluteloudnessunit(LKFS)使用符合本标准响度算法计算出的响度值的单位,以LKFS标示。其中,“K”表示测量中使用的频率加权,具体频率加权算法见第3章。LKFS表示“K加权下相对于标称满刻度的响度”。2.2真峰值电平true-peaklevel信号在连续时域中的昀大峰值电平,是相对于离散采样点的昀大峰值电平而言的。信号的真峰值电平可能大于在采样时刻获得的昀大离散采样点的峰值电平。2.3RLB加权revisedlow-frequencyB-curveweighting对音频噪声电平测量中B加权曲线进行修改形成的加权曲线,具体频率响应见第3章。3多声道响度客观测量算法本章定义了多声道响度客观测量模型化算法,该算法包含四个阶段:——“K”频率加权;——各声道能量均方值计算;——声道加权求和(环绕声道的权重较高,且不包括LFE声道);——在一个响度测量周期内,以400ms采样块组成的滑动窗口为单位(相邻窗口75%时间重叠)对响度测量值进行两步阈值处理:•第一步处理的阈值为-70LKFS;•第二步处理的阈值为经过第一步阈值处理后测得的响度值减去10dB。多声道响度客观测量算法处理流程见图1。为便于算法描述,对图1中的流程节点设置了标签。图1显示了五个主要声道的输入(左、中、右、左环绕和右环绕),算法允许监测包含一至五个音频声道,对于少于五个声道的节目,一些输入可以不使用。本算法不对低频效果(LFE)声道进行测量。GY/T262—20122图1多声道响度客观测量算法处理流程框图算法的第一阶段是对信号进行两级预滤波,第一级用于考虑头部的声学效果,这里头部被建模为一个严格的球体。用于考虑头部声学效果的第一级预滤波滤波器的频率响应见图2。图2用于考虑头部声学效果的第一级预滤波滤波器的频率响应考虑头部声学效果的第一级预滤波滤波器的信号流程见图3。滤波器系数见表1。图3一个二阶滤波器的信号处理流程GY/T262—20123表1第一级预滤波滤波器系数a1a2b0b1b2−1.690659293182410.732480774215851.53512485958697−2.691696189406381.19839281085285表1规定的滤波器系数是针对采样率为48kHz音频信号的,针对其他采样率的音频信号则需要不同的滤波器系数,以使滤波器的频率响应符合图2所示的频率响应曲线。在算法的实际实现中,可能由于硬件支持的精度不够,需要对表1中的系数值进行量化。经过测试表明,本算法的性能对系数的微小变化不敏感。第二级预滤波是应用RLB加权曲线,通过一个简单的高通滤波器实现。RLB加权二阶滤波器的信号流程见图3,频率响应曲线见图4,RLB加权滤波器系数见表2。图4第二级预滤波─RLB加权滤波器的频率响应曲线表2第二级预滤波─RLB加权滤波器系数a1a2b0b1b2−1.990047454833980.990072250366211.0−2.01.0表2规定的滤波器系数是针对采样率为48kHz音频信号的,针对其他采样率的音频信号则需要不同的滤波器系数,以使滤波器的频率响应符合图4所示的频率响应曲线。对预滤波后的信号计算测量周期T内的能量均方值Zi,计算公式见式(1)。tyTzTiid102∫=.............................................................(1)式中:yi——对输入信号预滤波后的值;{}iIILRCLsRs∈=,,,,,,I为输入声道的集合。GY/T262—20124测量周期T内的响度kL的定义见式(2)。100.69110logkiiiLGz=+⋅∑LKFS................................................(2)式中:iG——各个声道的加权系数。为使测量响度值与主观响度更加接近,需对按照式(2)测量出的响度值进行阈值处理。将测量周期T分为一系列交互重叠的滑动窗口,窗口长度Tg=400ms,窗口内的一组连续音频采样值组成采样块,各个采样块应有75%的时间重叠。测量周期T的末端应限制在昀后一个完整采样块的结尾,即测量周期结束端对应的不完整的采样块不予使用。在测量周期T内,第i个输入声道的第j个采样块能量均方值Zij的计算见式(3)。(1)21ggTjstepijigTjstepzydtT⋅⋅+⋅⋅=∫......................................................(3)式中:1step=−重叠率;(重叠率=75%);–0,1,2,...ggTTjTstep⎧⎫⎪⎪∈⎨⎬⋅⎪⎪⎩⎭。第j个采样块的响度lj的定义见式(4)。10–0.69110logjiijilGz=+⋅∑....................................................(4)对于阈值Γ,存在一个集合Jg={j:ljΓ},集合中的元素j为采样块响度值高于阈值的采样块在测量周期T内的索引,gJ表示集合Jg中元素的个数。响度测量周期T内,进行阈值处理后的响度LKG的定义见式(5)。101–0.69110loggKGiijiJgLGzJ⎛⎞⎜⎟=+⋅⋅⎜⎟⎝⎠∑∑LKFS..............................(5)测量算法的阈值处理分为两步,第一步为绝对阈值处理,第二步为相对阈值处理。相对阈值rΓ通过式(6)计算,其中,aΓ为绝对阈值,aΓ=-70LKFS。101–0.69110loggriijiJgGzJ⎛⎞⎜⎟Γ=+⋅⋅⎜⎟⎝⎠∑∑LKFS............................(6)式中:{}:gjaJjl=Γ;用rΓ按公式(5)计算阈值处理后的响度值。式中:GY/T262—20125{}:gjrJjl=Γ。测量中使用的频率加权,由预滤波器(补偿头部声学效果的第一级滤波器和RLB加权第二级滤波器的级联)产生,命名为“K”加权。由式(2)计算出的响度值应以“LKFS”为单位,“LKFS”表示“K加权下相对于标称满刻度的响度”。信号电平每增加1dB,将导致响度值读数增加1LKFS,从这个意义上来讲,LKFS单位与dB相当。如果将一个0dBFS的1kHz正弦波信号分别输入到左声道、中置声道或右声道,则对应的响度指示值均为–3.01LKFS。音频信号各个声道的加权系数见表3。表3音频信号各个声道加权系数声道加权,Gi左(GL)1.0(0dB)右(GR)1.0(0dB)中置(GC)1.0(0dB)左环绕(GLs)1.41(~+1.5dB)右环绕(GRs)1.41(~+1.5dB)有关多声道响度测量算法更详细地描述,参见附录A。应该注意到:本标准规定的算法对于典型的广播内容的音频节目的响度估算有效,但是通常不适用于估算纯音信号的主观响度。4真峰值电平测量算法本章描述了一种单声道线性PCM数字音频信号真峰值电平的估算算法,以下算法描述以48kHz采样率为例。真峰值电平是指信号波形在连续时域中的昀大值(正值或负值),该数值可能大于以48kHz采样率采样获得的昀大采样值。考虑到实际应用中,测量点下游的一些处理设备有可能对原信号滤除直流分量,因此,本算法不仅可以估算原信号的真峰值电平,而且还包含了一个可选项,用来估算原信号滤除直流分量后的真峰值电平;本算法的另一个可选项是轻微的高频预加重,这样做是考虑下游信号处理环节(例如奈奎斯