中国传媒大学13/05/2013章文辉53三、声音信号数字化行业标准GY/T156-2000《演播室数字音频参数》取样频率:44.1kHz(50×294×3与电视信号记录有关);48kHz;32kHz。量化比特数(n):20、16、18、24bit;量化信噪比:)(676.1maxdBnNSq+=⎥⎥⎦⎤⎢⎢⎣⎡中国传媒大学13/05/2013章文辉54三、声音信号数字化AES(AudioEngineeringSociety)EBU(EuropeanBroadcastingUnion)开发的一个数字音频传输标准,即AES/EBU标准传输和接收数字音频信号的数字设备接口协议(GY/T158-2000)传输介质采用电缆;串行传输时先传输最低有效位;加入字节时钟标志以表明每个样值的开始;串行传输的数据流进行双相标志码编码;中国传媒大学13/05/2013章文辉55模拟音频信号(1)16bitA/D转换器fs=48kHz(2)串行器(3)AES/EBU格式化器(5)双相标志码编码(4)同步比特AES/EBU数字音频信号形成中国传媒大学561、音频信号的取样和量化中国传媒大学57数字音频编码原理简述二进制编码最基本原理用3个比特(3个2进制数)来表达10进制数的[0]至[7][0]=000[1]=001[2]=010[3]=011[4]=100[5]=101[6]=110[7]=1113个比特只能表达到7,大于7就要用4个比特才够了中国传媒大学58二进制补码二进制补码:平时我们接触到的计算机编码实际上都是2进制补码表示法0和正数的补码:同原码[+0]补码=000;[+1]补码=001;[+2]补码=010;[+3]补码=011负数的补码:(1)写出与该负数相对应的正数的补码(2)按位求反(3)末位加1中国传媒大学59音频信号编码GB/T158-2000规定:音频样值字表示数字音频取样的幅度,用线性2的补码表示,正数对应于模拟/数字转换器输入端的正模拟电平。中国传媒大学60音频信号编码以16比特为例说明。用16个比特来表示的有正负极性的音频信号第1个比特用来表示音频信号的正负极性另外15个比特用来表达实际电平值16比特的系统,就是用16个2进制编码来表示音频信号每个量化等级的电平幅度。16比特的系统,可以表达的最大正向音频编码为0111111111111111,用16进制数为7FFF16比特的系统,可以表达的最大负向音频编码为1000000000000000,用16进制数为8000中国传媒大学61GY/T192-2003《数字音频设备的满度电平》对数字音频最大电平的定义GY/T192标准规定一个16比特系统的最大电平的正峰值为7FFF(十六进制),负峰值为8000(十六进制),记为0dBFS.同时规定基准电平比系统最大电平低20dB记为-20dBFS.根据计算可知,-20dBFS的电平编码为:正向信号0CCD负向信号F333中国传媒大学620111111111111111011111111111111001111111111111010111111111111100000000000000001000000000000000100000000000000001000000000000000011111111111111111111111111111110111111111111110110000000000000001000000000000010100000000000001110000000000000017FFF80000000正弦波幅度0值允许的最大正弦波峰值正弦波负峰值位置+32767-32768-32767-32766-327650-1-2-3+1+2+3+32766+32765+32764图616比特有效位编码的二进制、十六进制编码、量化级和相对满度电平的对应关系+40950FFFEBUR68-2000基准电平位置000011111111111100001100110011010CCD+3277SMPTERP155标准基准电平位置-20dBFS的峰值-20dBFS的准峰值数字峰值表显示的是准峰值,因此正弦波基准电平的实际峰值还将高3dB数字峰值表显示的是准峰值,因此如保证正弦波的峰值信号不过载,仪表应保持不超过-3dBFS时为宜二进制编码十六进制编码量化级相对满度电平参考信号幅度0dBFS-18.06dBFS-20dBFS音频信号幅度与编码的关系中国传媒大学630111111111111111011111111111111001111111111111010111111111111100000000000000001000000000000000100000000000000001000000000000000011111111111111111111111111111110111111111111110110000000000000001000000000000010100000000000001110000000000000017FFF80000000正弦波幅度0值允许的最大正弦波峰值正弦波负峰值位置+32767-32768-32767-32766-327650-1-2-3+1+2+3+32766+32765+32764图616比特有效位编码的二进制、十六进制编码、量化级和相对满度电平的对应关系+40950FFFEBUR68-2000基准电平位置000011111111111100001100110011010CCD+3277SMPTERP155标准基准电平位置-20dBFS的峰值-20dBFS的准峰值数字峰值表显示的是准峰值,因此正弦波基准电平的实际峰值还将高3dB数字峰值表显示的是准峰值,因此如保证正弦波的峰值信号不过载,仪表应保持不超过-3dBFS时为宜二进制编码十六进制编码量化级相对满度电平参考信号幅度0dBFS-18.06dBFS-20dBFS得到音频信号幅度与编码的关系中国传媒大学13/05/2013章文辉64模拟音频信号(1)16bitA/D转换器fs=48kHz(2)串行器(3)AES/EBU格式化器(5)双相标志码编码(4)同步比特AES/EBU数字音频信号形成中国传媒大学65音频数据字串行化将最低有效位在前进行并串转换16比特音频数据字Lsb...…Msb中国传媒大学13/05/2013章文辉66模拟音频信号(1)16bitA/D转换器fs=48kHz(2)串行器(3)AES/EBU格式化器(5)双相标志码编码(4)同步比特AES/EBU数字音频信号形成中国传媒大学13/05/2013章文辉673、AES/EBU信号格式AES/EBU信号格式中的音频帧结构的基本单位为音频帧,每192个音频帧构成一个块。一帧包括两个子帧(子帧A和子帧B),每个子帧包括来自一个音频源或声道的样值数据、辅助数据、同步数据、附加数据(包括有效比特(V)、用户比特(U)、声道状态比特(C)和奇偶校验比特(P))。在数据流中一个标志符Z标识每个块的开始。一个块192个音频帧384个音频子帧声道1声道2中国传媒大学13/05/2013章文辉68AES/EBU信号格式中的音频帧结构03478272831帧1子帧2子帧1Y声道2Z声道1Y声道2X声道1帧0前置同步字辅助字LSB20bit音频采样字MSBVUCP帧191V有效比特U用户数据比特C声道状态比特P奇偶校验比特中国传媒大学13/05/2013章文辉69音频帧数据一个音频帧包括两个32比特的子帧。传送立体声时,每个音频子帧分别传左右声道,传送单声道时,一个音频子帧可传送一个单独的辅助声道。每个样值可以是16或20比特,也可以是24比特(四个辅助数据也作为样值比特)。辅助数据可表示一些其它信息,如低质量的辅助声道(用于制作人员的通话或演播室之间的交流)。每4ms(即半块、192个子帧)有4bit×192=768bit辅助数据,可以组织成12bit分辨率的64个音频字节。每4ms的64个字节提供相当于16kHz的取样频率。中国传媒大学13/05/2013章文辉70每个子帧有4个附加比特:·有效比特(V):表示音频样值数据是正确的;·用户比特(U):用户自定义;·通道比特(C):规定了与该音频信号相关联的信息,如音频种类标识(通常有CD、PCM、DAT)、取样频率(32、44.1或48kHz)、声道方式(两声道,立体声,单声道,主/从声道(指声道A为一个单声道,声道B为数据))等;·奇偶校验比特(P)音频帧其他数据中国传媒大学13/05/2013章文辉71通道状态每个子帧中的用户比特送至24×8bit(1Byte)的存储器中。存储器中共有192个用户比特,是一个音频块帧数(192)的整数倍,可能的用户比特格式由声道状态字节1的比特4~7决定。与用户比特类似,每个子帧中的通道状态比特送到一个24×8bit(1Byte)的存储器中。通道状态比特用来标识音频数据内容,非常重要。中国传媒大学13/05/2013章文辉72通道状态字节0在存储器中字节0到字节4分配了最有用的内容:字节0:·a(0)=使用通道状态,专业用/非专业用;·b(1)=传送PCM音频还是用于其他目的的非音频;·c(2~4)=音频信号预加重方式,预加重/非预加重,预加重量;·d(5)=源取样频率锁定·e(6~7)=取样频率(32、44.1或48kHz)中国传媒大学13/05/2013章文辉73通道状态字节1字节1:·f(0~3)=声道方式(两声道,立体声,单声道,主/从声道(指声道A为一个单声道,声道B为数据));·g(4~7)=用户比特管理;字节2:·h(0~2)=辅助取样比特的使用,不使用24比特,用于传输单路联络信号;·i(3~5)=源字节长度和源编码历史;字节3:·j(0~7)=未来的多声道功能描述;字节4:·k(0,1)=数字音频基准信号;·r=保留。中国传媒大学13/05/2013章文辉74模拟音频信号(1)16bitA/D转换器fs=48kHz(2)串行器(3)AES/EBU格式化器(5)双相标志码编码(4)同步比特AES/EBU数字音频信号形成中国传媒大学13/05/2013章文辉754、同步字4比特的同步字用来标识一个新样值以及一个新块的开始。同步字有三种类型:·同步字Z:表示一个新的音频块第一帧的开始。·同步字X:表示一个块内所有其余帧的第一个子帧的开始。·同步字Y:表示每个第二子帧的开始。中国传媒大学13/05/2013章文辉76模拟音频信号(1)16bitA/D转换器fs=48kHz(2)串行器(3)AES/EBU格式化器(5)双相标志码编码(4)同步比特AES/EBU数字音频信号形成中国传媒大学13/05/2013章文辉775、双相标志码编码双相标志码(BPM)指在每个数据比特周期的开始都有一个转换,而且在每个比特1的中间有一个转换。因此在双相标志码的编码数据流中不会出现两个连续的1或0。这种数据流信号有一个重要特征:不看极性,只看数据比特单元的中间有没有转换就可知是1还是0。这种码也称为曼彻斯特码,用于在磁带上记录时间码,并用于AES/EBU格式的音频信号编码。中国传媒大学13/05/2013章文辉78中国传媒大学13/05/2013章文辉79不归零码和双相标志码的频谱特性中国传媒大学13/05/2013章文辉806、AES/EBU数据信号特性取样频率为48kHz时整个数据率为32×2×48000=3.072Mbps。在双相标志码编码后,数据传输率提高到两倍,即为6.144Mbps。双相标志码的频谱能量在6.144MHz的倍频处为0。同步字包括三个低单元和随之而来的三个连续的高单元。在AES/EBU信号频谱中占据一个低的基频,3.072/3=1.024MHz。中国传媒大学13/05/2013章文辉81在一个48kHz取样的系统中每个音频帧的时间是20.83ms。一个AES/EBU块的时间为20.83ms×192=4000ms。6