数字音频技术基础浅析简介:浅要讲述了音频数字化过程的三个阶段以及数字音频的发展概况,总结了数字音频系统的主要技术问题。关键词:数字音频,同步,接口标准,格式随着信息技术的发展,数字信号处理技术已经逐步取代了模拟信号处理技术,数字音频信号采用了全新的概念和技术,具备了抗干扰能力强,无噪音积累,长距离传送无失真等特点,目前已被广泛使用。数字音频指的是一个用来表示声音强弱的数据序列,通过对模拟音频进行取样、量化、编码过程,实现对音频信号的模/数(A/D)转换,形成数字音频信号。对这些数字信号可进行存储、传送,也可经再生电路进行数/模(D/A)转换,还原成模拟信号。音频的数字化是指把模拟的音频信号转化为数字音频信号的过程。包括采样、量化、编码三个阶段。1.采样指的是时间轴上连续的信号每隔一段时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点来表示,使其成为时间上离散的脉冲序列。采样频率是每秒钟所抽取声波幅度值样本的次数,单位为kHz。一般来说,采样频率越高声音失真越小,但相应的存储数量也越大。因此需要根据不同的应用范围来选择采样频率。2.量化模拟信号通过采样后变成一个时间上离散的脉冲样品序列,但在脉冲幅度上仍会在其动态范围内连续变化。量化就是把这些在时间上离散的模拟信号无限多的幅度值用有限多的量化电平来表示,使其变为数字信号。量化时,每个幅度值通常会用最接近的量化电平来采样,这个电平也称为量化等级。量化后,连续变化的电平幅值就会被有限个量化等级所取代。从信号质量方面考虑,量化级数越大则量化误差越小,量化后的信号越接近进原信号,但同时会造成信号数据量增大,因此量化比特数的选取要权衡各方面因素综合考虑。3.编码指的是把量化后的信号转换成代码的过程,也就是将已经量化的信号幅值用二进制数码表示。编码后,每一组二进制数码代表一个采样的量化等级,然后把它们排列起来,得到由二进制脉冲组成的信息流。数码率又称比特率,是单位时间内传输的二进制序列的比特数,通常用kbps为单位。显然,采样频率越高,量化比特数越大,数码率就越高,所需要的传输带宽就越宽。常见的如电话质量的音频信号采用8kHz采样,8b量化,码率为64kbps;AM广播采用16kHz采样,14b量化,码率为224kbps;CD音频标准为48kHz、44.1kHz、32kHz采样,16b量化,每声道数码率为768-705.6kbps。数字音响技术的基础是1939年创立的PCM原理,直到1970年代中后期在LSI技术推动下才真正在数字音箱领域得到实际应用,其发展过程大致经历了以下几个阶段:1.数字音频磁记录技术这种技术是首先由数字磁带录音机(DAT)实现了实用化的。2.数字音频光盘存储技术CD唱片(CD-DA格式)是最先实用化、商品化的数字音频光盘存储系统,目前此系统上存储的音频格式有CD-I、CD-Video、CD-Graphic、CD-Single、图像伴音MPEG-1音频,以及存储在CD数据盘中的wav、midi、mp3等多种文件格式数字音频。3.数字音频广播技术即DAB(DigitalAudioBroadcasting),指采用全数字方式进行音频播出的广播。4.数字音频计算机处理技术5.数字音频网络传输技术电子乐器是指通过接受系列发生器产生的信号而合成音乐的音源。MIDI即音乐设备数字接口(MusicalInstrumentDigitalInterface),是一种国际通用的标准接口,电子乐器之间以及电子乐器与计算机之间进行交流的标准协议。数字音频系统配结合使用中应注意的主要技术问题有以下几点:1.数字音频设备的同步Ⅰ)同步信号有以下三种:ⅰ)时间码大致有三种基本的时间码:①SMPTE/EBU时间码,其中SMPTE是在NTSC制中采用的时间码,EBU是在PAL制中采用的时间码。这种时间码记录在录像带上,与视频同步信号有严格的对应关系,SMPTE码的格式为时:分:秒:帧。②MIDI时间码有两个特定功能,一是将通用的SMPTE时间码转换成MIDI协议中规定的数据格式后分配给MIDI系统网络中的MIDI设备,而是提供传送所谓“设定”信息的方法,使控制微机能够在确定的事件发生时刻将各个接收设备同步起来。③IEC时间码由国际电工委员会制定,规定DAT按照SMPTE/EBU的标准完成全部数据的记录的标准。ⅱ)MIDI实时信息在每一个MIDI系统中将各个乐器和设备锁定在一起的最基本方法是MIDI同步,由四个基本类型组成:定时时钟、开始、停止和继续。ⅲ)字时钟数字音频录音设备的采样数据是按照固定的采样频率来流动的,字时钟就是通过精确的采样频率来控制数字系统中数据的流动速度。Ⅱ)音频设备间的同步包括模拟设备与数字设备的同步和数字设备到数字设备的同步2.数字音频接口标准Ⅰ)AES/EBU(AudioEngineeringSociety/EuropeanBroadcastUnion即音频工程师协会/欧洲广播联盟),其普通物理连接媒质主要有:①平衡或差分链接使用卡侬连接器(XLR)的三芯话筒屏蔽电缆,参数为阻抗110欧姆,电平范围0.2V-5Vpp,抖动为20ns;②单端非平衡连接,使用RCA连接器的音频同轴电缆;③光学连接,使用光纤连接器。Ⅱ)AES10/1991(标准多通道接口)是以双通道AES/EBU为基础制定的,MADI采用更高的数据率来传送更大的信息。Ⅲ)S/PDIF(Sony/PhilipsDigitalInterfaceFormat)主要用于民用和普通专业领域,插口硬件使用的是光缆或同轴口,普遍应用于现在的DAT、CD机和MD机,以及计算机声卡音频数字输入输出口。Ⅳ)IEC958(类型2)常用语准专业级或民用数字音频设备的技术规格中,如CD机和DAT机。Ⅴ)ADAT又称多信道光学数字接口。Ⅵ)TDIF是日本Tascom公司开发的一种多声道数字音频格式。Ⅶ)R-BUS是Roland公司推出的一种8声道数字音频格式。Ⅷ)IEEE1394具有如下特点:①高速率②实时性③线缆物理体积小④总线结构⑤接口设备对等⑥热插拔⑦兼容性好。3.接地问题Ⅰ)屏蔽地指为防止电磁感应而将音频线的屏蔽金属层、设备的金属外壳、屏蔽罩等进行接地的一种防护措施。屏蔽不良,接地不当会引起电子设备间的交流干扰、高频干扰等电磁干扰。Ⅱ)信号地作用是保证电路有一个统一的基准点位,不至于浮动而引起信号误差。数字音频工作站从应用角度可区分为音频制作工作站和播出工作站。音频工作站由硬件和软件构成,硬件部分包括:①计算机控制部分②声音信号采集输入设备,一般为MIDI的输入设备和音频信号的采集设备③音频接口,是指为计算机提供外部信号输入输出能力的设备,主要分为三种:插卡式、插卡并外挂接线盒式、USB或火线外挂④数据存储设备,常用SCSI硬盘、IDE磁盘阵列、IEEE1394火线硬盘⑤其他选用设备如调音台、同步器、视频采集系统。软件部分包括:①全功能软件即能对音频信号进行录音、剪辑、处理、混音、制作CD母盘,是真正意义上的音频工作站②单一功能软件如SoundForge和WaveLab都属于单轨音频编辑软件③效果插件和软音源数字音频格式的出现,满足了音频复制、存储、传输的需求,早期的模拟音频格式存在着复制失真和因为介质磨损而失效的问题,从CD盘的存储开始,数字格式音频文件开始普及。常见的数字音频格式有:①CD格式标准CD格式的采样频率是44.1kHz,16位量化位数,CD格式可以说是近乎无损基本忠于原音的。②MP3格式是指MPEG标准中的音频部分,MPEG压缩是一种有损压缩,MPEG3音频编码具有10至12倍高压缩率,同时基本保持低音频部分不是真,但是牺牲了声音文件中12kHz-16kHz高频部分的质量来换取文件的尺寸。③WAV格式支持多种压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz采样频率,16位量化位数,和CD音质相差无几。④MIDI格式⑤WMA格式⑥RealAudio是RealNetworks公司推出的一种可以实时传输音频信息的文件格式。⑦QuickTime是苹果公司推出的一种数字流媒体,面向视频编辑、web网站创建和媒体技术平台。⑧DVDAudio为音乐格式的DVD光碟,采样频率为48kHz/96kHz/192kHz和44.1kHz/88.2kHz/176.4kHz可供选择,量化位数可以为16、20或24bit。⑨新生代音频格式OGG特点是完全免费、开放、没有专利限制、支持多声道。⑩ACC格式是杜比试验室为音乐提供的技术,最大能容纳48通道的音轨,采样瓶率达96kHz。在数字多媒体技术高度发展的今天,要实现不同数字音频格式之间的转换非常容易,可用的工具也非常多,有专门用于格式转换的小软件,也有音频编辑软件中带有不同格式间软换的功能,如抓取CD音轨功能、批量转换格式功能等。参考资料:《数字音频素材的制作与运用》国防工业出版社刘毓敏李剑琴等编著《数字音视频资源的设计与制作》清华大学出版社李绯李斌等编著《现代音响技术设计》国防工业出版社王泽祥周小东等编著