5.3数字声音及应用5.3.1波形声音的获取与播放5.3.2波形声音的表示与应用5.3.3波形声音的编辑5.3.4计算机合成声音25.3数字声音及应用5.3.1波形声音的获取与播放35.3数字声音及应用声音的特性和类型声音由振动产生,通过空气进行传播声音是一种波,它由许多不同频率的谐波组成谐波的频率范围称为声音的“带宽”计算机处理的声音类型:话音或语音(speech),专指人的说话声音,带宽仅为300~3400Hz全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz~20kHz人耳可听到的声音统称“可听声”(audio),20Hz~20kHz45.3数字声音及应用数字波形声音的获取步骤:2.量化(quantization,模数转换)3.编码(encoding)1.取样(sampling)取样模拟声音信号取样的目的是把时间上连续的信号转换成时间上离散的信号量化量化是把每个样本从模拟量转换成为数字量(8位或16位整数表示)数字声音01100011001···编码将所有样本的二进制代码组织在一起,并进行数据压缩55.3数字声音及应用数字波形声音的获取设备声音的联机获取设备(声卡)声波转换为电信号声音的脱机获取设备:数码录音笔麦克风(microphone)声音卡(soundcard)模拟声音数字声音取样、量化和编码65.3数字声音及应用声音的重建与播放计算机输出声音分为两步:1声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成2声音播放:将模拟声音信号经处理和放大后送到音箱(扬声器)关于音箱:普通音箱接收的是重建的模拟声音信号数字音箱直接接收数字声音信号,失真更小数字声音011010011101…插值数模转换解码把压缩编码的数字声音恢复为压缩编码前的状态把声音样本从数字量转换为模拟量把时间上离散的一组样本转换成在时间上连续的模拟声音信号重建的模拟声音信号75.3数字声音及应用声卡的功能与逻辑组成波形声音的获取与编码波形声音的重建与播放MIDI消息的输入MIDI音乐的合成DSPDMA接口PC总线取样,量化D/A重建,滤波声音输出声音输入音乐合成器mixerMIDI接口声卡的主要功能85.3数字声音及应用选讲:声卡的物理实现•声卡主要由2块芯片组成:•主处理芯片:包括数字信号处理器、MIDI控制、I/O控制等•CODEC芯片:负责多声道取样、A/D与D/A转换、混音处理等音频主芯片音频混合芯片运算放大器功率放大器MIDI/joystickMIC输入/线路输入PCI总线线路输出扬声器AudioCODEC芯片•当前PC机的声卡大多已不再做成独立的插卡形式,而是与主板集成在一起,称为集成声卡2种音频技术规范:-AC’97音频技术规范-HDAudio95.3数字声音及应用选讲:声卡的几种类型硬声卡:除CODEC芯片外,主板上还有1块音频主处理芯片,很多音效处理任务无需CPU参与就可独立完成声卡的类型独立声卡:以扩展卡形式插在机箱中使用集成声卡软声卡:主板上仅1块CODEC芯片,负责取样与量化处理,I/O控制器部分集成在主板上的南桥芯片中,DSP的功能需由CPU协助完成声卡的组成部分均集成在主板上105.3数字声音及应用5.3.2波形声音的表示与应用115.3数字声音及应用数字波形声音的表示及其参数数字波形声音是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织,文件扩展名为“.wav”数字波形声音的主要参数有:取样频率:语音的取样频率低,一般为8k~16kHz全频带声音(如音乐)取样频率高,一般为44.1k~48kHz量化位数:通常为8位、12位或16位声道数目:单声道为1,双声道为2码率(比特率),每秒钟的数据量125.3数字声音及应用数字波形声音码率的计算未压缩时数字波形声音的码率计算公式码率=取样频率×量化位数×声道数例:声音类型声音信号带宽(Hz)取样频率(kHz)量化位数(bits)声道数未压缩时的码率数字语音300~340088164kb/sCD立体声20~2000044.11621411.2(kb/s)压缩编码之后数字波形声音的码率为:压缩后的码率=未压缩时的码率/压缩倍数例:上面CD唱片的立体声音乐压缩为MP3后,若压缩倍数是12倍,则该MP3音乐的码率是:118kb/s左右135.3数字声音及应用数字波形声音的数据压缩数据压缩的必要性:为了降低存储成本和提高在网络上的传输效率数据压缩的可能性:声音中包含有大量冗余信息;人耳灵敏度有限,允许有一定失真而不易察觉数字波形声音压缩编码的方法:全频带声音:国际标准MPEG;工业标准DolbyAC-3数字语音:固定电话使用ADPCM编码手机使用高效率的混合编码技术所谓“MP3音乐”,它是一种采用MPEG-1层3编码的高质量数字声音,压缩比大约10~12倍,使一张普通CD光盘上可以存储大约100首MP3歌曲,可连续播放10小时。145.3数字声音及应用选讲:MP3播放器的结构与原理程序存储器闪烁存储器液晶显示D/A转换嵌入式处理器及DSP声音输出控制按键USB接口嵌入式处理器用于运行控制程序,控制各个部件协调工作:它接收控制按键的操作命令,从闪烁存储器读取MP3音乐数据送到DSP去解码;显示播放器的工作状态;负责与主机连接并交换数据等等数字信号处理器DSP完成MP3数据流的解码操作,并输出波形格式的数字音频信号,经数模转换和功率放大之后,用户即可听到声音存放MP3音乐数据,容量越大,可存放的歌曲数目就越多固定存放MP3播放器的控制程序显示MP3播放器的工作状态和歌曲的歌词155.3数字声音及应用波形声音的文件类型及其应用文件类型开发者编码类型效果主要应用WAV微软公司未压缩声音达到CD品质支持多种采样频率和量化位数,获得广泛支持FLACXiph.Org基金会无损压缩压缩比为2:1左右高品质数字音乐APEMatthewT.Ashland无损压缩压缩比为2:1左右高品质数字音乐M4A苹果公司无损压缩压缩比为2:1左右QuickTime,iTunes,iPod,RealPlayerMP3ISO有损压缩MPEG-1audio层3压缩比为8:1~12:1因特网,MP3音乐WMA微软公司有损压缩压缩比高于MP3使用数字版权保护因特网,音乐AC3、AAC美国Dolby公司有损压缩压缩比可调,支持5.1、7.1声道DVD,数字电视,家庭影院等165.3数字声音及应用什么是流媒体?在因特网上收听(看)音(视)频节目的2种方式:下载存储方式:先下载存储在计算机中,下载完毕后再播放(缺点:需要等待很长时间,并需要较大的存储容量)流式传输方式:边下载、边播放(优点:只需要下载一部分数据之后,就可以开始一边播放一边下载,等待时间短、存储需求小)流媒体就是一种允许在网络上让用户一边下载一边收看(听)音视频媒体的媒体分发(delivery)技术目前流行的主要有3个公司的流媒体技术:1.RealNetworks公司的RealMedia(RealAudio和RealVideo)2.微软公司的WindowsMediaServices(WMA、WMV和ASF)3.苹果公司的QuickTime175.3数字声音及应用选讲:流媒体是如何工作的?流媒体播放软件Web服务器Web浏览器流媒体专用服务器音频(视频)流媒体文件网页(客户计算机)http协议3点击流媒体节目,启动流媒体播放程序RTSP/TCPRTP/UDP6播放器可以边播放边接收数据,并可以控制播放、暂停、快进、快倒等5将音(视)频节目传输给客户计算机RTCP/UDPHTML网页1请求网页2服务器送回网页4向流媒体服务器发出请求185.3数字声音及应用5.3.3波形声音的编辑195.3数字声音及应用波形声音编辑软件的功能主要功能:1编辑声音:如声音剪辑、复制、调节音量2声音的效果处理:如混响、回声、淡入、淡出等3录音4声音的格式转换5播放声音数字声音的参数左声道信号波形右声道信号波形淡入淡出时间刻度播放标尺声音编辑软件的典型用户界面205.3数字声音及应用5.3.4计算机合成声音215.3数字声音及应用什么是计算机合成声音?计算机合成声音就是计算机模仿人说话或演奏音乐计算机合成声音有两类:计算机合成话音(语音):计算机模仿人把一段文字朗读出来,即把文字转换为说话声音(简称为TTS)应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等计算机合成音乐:计算机模拟各种乐器发声并按照乐谱演奏音乐应用:计算机作曲、配器等225.3数字声音及应用例:计算机合成的语音Hello,everybody(1)你好,我是贝尔实验室的中文语音合成系统(BellTTS1)南京大学计算机系2002年招收了202名本科生,22名博士生,130多名硕士生。(中科大讯飞公司)(Bell)安徽中科大讯飞信息科技有限公司是专门从事中文语音及语言技术软件(讯飞)我们都是同行,我们一路同行,去参加人参培植研讨会(讯飞)(Bell)需要进一步提高之处:发音和断句要正确,提高自然度,丰富表现力235.3数字声音及应用计算机合成音乐(MIDI)音乐合成器音乐MIDI文件媒体播放器MIDI消息计算机合成音乐需要三个要素:乐器、乐谱和“演奏员”声卡上的音乐合成器能像电子琴一样模仿几十种不同的乐器发出声音,它按照MIDI消息合成出不同音色和音调的音符,通过扬声器播放出音乐来乐谱在计算机中使用一种叫做MIDI的音乐描述语言来表示。使用MIDI描述的音乐称为MIDI音乐。一首乐曲对应一个MIDI文件,其文件扩展名为.MID或.MIDI媒体播放器软件相当于“演奏员”。播放MIDI音乐时,它先从磁盘上读入.MID文件,解释其内容,然后以MIDI消息的形式向声卡上的音乐合成器发出各种指令245.3数字声音及应用选讲:音乐合成器PC机声卡一般都带有MIDI音源(音乐合成器)MIDI音源有两种:调频合成器(一种受控的电子振荡器)。音色单调,效果较差,已很少使用波表合成器。音色丰富,效果很好,可扩展,现广泛使用波表合成器的原理预先将真实乐器演奏的各个音符的波形数字化,把它们组织成一个个波表文件存放在存储器中播放时合成器软件根据乐器类型和音符参数等将相应的波形数据修饰成所要求的音强和时长,然后合成、加工后播放低通滤波采样、量化加工处理乐器演奏波表文件录音255.3数字声音及应用例:计算机合成的MIDI音乐例1音乐之声(6KB)例2军港之夜(7KB)MIDI的优点:数据量极小(比CD立体声少3个数量级,比MP3少3个数量级)易于制作和编辑修改可以与波形声音同时播放MIDI的不足:只能合成音乐,不能合成歌曲和语言音质与硬件设备相关265.3数字声音及应用小结:计算机中的数字声音数字声音的特点:是一种连续媒体,传输与播放有实时性要求数据量大,对存储和传输的要求比较高,必须进行压缩数字声音的类型:取样(波形)声音数字语音:应用于电话、手机、多媒体配音等全频带声音:CD和DVD音乐,数字电视伴音等计算机合成声音合成语音合成音乐(MIDI)