基于ADPCM的语音编解码设计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

11绪论1.1课题研究的背景和意义随着社会时代的发展,人类迅速进入信息时代,对于各种资源的利用率要求越来越高,从而推动了语音编解码技术的飞跃发展。与此同时,伴随着微电子技术的快速发展,以及超大规模集成电路设计技术的不断完善,使得语音编解码技术越来越广泛的深入到通信领域、消费电子领域,辟如数字录音笔、IP电话、复读机等等都是语音压缩编码技术的典型应用。语音编码技术就是将模拟的语音信号数字化离散化,利用语音听觉上的制约或者数据的冗余度来压缩信号的一些不必要的信息,以此来增加传输速率、减少存储容量,然后再进行传输、存储或者处理,而解码就是相反的一个过程。ADPCM是自适应差分脉冲编码调制的简称,是语音编码的多种算法中的一种,更是最早使用于数字通信系统中的一种语音编解码算法。此算法利用了语音信号样点间的相关性,针对语音信号的非平稳特点,使用了自适应预测和自适应量化,即预测器和量化器它们的参数能随着输入信号的统计特性,自适应于或接近于最佳的参数状态,在32kbps的速率上能够给出网络等级话音质量。ADPCM究其本质是一种针对16bits(或8bits或者更高)声音波形数据的一种有损压缩算法,它可以将声音流中每次采样的16bit数据用4bit来存储,所以其压缩比为1:4。而且它的压缩/解压缩算法非常简单,所以又是一种低空间消耗、高质量高效率声音获得的好途径。ADPCM其主要是针对连续波形数据的,保存的则是波形的变化情况,从而以达到描述整个波形的目的。1.2语音编码的发展和研究状况数字语音有很多的优点是模拟语音不可比拟的,它能更方便的传输和存储,可以在噪声信道中进行相当可靠的传输,容易进行交换,能够很方便的对信号进行加密传输。数字语音可以由模拟语音简单的抽样,量化来得到,但由于数字语音其数据量比较大如果不经过处理,那它在传输和存储时就会占用很大量的信道资源以及存储空间,那么给系统提出的要求势必就会很高,所以数字语音通常情况下都是要进行压缩编码的。在确保编码语音一定质量的前提下,究竟如何高效率进行压缩编码,或者说在给定信息速率的前提下,如何去提高编码后的语音质量,是当代语音编码所要研究的重点。语音编码技术一般分为两种:信源编码和信道编码。信源编码的目的是为了2提高信号的传输和存储效率,在这指的就是数字语音信号被压缩的比特率(即每秒钟传输语音信号所得出的比特数,通常也可以称为数码率),使得更多路的语音信号能在同样的信道容量中传输,或者说只需要较小的容量存储数字语音信号,所以这一类编码又被称为语音信号的压缩编码。而信道编码因为是为了提高传输的可靠性而作出的处理,所以又被称为可靠性编码。语音信号编码从方法上讲有波形编码和分析合成系统两大分支。波形编码是以尽最大可能无失真的重构出语音波形为目标,在其编码时以波形逼近为基本原则,在时域上或变换域上直接进行编码,虽然这种方法压缩效率不很高,但是在64~16Kb/s的速率上,却可以合成出相当高的语音质量,然而在速率进一步下降时,编码语音的质量将会随之大幅度下降。常用的波形编码算法有:时域上编码的PCM(PulseCodeModulation),ADPCM,APC(AdaptivePredictiveCoding);在频域上进行编码的子带编码SBC(Sub-BandCoding)和自适应变换编码ATC(AdaptiveTransformCording)。分析合成系统是把语音信号产生模型作为基础,把语音信号变换成模型参数后再进行编码,因此又称之为参数编码。参数编码其出发点同波形编码有所不同,它的原则是以在尽量保持语音可懂度的条件下,为语音信号搭建一个数学模型,然后通过给定的语音信号计算模型参数并且量化编码来实现。而且它的模型参数对比于语音波形来说数据量是很小的,因而其压缩效率很高。虽然也许参数编码会导致重建话音和原始语音在它时域波形上有很大的区别,但它的可懂度仍然可以保持在一个相当高的程度。现在,还时常采用混合编码的方案,混合编码是波形编码和参数编码优点的结合,这种结合是保留分析合成编码技术精华的基础,引用波形编码准则优化激励源信号,从而在一个较小的数码率上(4.8~9.6kbit/s)获得更高质量的合成语音。自1937年以来的脉冲编码调制(PCM)是AH里夫斯已经提出,语音编码技术的发展历史已经超过60年。尤其是在过去的20年里,随着计算机的语音编码技术和微电子技术的发展得到了快速发展。64kbit/s的PCM系统标准CCITT于1972年确定了64kbit/s的PCM语音编码G.711建议,已被广泛应用于数字交换机,数字通讯等领域,到现在为止,仍然是占主导地位。虽然这种编码方法可以得到良好的语音质量,但缺点是,它会占用更多的带宽,有限的带宽资源条件下不使用。CCITT在20世纪80年代初,就开始专攻小于64KB/s的非PCM编码算法,32K比特/秒ADPCM语音编码G.721建议,于1984年通过,它不仅可以实现与PCM等效语音质量,还更好的抗误码性能,它被广泛用于海底电缆,卫星,和可变速率的数字语音内插编码器清空设备。连续地,在那之后,1986年,1988,做了进一步的修改在此,也可以是32K比特/秒的PCM比特率,一般是高速率的3一半,达到接近正常的PCM语音质量,防误性能优于PCM格式。随后颁布G.723标准,扩大到24Kbit/s和40Kbit/s的编码标准税率。1990年G.723,G.721由ITU合并,将进一步扩展的编码率16KBIT/秒,从而促进G.726标准形成的。语音插值技术和浮动利率结合原来的PCM通道的ADPCM编码,可扩展到8-10倍,称之为数字语音通道倍增设备DCME。G.726标准算法不仅简单,但高品质的声音,即使在经过反复的切换,以确保他们的声音质量,所以网络会议系统,8-ISDN通信和VOIP网络通信等方面具有广泛的应用。然后16KB/s的低时延码激励线性预测(LD-CELP)G.728建议,在1992年出版。正是由于其较低的利率,高性能,低延迟在实践中广泛使用,如:单路单载波卫星,无绳电话和数字插值空气设备,海事卫星通信,存储,数字移动无线系统,分组语音,转发系统,语音留言录制。最后,在11月1995年共轭代数码激励线性预测(CS-ACELP)8KB/s的语音编码G.729建议ITU-TSGl5全体会议通过,并通过G.729附件降低复杂8KB/s的CS-ACELP讲话编解码器在ITU-TSGl51996年6月的会议上正式成为国际标准。这种编码其延迟小,可以节省带宽的87.5%,为32KB/s的ADPCM语音质量,音质在同级别最优的比特率,在嘈杂的环境中也可以更好的语音质量。虽然CS—ACELP语音编解码器占用比特率比ADPCM的少,但是其算法复杂度远没有ADPCM的算法简单明了,所以在现代通信系统中,ADPCM这种编码算法仍然占主导地位。1.3语音压缩编码的评价语音质量是一个语音编码系统必然要保证的性能指标,速率再低,编码效率再高,不能得到满意的语音质量也不能算是一个优良的编码算法。那么,在语音压缩编码中,怎样评价一个语音压缩质量的好坏就成为了是一个极其重要的概念,通常,评价语音压缩的标准主要有以下几点:1)语音质量语音质量的评价方法可分为主观评定和客观评定两大类。客观评定方法用客观测量的手段来评价语音编码质量,常用的方法有均方误差、信噪比、加权信噪比、平均分段信噪比等。主观评定方法是用人们自身去感受语音质量的感觉,然后主观评判其语音压缩编码的质量。2)编码速率编码速率,可以使用“比特/秒”(比特/秒或bps)的措施,即总速率编码,通常用I表示,即每秒的编码比特的数量。3)编解码复杂度所谓编解码的复杂度指的就是实现一个信号编解码算法的难易程度。编解码算法的复杂程度和语音编码的话音质量有着相当密切的联系。在一个相同的数码4率情况下,算法复杂一些的将会获得更好的语音质量。编解码复杂度可以由算法复杂程度、硬件实现及价格等许多因素来衡量。4)编解码延时数字音频编解码器的延迟主要由两部分组成:算法延迟和处理延迟。之前的压缩的音频信号到高速缓存中的数据必须是有效的,这个时间延迟称为算法延迟,它是不是唯一的方法,以减少通过改变延迟时间。即,音频信号压缩编码器和解码器的编解码器的实现在不同的应用程序所需的时间的处理延迟,国际社会已延时的编解码器不同的要求,如长途编解码器延迟不超过5-10毫秒,但对于可视电话可以扩展到几十毫秒到几百毫秒。5)稳健性(Robustness)所谓稳健性是指编译码系统的抗噪声、抗信道误码能力。一个实用的声码器,其误码率要求在10-3的信道上传输时,语音质量不至于过分恶化,而对于移动通信中的声码器则要求在信道误码率为3×10-2时仍能正常工作。ADPCM就语音质量的评价上来说,语音质量的客观评价方法主要采用均方误差和信噪比来评定。但客观评价还不能全面反映人对语音质量的感觉,而主观评定方法符合人们对语音质量感觉的要求。主观评价的优越性,主要体现在其处理还原后给人主观感觉效果很好,感觉语音失真度小;就编码速率来讲,ADPCM的编码速率为16KB/S,优于其他编码方式;就其编解码的复杂度而言,ADPCM采用四位二进制的差值编码方式,使用起来简单又容易实现;它的抗噪能力也比较强即稳健性相当好。1.4论文研究的主要内容及章节内容安排本论文研究的内容是语音编解码的算法及软件实现过程,主要是研究ADPCM的语音编解码算法及在MATLAB软件中的实现。论文共分4章,各章内容安排如下:第一章:简要介绍课题研究背景和意义,语音编解码的发展和研究状况以及它的评价标准。第二章:主要介绍语音信号脉冲编码基本理论,为对语音进行ADPCM编码译码系统提供理论依据。第三章:介绍PCM与DPCM(DifferentialPulseCodeModulation)的工作原理,并对二者进行比较,从而体现出DPCM编码的优越性。接着介绍增量调制DM(deltamodulation)及自适应增量调制ADM(adaptivedeltamodulation)的原理与运用,二者比较得出ADM更容易跟踪信号变化快的的语言,最后阐述了ADPCM的由来及主要原理。第四章:确定ADPCM实现的总体设计框图,以及ADPCM编码和解码实现过程5的设计流程图,并采用MATLAB软件对ADPCM编解码系统的实现进行了仿真。62语音信号脉冲编码基本理论当前最主要的通信业务有电话、图像(传真、电视)等,它们都是时间上和幅度上连续的模拟信号,如果要想实现数字化的传输和交换,则首先要做的就是把模拟信号变化成数字信号,电话信号数字化一般被称为语音编码,而图像信号数字化就被称为图像编码。虽然两者各有各的特点,但两者的编码原理基本上仍然是一致的。而当前的通信网中很多业务基本上都是电话业务,因此语音编码将为本章讨论的重点。可以说这些理论对任何模拟信号数字化的实现过程都是适用的,其不失一般意义。依照语音的特点,通常把语音编码方法分为波形编码和参量编码,波形编码是指对信号的波形进行编码,它具有较高重建信号质量的能力。参量编码则是通过提取语音信号的一些特征参量,从而对其进行编码,它的特点是码速率较低,但其语音质量要较波形编码差一些。波形编码的质量比较高,通常在300~3400Hz话路通道中传输模拟信号(例如模拟数据信号、电话信号、传真信号及各种随路信令信号等)在数字化以后,仍然可以达到原来的质量容限。这一特点是通信网由模拟转换为数字过渡过程中极其重要的一点。根据语音的特性,通常分为波形编码和参数编码类型的两类语音编码方法,波形编码,用于编码的信号波形,它具有更高的能力来重建信号的质量。参数编码是通过提取语音信号的参数的一些特点,从而编码,它的特点是较低的比特率,但不如波形编码的语音质量。波形编码质量是比较高的,通常会在通道300〜3400Hz传输各种模拟信号(如模拟数据信号,电话信号,传真信号,与信道相关信令的各种信号)后的数字仍实现其原来的质量宽容。的通信网络,其特征在于由模拟到数字的转换是非常重要的。语音信号有很多波形编码方法,

1 / 36
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功