基于CELP的语音编码解读

anry1986
0 ℃
2020-11-16

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

基于CELP低速率语音编码算法的研究内容简介•语音压缩编码的意义•低速率语音编码技术的发展现状•码激励线性预测语音编码（CELP）算法•语音编码的前景一、语音压缩编码的意义语音压缩编码的意义语音是语言的声学表现，是人们传达信息最自然、最有效以及最常用的途径，它可以传递情绪、态度以及其他个人化信息。语音编码是其中一个重要领域。语音编码是数字化语音传输和存储的基础技术，用压缩语音信号的数字表示而使表达这些信号所需的比特数最小。与模拟语音相比，使用语音编码技术的数字语音传输和存储系统，具有可靠性高、抗干扰能力强、便于快速交换、易于实现保密、复用、打包和价格低廉等优势。语音压缩编码的意义压缩后的语音用于传输，可以降低每路话音所需带宽，在同样的带宽内传输更多路的语音；用于存储，可以节约空间，提高存储语音长度，降低成本。如果将语音编码技术与网络合并成一个整体结构，可以减少通信成本，提高效率，有利于网络资源的管理。它在各种通信系统中占有重要地位。比如，在移动通信、卫星通信、军用通信和网络通信中，双方或者多方的话音传输、呼叫服务、多媒体查询等它都具有广泛应用。语音压缩编码的意义•这些实际应用的需求推动了语音编码、特别是低比特率语音压缩编码理论与技术的发展。因此，研究人员多年来一直致力于在保持重构语音质量的前提下，提高语音压缩效率的研究。二、低速率语音编码技术的发展现状低速率语音编码技术的发展现状•语音编码技术随着科技发展和其应用领域的拓宽，更体现出研究的价值和意义。主要原因，首先是语音编码技术日趋成熟，其次是社会对低速率语音编码的需要也促进了各种语音编码技术的竞争，使语音编码技术尽快走向成熟。16kbps和8kbps的技术已经标准化，具备比较完善的理论和技术体系，并进入使用阶段，目前对4kbps以下语音编码标准的竞争十分激烈，已经有不少地区性标准诞生。低速率语音编码技术的发展现状•最早的数字语音编码标准，是由CCITT对64kbps脉冲调制（PCM）的建议，也即G.711建议。由G.711引入的量化失真单位，考虑为1个失真单位（QDU）。•第二个数字语音编码标准是32kbps的ADPCM，接着又制定了16kbps的低延迟码激励线性预测（LD_CELP）的标准，它们的量化失真单位都是四个QDU。低速率语音编码技术的发展现状1994年，由日本电报公司（NTT），法国电信（CNET）和Sherbrooke大学与AT＆T合作研究，产生了8kbps语音编码器标准G.729。地方性的标准很多，Motorola公司提出了7.95kbps的VSELP编码器标准IS-54。日本无线系统研究和开发公司（RCR）提出了3.45kbps的PSI-CELP编码器，1990年由国际海事卫星组织INMARSAT提出了4.15kbps的IMBE编码器，美国防卫部门（DOD）提出了标准为FS1015的2.4kbps的LPC声码器。此后DOD在1988年提出了标准为FS1016，码率为4.8kbpsCELP的编码器，FS1016比FS1015具有更高的语音自然度，但是仍然能感觉人工噪声。三、码激励线性预测语音编码（CELP）算法码激励线性预测语音编码（CELP）算法•码激励线性预测CELP（CodeExitedlinearprediction）编码技术是一种有效的中低速率语音压缩编码技术，它以码本作为激励源，具有速率低、合成语音质量高、抗噪性强及多次音频转接性能良好等优点。在4.8~16Kb/s速率上得到广泛的应用。•采用CELP算法的低速率语音压缩编码很多，如北美的IS-95、IS-96，日本的JDC半速率标准，ITU的G.723、G.728和G.729采用的都是CELP算法。码激励线性预测语音编码（CELP）算法1、码激励线性预测语音编码（CELP）的模型随机激励线性预测模型码激励线性预测语音编码（CELP）算法•根据上图给出的语音合成模型，可以给出如图所示的基于合成分析过程的CELP语音编解码模型。码激励线性预测语音编码（CELP）算法码激励线性预测语音编码（CELP）算法•为了获得与原始语音信号的最佳匹配，CELP编码模型需要频繁地修正时变滤波器参数和激励参数。系统的分析过程是按帧分序进行的，即首先确定时变滤波器的参数，然后确定固定激励参数。分析帧的长度和修正速率决定了编码方案的比特率。码激励线性预测语音编码（CELP）算法此编码方案的基本步骤如下：1）初始化短时合成滤波器和基音合成滤波器历史（通常初始化为零值或低电平随机噪声）。2）缓存一帧语音信号，然后对这帧语音信号进行线性预测分析，确定一组LPA系数。3）利用已经确定的LPA系数和线性预测误差滤波器A（z），计算未量化的残差信号。4）为了有效的确定激励参数，将LPA帧分为几个子帧。5）对于每个子帧，首先用开环方法或闭环方法确定基音预测参数。一旦确定了基音预测器参数，则将基音合成滤波器和短时合成滤波器组合在一起形成一个级联的滤波器。其次用激励码书中的某一矢量去激励这个级联滤波器，得到合成语音，再计算合成语音和原始语音之间的误差，经感知特性进行加权后，选取均方误差最小的激励矢量作为最佳矢量。码激励线性预测语音编码（CELP）算法6）借助于滤波器的初始记忆内容，将最佳激励信号通过级联滤波器产生合成语音。7）对每个子帧重复第（2）至第（6）步。需要注意的是，在上述CELP语音编码方案中，基音预测器对产生高质量的浊音语音发挥着十分重要的作用，这是因为浊音语音被表征为由基音周期分隔的样点间大量相关的准周期信号。而短时预测器在很大程度上排除了近样点的相关，得到的短时预测残差信号是一主要由基音尖峰信号构成的低密度准周期信号，如果没有基音预测器，只靠随机码书就不能有效地产生类似于短时预测残差信号的准周期激励信号。码激励线性预测语音编码（CELP）算法•在上述模型中，激励参数优化没有使用普通的均方误差最小准则，而利用感知加权均方误差最小准则。这是由于在低比特速率，每个语音样点平均分配的比特数一般要小于1，这就使得准确匹配语音波形变的十分困难，因此语音信号和重建语音信号之间的均方误差缺少意义和充分性，这就要求所使用的误差准则应该与人类的听觉特性相一致，然而迄今为止还没有一个满意的误差准则。目前流行的方法是基于合成分析的编码方案中由Atal提出的感觉加权滤波器。码激励线性预测语音编码（CELP）算法感知加权滤波器的频率特性中的峰和谷正好与语音信号的峰和谷相反，加权滤波器的作用是减弱共振峰频率区域的重要性，通过在共振峰区域分配比较大的失真，来减少共振峰谷里主观感觉更大的噪声。即利用了人耳听觉的掩蔽效应，共振峰处的噪声相对于能量较低频段的噪声不易被查觉。所以对加权滤波器的位置作一下调整，调整后的编码器如下图码激励线性预测语音编码（CELP）算法调整后在搜索前仅对输入语音信号进行加权一次，并有短时合成滤波器与加权滤波器相组合的全极点感知加权合成滤波器。2、激励参数的码书结构码激励线性预测语音编码（CELP）算法根据刚才的模型分析得，可以将合成激励看作两个激励的叠加，一个来自于u(n)，用固定码书表示。结合图1和图3可知，这里的u(n)在理论上具有白噪声的特性。另一个激励信号来自于过去的合成激励d(n-M)（M为基音延迟）。这里，d(n-M)由自适应码书表示。自适应码书利用移位寄存器来存储码矢量，码矢量具有叠接性，若基音延迟M的最大值为Mmax，则自适应码书的大小为Mmax。自适应码书记录着语音信号的周期信息，并且每子帧更新一次。两级码书结构的CELP语音编码模型的原理可用图4来表示。码激励线性预测语音编码（CELP）算法事实上，几乎全部的CELP语音编码器都是基于这种两级码书结构模型而实现的。四、语音编码的发展方向语音编码的发展方向随着通信领域发展的多样化，语音编码的发展也应是多元化、多分支的。目前，语音编码主要有以下几个发展方向：宽带语音编码、语音/音频联合编码、多讲话者的语音编码、甚低速率的语音编码、嵌入式语音编码等。目前的多数语音编码标准都能适应一般通信时的信道状况。然而，当信道状况恶化，只允许极少的比特通过信道时，比如矿井救援时，就需要甚低比特语音编码了。而CELP混合编码算法在中低语音压缩算法中居于统治地位。采用CELP算法为基础的声码器能够4kbps~16kbps的速率范围内合成出高质量的语言，且具有优良的抗噪声和多次转接性能。基于CELP的低速语音压缩编码算法的出现给人们带来了很大的便利特别是在普通电话带宽信道中传输数字电话成为现实。它还使得移动通信的应用成为可能，而且对未来多媒体通信有着极大的推进作用。当然，甚低速率语音编码必然会造成高编码延迟，因而很难应用于一般的双向通信的系统中。可是以后需要解决的问题。语音编码的发展方向THEEND