信息科学与工程学院东南大学第四章语音信号的矢量量化4.1概述4.2矢量量化的基本原理4.3失真测度4.4最佳矢量量化器和码本设计4.5语音参数的矢量量化信息科学与工程学院东南大学4.1概述矢量量化(VQ,VectorQuantization)分为两类:标量量化:将取样后的信号值逐个地进行量化矢量量化:将若干取样信号分成一组,即构成一个矢量,然后对此矢量一次进行量化。凡是要用量化的地方都可以采用矢量量化信息科学与工程学院东南大学4.1概述采用矢量量化的效果优于标量量化的原因矢量量化能有效的应用矢量中各分量之间的四种相互关联性质来消除数据中的冗余度。•线性依赖(相关性)、•非线性依赖(统计不独立)、•概率密度函数的形状•矢量量化的维数标量量化仅能利用线性依赖和概率密度函数的形状来消除冗余度。信息科学与工程学院东南大学4.1概述矢量量化研究的目的:针对特定的信息源和矢量维数,设计出一种最优化的量化器,在R(量化速率)一定的情况下,给出的量化失真尽可能接近D(R)(最小量化失真)。信息科学与工程学院东南大学4.2矢量量化的基本原理标量量化是对信号的单个样本或参数的幅度进行量化;标量是指被量化的变量,为一维变量。矢量量化的过程是将语音信号波形的K个样点,或有K个参数构成K维空间的一个矢量,然后对这个矢量进行量化。矢量量化将K维无限空间划分为M个区域边界,然后将输入矢量Xi与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。信息科学与工程学院东南大学4.2矢量量化的基本原理将信号序列{xi}的每K个连续样点分成一组,形成K维欧式空间中的一个矢量,矢量量化就是把这个K维输入矢量X映射成另一个K维量化矢量。量化矢量构成的集合{Yi}称为码书或码本,码书中的每个矢量Yi称为码字或者码矢。},,{21KiNRYYYYY信息科学与工程学院东南大学4.2矢量量化的基本原理以K=2进行说明:所有可能的二维矢量就形成了一个平面,记为(a1,a2)。(a1,a2)就是一个二维空间。信息科学与工程学院东南大学4.2矢量量化的基本原理矢量量化的码本设计:将二维平面划分为J个互不相交的子区域,S1,S2,…,SJ,从每一子区域中找出代表值Yi(i=1,2….J),构成一个有J个区间的二维矢量量化器。图示的是一个7区间的二维矢量量化器,即K=2,J=7。J个量化矢量构成的集合{Yi}称为码书或码本码书中的每个量化矢量Yi(i=1,2….J)称为码字或码矢。信息科学与工程学院东南大学4.2矢量量化的基本原理区域划分不同或者量化矢量选取不同,构成不同的矢量量化器。根据仙农信息论,矢量越长越好。实际中码书是不完备的,即矢量数是有限的,而对于任何一个实际应用来说,矢量通常是无限的。在实际运用中,输入矢量和码书中码字不匹配的情况下,这种失真是允许的。信息科学与工程学院东南大学4.2矢量量化的基本原理矢量量化过程:对一个矢量X进行量化,首先选择一个合适的失真测度,然后用最小失真原理,分别计算矢量X和各个量化矢量Yi之间的失真。最小失真值所对应的那个量化矢量,就是矢量X的重构矢量(或恢复矢量)。信息科学与工程学院东南大学4.2矢量量化的基本原理存在的问题一、如何划分M个区域边界。将大量欲处理的信号矢量进行统计划分,进一步确定这些划分边界的中心矢量值来得到码书二、如何确定两矢量在进行比较时的测度测度就是两矢量间的距离,或以其中某一矢量为基准时的失真度。信息科学与工程学院东南大学4.2矢量量化的基本原理图7-2矢量量化系统的组成信息科学与工程学院东南大学4.2矢量量化的基本原理工作过程:编码端:输入矢量Xi与码书中的每一个码字进行比较,分别计算出它们的失真。搜索到失真最小的码字Yjmin的序号j,这些序号就作为传输或存储的参数。在恢复时,根据此序号从恢复端的码书中找出相应的码字Yjmin。此时,Yjmin就是输入矢量Xi的重构矢量。信息科学与工程学院东南大学4.2矢量量化的基本原理特点:传输存储的不是矢量本身而是其序号,所以数据有高保密性能。收发两端没有反馈回路,因此比较稳定矢量量化器的关键是编码器的设计,译码器只是简单的查表过程。信息科学与工程学院东南大学4.2矢量量化的基本原理性能指标:码书的大小J和由于量化而产生的平均信噪比。矢量量化的准则:在给定码本大小时使量化所造成的失真最小。矢量量化的设计:从大量信号样本中训练出好的码书,从实际效果出发寻找最好的失真测度定义公式,设计出最佳的矢量量化系统,以便用最少的搜索和计算失真的计算量,来实现最大可能的平均信噪比。信息科学与工程学院东南大学4.3失真测度设计矢量量化器的关键是编码器的设计,就需要引入失真测度的概念。失真测度(距离测度):是将输入矢量Xi用码本重构矢量Yi来表征时所产生的误差或失真的度量方法,它可以描述两个或多个模型矢量间的相似程度。信息科学与工程学院东南大学4.3失真测度失真度选择必须具备的特性主观评价上有意义,即小的失真应该对应于好的主观语音质量;易于处理的,即在数学上易于实现;平均失真存在并且可以计算;易于硬件实现信息科学与工程学院东南大学4.3失真测度一、欧氏距离-均方误差K维矢量X和码矢量Y的欧式距离定位:1.均方误差2.r方平均误差:KiriiryxKYXd11),(2211()()(,)()TKiiiXYXYdXYxyKK信息科学与工程学院东南大学4.3失真测度3.r平均误差:4.绝对值误差:5.最大平均误差:rKiriiryxKYXd11']1[),(KiiiyxKYXd111),(iiKirrrMyxYXdYXd11max)],([lim),(信息科学与工程学院东南大学4.3失真测度二、线性预测失真测度由预测系数的差值,不能完全表征这两个语音信息的差别,应由预测系数对应的信号功率谱来进行比较。信号功率谱:222)()()(jjeAeXf信号的功率谱预测误差能量预测逆滤波器的频率响应信息科学与工程学院东南大学4.3失真测度相应的,设码书中某重构矢量的功率谱为定义Itakura-Saito距离为:222)()()(jpjeAeXf1ln),(2aRaffdTISpiaaTirirrrRaa1)()(2)0()0(信息科学与工程学院东南大学4.3失真测度两种线性预测的失真测度,即:1.对比似然比失真测度2.模型失真测度)ln(ln),(22RaaaRaffdTTpLLR11),(22RaaaRaffdTTpm信息科学与工程学院东南大学4.3失真测度三、识别失真测度g(x)的作用:当两矢量的能量接近时,忽略能量差异引起的影响;当两矢量能量相差很大时,即进行线性加权;而当能量差超过门限时,则为固定值)(),(),(EEgffdEfdLLR加权因子输入信号矢量的归一化能量码书重构矢量的归一化能量)()()(0)(FFddxxxxxxxxxxg信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计最佳矢量量化器设计的两个必要条件1)Voronoi分割条件(最近邻准则)对空间的分割应满足根据该条件可以对信号空间进行最佳划分,得到的Sl称为一个胞腔});,(),(:{liYXdYXdRXSilKl信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计2)Centroid质心条件:子空间分割固定后,Voronoi胞元的质心就是量化器的码字。一般而言,质心较难计算。对于一般的分布和常用的均方失真测度,可以证明][llSYXEYlSXllXNY1是中包含的矢量个数lS信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计二、LBG算法1980年由Linde,Buzo和Gray提出,它是标量量化器中Lloyd算法的推广,在矢量量化中是一个基本算法。信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计LBG步骤第一步:初始化给出训练VQ码书所需的全部参考矢量X,用S表示;设定量化级数,失真控制门限δ,算法最大迭代次数L以及初始码书{Y1(0),Y2(0),…,YN(0)};设总失真D(0)=∞,迭代次数的初始化为m=1信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计第二步:迭代1)根据最近邻准则将S分成N个子集S1(m),S2(m),…,SN(m):2)计算失真()(1)(1)(,(,),,mlmmliXSdXYdXYijl即时NiSXmlmmlYXdD1)1()()(),(信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计3)计算新码字Y1(m),Y2(m),…,YN(m)4)计算相对失真改进量δ(m)将δ(m)与失真门限δ进行比较,若δ(m)≤δ则转入6),否则转入5))(1)(miSXimiXNY)()()1()()()(mmmmmmDDDDD信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计5)若m>L,则转至6),否则m加1,转至1)6)得到最终的训练码书Y1(m),Y2(m),…,YN(m),并输出总失真D(m)为了避免迭代算法无限制循环下去,这里设置了两个阈值参数:最大迭代次数L和失真控制门限δ。信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计三、初始码书的选择随机选取法方法:从训练序列中随即按选择J个矢量作为初始码字缺点:收敛速度慢或者不能收敛分裂法方法:将全体训练矢量的质心作为初始码本Y1(0),然后根据一定阈值ε将Y1(0)一分为二,同时训练新码本Y1(1)、Y2(1),由此循环。缺点:阈值ε选取对码书设计影响较大。信息科学与工程学院东南大学4.4最佳矢量量化器和码本设计链映射法方法:选择初始矢量X1,根据与X1的距离将训练序列进行排序,并计算前后序列的距离di,得到di~i的链映射图,根据映射图对训练序列进行初始区域划分,选择每个区域的质心作为初始码本。缺点:初始矢量X1的选择对聚类结果有影响。信息科学与工程学院东南大学4.5语音参数的矢量量化语音参数的矢量量化:将语音信号经过分析,得到各种参数,然后再将这些按帧分析所得的参数构成矢量,进行矢量量化。线性预测系数的矢量量化是人们最关心的问题。信息科学与工程学院东南大学800b/s的VQLPC声码器框图对线性预测系数采用了矢量量化,而其余参数均采用差值标量量化