语音信号处理第3章-语音信号分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

信息科学与工程学院东南大学3.1概述3.2语音信号的数字化和预处理3.3语音信号的时域分析3.4语音信号的频域分析3.5基间周期估计3.6共振峰估计信息科学与工程学院东南大学3.1概述语音信号分析(提取表示语音信号特征的参数):短时分析技术特征参数均是随时间而变化的-非平衡态过程在短时间范围内(10-30ms),其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。信息科学与工程学院东南大学3.1概述参数性质的不同:时域分析频域分析倒频域分析线性预测分析分析方法的不同:模型分析方法非模型分析方法信息科学与工程学院东南大学3.2语音信号的数字化和预处理语音信号分析前,需要前端过程语音信号数字化:反混叠滤波、增益控制、采样、A/D变换及编码(PCM码)预处理一般包括预加重、加窗和分帧等。带通滤波器自动增益控制(AGC)模/数转换(A/D)脉冲编码调制(PCM)语音信号存入计算机信息科学与工程学院东南大学预滤波抑制语音信号中频率超出fs/2的频谱分量(fs为采样频率),防止混叠干扰。抑制50Hz的电源工频干扰。预滤波器必须是一个带通滤波器,设其上、下截止频率分别是fH和fL:fH=3400Hz,fL=60-100Hz,fS=8kHz信息科学与工程学院东南大学采样、A/D变换信息科学与工程学院东南大学采样、A/D变换语音信号经过预滤波和采样后,由A/D变换器变换为二进制数字码。A/D要对信号进行量化,不可避免地会产生误差。量化后的信号值与原信号值之间的差值称为量化误差,又称为量化噪声。若信号波形的变化足够大,或量化间隔Δ足够小时,量化噪声符合具有下列特征:①是平稳的白噪声过程②量化噪声与输入信号不相关③量化噪声在量化间隔内均匀分布,即具有等概率密度分布信息科学与工程学院东南大学采样、A/D变换量化信噪比SNR(信号与量化噪声的功率比):其中σx2表示语音方差,2Xmax表示信号的峰值,B表示量化字长,σe2表示噪声差。通常语音信号的幅度符合Laplacian分布,则表明量化器中的每bit字长对SNR的贡献为6dB。xexXBdBSNRmax22lg2077.402.6lg10)(2.702.6)(BdBSNR信息科学与工程学院东南大学预处理语音信号的平均功率谱受声门激励和口鼻辐射影响,预处理中要进行预加重(Preemphasis)处理。其目的是提升高频部分,使信号频谱变得平坦,以便于频谱分析或声道参数分析。1()1Hzz信息科学与工程学院东南大学预处理语音信号预加重后,进行加窗分帧处理。一般33-100帧/s。分帧可以采用连续分段,但一般要采用如交叠分段,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的比值一般取为0-1/2。信息科学与工程学院东南大学预处理信息科学与工程学院东南大学预处理分帧后用一定的窗函数ω(n)来乘语音信号s(n),从而形成加窗信号sω(n)=s(n)*ω(n)常用的窗函数是矩形窗和汉明窗(其中N为帧长):矩形窗:汉明窗:elsenNnn,0)1(0,1)(elsenNnNnn,0)1(0)],1/(2cos[46.054.0)(信息科学与工程学院东南大学预处理窗函数的形状和长度对短时参数特征影响很大1.窗口形状时域:要减小时间窗两端的坡度,使窗口边缘两端不引起急剧变化而平滑过渡到零,这样可以使截取出的语音波形缓慢降为零,减小语音帧的截断效应;频域:要有较窄的3dB带宽以及较大的旁瓣衰减(较小的边带最大值)。这里只以典型的矩形窗和汉明窗为例进行比较。信息科学与工程学院东南大学矩形窗与汉明窗的比较汉明窗的主瓣宽度比矩形窗大一倍,即带宽约增加一倍,同时其带外衰减也比矩形窗大一倍多,汉明窗比矩形窗更为合适。因此,对语音信号的短时分析来说,窗口的形状是至关重要的。窗类型旁瓣峰值主瓣宽度最小阻带衰减矩形窗-134π/N-21汉明窗-418π/N-53信息科学与工程学院东南大学窗函数对频谱分析的影响信息科学与工程学院东南大学窗函数对频谱分析的影响矩形窗、Hamming窗下信号功率谱的比较12()5sin()5sin()()xnnwnwvn信息科学与工程学院东南大学窗函数对频谱分析的影响12()0.2sin()5sin()()xnnwnwvn信息科学与工程学院东南大学2.窗口的长度采样周期Ts=1/fs,窗口长度N和频率分辨率Δf之间存在下列关系:采样率一定时,Δf随窗口宽度N的增加而减小,即频率分辨率相应得到提高•窗口长,频率分辨率高,时域分辨率降低•窗口短,频率分辨率低,时间分辨率提高1sfNTV信息科学与工程学院东南大学预处理窗口长度的选择,更重要的是要考虑语音信号的基音周期。通常认为在一个语音帧内应包含1~7个基音周期。不同人的基音周期变化很大,从女性和儿童的2ms到老年男子的14ms(即基音频率的变化范围为500~70Hz),所以N的选择比较困难。通常在10kHz取样频率下,N折中选择为100~200点为宜(即10~20ms持续时间)。信息科学与工程学院东南大学数字化和预处理经过数字化和预处理过程,语音信号就已经被分割成一帧一帧的加过窗函数的短时平稳信号对每一个短时语音帧,利用数字信号处理技术来提取语音特征参数。信息科学与工程学院东南大学3.3语音信号的时域分析时域分析就是分析和提取语音信号的时域参数,通常用于最基本的分析及应用,如语音的分割、预处理、大分类等,其特点①表示语音信号比较直观、物理意义明确。②实现起来比较简单、运算量少。③可以得到语音的一些重要的参数。④只使用示波器等通用设备,使用较为简单等信息科学与工程学院东南大学1.短时能量及短时平均幅度分析语音波形时域信号为x(t)加窗分帧后的第n帧语音信号为xn(m)设第n帧语音信号xn(m)的短时能量用En表示,则其计算公式如下:102)(NmnnmxE信息科学与工程学院东南大学1.短时能量及短时平均幅度分析信息科学与工程学院东南大学1.短时能量及短时平均幅度分析En用于度量语音信号幅度值变化,其缺点是对高电平非常敏感(采用信号的平方)。可采用另一个度量语音信号幅度值变化的函数,即短时平均幅度函数Mn:Mn用于表征一帧语音信号能量大小,与En的区别在于计算时不会因为取平方而造成较大差异。10)(NmnnmxM信息科学与工程学院东南大学2.短时过零率分析短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。连续语音信号,过零即意味着时域波形通过时间轴离散信号,如果相邻的取样值改变符号则称为过零。过零率就是样本改变符号的次数。定义语音信号xn(m)的短时过零率Zn为:式中,sgn[]是符号函数,即10)]1(sgn[)](sgn[21NmnnnmxmxZ)0(,1)0(,1]sgn[xxx信息科学与工程学院东南大学2.短时过零率分析Zn可以从背景噪声中找出语音信号,可用于判断寂静无声段和有声段的起点和终点位置。在背景噪声较小时用平均能量识别语音起止位置较为有效,而在背景噪声较大时用平均过零率识别较为有效。对于一些特殊发音,只用其中一个参量来判别语音的起点和终点是有困难的,必须同时使用这两个参数。信息科学与工程学院东南大学3.短时相关分析相关分析有自相关和互相关之分。这里主要讨论自相关函数。自相关函数的作用:浊音语音的基音周期估计。线性预测分析信息科学与工程学院东南大学3.短时相关分析1.短时自相关函数定义语音信号xn(m)的短时自相关函数Rn(k):这里K是最大的延迟点数。短时自相关函数的性质:(1)如果xn(m)是周期的,则自相关函数是同周期(2)Rn(k)是偶函数(3)Rn(0)是最大值,且为确定信号的能量或随机信号的功率。KkkmxmxkRkNmnnn0,)()()(10信息科学与工程学院东南大学-80-60-40-20020406080-0.1-0.0500.050.1-80-60-40-20020406080-0.1-0.0500.050.1k=1信息科学与工程学院东南大学-80-60-40-20020406080-0.1-0.0500.050.1-80-60-40-20020406080-0.1-0.0500.050.1k=11信息科学与工程学院东南大学-80-60-40-20020406080-0.1-0.0500.050.1-80-60-40-20020406080-0.1-0.0500.050.1k=21信息科学与工程学院东南大学-80-60-40-20020406080-0.1-0.0500.050.1-80-60-40-20020406080-0.1-0.0500.050.1k=51信息科学与工程学院东南大学020406080100120140160-0.1-0.0500.050.1020406080100120140160-0.1-0.0500.050.1k=-1信息科学与工程学院东南大学020406080100120140160-0.1-0.0500.050.1020406080100120140160-0.1-0.0500.050.1k=-11信息科学与工程学院东南大学020406080100120140160-0.1-0.0500.050.1020406080100120140160-0.1-0.0500.050.1k=-21信息科学与工程学院东南大学020406080100120140160-0.1-0.0500.050.1020406080100120140160-0.1-0.0500.050.1k=-51信息科学与工程学院东南大学-80-60-40-20020406080-0.0200.020.040.060.080.1信息科学与工程学院东南大学3.短时相关分析2.修正的短时自相关函数修正的短时自相关函数是用两个长度不同的信号进行乘积和,修正的短时自相关函数定义为其中,KkkmxmxkRNmnnn0,)(')()(10其它值mNmm,0)1(~0,1)()0(),()()(Kkmnxmmxn)10(),()(')('KNkmnxmmxn其它值mKNmm,0)1(~0,1)('信息科学与工程学院东南大学3.短时相关分析2.修正的短时自相关函数信息科学与工程学院东南大学4.短时平均幅度差函数短时自相关函数是重要参量,其缺点是运算量很大,其原因是乘法运算所需要的时间较长。为了避免乘法,一个简单的方法就是利用差值。为此常常采用另一种与自相关函数有类似作用的参量,即短时平均幅度差函数(AMDF)。平均幅度差函数能够代替自相关函数进行语音分析,是基于这样一个事实:如果信号是完全的周期信号(设周期为Np),则相距为周期的整数倍的样点上的幅值是相等的,差值为零。信息科学与工程学院东南大学4.短时平均幅度差函数对于实际的语音信号,差值不为零,但其值很小,这些极小值将出现在整数倍周期的位置上。为此,可定义短时平均幅度差函数:kNmnnnkmxmxkF10)()()(信息科学与工程学院东南大学4.短时平均幅度差函数信息科学与工程学院东南大学3.4语音信号的频域分析频域分析就是分析语音信号的频域特征:语音信号的频谱功率谱倒频谱频谱包络分析常用的频域分析方法:带通滤波器组法傅里叶变换法线性预测法信息科学与工程学院东南大学1.短时傅里叶变换对第n帧语音信号xn(m)进行傅里叶变换(离散时域傅里叶变换,DTFT):语音信号的标准傅里叶变换,窗口函数不同,傅里叶变换的结果也将不同。10)()(Nmmjn

1 / 108
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功