数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)1第四章语音信号的短时频域分析4.1概述14.2傅里叶变换的解释4.3滤波器的解释34.4短时谱的时域及频域采样率44.5短时综合的滤波器组相加法52数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)24.1概述语音信号可被看作是短时平稳信号,其某一帧的短时傅里叶变换定义式如下:(4.1)式中w(n-m)是窗函数。在式中,短时傅里叶变换有两个变量,它们是离散时间n及连续频率ω)e()()(ejjmmnmnwmxX数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)3若令,则得离散的短时傅里叶变换如下:(4.2)它实际上就是的频率的取样。Nkπ22π2πjj(e)()()()e,01kkmNNnnmXXkxmwnmkN)(ejnX4.1概述数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)4可以看出:(1)当n固定时,它们就是序列(-∞≤m≤+∞)的傅里叶变换或离散傅里叶变换。(2)当或k固定时,它们是一个卷积,这相当于滤波器的运算。因此,语音信号的短时频域分析可以解释为傅里叶变换或滤波器。下面分别讨论这两种情况。mxmnw4.1概述数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)54.2傅里叶变换的解释1.求x(n)将式(4.1)写作(4.3)时变傅里叶变换是时间标号n的函数,当n变化时,窗w(n-m)沿着x(m)滑动。)]e()([)(ejjmmnmnwmxX数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)6图4.1x(m)及w(n-m)的示意图w(50–m)w(100–m)w(200–m)x(m)0n=50n=100n=200m数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)7傅里叶逆变换公式为:(4.4)令m=n,则(4.5)可以看出,只有当w(0)≠0时,x(n)才能从求出。d)e(eπ21)()(jjππmnXmxmnwd)e(e(0)π21)(jjππnnXwnx)e(jnX数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)8此外,由功率谱定义,可以写出短时功率谱与短时傅里叶变换的关系:(4.6)功率谱是自相关函数(4.7)的傅里叶变换。|)(e|)(e)(e)(e2jjjjnnnnXXXS)e(jnS∑∞∞)()()()()(mnmknwkmxmnwmxkR数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)9窗函数的作用1.选出x(m)序列中被分析部分;2.它的形状对时变傅里叶变换特性也有重要作用。数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)10如果被看成是w(n-m)x(m)序列的标准傅里叶变换,同时假设x(m)及w(m)的标准傅里叶变换存在,为:(4.8)(4.9)当n固定时,序列w(n-m)的傅里叶变换为:(4.10))(ejnnX)e()(e)e()(ejjjjmmmmmwWmxXe)e(e)(jjjnmmWmnw数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)11根据卷积定理,有:(4.11)写成卷积积分形式:(4.12)将θ改换为-θ后,可以写成:(4.13))](e[*]e)(e[)(ejjjjXWXnn)de(e)e(π21)e()(jjππjjXWXnn)de(e)e(π21)e()(jjππjjXWXnn可见,为了使能够充分地表现的特性,要求对于来说,必须是一个冲激脉冲。)e(jnX)e(jX)e(jW)e(jX数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)12窗函数和窗宽对短时傅里叶谱的影响:由于矩形窗有较高的旁瓣,在语音频谱分析中,很少采用。实验表明,窗的主瓣宽度与窗宽度N成反比,选择窗宽时应根据应用需要,折衷考虑,要得到好的时间分辨率要求用窄窗,而要得到好的频率分辨率要求用宽窗。数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)134.3滤波器的解释(ω给定)1.短时傅里叶变换的滤波器实现形式一由式(4.1)可得(4.14)如果把w(n)看作为一个滤波器的单位取样响应,则短时傅里叶变换就是该滤波器的输出,为滤波器的输入。)(]e)([)e(jjmnwmxXmmn)e(jnXnnxje)(数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)14图4.2短时频谱分析的滤波表示(a)复数运算(b)只有实数运算x(n)x(n)cos(ωn)sin(ωn)an(ω)bn(ω)冲激响应w(n)冲激响应w(n)冲激响应w(n)nje)je(nX(a)(b)数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)15用实数来运算的方法:(4.15))e(jnX)(j)(e|)e(|)e()(jjjnnnnbaXX(4.16)∑∑∞∞∞∞)-()sin()()()()cos()()(mnmnmnwmmxbmnwmmxa数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)16结论:经调制后,其付里叶变换为,这说明调制使的频谱在频率轴上向左移动了,线性滤波器输出端的频谱等于乘积,故为了使输出频谱准确等于,应当是一个冲激。即要求线性滤波器近似为一个窄带低通滤波器。)(nx)()(jeX)(nx()()()jjXeWe)(jeX()jWe数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)172.短时傅里叶变换的滤波器实现形式二令:(4.16)令(4.17)则有(4.18)mnmmmjnmmnjnemwmnxemwmnxX])()([e)()()e(j-)(j)e(ee)()()e(~jjjjnnmmnXmwmnxX)](b~j)(~[e)e(~e)e(jjjjnnnnnnaXX数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)18可以画出短时傅里叶变换的滤波器解释的另一种形式如图(4.3)所示,也分为复数运算和实数运算两种。同样要求线性滤波器近似为一个中心频率为ω的窄带带通滤波器。数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)19x(n)图4.3另一种用线性滤波对短时频谱分析的解释(a)复数运算(b)只有实数运算cosωnsinωnbn(ω)an(ω)(a)(b)x(n)cosωn++-冲激响应w(n)cosωn冲激响应w(n)sinωn+nnwje)(冲激响应)je(~nX)je(nX)(~na)(~nbnje数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)20x(n)sinωncosωnw(n)w(n)w(n)cosωnw(n)sinωn()2()2()2()2()1/2()1/2)je(nx)je(nx图4.4得到短时频谱模值的两种方法(a)利用低通滤波器(b)利用带通滤波器x(n)(a)(b)数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)214.4短时谱的时域及频域取样率短时傅里叶变换同时是时间n以及角频率ω的函数。由来恢复x(n),首先遇到的就是时域取样率和频域取样率的问题。)e(jnX)e(jnX数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)221.时域取样率(ω为固定值)若将w(n)的傅里叶变换记为,对于大多数窗函数来说,具有低通滤波器的特性,若它的带宽为BHz,则具有与窗相同的带宽。低通滤波器的带宽是由第一个零点位置决定的。因为是-1的傅里叶变换,因而B的取值决定于窗口序列的长度N和形状。)e(jnX)e(jW)e(jWNnnw≤≤0),()e(jW数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)23若使用哈明窗,的近似带宽为(4.20))e(jW(Hz)2NFBS)/(42)je(秒采样的采样率为NsFBnX)j(e,的近似带宽为若使用矩形窗W(Hz)NsFB)/(22)je(秒采样的采样率为NsFBnX数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)242、频率取样率(n为固定值)此时,是以2π为周期的ω的连续函数,用下述一组频率值来取样:(4.21)设w(n)为有限时宽N,的短时付里叶反变换x(m)w(n-m)也应当是宽度为N有限时宽的。现在在频域内L个角频率上对进行取样,根据这些取样所恢复出的时间信号应该是x(m)w(n-m)进行周期延拓的结果,延拓周期等于L。为使恢复的时域信号不产生混叠,要求,故频域最小取样数为窗宽SRf=N。)e(jnX1-,0,1,,π2LkLkk)e(jnXNL)e(jnX数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)253、总取样率的总抽样率(SR)等于(4.22)在大多数实际窗中,B可以表示为FS/N的倍数(4.23)其中,C是比例常数,x(n)的抽样频率即为(4.24)SR/FS即为与一般取样频率相比而得到的“过速率采样比”。)e(jnX秒抽样/2NBSRSRSRft(Hz)CNFBs秒采样/C2SFSR数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)26欠速率采样:x(n)的短时谱所要求的取样率比起一般波形表示来说,要增加到2~4倍。但有时在时域或频域用低于理论上最小值的取样率,而x(n)仍能从混叠的短时变换中准确地恢复。欠速率采样在短时谱估计,基音及共振峰分析,数字语谱图以及声码器中得到应用。数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)274.5短时综合的滤波器组相加法)e(jnXjjjjj(e)()()e(e)e()()eiiiiimnimnmnimXwnmxmXxnmwm或可表示为(4.25)(4.26)若定义e)()(jniiinwnh)()(e)e(jjmhmnxXminnii则(4.27)(4.28)数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)28hi(n)wi(n)hi(n)nijenije)je(inXnijenije)je(inXyi(n)x(n)x(n)x(n)yi(n)yi(n)(b)(c)(a)图4.6用线性滤波实现单个通道综合式(4.28)的图形解释数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)29定义(4.29)可得(4.30)可见,是一个冲激响应为的带通滤波器的输出。jj()(e)eiininynX()()()iimynxnmhm)(nyi)(nhi数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)30图4.7(a)理想低通;(b)理想带通滤波器的频率响应)e(jiW-ωpi0ωpiπ2π-ωpi2π+ωpiω(a)ω)e(jiH0ωiπ2π2π+ωi2ωpi(b)数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)31复数带通滤波器的频率响应为上式用图4.7(b)表示,中心频率为,带宽为,假定所有通道都使用了相同的窗函数,即)(e)e()(jjiiiWH(4.31)ipi21,...,1,0),()(Ninwnwi(4.32)数字语音处理及MATLAB仿真张雪英编著(李红莲修改并主讲)32考虑整个带通滤波器组时,其中每个带通滤波器具有相同的输入,其输出相加在一起,如图4.8