《语音信号处理》实验4-MFCC特征提取

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

华南理工大学《语音信号处理》实验报告实验名称:MFCC特征提取姓名:学号:班级:10级电信5班日期:2013年5月24日1.实验目的1、熟练运用MATLAB软件进行语音信号实验;2、熟悉短时分析原理、MFCC的原理;3、学习运用MATLAB编程进行MFCC的提取;4、学会利用短时分析原理提取MFCC特征序列;2.实验原理MFCC:语音识别和说话人识别中,常用的语音特征是基于Mel频率的倒谱系数(即MFCC)。MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。Mel频率可以用如下公式表示:)700/1log(2595ffMel在实际应用中,MFCC倒谱系数计算过程如下;①将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频谱。②求出频谱平方,即能量谱,并用M个Mel带通滤波器进行滤波;由于每一个频带中分量的作用在人耳中是叠加的。因此将每个滤波器频带内的能量进行叠加,这时第k个滤波器输出功率谱)('kx。③将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反离散余弦变换,得到L个MFCC系数,一般L取12~16个左右。MFCC系数为MkMnkkxCn1']/)5.0(cos[)(log,n=1,2,...,L④将这种直接得到的MFCC特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。3.实验数据及平台本实验所采用的数据是语音文件phrase.WAV和monologuespeech_female,平台是MATLAB。4.实验过程(步骤)(1)实验步骤①输入样本音频②给样本音频预加重、分帧、加窗③将处理好的样本音频做傅里叶变换④进行Mel频率滤波⑤进行Log对数能量⑥对样本求倒谱⑦输出MFCC图像(2)、MFCC提取程序流程图s(n)s(n)X(k)X(k)图1MFCC特征提取5.实验结果及讨论运行附录程序,得到的结果为:1、采用语音文件phrase.WAV,得到的MFCC特征提取图像为:预加重、分帧、加窗DFT/FFTMel频率滤波组Log对数能量DCT求倒谱2、采用语音文件monologuespeech_female.wav,得到的MFCC特征提取图像为:通过计算MFCC参数,获得了声纹识别的特征参数。由于MFCC参数是对人耳听觉特征的描述,因此,可以认为,不同声纹的MFCC参数距离,能够代表人耳对两个语音听觉上的差异,可以为声纹的识别提供可靠的依据。6.实验总结在上一次做了LPC特征提取的实验之后,对这方面已经有了一定的认识,这次通过课堂的学习和资料的查找,对MFCC特征提取进行探究和验证,真正把课堂知识用到实验之中,对相关知识的理解和掌握起了比较好的作用。7.实验代码closeallclearclc[x]=wavread('E:\yuuyin\monologuespeech_female.wav');bank=melbankm(24,256,8000,0,0.5,'m');bank=full(bank);bank=bank/max(bank(:));fork=1:12n=0:23;dctcoef(k,:)=cos((2*n+1)*k*pi/(2*24));endw=1+6*sin(pi*[1:12]./12);w=w/max(w);%预加重滤波器xx=double(x);xx=filter([1-0.9375],1,xx);%语音信号分帧xx=enframe(xx,256,80);%计算每帧的MFCC参数fori=1:size(xx,1)y=xx(i,:);s=y'.*hamming(256);t=abs(fft(s));t=t.^2;c1=dctcoef*log(bank*t(1:129));c2=c1.*w';m(i,:)=c2';endfigureplot(m);xlabel('帧数');ylabel('幅度');title('MFCC');

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功