学术研究AcademicResearch摘要:语音信号处理技术是语音处理领域中新近发展起来的一个学科分支,MATLAB是一个数据分析和处理功能十分强大的工程实用软件,运用它来进行语音信号的采集、分析和处理相当便捷。文章介绍了在Matlab环境中如何采集语音信号和语音信号采集后的频谱分析处理,并通过实例分析了语音信号处理的Matlab。关键字:MATLAB;语音信号;频谱分析;傅里叶变换中图分类号:TN911.6文献标识码:A文章编号:1673-1131(2010)04-015-03一、引言随着计算机技术和信息技术的发展,语音交互已经成为人机交互的必要手段,而语音信号的采集和处理是人机交互的前提和基础。Matlab是美国MathWorks公司推出的一种面向工程和科学计算的交互式计算软件,它以矩阵运算为基础,把计算、可视化、程序设计融合到了一个简单易用的交互式工作环境中。同时由于Matlab是一个数据分析和处理功能十分强大的工程实用软件,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。基于MATLAB实现对语音信号频谱分析赵淑敏/兰州交通大学电子与信息工程学院(甘肃兰州·730070)ApplicationofSpeechSignalSpectrumAnalysisBasedOnMATLABAbstract:Speechsignalprocessingtechnologyisthefieldofvoiceprocessinginthenewlydevelopedbranchofasubject.MATLABisverypowerfulandpracticalengineeringsoftwarewhichisusedindataanalysisandprocessingfraction,anduseittocollect,analysisandprocessvoicesignal,whichisveryconvenient.ThisarticledescribestheMatlabenviironment,howtocollectandprocessspeechsignal,andthroughexampleanalysisofthespeechsignalprocessinginMatlab.Keywords:MATLAB;Speechsignal;SpectrumAnalysis;FFT二、语音信号的采集Windows附件的娱乐中有个录音机程序,通过它可以驱动声片采集、播放和简单处理语音信号。为了清晰的阐明对语音信号进行频谱分析,首先使用Windows的录音机功能可以用麦克风直接录制一段女声“世界上最遥远的距离不是生与死,而是我就站在你面前你确不知道我爱你”,并保存为WAV格式文件,供MATLAB相关函数直接读取、写入或播放。本文以WAV格式语音信号作为分析处理的输入数据。例:在MATLAB中使用wavread函数读取录制得到的声音采样频率Fs为11kHz,且声音是8位单声道的声音文件“test.wav”。并利用wavplay函数播放声音,可清晰地听到语音。然后绘制显示出语音数据的波形图(如图1所示)。ClearS=wavread('C:\DocumentsandSettings\administrator\桌面\test.wav');%读取语音数据图1原始语音信号152010No.4赵淑敏/基于MATLAB实现对语音信号频谱分析&Informationcommunications信息通信Plot(S),title('原始语音信号')%画波形图Wavplay(S);%播放语音三、语音信号分析及MATLAB的实现3.1语音信号的频谱分析过程傅里叶频谱分析是语音信号频域分析中广泛采用的一种方法。语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。进行频谱分析时,在时域数据进行短时FFT处理之前都要进行加窗处理。在FFT处理之后,普通频谱分析可以进行频域上的滤波处理,从而使频谱更加平滑。最后IFFT处理观察恢复后的时域信号图形,频谱分析过程(如图2所示)。3.2短时傅里叶变换(频谱分析)傅里叶频谱分析的基础是傅里叶变换,用傅里叶变换及其反变换可以求得傅里叶谱、自相关函数、功率谱、倒谱。由于语音信号的特性是随着时间缓慢变化的,由此引出语音信号的短时分析。如同在时域特征分析中用到的一样,这里的傅里叶频谱分析也采用相同的短时分析技术。信号x(n)的短时傅里叶变换定义为式中,w(n)为窗口函数。可以从两个角度理解函数的物理意义:第一种解释是,当n固定时,如n=n0,则是将窗函数的起点移至n0处截取信号x(n),再做傅里叶变换而得到的一个频谱函数。这是直接将频率轴方向来理解的。另一种解释是从时间轴方向来理解,当频率固定时,例如=,则可以看作是信号经过一个中心频率为的带通滤波器产生的输出。这是因为窗口函数(n)通常具有低通频率响应,而指数对语音信号x(n)有调制的作用,使频谱产生移位,即将x(n)频谱中对应于频率的分量平移到零频。3.3短时傅里叶反变换(倒谱分析)傅里叶变换建立了信号从时域到频域的变换桥梁,而傅里叶反变换则建立了信号从频域到时域的变换桥梁这两个域之间的变换为一对一映射关系。我们知道,可以看作是加窗后函数的傅里叶变换,为了实现反变换,将进行频率采样,即令=2πk/L,则有其中,L为频率采样点数。将在时域n上每隔R个样本采样,则可令用这些求出其离散傅里叶反变换yr(n)如下:而可以证明,x(n)和y(n)之间只相差一个比例因子,它们的关系如下:3.4MATLAB处理语音信号Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种分析图的呈现等等。下面以语音信号的波形图、频谱图和倒谱图(如图3所示)分析为例来说明Matlab在语音信号处理中的具体实现方法。%分段fourier变换,每段长为512,每段加矩形窗,连续断之间重叠的长度100S=wavread('C:\DocumentsandSettings\administrator\桌面\test.wav');subplot(3,1,1);plot(S),title('波形图')wavplay(S);%播放语音n=size(S);d=100;%连续段之间的重叠长度L=512;k=L-d;t=fix(n/k);frame_length=512;%采用滑动窗进行短时fft变换r=(rectwin(frame_length));fora=1:tn1=(L-d)*(a-1)+1;n2=(L-d)*(a-1)+frame_length;y=S(n1:n2);sf=fft(y'.*r',512);图2频谱分析过程162010No.4赵淑敏/基于MATLAB实现对语音信号频谱分析学术研究AcademicResearchX1(n1:n2)=sf(1:frame_length);endFFTSIZE=8000;%FFT长度为8000点,每点对应于1HzY=zeros(FFTSIZE,1);Y=20*log10(abs(X1));subplot(3,1,2);plot(Y(1:4000)),title('频谱图');%画前4000点%IFFT变换T1=length(X1);t1=fix(T1/L);fori=1:t1z=ifft(X1((i-1)*L+1:i*L),512);z=real(z./r');y((i-1)*k+1:i*k)=z(1:k);endsubplot(3,1,3);plot(y),title('倒谱图')四、结束语本文主要是基于高级面向对象开发语言MATLAB的基本特征,以及MATLAB强大的工具箱功能,实现信号的预处理、信号的时域处理和信号的频域处理。其中实现信号的时域处理过程中,设计了加窗处理;在信号频域处理过程中,实现对低于20kHz语音信号进行频谱分析。同时,通过上述实例说明,基于MATLAB可以很好的达到对语音信号的频谱的分析处理。参考文献[1]姚天任.数字语音处理[M]武汉:华中科技大学出版社,1991[2]刘卫国.MATLAB程序设计教程[M]北京:中国水利水电出版社,2005[3]张登奇,蒋敏.基于MATLAB的音频信号处理技术实现[J]电脑知识与技术,2009(2)[4]陈宇锋.基于声卡和MATLAB的语音信号采集和处理[J]高教装备,2006(5)[5]徐靖涛,王金根,基于MATLAB的语音信号分析和处理[J]重庆科技学院学报,2008(1)作者简介赵淑敏(1985-),女,汉族,在读硕士,兰州交通大学电子与信息工程学院,主要研究方向为信号与信息处理。(上接第31页)四、结论由于视频信号在无线网络中传输时数据出错率和丢包率都很大,所以基于后处理的误码隐藏技术不会因为带宽扩容和信源、信道编码技术的发展而失去意义。通过阐述加权内插算法的原理,实验验证了加权内插算法对于提升无线传输视频效果明显,但是加权插值和其他掩盖算法(如模糊集方法、小波变换方法等)的误码隐藏效果比较还有待进一步研究。此外,由于手机等嵌入式设备CPU资源的紧张,在采用更优误码掩盖算法来提高视频效果时,还需要研究误码掩盖的快速算法[4],进一步降低运算复杂度,使其在实际视频通信应用中发挥重要作用。参考文献[1]沈兰荪,卓力,田栋,等.视频编码与低速率传输[M].北京:电子工业出版社,2001.[2]李非一.无线信道下误码控制和误码隐藏研究与实现[D].武汉:武汉大学,2005.[3]ISOPIECCD13818-2:Codingofmovingpicturesandassociatedaudio-Part2:video,1994.[4]DapengWu,YiweiThomasHou,Ya-QinZhang.“TransportingReal-timeVideoovertheInternet:ChallengesandApproaches”.ProceedingsoftheIEEE,Vol.88,No.Y.2000.作者简介裴红津(1976-),男,湖北宜都人,工程师,硕士,主要研究方向为移动通信、信息处理。172010No.4赵淑敏/基于MATLAB实现对语音信号频谱分析