噪声环境下语音识别系统研究作者:刘丽娟学位授予单位:西北大学相似文献(10条)1.学位论文许涛抗噪声语音识别中的语音增强技术2002论文首先研究了基于语音增强的识别系统的性能,用基于听觉掩蔽的维纳滤波和指数滤波算法替代传统的减谱法和MMSE法.在特征空间提出了一种新的特征加权算法,并利用基于短时谱幅度估计(STSA)的语音增强方法,用谱幅度增益系数取代了MissingData方法中的局部信噪比估计,给出了权重的计算公式.论文的另一个贡献是将前端的MMSE增强方法、特征加权算法,以及Log-Add模型补偿融合起来,提出了多空间信号处理的MMSE-FW-LA方案.即同时在信号空间、特征空间和模型空间消除噪声引起的训练和识别环境的失配.2.学位论文林波低信噪比下语音识别技术的研究2006低信噪比下的语音识别是目前国内外一个重要的研究课题,也是目前语音识别的研究热点和难点,具有极其重要的理论和实际意义。本文从研究语音处理的一些基本理论入手,重点研究了其中的语音识别算法、噪声参数估计方法和语音增强技术,并将语音增强技术应用于低信噪比噪声环境下的语音识别系统中,实验结果表明,系统性能得到了明显的改善。本文的主要研究工作如下:1.在研究语音识别的一些基本理论基础上,分别采用DTW和VQ两种识别算法实现了非特定人孤立词识别系统和说话人辨认系统。对基于VQ算法的说话人辨认系统,提出了在不同噪声环境下建立多个训练模板的方法。同时,对基于DTW算法的非特定人孤立词识别系统进行了多种噪声环境下的仿真实验,结果表明:在安静环境下,系统识别率可到达96%以上,而在低信噪比环境下,语音识别系统性能急剧下降,在信噪比极低时,几乎无法识别。2.在分析噪声特性的基础上,重点研究了基于语音活性检测和基于连续更新噪声谱的两种噪声参数估计方法,并提出了将能零积的思想应用到基于LPC倒谱系数的语音活性检测算法中。实验结果表明,这两种算法都能有效地估计平稳噪声参数,而基于连续更新噪声谱的方法在非平稳噪声环境下表现出了更佳的性能。3.系统地研究了多种语音增强算法,包括基于短时谱分析的维纳滤波法、谱减法和MMSE算法,并研究了基于人耳听觉掩蔽效应的语音增强算法。在此基础上,结合前面的改进噪声参数估计方法,对各种语音增强算法及其改进方法进行了低信噪比环境下的系统仿真,并对实验结果进行了比较和分析。4.将语音增强技术与语音识别系统结合起来,即通过对原始带噪语音进行语音增强处理,提高信号的信噪比和可懂度,从而提高语音识别系统的识别率。本文分别采用维纳滤波、谱减法、MMSE算法和基于掩蔽模型的增强算法对语音识别系统进行了低信噪比环境下的系统仿真,实验结果表明,这种方法能有效地提高低信噪比环境下系统的识别率。3.学位论文张健自适应噪声抵消及其在语音识别中应用的研究2003该文从使用语音增强技术改善语音识别系统识别率的角度出发,探讨了在可获得噪声信号参考情况下的自适应噪声抵消增强技术及其在语音识别中应用.该文的工作包括以下几个部分:1.分析了几种有代表性的单通道的语音增强技术,指出了它们的优缺点.进而提出了一种双通道的基于自适应噪声抵消的语音增强方案.2.研究了已有几种自适应噪声抵消算法(包括LMS算法、RLS算法、Subband方法)的原理和性能;出于提高自适应滤波收敛速度的考虑,提出了一种基于权重轮廓线的改进的NLMS算法,并取得了很好的实验结果;为了解决非线性问题,提出一种带非线性补偿的自适应噪声消除方法,并在满足假设条件的模拟实验中取得了较好的效果.3.分析、设计并实现了一个集成自适应噪声抵消的电视机语音控制系统.介绍了其中的硬件和软件平台具体实现,以及用到的主要算法,并介绍了在端点检测方面所提出的改进的基于能量滤波的方法.4.对上述语音控制系统进行了评测,并在此系统基础上将自适应噪声抵消和其它语音增强算法做了对比研究.4.学位论文刘雪飞基于小波分析方法的含噪声语音信号增强技术研究2005语音增强技术是噪声环境下语音识别中的关键技术之一,而噪声环境下的语音识别是目前语音识别领域的研究热点,具有一定的理论和实际意义。目前,国际上噪声环境下的语音识别主要有3种方法:语音增强方法、模型补偿法、提取鲁棒性好的语音特征参数方法。本论文的研究工作是针对噪声环境下语音增强问题展开的。论文对语音增强技术进行了探讨,主要对基于小波变换的阈值去噪增强方法进行了研究。介绍了常用的语音增强算法,小波分析的基本理论,小波阈值去噪法的主要思想;研究了五种不同阈值情况下运用折中阈值函数对语音信号的去噪增强效果;比较了同一种阈值规则情况下不同阈值函数的去噪结果。设计了基于LabVIEW平台的语音信号采集系统,编制了基于Matlab软件平台的算法仿真程序。仿真结果表明:在五种阈值规则中,运用Neyman-Pearson准则得到的重构信号均方根误差最小,信噪比提高最大;在同一种阈值规则中,本文所提出的折中阈值函数对语音信号去噪后得到的重构信号波形平滑性最好。最后简要讨论了由于语音增强所带来的失真问题,失真的结果表现为引起频谱变形的乘性噪声和近似表现为加性的剩余噪声,在特征空间运用倒谱均值归一化方法(CMN)对乘性噪声带来的失真进行补偿,在模型空间采用并行模型合并算法(PMC)对加性噪声带来的失真进行补偿。仿真结果表明:识别率较高,说明补偿方法是有效的。5.期刊论文洪鸥.Hong.Ou麦克风阵列语音增强技术及其应用-微计算机信息2006,22(1)本文简要叙述了应用麦克风阵列进行语音增强的原理及方法.且由于麦克风阵列在实际语音处理时具有良好的拾取语音能力及噪声鲁棒性,本文将介绍该技术在车载系统环境、机器人语音识别、大型场所的记录会议、助听装置及声源定位等系统中的应用.6.学位论文覃毅语音增强技术的算法改进研究2007在实际的语音应用过程中,如语音通信、语音合成、语音识别等,所使用的语音信号不可避免的受到外来的各种各样的噪声干扰,这些干扰将严重影响语音设备功能的发挥。因此,有必要对被噪声干扰的语音信号进行去噪处理,即我们所说的语音增强。语音增强的算法多种多样。本文首先介绍了语音增强的来源、发展历程等,重点讨论了几种常用的基于短时谱的语音增强算法,以及语音和噪声模型,讨论了噪声估计的方法。一般的噪声估计是对噪声的方差进行估计,所估计的方差的准确性将对后续的处理有重大的影响。本文着重对基于最小值跟踪法的噪声估计做了详细的研究,通过实验仿真对其估计效果进行评价。最终以最小值跟踪算法作为改进的语音增强方法的噪声估计部分。本文主要是为了提高语音的清晰度,要求语音失真要小,并且减少“音乐噪声”对主观听觉的不良影响。利用人耳的语音感知特性,本文提出一种基于听觉掩蔽效应的改进谱相减语音增强方法。仿真结果表明:改进后的算法性能明显优于改进前的算法。在后续处理中,本文将基于人耳听觉的掩蔽效应引入增强系统中,最终试验表明掩蔽效应增加了语音的清晰度,提高了舒适度。7.学位论文曹乃文带噪语音增强技术研究2008当前,语音识别技术日益成熟,应用领域日趋扩展。但是,在实验室训练好的性能优越的语音识别系统,在不同声学环境,特别是在强噪声环境中使用时,识别性能会急剧下降。语音增强是解决该问题的主要方法,对带噪语音进行语音增强技术处理后,能够保持识别系统的高识别率。本文对带噪语音增强技术展开了研究。本文首先分析研究了几种传统的语音增强方法的原理,包括谱减法、维纳滤波法、自适应滤波法。其中的重点是谱减法和维纳滤波法,探讨了两种方法的改进形式并给出了实验结果。通过对实验结果主、客观分析,比较了两者的性能和增强效果,讨论其优缺点。然后,本文重点对独立分量分析方法(ICA)在语音增强方面的应用展开了较深入的研究。讨论了独立分量分析理论,被广泛应用的固定点算法及其准则函数的选取问题。详细分析了以四阶累积量和负熵为算法的准则函数的固定点算法,通过仿真计算和实验结果,从主、客观两个角度探讨了基于这两种准则函数的固定点算法各自的性能和分离效果。接着讨论了单通道下将ICA应用于语音增强的方法,实现了其中的二抽取法并对其作了验证。单通道ICA扩展了ICA的应用范围,可以降低实际应用成本。接着,本文提出了一种强噪声下基于谱减法和ICA的带噪语音增强方法,将带噪语音先用ICA将语音和噪声分离,初步提高语音的信噪比,再用谱减法对语音再次消噪,进一步提高语音的信噪比。实验结果显示该方法能有效地、更大程度地提高信噪比。在此基础上,进一步探讨了基于谱减法和ICA对带噪混叠语音进行的分离,验证了其可行性,发现其去噪效果明显,但是对语音的分离效果不够理想。最后,对本文的结论进行了总结,对今后的研究工作提出了一些想法。8.学位论文宫晓梅中等词汇量汉语连续语音识别技术研究2007语音识别的目的是让机器理解人的语言,实现更方便直接的人机交互。经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用。越来越多具有语音识别功能的产品进入人类的日常生活。然而语音识别技术对环境的依赖性很强,语音识别系统通常是将在安静环境下训练得到的模板应用于实际环境中。而实际环境中一般都存在噪声,随着环境噪声的加大,识别性能将会急剧下降,这是因为噪声对语音识别的影响很大,而对噪声的处理比较困难,如何建立鲁棒性识别系统成为语音识别领域的重要研究课题。本文介绍了语音识别的主要应用领域,国内外发展历史与研究现状,简要介绍了语音识别的基本方法及涉及到的关键技术,包括语音识别系统的分类、识别基元的选取以及模板训练与模式匹配的主要方法等。分析语音识别系统的基本结构及涉及到的各种主要技术,讨论了语音信号的预处理及语音信号各种主要时、频域特征参数的提取,重点分析研究常用且效果良好的、反映语音倒谱特征的线性预测倒谱系数(LPCC)和美尔倒谱系数(MFCC)的提取方法。隐马尔科夫模型用统计原理建立语音识别的声学模型,是目前语音识别的主流声学建模技术,本文重点介绍了隐马尔科夫模型的原理及其在语音识别中的应用,并探讨了其局限性。最后在HTK平台上实现了中等词汇量特定人汉语连续语音识别的实验,验证了语音识别各个步骤的工作,提取出多种语音特征参数并对其进行对比实验以比较不同特征参数的识别效果;通过实验讨论HMM状态数的不同对识别率的影响;讨论基于最小统计谱减法的语音增强技术对加性噪声的抑制效果。9.学位论文汤玲基于HMM模型的语音识别系统研究2005语音识别就是让机器听懂人的话,并作出正确的反应从而执行相应的命令。语音识别技术作为一门交叉学科,它与声学、语音学、语言学、人工智能、模式识别、数字信号处理、计算机学科等众多学科都有紧密的联系。不同学科的研究成果共同促进了语音识别技术的发展。语音信号本身的特点(包括多变性、动态性、瞬时性和连续性等)造成了语音识别技术实现上的困难。计算机对语音识别的过程和人对语音识别的过程基本上是一致的,目前主流的计算机语音识别技术大都基于统计模式识别的基本理论。实用语音识别系统在噪声环境中的应用也是一个重要的研究课题。本文在已有的研究成果基础上,研究了基于HMM模型的智能车语音交互命令识别系统,并对其在含噪环境的应用进行了研究。具体工作如下:1.实现了一个较为完整的语音处理程序,包含语音录入、预处理、训练、识别及结果输出等过程。2.介绍了HMM模型的基本原理,简述了该模型的三个核心问题和解决问题的基本算法,探讨了如何将HMM模型引入实际的语音识别系统。3.从语音信号处理分析出发,在HMM的理论基础上,阐述了本文所研究的孤立词语音识别系统的基本框架和组成部分,包括声学分析、特征提取、孤立词声学建模、训练识别以及最终的孤立词系统识别结果。4.考虑到面向自主车应用的实际应用背景,本文研究了如何在含噪声环境下提高语音识别系统的性能,实现了一种结合人耳听觉特性和语音增强技术的鲁棒语音特征提取方法。实验结果证明,这种方法的应用有效地改进了识别系统的性能。10.学位论文林遂芳噪声环境下语音识别方法的研究2005噪声环境下的语音识别是国内外一个重要的研究课题,具有重要的理论和实际意义。由于训练环境与识别环境的不匹