2014届本科毕业论文(设计)题目:※※※※※※※※※※※※※※※系别:信息工程学院班级:2010级计算机科学与技术(嵌入式技术方向)学号:201060861???姓名:※※※指导教师:※※※职称※※※起讫日期:2013年10月16日-2014年5月31日文档页面设置约定:一律用A4纸规范打印,左边距为2.8cm,右边距为2.2cm,上边距都为2.5cm,下边距都为2.4cm。页眉、页脚边距分别为1.7cm和1.5cm,行间距均为固定行距22磅,文中公式均为单倍行距.字间距为默认值奇数页眉内容为:××届××专业毕业设计(论文),偶数页眉的内容为:×××(作者姓名):××××(论文题目),均采用宋体小五号居中。中、置于目录页之前。页码从正文开始编排。英文摘要单独一页置于正文参考文献后,致谢语单独一页置于英文摘要后,英文摘要、致谢语不需要页眉、页脚。噪声环境下语音特征参数鲁棒性的研究张三丰三明学院信息工程学院2010级计算机科学与技术(嵌入式技术方向)摘要:实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究Mel倒谱参数、Mel差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。关键词:语音识别;鲁棒性;Mel倒谱参数;Mel差分倒谱;倒谱系数零均值化摘要以简要文字介绍研究课题的目的、方法、内容及主要成果,中文摘要字数一般不超过400字。关键词是表述毕业论文(设计)主题内容信息的单词或术语,应尽量从汉语主题词表中选取,第一关键词应能体现出文章的学科分类。关键词数量一般为3—5个。论文中英文字体均用TimesNewRoman字体。注:所有文字内容仅做样板。1.设计(论文)题目为四号黑体字,可以分为1或2行居中打印;设计(论文)题目下空一行打印作者姓名(单独一行,小四号宋体,居中);下行打印“三明学院信息工程学院XX级XX专业”(五号宋体,居中);再下行打印摘要。2.摘要二字为小四号黑体,“摘要:”二字后打印内容(五号宋体);摘要内容下空一行打印关键字,“关键词:”三字为小四号黑体,其后的内容为五号宋体,关键词之间用分号隔开,3.英文摘要题目和关键字全部采用小四号TimesNewRoman字体,摘要内容和关键字内容均用五号TimesNewRoman字体。题目黑体四号字,应以简明、确切、有概括性的词语反映文章内容。字数要适当,一般不宜超过20个汉字。姓名:宋体小四号字。目录第一章绪论................................................................11.1语音识别简介........................................................11.1.1什么是语音识别.................................................11.1.2语音识别的应用及分类............................................11.2国内外语音识别技术的发展历史及现状....................................11.3语音识别面临的问题...................................................21.4本课题研究背景及内容.................................................2第二章语音识别基础理论....................................................32.1语音信号产生的机理...................................................32.2语音信号的预处理....................................................42.2.1预滤波、采样、A/D转换..........................................42.2.2预加重........................................................42.2.3分帧加窗......................................................52.3端点检测...........................................................52.3.1短时能量......................................................62.3.2短时平均过零率................................................7第三章常用的语音识别模型...................................................8第四章噪声下语音特征参数的提取识别..........................................9第五章结论..............................................................10参考文献.................................................................11附件语音“0”的各状态频谱图..............................................132014届计算机科学与技术(嵌入式技术方向)专业毕业论文(设计)1第一章绪论语言,是人类进行行为沟通和思想交流最重要的工具[1],也是人类最重要的信息载体。随着信息科技的快速发展,计算机的越来越便携化和应用的复杂化,在越来越多的领域有了让计算机听懂人言的要求,这样,就引出了语音处理技术这门交叉学科。语音识别技术,是语音处理技术中的一个重要组成。1.1语音识别简介1.1.1什么是语音识别所谓的语音识别是指利用计算机自动识别语音的技术,有狭义和广义之分。狭义的语音识别特指利用计算机识别出语音信号所表达的内容,其目的是要准确地理解语音所蕴含的含义,例如将语音转换成其所对应的文字。而广义的语音识别则泛指利用语音信号识别出其中所包含的“任何感兴趣”的内容的一种技术,例如利用语音信号中所包含的特定人的信息进行说话人身份辨认的说话人识别技术[2]。1.1.2语音识别的应用及分类语音识别的应用范围十分广泛,遍及各行各业。如智能家居、语音拨号、信息通讯、自动应答系统、工业控制、机器人、交通导航等等。语音识别是一门新兴的交叉性学科,它广泛涉及声学、语音学、语言学、数字信号处理、通信学、网络技术、电子技术、计算机科学、模式识别和人工智能等众多学科。如前所述,语音识别系统有广义和狭义之分,这里所讨论的语音识别分类特针对狭义的语音识别而言[3]。由文献[4,5-8]可知“从不同角度,语音识别系统可以分为以下几类:按词汇量大小,可分为小词汇量、中等词汇量、大词汇量及无限词汇量语音识别系统;按对说话人的依赖程度可以分为特定人和非特定人语音识别系统;按对说话人说话方式的要求,可以分为孤立词语音识别系统、连接词语音识别系统及连续语音识别系统;按识别的目的来分,可以分为说话人语音识别系统和语音内容理解的语音识别系统”。1.2国内外语音识别技术的发展历史及现状语音识别的历史可以追溯到20世纪50年代。1952年AT&TBell实验室的确K.H.Davis等人1.各级标题使用样式进行设置。每章标题以四号黑体字居中打印;“章”下一行为“节”,以小四号黑体左起打印;“节”下空一行为“小节”,以五号黑体左起打印,换行打印设计(论文)正文。2.论文中的英文字体、数字均为TimesNewRoman.3.引用文献标示方式应全文统一,并采用所在学科领域内通用的方式,用上标的形式置于所引内容最末句的右上角,用5号字体。所引文献编号用阿拉数字置于方括号中,如:“…成果[1]”。当提及的参考文献为文中直接说明时,其序号应该用5号字与正文排齐,如“由文献[8,10-14]可知”。不得将引用文献标示置于各级标题处,引用文献应按文中引用出现的顺序列全。正文采用五号宋体字打印,行间距均为固定行距22磅,文中公式均为单倍行距.字间距为默认值;正文层次标题序号依次为“1”、“1.1”、“1.1.1”等,一律顶格,后空一格写标题,第四层次用(1)、(2)等,后空一格写标题。张三丰:噪声环境下汉语语音特征提取方法研究2利用带通滤波器进行语音频谱的分析和匹配,并成功用于对10个英文数字的识别,识别率达到98%。1960年P.Denes等研制成功第一个计算机语音识别系统,同年G.Fant提出了语音产生的声源——滤波器模型,对语音识别工作起到了巨大的推动作用。20世纪80年代语音识别研究进一步走向深入,其研究重点是连接词语音识别,用于连接词识别的分层构筑技术(levelbuilding)得到发展。另一个重要的发展是语音识别算法从模板匹配技术发展到基于统计模型的技术。期间,美国CMU大学的J.K.Baker等人将隐马尔可夫模型(HiddenMarkovModel,HMM)应用到语音识别领域,在语音识别中获得极大的成功,成为语音识别的主要方法。HMM模型的研究使大词汇量连续语音识别系统的开发成为可能。1988年,美国CMU大学用VQ(VectorQuantization)/HMM的方法实现了997个词的非特定人连续语音识别系统,其后,连续语音识别技术获得长足的发展。近年来,人工神经网络(ArtificialNeuralNetwork,ANN)以及支持向量机(SupportVectorMachine,SVM)由于其较强的自适应性和学习能力而获得了普遍的重视,并在语音识别中获得了成功的应用。国外的IBM、APPLE、MOTOROLA等公司也投入了汉语语音识别系统的开发。IBM公司于1997年正式推出中文听写机系统ViaVoice,该系统对新闻语音识别有较高的精度,是目前比较有代表性的汉语连续语音识别系统。国内汉语语音识别的研究紧密跟踪识别领域的最新研究成果并基本与之保持同步。目前,国内一些研究机构对大词汇量连续语音识别系统的研究已经接近国外最高水平[1],其中,具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。1.3语音识别面临的问题语音识别系统存在一些困难[3]:语音识别系统的适应性差,对环境依赖性强,即在一种环境下训练得到的语音识别系统只能在这种环境下得到最优的性能;强噪声环境下语音识别率急剧下降,语音信号在受到干扰后表现出多变性,必须寻找新的信号分析处理方法,提高语音识别的抗噪性;如何将语言模型、语法及词法模型应用到大词汇量连续语音识别中去;人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等方面的认识,以及如何将这些知识应用到语音识别中去。1.4本课题研究背景及内容如前所提到的,语音识别系统目前还面临着很多问题,其中的噪声干扰,是最常见也是影响最2014届计算机科学与技术(嵌入式技术方向)专业毕业论文(设计)3广泛的一个难题。实际应用中很多情况下是要求语音识别系统工作在噪声环境下,因此一个高性能水平的语音识别系统必需要对不同类型各强度的噪声具有较强的鲁棒性。尽管过去的研究对抗噪声的语音识别技术做了大量工作,但到目前为止仍未能找到一种独立于噪声的可靠的识别算法[4]。语音识别系统在噪声环境下性能下降的原因在于噪声造成了训练环境与识别环境之间的不匹配,因此,必须尽量减少这种不