1课程设计报告名称语音信号处理课程设计基于动态时间规整的小规模孤立词语音识别系统设计与开发指导教师李红莲设计起止日期2015-5-14至2015-6-14学院信息与通信工程专业电子信息工程学生姓名班级/学号成绩指导老师签字212级“语音信号处理课程设计”任务书题目3基于动态时间规整的小规模孤立词语音识别系统设计与开发主要内容编程实现基于动态时间规整的小规模孤立词语音识别系统,可以实时识别每个集合内的孤立词。设计要求1.录制训练及测试语音。2.能够提取特征参数MFCC。3.能够使用动态时间规整(DTW)算法计算语音模板之间的距离。4.编程实现基于动态时间规整的小规模孤立词语音识别系统。5.对某个集合内的孤立词语音实时进行识别6.准确率应不低于80%。主要仪器设备计算机1台,安装MATLAB软件及cooledit录音软件主要参考文献数字语音处理及MATLAB仿真[M].北京:电子工业出版社,2010.课程设计进度计划(起止时间、工作内容)本课程设计共安排3个题目,这是其中题目之一。具体进度如下:6学时复习题目相关知识,掌握实现的原理;16学时用MATLAB语言实现题目要求;6学时进一步完善功能,现场检查、答辩;4学时完成课程设计报告。课程设计开始日期2015.5.14课程设计完成日期2015.6.14课程设计实验室名称电子信息技术实验室地点实验楼3-507资料下载地址3摘要本论文主要阐述了语音识别系统开发的过程,采用了端点检测和特征参数提取的思路,主要的关注点是如何运用MEL频率倒谱系数(MFCC)的算法,也运用了动态时间规整(DTW)算法,以MATLAB语言为编程语言,编程和获得语音识别算法。笔者设计的语音识别算法的识别率相对较高,而以该算法为基础的语音识别系统可以达到设计的要求,所以其市场前景广阔。关键词:语音识别系统;MFCC;DTW;孤立词识别4AbstractThispapermainlyexpoundsthevoicerecognitionsystemdevelopmentprocess,usingtheendpointdetectionandfeatureextractionofideas,themainconcernishowtouseMELFrequencyCepstralCoefficients(MFCC)algorithm,alsousedtheDynamicTimeWarping(DTW)algorithminMATLABlanguageprogramminglanguageprogrammingandaccesstospeechrecognitionalgorithm.Theauthordesignthespeechrecognitionalgorithmoftherecognitionrateisrelativelyhigh,andbasedonthealgorithmofspeechrecognitionsystemcanmeetthedesignrequirements,soitswideprospectofmarket.Keywords:speechrecognitionsystem,MFCC,theDTW(dynamictimewarping);isolatedwordsrecognition;5目录12级“语音信号处理课程设计”任务书......................................................................................................2摘要.........................................................................................................................................................3Abstract.....................................................................................................................................................4第一章概述.................................................................................................................................................61.1主要内容........................................................................................................................................61.2要求................................................................................................................................................61.3主要仪器设备................................................................................................................................61.4基本方法........................................................................................................................................6第二章信号特征参数MFCC提取...............................................................................................................7第三章DTW算法..........................................................................................................................................9第四章实现过程及结果...........................................................................................................................114.1实现过程.....................................................................................................................................114.2结果及分析.................................................................................................................................11结束语.........................................................................................................................................................12参考文献.....................................................................................................................................................12附录.............................................................................................................................................................131、place_recgrnition...........................................................................................................................132、vad.................................................................................................................................................133、mfcc...............................................................................................................................................154、dtw.................................................................................................................................................165、out.................................................................................................................................................196第一章概述21世纪,人类要不断地进行信息交流和传递,而在这一过程中,语音无疑是最为方便的工具和主要的交流媒介。所以,为了达到交流方便的目的,我们往往在人机系统中,采用语音识别系统。说得更通俗一点,语音识别就是要能让机器理解人在说什么,即准确地识别出语音的内容,以此来达到人的意愿执行机器指令的目的。就语音识别技术的应用的主要内容来看,主要就是语音拨号、导航、语音文档检索等一系列功能。语音识别技术就好像其他的自然语言处理技术一样,在处理了相关的技术之后,就能够顺利地展开语音间翻译。1.1主要内容编程实现基于动态时间规整的小规模孤立词语音识别系统,可以实时识别每个集合内的孤立词。1.2要求1.录制训练及测试语音。2.能够提取特征参数MFCC。3.能够使用动态时间规整(DTW)算法计算语音模板之间的距离。4.编程实现基于动态时间规整的小规模孤立词语音识别系统。5.对某个集合内的孤立词语音实时进行识别6.准确率应不低于80%。1.3主要仪器设备计算机1台,MATLAB软件及cooledit录音软件1.4基本方法一般开说,我们在识别语音的时候,主要有三种语音识别方法:第一种是声道模型和语音知识方法,第二种是模板匹配方法,第三种是人工神经网络语音识别方法。(1