面向智能家居的语音辨识系统的实现

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

南京邮电大学通达学院2017届本科毕业设计(论文)南京邮电大学通达学院毕业设计(论文)题目:面向智能家居的语音系统识别与实现专业:自动化学生姓名:陈治宇班级学号:13003521指导教师:赵静指导单位:自动化学院日期:2017年2月20日至2017年5月29日南京邮电大学通达学院2017届本科毕业设计(论文)毕业设计(论文)原创性声明本人郑重声明:所提交的毕业设计(论文),是本人在导师指导下,独立进行研究工作所取得的成果。除文中已注明引用的内容外,本毕业设计(论文)不包含任何其他个人或集体已经发表或撰写过的作品成果。对本研究做出过重要贡献的个人和集体,均已在文中以明确方式标明并表示了谢意。论文作者签名:日期:年月日南京邮电大学通达学院2017届本科毕业设计(论文)摘要语音识别技术就是让机器通过识别的过程把语音信号转变为相应的文本或命令的多学科的交叉技术,所涉及的领域有信号处理、概率论和模式识别人工智能等等,甚至于还涉及到人的形态语言。其应用领域非常的广泛,例如相对于键盘输入方法的语音输入系统、可用于工业控制的语音控制系统及服务领域的智能对话查询系统,在信息高度化的今天,语音识别技术及其应用已成为信息社会不可或缺的重要组成部分。语音合成技术把可视的文本信息转化为可听的声音信息,其应用的经济效益和社会效益前景良好。尤其对汉语语音合成技术的应用而言,全球有十几亿人使用中文,其市场需求、应用前景和经济效益等可见一般[1]。本文按照语音识别技术,详细的介绍了数种主流的语音识别方法,并将这几种主流的识别方法进行了对照。针对MATLAB开发的语音识别系统,在独立词单音段的识别率取得了良好的进展。本论文介绍了双门限语音端点检测理论,研究了语音特征参数地提取过程,特征参数包括:线性预测系数(LPC)、线性预测倒谱系数(LPCC)和梅尔频率倒频系数(MFCC)[2]并研究了3种不同的语音识别算法:DTW算法、VQ算法和HMM算法。并且在MATLAB环境中提取了孤立字语音(十个数字0~9的汉语发音)的LPCC、MFCC特征参数,用它们配合上述语音识别算法实现了对这些孤立字语音的识别。关键词:智能家居;语音识别;梅尔频率倒谱参数;动态时间规整南京邮电大学通达学院2017届本科毕业设计(论文)ABSTRACTSpeechrecognitiontechnologyistoallowthemachinetocrossthroughtheprocessofidentificationtechnologyofmultidisciplinaryvoicesignalintoacorrespondingtextorcommand,whichisinvolvedinthefieldofsignalprocessingandpatternrecognition,probabilitytheory,artificialintelligenceandsoon,eventoformlanguagepeoplealsorelatesto.Itsapplicationisveryextensive,forexamplewithrespecttospeechinputsystemkeyboardinputmethodcanbeusedforindustrialcontrol,voicecontrolsystemandserviceinthefieldofintelligentconversationquerysystem,intheinformationsocietytoday,speechrecognitiontechnologyanditsapplicationhasbecomeanimportantpartoftheinformationsocietyindispensable.ThevisualspeechsynthesistechnologyoftextinformationintoVoicemessage,theapplicationofeconomicandsocialbenefitsofgoodprospects.EspeciallytheapplicationofChinesespeechsynthesistechnology,theworldhasmorethanonebillionpeopleuseChinese,itsmarketdemand,remarkableapplicationprospectandeconomicbenefits.Accordingtothespeechrecognitiontechnology,introducesseveralmethodsofspeechrecognitionofthemainstream,andtheidentificationmethodofseveralmainstreamwerecompared.AccordingtothespeechrecognitionsystemdevelopedbyMATLAB,therecognitionrateofthewordindependenttonehasmadegoodprogress.Thispaperintroducesthedoublethresholdendpointdetectiontheory,researchthespeechfeatureextractionprocess,thecharacteristicparametersinclude:linearpredictioncoefficient(LPC),linearpredictioncepstralcoefficients(LPCC)andmelfrequencycepstrumcoefficient(MFCC).AndStudy3differentspeechrecognitionalgorithms:DTWalgorithm,VQalgorithmandHMMalgorithm.IntheMATLABenvironment,theLPCCandMFCCfeatureparametersofisolatedwordspeech(tendigitsfrom0to9Chinesepronunciation)areextracted,andtheyareusedtomatchtheabove3speechrecognitionalgorithmstorealizetherecognitionoftheseisolatedwords.Keywords:smarthome;speechrecognition;melfrequencycepstrum;dynamicTimewarping南京邮电大学通达学院2017届本科毕业设计(论文)目录第一章绪论................................................................................................11.1课题研究背景.................................................................................................11.2国内外研究现状分析......................................................................................21.3语音识别技术..................................................................................................31.4本文的主要内容和结构安排..........................................................................4第二章语音信号处理与信号特征提取...................................................62.1引言..................................................................................................................62.2语音信号的预处理与分析..............................................................................62.3端点检测..........................................................................................................82.4短时能量与过零量..........................................................................................92.5运用MFCC进行特征提取.............................................................................11第三章语音识别算法的实现.................................................................133.1引言................................................................................................................133.2动态时间规整...............................................................................................153.3程序设计.......................................................................................................193.4实验结果对比测试........................................................................................23第四章总结与展望.................................................................................27致谢............................................................................................................29参考文献....................................................................................................30附录语音识别程序.................................................................................31南京邮电大学通达学院2017届本科毕业设计(论文)1第一章绪论1.1课题研究背景在未来的社会,在未来的智能设备的上边,语音的识别必将成为设备的信息获取的接口,成为信息获取的手段。就像电影《HER》里讲的那样,设备将逐渐消失不见,取代的将是入耳式的耳机,通过耳机与世界进行交流,与人工智能进行交流,成为

1 / 41
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功