语音识别系统的开题报告

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

天津理工大学本科毕业设计开题报告届:2015届学院:自动化学院专业:测控技术与仪器2015年3月11日毕业设计题目语音信号识别系统的设计学生姓名学号指导教师职称讲师(报告内容包括课题的意义、国内外发展状况、本课题的研究内容、研究方法、研究手段、研究步骤以及参考文献资料等。)一、本课题的研究意义:语音是人的自然属性之一,由于发音器官的生理差异以及后天所形成的发音习惯的行为差异,不同说话人的语音具有鲜明的个人特征,这使得通过分析语音信号来识别说话人成为可能。说话人确认属于说话人识别中的一类,通过提取说话人语音中的个人特征来确认一个人的身份。说话人识别所使用的语音是人体所固有的生物特征,不容易被冒充或窃取,可以随时使用,并且可以利用电话网络实现远距离服务,相对于传统的密码、钥匙等身份识别方法更安全、更有效、更可靠,因此具有广泛的应用领域,越来越受到人们的重视。自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让各种机器能听懂人类的语言并能按人的口头命令来行动呢,从而实现人机的语言交流。随着科学技术的不断发展,语音识别技术的出现,使人类的这一理想得以实现,语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与合成技术的结合,使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。本课题设计语音信号系统是建立特定人的语音数据库。采用LabVIEW编写程序,利用计算机上的声卡,从麦克风获取语音信号,分析语音信号的特点,识别出特定人的声音,并给出识别结果。该系统界面友好,维护费用低,为说话人识别和语音系统的构建提供了一个有效的框架。通过系统的设计和具体的实践,可以加深学生对本学科专业知识的掌握和综合应用能力。二、本课题国内、外发展状况:语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。我国的语音识别研究一直紧跟国际水平,国家也很重视。国内中科院的自动化所、声学所以及清华大学等科研机构和高校都在从事语音识别领域的研究和开发。国家863智能计算机专家组为语音识别技术研究专门立项,并取得了高水平的科研成果。我国中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统,其准确率和系统、均可达90%以上。语音作为当前通信系统中最自然的通信媒介,语音识别技术是非常重要的人机交互技术。随着计算机和语音处理技术的发展,语音识别系统的实用性将进一步提高。应用语音的自动理解和翻译,可消除人类相互交往的语言障碍,国外已有多种基于语音识别产品的应用,如声控拨号电话、语音记事本等,基于特定任务和环境的听写机也已经进入应用阶段。这预示着语音识别技术有着非常广泛的应用领域和市场前景。随着语音技术的进步和通信技术的飞速发展,语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各个领域带来极大地便利,其应用和经济、社会效益前景非常良好。三、本课题的研究内容、方法、手段和步骤:1、本设计的主要研究内容:本文设计的说话人确认系统由软、硬件两部分组成。硬件部分的主要任务是通过麦克风和计算机上的声卡将与印尼信号转换为电信号,经过A/D转换,以数字信号的形式传入计算机;软件部分的主要任务是数字语音信号的分析和识别。2、本设计需要实现的方法及步骤是:(1)硬件部分为了完成语音的采集和数字化,硬件一般包括三个部分:传感器及信号调理电路,A/D转换电路,PC机接口电路。但是由于声卡已经成为计算机的标准配置,而且LabVIEW提供了对声卡进行操作的函数,所以在本系统中直接采用话筒和声卡实现这部分功能。(2)软件部分LabVIEW最显著的特性之一是对数据的图形化显示提供了丰富的支持。本系统借助LabVIEW的这一优势设计了功能强大、友好的系统用户界面。但是LabVIEW的数据处理功能不够强大,而本系统需要进行大量复杂的运算。为了弥补LabVIEW这方面的不足,本系统在LabVIEW中通过MATLABScript节点调用MATLAB程序来完成语音的预处理和说话人的确认等复杂运算。整个系统从功能上可以分为语音采集模块、训练模块、确认模块三部分。3、实验结果与分析本实验在实验室环境下进行。实验时,声卡参数通过前面板设置为单声道、采样频率为11025Hz,数据格式为16位字长。本系统为与文本有关的说话人确认系统,训练和识别所用的音节显示在前面板的“口令”文本框中。训练时,每个说话人对指定的音节发音;识别时,每个说话人再对(同训练时)相同的音节发音;对于真的待确认者和假的待证实者,分别进行实验。从实验结果可以看出,该系统较好的完成了对说话人身份的确认,识别准确率较高。四、参考文献:[1]赵力.语音信号处理[M].2版,北京:机械工业出版社,2011.[2]吴朝晖,杨莹春.说话人识别模型与方法[M].北京:清华大学出版社,2009.[3]曾璐,陆荣双.基于LabVIEW的数据采集系统设计[J].电子技术,2004(12)[4]杨大志.基于声卡的信号采集技术[J].仪表技术与传感器,2007,7(7):74-75.[5]徐云峰,张世庆,张西良.基于声卡的数据采集系统设计[J].机械设计与制造,2006(4):46-47.[6]曲喜强,刘哲.基于声卡的音频信号采集与分析系统设计[J].电子测试,2009(2):75-77[7]张桐,陈国顺,王正林.精通LabVIEW程序设计[M].北京:电子工业出版社,2003.[8]吴成东,孙秋野,盛科.LabVIEW虚拟仪器程序设计及应用[M].北京:人民邮电出版社,2008.[9]江建军,刘继光.LabVIEW程序设计教程[M].北京:电子工业出版社,2008.[10]张丙才,刘琳,高广峰.基于LabVIEW的数据采集与信号处理[J].仪表技术与传感器,2007(12),74-75.指导教师意见该生选题合理,对所研究问题相关理论叙述正确,设计内容明确,研究方法可行。开题报告中文献资料充实,设计方案可行,报告内容符合要求,同意该生开题。签字:年月日天津理工大学教务处制表

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功