LD3320-语音识别芯片

yaya8573
1 ℃
2020-03-04

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第页1LD3320语音识别芯片(单芯片/非特定人/动态编辑识别列表语音识别解决方案)用声音去沟通VUI(VoiceUserInterface)ICRoute用声音去沟通VUI(VoiceUserInterface)Web:：021-58796509Mail:sales@51sensor.com第页2一一一一、、、、....语音识别芯片介绍语音识别芯片介绍语音识别芯片介绍语音识别芯片介绍LD3320是一颗基于非特定人语音识别（SI-ASR：Speaker-IndependentAutomaticSpeechRecognition）技术的语音识别/声控芯片。提供了真正的单芯片语音识别解决方案。LD3320芯片上集成了高精度的A/D和D/A接口，不再需要外接辅助的Flash和RAM，即可以实现语音识别/声控/人机对话功能。并且，识别的关键词语列表是可以动态编辑的。基于LD3320，可以在任何的电子产品中，甚至包括最简单的51作为主控芯片的系统中，轻松实现语音识别/声控/人机对话功能。为所有的电子产品增加VUI（VoiceUserInterface）语音用户操作界面。主要特色功能：非特定人语音识别技术非特定人语音识别技术非特定人语音识别技术非特定人语音识别技术：：：：不需要用户进行录音训练可动态编辑的识别关键词语列表可动态编辑的识别关键词语列表可动态编辑的识别关键词语列表可动态编辑的识别关键词语列表：：：：只需要把识别的关键词语以字符串的形式传送进芯片，即可以在下次识别中立即生效。比如，用户在51等MCU的编程中，简单地通过设置芯片的寄存器，把诸如“你好”这样的识别关键词的内容动态地传入芯片中，芯片就可以识别这样设定的关键词语了。真正单芯片解决方案真正单芯片解决方案真正单芯片解决方案真正单芯片解决方案：：：：不需要任何外接的辅助Flash和RAM，真正降低系统成本。内置高精度内置高精度内置高精度内置高精度A/DA/DA/DA/D和和和和D/AD/AD/AD/A通道通道通道通道：：：：不需要外接AD芯片，只需要把麦克风接在芯片的AD引脚上；可以播放声音文件，并提供550mW的内置放大器。高准确度和实用的语音识别效果高准确度和实用的语音识别效果高准确度和实用的语音识别效果高准确度和实用的语音识别效果支持用户自由编辑支持用户自由编辑支持用户自由编辑支持用户自由编辑50505050条关键词语条关键词语条关键词语条关键词语在同一时刻，最多在50条关键词语中进行识别，终端用户可以根据场景需要，随时编辑和更新这50条关键词语的内容。LD3320芯片外观第页3二二二二、、、、语音识别介绍语音识别介绍语音识别介绍语音识别介绍语音识别ASR技术，是基于关键词语列表识别的技术。只需要设定好要识别的关键词语列表，并把这些关键词语以字符的形式传送到LD3320内部，就可以对用户说出的关键词语进行识别。不需要用户作任何地录音训练。语音识别ASR现实意义:ASR技术最重要的现实意义就在于提供了一种脱离按键，键盘，鼠标的基于语音的用户界面VUI：VoiceUserInterface。使得用户对于产品的操作更快速，更自然。非特定人语音识别技术ASR，是对几十G的语音数据经语言学家语音模型分析，科学家建立数学模型，并经过反复训练提取基元语音的细节特征，以及提取各基元间的特征差异。可以得到在统计概率最优化意义上的各个基元语音特征。最后才由资深工程师将算法以及语音模型转化为硬件芯片以应用在嵌入式系统中。基于领先的语音识别核心引擎，经过在各大主流手机产品中三年来超过一千万份的量产检验，LD3320提供了可以真正实用的语音识别/声控功能。ASR技术是基于关键词语列表识别的技术。每次识别的过程，就是把用户说出的语音内容，通过频谱转换为语音特征，和这个关键词语列表中的条目进行一一匹配，最优匹配的一条作为识别结果。比如在手机的应用中，这个关键词语列表的内容就是电话本中的人名/手机的菜单命令/T卡中的歌曲名字。不论这个列表的条目内容是什么，只需要用户设置相关的寄存器，就可以把相应的待识别条目内容以字符形式传递给识别引擎。LD3320可以识别列表中的关键词，用户说的语音可以是这个列表中任意的关键词语，而且不需要用户在识别前进行任何训练。识别引擎不关心关键词语列表中的关键词语的内容，可以是命令，人名，歌曲名字，操作指令等等任何的汉字字符串。每条关键词语最大可以支持的字数，从算法角度是限制在30字以内。但是从实际情况来看，用户一口气说超过8个字以上的条目时，几乎肯定会出现说错字/说漏字/说多字/打嗝/停顿等情况，这些情况都会严重影响识别并造成识别错误。因而一般来说，如果要获得理想的识别效果，建议每条关键词语的字数不要过长，避免影响效果。ASR技术上的局限性在于：ASR不是听写系统ASR不能把人的声音转换为确定的拼音串ASR不能任意地识别人的说话内容第页4ASR不能识别关键词语列表中的某个关键词语的一部分内容，除非这一部分内容自身也是一个关键词语ASR不可以识别与关键词语列表中列出的关键词语不相符的情况比如，前后加了“嗯”，“阿”之类的语气词比如，只说出了关键词语中的一部分而不是整个关键词语比如，没有列在关键词语列表中的词语三三三三、、、、应用场景应用场景应用场景应用场景由于LD3320可以动态编辑的识别关键词语列表，因此其可以应用的范围大大超过了那些不可以改变识别列表的芯片。同时，LD3320是一颗真正的单芯片解决方案，不需要辅助的外围Flash/RAM/AD，只需要有一颗51级别的单片机芯片就可以控制LD3320，从而降低了系统的成本。其应用场景主要包括：1.智能玩具/对话玩具2.导航仪3.MP3/MP44.数码像框5.机顶盒/彩电遥控器6.电磁炉/微波炉/洗衣机/智能家电操作7.PMP/游戏机8.自动售货机9.地铁自动售票机10.导游机11.楼宇电视的广告点播（请参考“LD3320语音识别芯片应用场景”）四四四四、、、、主要技术参数主要技术参数主要技术参数主要技术参数1.内置单声道mono16-bitA/D模数转换2.内置双声道stereo16-bitD/A数模转换3.内置20mW双声道耳机放大器输出4.内置550mW单声道扬声器放大器输出5.支持并行接口或者SPI接口6.内置锁相电路PLL，输入主控时钟频率为2MHz-34MHz7.工作电压：(VDD:forinternalcore)3.3V8.48pin的QFN7*7标准封装9.省电模式耗电：1uA第页5LD3320评估板的照片：（其中，控制MCU目前选用的是STC的51单片机）五五五、、、联联系我们联系我们T021-58796509