科大讯飞语音云发布会PPT

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

内容提要一、扑面而来的移动互联网“语时代”二、新一代语音云核心技术及平台特性扑面而来的“语时代”语音是人类最自然便捷的沟通方式,所有信息设备“能听会说”是必然的趋势。扑面而来的“语时代”•语音应用爆发需要的条件已经逐步成熟–关键技术持续进步,达到实用门槛扑面而来的“语时代”•语音应用爆发需要的条件已经逐步成熟–关键技术持续进步,达到实用门槛–智能终端、无线网络、云计算平台等环境条件基本完备2011年10月苹果公司发布iPhone4S,Siri成为最大卖点语音交互的终端和应用不断涌现语音交互的终端和应用不断涌现谷歌计划今年上半年发布平板电脑GoogleNexus,并将搭载Majel网络语音识别技术微软称:新版Tellme将实现人机语音交互,用于Windows8及下一代WindowsPhone系统中语音交互的终端和应用不断涌现2010年10月28日,科大讯飞在业界率先发布“讯飞语音云”,为手机、汽车、智能家电等终端提供高质量语音合成、语音搜索、语音听写等智能语音交互服务能力。柳传志致辞周光召致辞语音云启动仪式讯飞语音云发布语音云应用日益丰富语音输入微博短信搜索虚拟形象娱乐日程管理生活服务阅读地图导航基于语音云平台的开发伙伴已达3100家!语音云用户规模加速增长100万1000万3300万3300万700万次语音云用户每日请求2012年1-3月2011年7-12月2011年1-6月内容提要一、扑面而来的移动互联网“语时代”二、新一代语音云核心技术及平台特性1、语音合成技术进展•在中英文取得国际领先水平的基础上,多语种合成正在逐步实现世界语言覆盖•基于发音模拟技术,就可以实现虚拟主持人和针对任意人员的个性化合成服务中英文语音合成技术均是业界自然度唯一超过真人发音水平(4.0分)的系统;连续6年荣获国际最权威的英文合成大赛BlizzardChallenge冠军。全球领先的中英文合成系统全球领先的中英文合成系统4.94.23.83.12.92.82.82.72.62.52.42.12.12.12.1221.9012345ASKIBLHCODJERQWPTM自然度自然语音科大讯飞唯一自然度大于4分的系统其他参赛单位美国Microsoft、IBM、MIT、CMU英国Edinburgh日本NITech、ATR等BlizzardChallenge2011国际英文合成大赛比赛结果■合成样例英中热烈欢迎各位来宾出席今天的发布会,感谢大家长期以来对科大讯飞的关心和支持,祝大家身体健康、工作顺利!Herefusedtoidentifygovernmentshesuspected,butGermanpressreportssaidinvestigationswerefocusingonNorthKoreaandPakistan覆盖全面的多语种合成系统•多语种合成逐步实现世界语言覆盖法、俄、西、日、韩等语种合成正在研发德、意、葡、阿拉伯、印地等语种合成中文合成多语种合成样例中英法俄西意葡日越南印地藏维粤川停止英文合成欢迎参加科大讯飞召开的新一代语音云发布暨语音开发者大会!全自动构建的个性化合成系统•基于发音模拟、声纹识别、语音文本转写及韵律自动标注技术,实现全自动构建的个性化语音合成系统全自动构建的个性化合成系统•基于发音模拟、声纹识别、语音文本转写及韵律自动标注技术,实现全自动构建的个性化语音合成系统丰富多彩的歌唱合成基于声学模型自动构建、韵律自动预测和调性匹配的技术,实现可自编词曲的唱歌语音合成系统2、语音识别技术进展•在语音云规模运营的基础上,核心效果持续进化,通用识别准确性大幅提升•多项核心技术取得突破,有效解决抗噪、口音适应、个性化词汇等技术难题语音识别通用准确性大幅提升面向移动互联应用环境的中文连续语音识别技术性能(识别准确率)备注:该结果根据工信部软件促进中心《语音识别测试标准》测试得出89.56%90.15%92.39%81.38%81.83%89.21%60%70%80%90%短信、微博搜索、导航数字、数值讯飞语音云系统N系统G系统Q语音识别三大技术创新•首次提出PLA、JFA、IVN综合噪声补偿算法,系统抗噪性能达到国际领先水平•率先实现MSDT声学模型训练算法,大幅增强系统口音适应性能•独创LSA语言模型自学习算法,个性化词汇识别准确度首次达到实用噪声环境识别性能提升30.4%口音适应性能相对提升50.3%个性化词汇识别性能提升36.3%语音识别技术的应用效果语音识别技术的应用效果NIST说话人识别评测名列前茅测试时间三大核心测试指标在参测系统中排名MinDCFEERDCFMinDCFEERDCF20080.1072.6250.18711320100.335.8720.405222参赛单位有:CMU、MIT、Stanford、清华大学、中科院自动化所、中科院声学所、Motorola研究中心、IBM研究院等国内外50家著名语音研究机构由NIST(美国国家标准技术研究院)举办,是国际上规模与影响力最大的说话人识别评测1996年第一次评测,之后每两年评测一次,说话人识别任务难度接近大规模实际应用环境(不同信道、不同环境干扰)科大讯飞在2008、2010年连续两届评测中均处于国际领先地位NIST语种识别评测名列前茅•2009/2011年国际NIST语种识别最混淆方言对测试冠军评测时间:2011年评测对象:语种识别技术评测单位:美国国家标准技术研究院(NIST)参赛单位:麻省理工学院林肯实验室(MITLL)、法国科学研究中心(LIMSI),捷克布尔诺科技大学(BUT)、清华大学等2011年语种识别测试中,在9个高混淆度方言对中获7个第一名名次代号代表机构不同方言对测试结果排名P1P2P3P4P5P6P7P8P91iFLY科大讯飞1113112112MITLL麻省理工学院林肯实验室2322221233BLZ捷克布尔诺科技大学&法国科学研究中心333133332独家实用的口语评测技术机器自动评分误差1分以上仅为5%专家评分误差1分以上为17%英文口语评测机器和人工评分员对比国家语委组织的机器和人工评分员对比鉴定结果已累计完成国家普通话等级考试500万人测试在全国各省5000万中小学生的课堂教学中使用•科大讯飞口语评测技术唯一通过国家语委鉴定达到实用水平高精准度的音乐评测技术•在语音识别技术体系的基础上,研发出业界唯一可精确反应音准、节奏和歌词演唱准确度的音乐评测技术,率先完成业界首个提供在线音乐评测服务的“爱吼网”系统爱吼网独家承办第十届中国少年儿童卡拉OK电视大赛网络赛区3、语义理解技术进展•基于识别合成的语言处理算法,研发出完善的人机交互语义词典和语义理解算法体系•面向移动互联语音应用,率先完成首个达到实用、覆盖衣食住行的中文语义理解系统完善的语义理解算法体系•首次提出ISF中文语义框架,具备灵活高效的多业务扩展能力•实现集词法分析、文法理解、意图分类及句子语义度量的一体化语义理解算法体系请问有没有下周一晚上从合肥到北京的航班意图飞机票操作查询起点城市:合肥终点城市:北京日期2012-03-26时间≥19:00实用全面的语义系统和云进化能力•面向移动互联语音应用,率先完成首个达到实用、覆盖衣食住行等应用领域的中文语义理解系统0%20%40%60%80%100%电话短信应用搜索网站日程音乐天气股票地图餐饮闲聊平均各应用领域语义理解正确率平均性能85%基于语音云平台,形成了持续的语义理解进化能力语义理解技术的应用成果•讯飞语义理解技术已经在各大运营商的短信营业厅智能化服务中广泛应用短信营业厅网上营业厅掌上营业厅自然语言理解智能语音技术传统电子渠道智能交互系统示例KT6021QX6022示例给我个早晚都能看的报纸吧。有每天能看新闻的业务吗?我要订个新闻早晚报。……语义理解技术的应用成果科大讯飞承建的安徽移动短信营业厅智能服务系统,在2011年中国移动总部电子渠道专项评测中,各项指标排名第一,成为移动下文各省学习的样板。84322110510科大讯飞系统A系统B系统C系统D系统E系统F识别正确识别不正确语音产业国家队•2011年再次荣获中文语音产业最高荣誉国家科技进步奖信息产业重大技术发明奖语音产业国家队2010年国家科技部“国家智能语音高新技术产业化基地”2011年国家发改委“语音及语言信息处理国家工程实验室”语音产业国家队2011年9月27日,语音及语言信息处理国家工程实验室揭牌新一代语音云平台特性更全面的操作系统和硬件支持跨终端的个性化管理平台更加可靠和高效的服务完善的开发和运营支撑1、更全面的操作系统和硬件支持手写识别语音搜索语音合成语音识别语音评测新一代语音云声纹识别语义理解开发者网站:、跨终端的个性化平台手机PC电视Pad语音通行证个性化语音引擎数据优化云存储账号管理•通过语音通行证实现用户个人输入习惯(常用词、说法)不同终端共享,保持体验一致•通过个性化训练生成个性化音库跨终端的语音空间通知王珩吃饭地点改为京临饭店3、更加可靠和高效的服务面向亿级用户、高度可用的语音云平台•持续提高的可用性,整体服务可用性已达95%•持续优化的响应速度,2G信道平均响应时间2秒以内,3G信道1秒以内•持续完善的“云+端”方案,保证语音云在恶劣网络环境下的可用性•持续扩容的语音云服务中心,已支持过亿的活跃用户10000W95%1.5S整体服务可用性系统平均响应时间活跃用户容量4、完善的开发和运营支撑最新最好的语音体验全程一对一的技术服务自动化运维体系•为每个应用开放全自动、全天候的运维体系;•应用服务和语音云的服务端对接,提供高度业务分析平台•提供对每个语音应用的使用情况分析,帮助您快速改进语音应用效果。•平台开放最新最好的语音技术,并提供效果体验。•为每个开发伙伴提供一对一的技术支持服务,保证应用快速开发。创新开拓未来合作成就梦想共同开启“语时代”

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功