科大讯飞智能语音电视解决方案——电视语点安徽科大讯飞信息科技股份有限公司2012年7月主要议题•讯飞语音技术介绍•电视语点系统介绍智能语音交互技术概述•智能语音交互技术:使信息时代的各种信息机器像人一样“能听会说”的技术,包括语音合成、语音识别和语音评测等可以将任意的文字信息转化为自然流畅的语音,相当于给机器装上了人工嘴巴可以将语音中内容、说话人、语种等信息识别出来,相当于给机器装上了人工耳朵可以进行发音标准评价和错误反馈指导,相当于把机器变成语音评测老师智能语音交互技术时代-国际2009年11月与Nunace就智能语音技术展开战略合作。自上个世纪70年代就开始进行语音技术研究,发布了ViaVoice,2007-2010年先后发布电话语音搜索,互联网移动语音搜索,GoogleVoiceAction2011年10月iPhone4S发布,重点推出Siri讯飞语点,据悉苹果Siri的中文版将于3月正式推出,2月已开始中文的测试工作。2007年3月以8亿美金价格收购语音搜索业务公司TellMe,加大对语音技术投入2009年10月微软发布WIN7操作系统,集成语音识别技术语音是人类沟通最自然便捷的方式。语音技术可带来人机交互方式的根本性变革,具有广阔产业化前景中国语音产业唯一的国家863计划成果产业化基地、国家规划布局内重点软件企业和唯一的语音上市公司股票代码002230,市值近100亿,2010年营收4.36亿,2011年5.58亿研究积累最深厚(整合中国语音、语言研究重点机构,超过20年不懈创新)核心技术最领先(语音合成、识别、声纹历次国际、国内权威评测名列第一)专业人才最多(全职员工超过1500人,专业技术人员超过1000人)市场占有率最高(73%,CCID-中国知名的市场研究和顾问机构)5科大讯飞简介6智能语音交互技术时代-中国•社会信息服务:满足网络时代普通中国百姓通过电话、手机等获取互联网信息的需求政府银行电信体育交通证券智能语音交互技术时代-国内教育电子电视家电手机领域车载领域核心技术的国家队中国语音产业唯一的国家级企业技术中心、国家规划布局内重点软件企业和语音上市公司,荣获2次国家科技进步奖科大讯飞产学研一体化研发体系合作项目联合实验室清华大学社科院语言所中科院自动化所新疆大学内蒙古大学西藏大学云南大学语音及语言信息处理国家工程实验室科大讯飞·中国科学技术大学约克大学中科院计算所合肥工业大学哈尔滨工业大学同济大学浙江大学国家工程实验室正式获批运行•国家工程实验室揭牌仪式–2011年9月27日,“语音及语言信息处理国家工程实验室”揭牌仪式在中国科学技术大学西区活动中心隆重举行!•语音合成系统最关键的是自然度综合指标:年份1995年1998年1999年2001年2010年自然度3.03.03.53.84.5STOP原文:9,这是乔丹参加1984年奥运会和1992年奥运会时的球衣号码。在1984年洛杉矶奥运会上,由于前苏联以及东欧诸国……一、世界领先的语音合成技术国际英文语音合成大赛六联冠00.511.522.533.544.55AMJTFVSBPRUGHNCLOQ4.84.23.83.73.33.33.1332.72.72.62.62.62.52.11.91.6评测时间:2006~2011评测对象:英文语音合成技术评测单位:“BlizzardChallenge”国际英文语音合成大赛参赛单位:IBM、微软、MIT、CMU、英国爱丁堡大学、日本ATR等评测结果:英文合成系统连续六年蝉联自然度评测指标第一名BlizzardChallenge测试结果(自然度指标)迄今唯一自然度大于4分的参测系统自然语音科大讯飞参测系统参测系统编号匿名MOS■Herefusedtoidentifygovernmentshesuspected,butGermanpressreportssaidinvestigationswerefocusingonNorthKoreaandPakistan覆盖面逐步扩大的多语种合成系统•多语种合成逐步实现世界语言覆盖法、俄、西、日、韩等语种合成正在研发德、意、葡、阿拉伯、印地等语种合成中文合成多语种合成样例中英法俄西意葡日越南印地藏维粤川停止英文合成欢迎参加科大讯飞召开的新一代语音云发布暨语音开发者大会!全自动构建的个性化合成系统•基于发音模拟、声纹识别、语音文本转写及韵律自动标注技术,实现全自动构建的个性化语音合成系统个性化合成样例二、业界领先的语音识别技术•在语音云规模运营的基础上,核心效果持续进化,通用识别准确性大幅提升•多项核心技术取得突破,有效解决抗噪、口音适应、个性化词汇等技术难题语音识别通用准确性大幅提升面向移动互联应用环境的中文连续语音识别技术性能(识别准确率)备注:该结果根据工信部软件促进中心《语音识别测试标准》测试得出89.56%90.15%92.39%81.38%81.83%89.21%60%65%70%75%80%85%90%95%短信、微博搜索、导航数字、数值讯飞语音云系统N系统G系统Q语音识别三大技术创新•提出PLA、JFA、IVN综合噪声补偿算法,系统抗噪性能达到国际领先水平•实现MSDT声学模型训练算法,大幅增强系统口音适应性能•提出LSA语言模型自学习算法,个性化词汇识别准确度首次达到实用噪声环境识别性能提升30.4%口音适应性能相对提升50.3%个性化词汇识别性能提升36.3%NIST说话人识别评测名列前茅测试时间三大核心测试指标在参测系统中排名MinDCFEERDCFMinDCFEERDCF20080.1072.6250.18711320100.335.8720.405222参赛单位有:CMU、MIT、Stanford、清华大学、中科院自动化所、中科院声学所、Motorola研究中心、IBM研究院等国内外50家著名语音研究机构由NIST(美国国家标准技术研究院)举办,是国际上规模与影响力最大的说话人识别评测1996年第一次评测,之后每两年评测一次,说话人识别任务难度接近大规模实际应用环境(不同信道、不同环境干扰)科大讯飞在2008、2010年连续两届评测中均处于国际领先地位NIST语种识别评测名列前茅•2009/2011年国际NIST语种识别最混淆方言对测试冠军评测时间:2011年评测对象:语种识别技术评测单位:美国国家标准技术研究院(NIST)参赛单位:麻省理工学院林肯实验室(MITLL)、法国科学研究中心(LIMSI),捷克布尔诺科技大学(BUT)、清华大学等2011年语种识别测试中,在9个高混淆度方言对中获7个第一名名次代号代表机构不同方言对测试结果排名P1P2P3P4P5P6P7P8P91iFLY科大讯飞1113112112MITLL麻省理工学院林肯实验室2322221233BLZ捷克布尔诺科技大学&法国科学研究中心333133332独家实用的口语评测技术机器自动评分误差1分以上仅为5%专家评分误差1分以上为17%英文口语评测机器和人工评分员对比国家语委组织的机器和人工评分员对比鉴定结果•已累计完成国家普通话等级考试600万人测试•在全国5000万中小学师生的课堂教学中使用•科大讯飞口语评测技术唯一通过国家语委鉴定达到实用水平高精准度的音乐评测技术•在语音识别技术体系的基础上,研发出业界唯一可精确反应音准、节奏和歌词演唱准确度的音乐评测技术,并推出“爱吼网”(),提供在线音乐评测服务。爱吼网独家承办第十届中国少年儿童卡拉OK电视大赛网络赛区爱吼网应用三、不断成熟的自然语言理解技术•基于识别合成的语言处理算法,研发出完善的人机交互语义词典和语义理解算法体系•面向移动互联语音应用,率先完成首个达到实用、覆盖衣食住行的中文语义理解系统完善的语义理解算法体系•提出ISF中文语义框架,具备灵活高效的多业务扩展能力•实现集词法分析、文法理解、意图分类及句子语义度量的一体化语义理解算法体系请问有没有下周一晚上从合肥到北京的航班意图飞机票操作查询起点城市:合肥终点城市:北京日期2012-03-26时间≥19:00实用全面的语义系统和云进化能力•面向移动互联语音应用,率先完成首个达到实用、覆盖衣食住行等应用领域的中文语义理解系统0%20%40%60%80%100%电话短信应用搜索网站日程音乐天气股票地图餐饮闲聊平均各应用领域语义理解正确率平均性能85%基于语音云平台,形成了持续的语义理解进化能力语义理解技术的应用成果•讯飞语义理解技术已经在各大运营商的短信营业厅智能化服务中广泛应用短信营业厅网上营业厅掌上营业厅自然语言理解智能语音技术传统电子渠道智能交互系统示例KT6021QX6022示例给我个早晚都能看的报纸吧。有每天能看新闻的业务吗?我要订个新闻早晚报。……语义理解技术的应用成果科大讯飞承建的安徽移动短信营业厅智能服务系统,在2011年中国移动总部电子渠道专项评测中排名第一,成为移动下文各省学习的样板。84322110510科大讯飞系统A系统B系统C系统D系统E系统F识别正确识别不正确•基于讯飞语义理解技术研发的呼叫导航智能客服系统已在上海世博会和多家银行成功应用–讯飞呼叫导航在上海世博热线962010成功应用语义理解技术的应用成果•基于讯飞语义理解技术研发的呼叫导航智能客服系统已在上海世博会和多家银行成功应用–工行95588智能呼叫导航2011年9月2日成功上线系统上线3个月以后,自动服务转人工服务的比例降低10%以上,IVR满意度提升17%扑面而来的“语音应用时代”•互联网时代快速推动电子产品的网络化、智能化发展:–海量信息检索、新颖的交互应用:对人机交互带来新挑战–语音技术是人机交互最自然的方式,她的应用将引起移动终端发展二次革命•语音应用大规模应用需要的条件已经逐步成熟–关键技术持续进步,达到实用门槛–智能终端、无线网络、云计算平台等环境条件基本完备2011年10月苹果公司发布iPhone4S,Siri成为最大卖点语音交互的终端和应用不断涌现谷歌计划今年上半年发布平板电脑GoogleNexus,并将搭载Majel网络语音识别技术语音交互的终端和应用不断涌现微软称:新版Tellme将实现人机语音交互,用于Windows8及下一代WindowsPhone系统中语音交互的终端和应用不断涌现•2010年10月28日,科大讯飞‘语音云’发布会在北京隆重举行•2012年3月22日,科大讯飞在北京再次发布新一代“语音云”2012年移动互联网大事件:“讯飞云.语点”34手写识别语音搜索语音合成语音识别语音评测新一代语音云声纹识别语义理解开发者网站:语音云:为各种移动终端提供全面语音服务语音云应用日益丰富语音输入微博短信搜索虚拟形象娱乐日程管理生活服务阅读地图导航基于语音云平台的开发伙伴已达3100家!语音云用户规模加速增长100万1000万3300万3300万700万次语音云用户每日请求2012年1-3月2011年7-12月2011年1-6月语音云应用规模呈现出显著的爆发增长态势!超大规模的语音数据自我进化的语音云领先的内核算法自动优化训练平台环境抗噪技术口音自适应技术超大规模解码技术自然语言理解技术180000G内存10000CPU持续引入新的数据,加入各种高级算法,采用高性能服务器,不断训练新模型迭代到产品中,识别效果持续提升识别率55%91%70%1万人100万人1000万人典型应用:讯飞输入法讯飞输入法准确的键盘输入随意的手写输入快捷的语音输入3939/44典型应用:讯飞语点4040/44完善的开发和运营支撑最新最好的语音体验平台开放最新最好的语音交互技术,并提供效果体验。1全程的开发技术支持平台为开发伙伴提供全程的技术支持服务,保证应用快速开发。2全天候的运维保障平台开放全天候的自动化运维体系,为应用提供高可靠性的运营支撑。3自动化的业务分析平台提供应用情况的自动分析,帮助持续改进语音应用效果。4主要议题•讯飞语音技术介绍•电视语点系统介绍电视进入智能语音时代2012CE