推荐国家科技进步奖项目公示项目名称面向海量语音数据的识别、检索和内容分析技术及应用推荐单位北京市推荐单位意见:我单位认真审阅了该项目推荐书及附件材料,确认全部材料真实有效,相关栏目均符合国家科学技术奖励工作办公室的填写要求。呼叫中心以电话交互方式向社会提供信息和服务,已成为电信、金融、保险、互联网等行业提供产品服务的重要渠道。《面向海量语音数据的识别、检索和内容分析技术及应用》项目针对呼叫中心服务和质检几乎完全依赖人工、用户满意度不高,成本高效率低等问题,从提升服务质量、深挖数据运营价值、节约用工成本三个方面开展了呼叫中心智能化改造的系统性研究和开发,依靠自主原始的技术创新和系统集成创新,设计研发了应用于呼叫中心的自动客服和语音分析整体解决方案,主要技术指标国际领先。该项目成果获授权发明专利21项,软件著作权35项,发表SCI和EI检索论文136篇。2013年教育部成果鉴定认为“该项目成果的总体技术水平达到国际领先水平”,2014年获北京市科学技术奖一等奖。该项目研发的面向海量语音数据的识别、检索和内容分析技术是目前业界唯一可以替代人工应用于呼叫中心服务的技术。目前已经在国内三大电信运营商、金融、交通、保险等行业的主流企业长期稳定应用,带来显著经济效益和社会效益。开创了采用智能技术改造呼叫中心的行业新方向,推动传统呼叫中心的升级换代,在与国际厂商的竞争中处于领先地位。对照国家科学技术进步奖授奖条件,北京市推荐该项目为2016年度国家科学技术进步奖一等奖。项目简介:该项目属于语音处理领域。呼叫中心以电话交互方式向社会提供信息和服务,已成为电信、金融、保险、互联网等行业提供产品服务的重要渠道。2014年末中国呼叫中心坐席规模突破80万,累计市场投资达到1000亿人民币以上。与呼叫中心快速发展不匹配的现状是服务和质检几乎完全依赖人工、成本高效率低。该项目针对上述问题,从提升客服质检质量、深挖客服数据运营价值、节约用工成本三个递进层面开展了呼叫中心智能化改造的系统性研究和开发,取得了多项创新性成果和关键技术突破。2001年以来,该项目以下三个方面开展系统性研究和开发:一是通过语音识别和语音检索技术改善客服质检的效率效果,为向客户提供高质量的服务提供保障;二是通过海量语音内容分析技术,获取用户关注的业务焦点和热点并预测其趋势走向,深入挖掘客服录音数据的运营价值;三是在海量语音深度挖掘的基础上,通过基于自然口语理解和对话管理策略的自动应答技术减轻客服人员的工作强度,节约呼叫中心的用工成本。该项目主要创新点有:1)提出了基于深度全序列卷积神经网络的声学建模方法、篇章级语言模型建模方法和基于抗噪深度学习的语音端点检测方法,显著提升了识别引擎对于复杂多变环境噪声和用户自然随意说话风格的鲁棒性。电话语音数据的识别准确率首次达到85%,全球首次实现了会议语音的同步字幕转写。语音识别系统在实际应用场景下准确率达到实用要求并大规模应用推广。2)提出了基于范式转换的容错语音检索算法、基于小世界理论及引力场模型的热点分析方法、提出有监督主题模型与本体概念空间结合的来电原因分析方法、提出基于神经网络概率生成模型的对话主题结构分析方法。首次实现海量客服数据的全量质检,质检投入产出比提升20倍以上,实现了趋势发现、投诉重点和异常报警灯自动分析功能,显著提升客服中心的服务质量和业务价值。3)提出基于自动模式发现的文法生成算法,结合语义文法解析和统计模型识别提出多重解码网络构建和搜索算法;提出多轮对话系统的整体概率模型框架,在此框架下定义了全新的对话状态描述方式,提出了基于证据理论的对话状态跟踪算法和最大熵的对话策略。结合上述创新性工作,成功研发了自动电话客服系统,用户需求理解准确率达到86%,音乐互动业务实现全自动交互,电信自动客服业务上有效分担20%以上的人工话务量。该成果获授权发明专利21项,软件著作权35项,发表SCI和EI检索论文136篇。2013年教育部成果鉴定认为“该项目成果的总体技术水平达到国际领先水平”,2014年获北京市科学技术奖一等奖。项目成果开创了以智能语音技术改造呼叫中心的行业新方向,已在电信、金融、保险等行业的数十家主流企业推广应用,累计收入9.26亿元。客观评价:1、成果鉴定2013年7月23日,受教育部委托,清华大学在北京主持召开了“面向海量语音数据的识别、检索和内容分析技术及其应用”成果鉴定会,由黄河燕、钱跃良、陈景东、戴礼荣、李爱军、黄鹏、张俭等7位专家组成的鉴定委员会,鉴定意见如下:“该项目集成了基于降噪深度学习的语音端点检测技术、基于前后缀查询扩展的中文口语文档检索技术、基于概率主题模型的口语文档多标签分类技术及其它多项语音和语言处理前沿技术”,形成了面向海量语音数据处理的整体解决方案,研制完成的语音分析系统已在电信、保险领域等10余家单位的客服中心得到推广应用,实现了产业化的重要突破,率先成为海量语音数据处理和分析的成功案例。综上所述,鉴定委员会认为该项目成果的总体技术达到国际领先水平。”见附件7。2、试验见证项目成果“智能语音客服服务系统”通过了安徽省电子产品监督检验所的现场检测,检测报告结论为:“语音转写识别率:客服领域的中文普通话语音转写准确率为94%、呼叫中心窄带语音环境转写准确率92.8%;客服领域的语义理解准确率为93.2%;智能客服系统平均每日的业务处理量≥1000万次,提供服务总规模≥1.1万坐席,呼叫中心业务并发量≥2万,日处理用户语音≥15万小时。”见附件27。3、所获奖励项目成果“面向海量语音数据的识别、检索及内容分析技术研发及应用”获2014年北京市科学技术奖一等奖。见附件6。项目成果“科大讯飞智能语音应用技术及解决方案”获2014、2016年度中国客户中心“金耳唛”最佳行业解决方案奖。4、应用单位评价中国移动通信有限公司于2012年7月委托广东、浙江、福建、安徽、山西等省公司在语音导航和语音分析等领域开展语音技术试点应用工作,发布了《关于委托你公司开展客服热线语音技术试点应用工作的通知》(市通[2012]235号),通知肯定了语音技术的应用能够有效提升运营管理效率、拓展服务模式、节约服务成本。在试点应用取得初步成果的基础上,移动总部于2012年11月委托安徽省公司在语音导航和声纹识别两方面进行拓展试点,取得人工话务量下降10%的成果。根据以上试点工作在语音合成播报、语音质检、语音分析、语音导航、员工基本技能测评、声纹密码等方面取得的阶段性成果上,移动总部于2013年4月面向各省、自治区、直辖市公司发布了《关于全面推进10086客户服务热线语音技术应用的通知》(市通[2013]133号)决定在10086客服热线全面推进语音技术应用。中国电信股份有限公司为进一步优化改进10000号IVR语音导航流程、提升客户感知,集团公司于2013年11月在广东、浙江、江苏、湖南、江西和安徽省公司10000号开展语音导航优化试点工作。根据试点结果,集团公司于2015年制定了《中国电信10000号省级多媒体智能客服业务规范“(2015补充版)”》。见附件30。5、社会效益山西移动上线质检后通过3个月的持续使用,对系统质检结果进行通报+考核,服务效率违规录音由原来的745件/月下降到97件/月,服务效率违规率降低86.98%。通过对员工管理分析模型的运用,对服务态度恶劣问题做到了有效控制,由原来的9件/月降低到目前的2件/月,降低77.78%,智能客服客户“非常满意率”也从上线初期的64.32%提升至10月的85.71%。通过智能客服增加紧急停开机等智能自助服务,客服代表满意率由原先的77%上升至89%,客服代表员工满意率提升12%,客户非常满意率增加21.39%,人员流失率每月降低1%。6、科技查新2013年7月,经教育部科技查新工作站L11查新表明“面向海量语音数据的识别、检索及内容分析系统”的3个查新点--基于降噪深度学习的语音端点检测技术、基于前后缀查询扩展的汉语语音文档检索技术、基于概率主题模型的语音文档多标签分类技术,国内外未见研究内容相同的公开文献报道。”见附件19。7、论文评价代表性论文[1]最早将深度神经网络引入语音端点检测的研究,2013发表以来GoogleScholar引用103次,SCI引用27次,是2012年以来语音端点检测领域引用数最高的论文。多篇论文在综述中把本论文作为语音端点检测领域,特别是深度学习用于语音端点检测任务的代表作;包括来自于IEEE院士LiDeng[2,3],B.Yegnanarayana[4],ShriNarayanan[5]和Chin-huiLee[6,7]的论文。邓力博士在其担任IEEETRANSACTIONSONAUDIO,SPEECH,ANDLANGUAGEPROCESSING(T-ASL)主编,三年任满的告别信[2]中,专门把此文列入了近年来在T-ASL发表的创新性工作的代表作之一。其它关于对话系统[8],自动标点[9],深度模型自适应[10],语音端点检查[11-13]的代表性论文,也得到IEEE院士MariOstendorf[14],SteveRenals[15],NasserKehtarnavaz[16],M.OmairAhmad[17],Chin-huiLee[18],LiDeng[19]的正面引用。见附件18。8、企业荣誉依托该项目的创新性的技术成果以及产业应用成效,2009年科大讯飞被科技部、国务院国资委、中华全国总工会授予“创新型企业”;2012年科大讯飞被工信部认定为“国家技术创新示范企业”。见附件33,34。推广应用情况:该项目研发的面向海量语音数据的识别、检索和内容分析技术是目前业界唯一可以替代人工应用于呼叫中心服务的技术。目前已经被国内三大电信运营商、金融、交通、保险等行业的主流企业成功应用。通过自主研发的语音识别系统、语音导航软件、语音分析系统、音乐搜索软件、音乐互动软件等产品形态在不同行业中形成了广泛应用,已累计形成直接产品收入9.26亿元(其中过去3年直接产品收入3.95亿元,新增利润1.39亿元),并为产品合作伙伴带来增加收入,降低成本等多种形式的经济效益。具体推广应用情况如下:1、语音分析类产品:项目成果已成功应用于中国移动、中国联通,中国电信,建设银行、中国平安、厦门航空等合作伙伴,覆盖19个省市呼叫中心。在运营商及金融保险领域已形成了行业内的质检规范。2、语音呼叫导航类产品,包括客服类应用产品和音乐类应用产品两大类。(1)客服类应用产品:以软件授权+项目实施+专业服务的方式销售给金融、电信、保险等行业呼叫中心中,通过将传统的按键式IVR自助服务系统转换成语音交互的智能自助服务系统,显著提升客户体验,分流人工话务,降低人力成本。目前在中国移动、中国联通、中国平安、交通银行、中国国航等项目中都已经使用了该系统,每天通过系统获取服务的次数超过80万次,并未开发伙伴带来了显著的经济效益。以客服接听每通电话1元计算,每年可为行业用户节约运营成本1.8亿元以上。(2)音乐类应用产品:基于智能语音识别、搜索等技术为电信运营商无线音乐等业务提供语音搜索解决方案,方便了用户使用;同时基于唱歌内容质检、评测等技术提供无线音乐互动等产品和服务,提升了无线音乐业务娱乐性和趣味性。目前业务系统已覆盖中国移动、中国联通、中国电信等三大运营商全国市场,覆盖手机用户超过3亿。主要知识产权证明目录:类别名称国家授权号授权日期证书编号权利人发明人状态发明一种交互式的检索式生成方法及系统中国201310611470.72016年8月31日第2218349号科大讯飞股份有限公司吴及;侯晋峰;吕萍;何婷婷;胡国平;胡郁有效专利发明一种对复杂检索式进行检索优化的方法及系统中国201310627325.8科大讯飞股份有限公司吴及;侯晋峰;吕萍;何婷婷;胡国平;胡郁有效专利发明语音导航方法及系统中国201310611734.92016年8月31日第2218971号科大讯飞股份有限公司高建清;刘聪;王智国;胡国平;胡郁有效专利发明一种电信运营商垃圾短信处理系统及