车音网语音云平台研究车音网语音云平台研究车音网语音云平台研究车音网语音云平台研究车音网语音云平台研究车音网语音云平台研究车音网语音云平台研究车音网语音云平台研究——C4车联云车联云车联云车联云CCARVPARVPCCyberyber--CCararCCloudloud车音网总经理车音网总经理车音网总经理车音网总经理沈鱇麒沈鱇麒沈鱇麒沈鱇麒AndyShum,CEOofCARVP车联网语音云平台研究1.1.车音网的C4理念未来汽车生活的需求汽车时代信息时代汽车已经成为城市生活中的重要交通工具生活中充斥着大量信息,我们随时随地需要掌握和沟通信息时代娱乐时代生活中充斥着大量信息,我们随时随地需要掌握和沟通娱乐在以各种方式和姿态闯入我们的生活汽车生活作为我们生活的重要部分,已经不能满足于代步工具的功能,需要实现更多。通讯需求信息互动车联网将改变未来汽车时代Cyber-Car代步工具传统汽车时代Car汽车信息化代步工具信息互联车联网时代Cyber-CarCar车载通讯、获取资讯、享受娱乐、车况监测、道路监控……驾驶环境下语音是最好的交互手段获取信息方式1、人工服务成本高,人员有限,无法满足更大规模客户服务驾驶的特殊环境决定了语音指令是驾驶员最为可行的丰富信息交互方式1、人工服务2、多媒体机3、语音交互成本高,人员有限,无法满足更大规模客户服务需要手动操作并会转移视线,缺乏安全和便捷性信息由后台自动处理,驾驶中操作更安全便捷驾驶的特殊环境决定了语音指令是驾驶员最为可行的丰富信息交互方式实现车联网的通路信息源实现终端3G对外通讯服务资源娱乐资讯路况信息手机端车载音响多媒体机路况信息……多媒体机车音网的车联网理念车音网的车联网理念车音网的车联网理念车音网的车联网理念CyberCyberCyberCyber----Car+CloudCar+CloudCar+CloudCar+Cloud人服务:信息通讯:3G道路车交通:更智能更环保更安全服务:便捷高效多元化信息通讯:无障碍个性化专属化车联网语车联网语车联网语车联网语音云平台音云平台音云平台音云平台车音网希望借助优势车音网希望借助优势车音网希望借助优势车音网希望借助优势3G3G3G3G网络网络网络网络,,,,通过语音云技通过语音云技通过语音云技通过语音云技术将术将术将术将‘‘‘‘人人人人,,,,车车车车,,,,道路道路道路道路’’’’整合为一个有机整合为一个有机整合为一个有机整合为一个有机““““车联网车联网车联网车联网””””服务平台服务平台服务平台服务平台车联网语音云平台研究2.2.C4核心技术C4的语音云计算特性作为以语音识别为核心技术的车音网,将大量的语音识别数据进行收集和计算,云计算的核心思想,是将大量用网络连接的计算资源统一管理和调度,构成一个计算资源池向用户按需服务作为以语音识别为核心技术的车音网,将大量的语音识别数据进行收集和计算,依托网格计算技术,构建了基于移动互联网环境的语音云平台C4,可在不同层次按需为驾驶员、车主提供丰富的多媒体信息驾驶伴随服务。完善数据库后台计算处理用户按需语音呼入语音数据收集C4的核心技术世界最先进的中文普通话、粤语、闽南语、英语四语非特定特有的的商用级非特定人语音识别技术特有的的商用级非特定人语音识别技术特有的的商用级非特定人语音识别技术特有的的商用级非特定人语音识别技术ASR((((AdvancedSpeechRecognition))))世界最先进的中文普通话、粤语、闽南语、英语四语非特定人识别引擎世界上独一无二的、耗时十年语料采集、耗资过亿特征提取所形成的中文语种广谱语音特征库基于话音链路、移动网络成熟投入商用的语音识别信息交互解决方案在驾驶环境下,驾驶员的语音指令代替复杂的键盘操作在驾驶环境下,驾驶员的语音指令代替复杂的键盘操作不破坏“手眼同向”法则可通过移动互联网实现丰富的信息互动该技术也成为十二五计划“国家搜索引擎”课题将选用的先进技术车音网非特定人语音识别技术原理Human-MachineInterfaceDesign人机界面设计DataAnalysis&PilotProduction正式投入工作ASREngine语音识别SpeechDatabase语言库DataAnalysis&Tuning数据分析及调整Grammars&Models语法及语言模型•语音模型+语法模型+地域语言文化+广谱发音特征库+长期实践五大要素成就了车音网现有的商用级语音识别引擎及车联网应用解决方案C4核心技术声纹识别技术声纹识别技术声纹识别技术声纹识别技术对特定人的声纹提取通过声纹作为说话者的生物特征标识基于声纹的身份验证及语音指令验证完整的声纹鉴权商用解决方案C4核心技术语音检索技术语音检索技术语音检索技术语音检索技术通过“听写机”模式可直接对音频或视频伴音进行内容识别无需大量人工干预音频内容可存入海量媒体库可通过文字关键字或声音关键字直接从海量库中检索到相关内容内容高效而准确C4核心技术自然语法的垂直识别引擎自然语法的垂直识别引擎自然语法的垂直识别引擎自然语法的垂直识别引擎对特定垂直领域提供基于自然语言的语音识别算法导航领域范例:“我要去虹桥机场”、“到香格里拉酒店的路怎么走”、“最近的医院”、“请带我到附近的加油站”……区别与现有关键词引擎的用法,在某些领域将更加区别与现有关键词引擎的用法,在某些领域将更加人性化C4核心技术旋律识别技术旋律识别技术旋律识别技术旋律识别技术对旋律节奏及特征的识别将音乐做特定的旋律分析和归类基于音乐旋律和人类起居生理特征做出不同时段的适度音乐节目表对驾驶员提供符合人体工学的人性化音乐服务对驾驶员提供符合人体工学的人性化音乐服务人性化的驾驶伴随服务C4核心技术移动环境下的云计算技术移动环境下的云计算技术移动环境下的云计算技术移动环境下的云计算技术成熟的云计算平台架构技术高可靠性结构设计能力符合移动网络环境和驾驶环境的应用接口提供规范的服务提供协议和开放的架构多种移动终端支持,支持Android、IPHONEOS、多种移动终端支持,支持Android、IPHONEOS、WindowsMobile(WinCE、EmbeddedXP)、Symbian等多种智能系统•世界最先进的中文普通话、粤语、闽南语、英语四语非特定人混合识别引擎•世界上独一无二的、耗时十年语料采集、耗资过亿特征提取所形成的广谱语音特征库•基于话音链路、移动网络真正投入商用的语音识别信息交互解决方案C4核心技术组成的独特平台引擎特有的商用级语音识别合成技术•对特定人的声纹提取,通过声纹作为说话者的生物特征标识•基于声纹的身份验证及语音指令验证,完整的声纹鉴权商用解决方案声纹识别技术•对旋律节奏及特征的识别,将音乐做特定的旋律分析和归类,基于音乐旋律和人类起居生理特征做出不同时段的适度音乐节目表•对驾驶员提供符合人体工学的人性化音乐服务,良好的驾驶伴随旋律识别技术•对驾驶员提供符合人体工学的人性化音乐服务,良好的驾驶伴随对某特定垂直领域提供基于自然语言的语音识别算法导航领域范例:“我要去虹桥机场”、“到香格里拉酒店的路怎么走”、“最近的医院”、“请带我到附近的加油站”……区别与现有关键词引擎的用法,在某些领域将更加人性化自然语言模型车联网语音云平台研究3.3.C4平台功能车音网语音云平台C4CARVPCYBER-CARCLOUD客户端客户端客户端客户端Client客户端客户端客户端客户端ClientPC&浏览器浏览器浏览器浏览器移动终端设备移动终端设备移动终端设备移动终端设备车载终端设备车载终端设备车载终端设备车载终端设备互联网互联网互联网互联网&移动互联网移动互联网移动互联网移动互联网平台即服务平台即服务平台即服务平台即服务PaaS平台即服务平台即服务平台即服务平台即服务PaaS互联网互联网互联网互联网&移动互联网移动互联网移动互联网移动互联网智能语音导航智能语音导航智能语音导航智能语音导航,,,,动态交通信息动态交通信息动态交通信息动态交通信息全音控车载通讯全音控车载通讯全音控车载通讯全音控车载通讯CRM数据挖掘数据挖掘数据挖掘数据挖掘信息信息信息信息、、、、娱乐娱乐娱乐娱乐定制服务定制服务定制服务定制服务救援救援救援救援、、、、车车车车务服务务服务务服务务服务营销传播营销传播营销传播营销传播个个个个人人人人应应应应用用用用SNS行行行行业业业业应应应应用用用用其他其他其他其他语语语语音音音音识识识识别别别别应应应应用用用用研研研研发发发发团团团团队队队队音频搜索音频搜索音频搜索音频搜索旋律识别旋律识别旋律识别旋律识别声纹识别声纹识别声纹识别声纹识别ASRTTSSDK&Interface软件即服务软件即服务软件即服务软件即服务SaaS软件即服务软件即服务软件即服务软件即服务SaaS广谱语音特征库广谱语音特征库广谱语音特征库广谱语音特征库队队队队音频搜索音频搜索音频搜索音频搜索自然语言模型自然语言模型自然语言模型自然语言模型旋律识别旋律识别旋律识别旋律识别声纹识别声纹识别声纹识别声纹识别ASRTTS视音频编解码视音频编解码视音频编解码视音频编解码Interface地图引擎地图引擎地图引擎地图引擎C4服务提供模式平台即服务:直接提供平台功能,服务拥有私有运营数据,并可更改服务界面使服务“自有化”PlatformasaService平台即服务:直接提供平台功能,服务拥有私有运营数据,并可更改服务界面使服务“自有化”软件即服务:提供平台接口和SDK,服务商可定制自己的客户端或将C4核心功能融入自有系统SoftwareasaService基于C4车音网不仅直接提供B2C服务,还可为合作厂商提供B2B(B2B2C)服务车音网基于C4所提供的车联网应用导航手机报歌曲点播网络电台软件启动启动预装在客户手机端的唯智驾软件,多种应用随时畅享语音呼出“我要导航”只需说出目的地,客服后台规划路径,激活客户端手机软件,导航自动开始可定制的每日最新新闻资讯,自动更新,随时阅读语音呼出“歌曲点播”,选择播放类型,播放器自动激活,海量歌曲即刻畅听语音呼出“网络电台”,覆盖全国的电台资源任你收听车联网语音云研究4.C4研发背景4.C4研发背景及动态优良的研发环境•语音识别、云计算、高可靠性研究、互联网平台、嵌入式、移动通优秀而成熟的基础研发团队优秀而成熟的基础研发团队优秀而成熟的基础研发团队优秀而成熟的基础研发团队:信……•来自研究与应用方的广泛支持合作:中国联通、中央人民广播电台、深圳市科委、北京交通大学、北京城市交通研究中心、美国犹他大学、美国西北大学…广泛的技术合作与资源支持广泛的技术合作与资源支持广泛的技术合作与资源支持广泛的技术合作与资源支持:•即将与高校、科研机构共建研究生培养基地•在政府资助下筹备语音技术、车联网基础技术实验室国家级课题技术提供商国家级课题技术提供商国家级课题技术提供商国家级课题技术提供商通过安全的方式旅途中的有力助个性化信息需求的满足,变被动有效降低围绕车辆所产生的时间实时的,准确的了解车辆的安全在车辆出现问题时能够得到及时降低时间成本降低时间成本降低时间成本降低时间成本满足个性化需求满足个性化需求满足个性化需求满足个性化需求车辆主被动安全车辆主被动安全车辆主被动安全车辆主被动安全高品质的产品高质量的服务驾驶者需求分析及解决方案研究驾驶者需求分析及解决方案研究驾驶者需求分析及解决方案研究驾驶者需求分析及解决方案研究通过安全的方式与外界进行语音通信,实时互通手,更便捷实用的导航和出行服务的满足,变被动的接受信息为主动的个性化信息摄取辆所产生的时间成本-----车辆的审验,违章的处理了解车辆的安全状况,以便于在出行前将安全隐患排除时能够得到及时有效的服务,以协助解决车辆安全问题低廉的成本TelematicsTelematicsTelematicsTelematics------------------------特马服务特马服务特马服务特马服务语语语语音音音音3G语音通信语音通信语音