AI芯片行业研究报告2019年2©2019.6iResearchInc.摘要来源:艾瑞研究院自主绘制。芯片行业具有资本和技术壁垒双高的特点,高昂的研发费用需要广大的市场进行支撑,对于AI芯片厂商来说除了核心软硬件技术开发实力外,市场洞察及成本控制亦是不可或缺的能力;行业当前接近Gartner技术曲线泡沫顶端,未来1~2年将会面临市场对于产品的检验,只有通过市场检验和筛选的优质团队才能够继续获得产业、政策和资本的青睐和继续支持。AI芯片主要适用于包括训练、推理在内的AI应用,擅长并行计算。主要应用于云端、边缘及物联网设备终端。市场空间在2022年有望超过500亿美元;边缘侧和终端对于AI芯片需求更加分散,不同场景需要综合考虑芯片的PPACR。AI芯片作为协处理器难以单独实现应用功能,对厂家软件及系统开发交付能力同样有很高的考量。不同的应用场景中,拥有较高的固有行业壁垒,这需要AI芯片厂商能够加强与产业固有主体的合作,融入现有产业结构;AI芯片在云端主要为数据分析、模型开发(训练)及部分AI应用(推理)等提供算力支持。英伟达基于其完备的GPU+CUDA生态主导云端AI芯片市场,但其产品售价高昂,GPU计算效能及功耗不如FPGA及ASIC芯片,市场寻求潜在替代方案;SMS3AI芯片行业概述1AI芯片应用场景及市场需求分析2AI芯片行业产业链及商业模式分析3AI芯片行业发展展望4企业推荐54©2019.6iResearchInc.•芯片工艺制程逼近物理极限;•CPU芯片中大量晶体管用于构建逻辑控制和存储单元,用于构建计算单元的晶体管占比极小;•为了保证兼容性,CPU构架演进发展受限。关于人工智能芯片(AI芯片)AI芯片:基于矩阵运算、面向AI应用的芯片设计方案1、定义:当前AI芯片设计方案繁多,包括但不限于GPU\FPGA\ASIC\DSP等。目前市场上的对于AI芯片并无明确统一的定义,广义上所有面向人工智能(ArtificialIntelligence,AI)应用的芯片都可以被称为AI芯片。2、当前AI运算指以“深度学习”为代表的神经网络算法,需要系统能够高效处理大量非结构化数据(文本、视频、图像、语音等)。这需要硬件具有高效的线性代数运算能力,计算任务具有:单位计算任务简单,逻辑控制难度要求低,但并行运算量大、参数多的特点。对于芯片的多核并行运算、片上存储、带宽、低延时的访存等提出了较高的需求。3、针对不同应用场景,AI芯片还应满足:对主流AI算法框架兼容、可编程、可拓展、低功耗、体积及造价等需求。注释:DL:DeepLearning,指深度学习。来源:《DeepLearning》——IanGoodfellow、YoshuaBengio、AaronCourville;英伟达官网。ControlALUALUALUALUCacheDRAMDRAMALU深度学习模型复杂度及规模对芯片算力需求激增通过架构设计AI芯片跨越工艺限制,算力效能对CPU实现大幅超越•工艺提升缓慢,面对大规模并行运算需求,需要对芯片架构进行重新设计;•GPU:开发即面向图像处理等大规模运算需求;•FPGA/ASIC:对缓存、计算单元、连接进行针对性优化设计。5©2019.6iResearchInc.应用所需的“暴力计算”需求早在上世纪80年代,学术界已经提出了相当完善的人工智能算法模型,但直到近些年,模型的内在价值也没有被真正的实现过。这主要是受限于硬件技术发展水平,难以提供可以支撑深度神经网络训练/推断过程所需要的算力。直到近年来GPU\FPGA\ASIC等异构计算芯片被投入应用到AI应用相关领域,解决了算力不足的问题。下图以云计算场景为例,通过对全球几大科技巨头的代表性云端芯片产品计算性能对比,我们可以发现ASIC芯片相比起其他几种芯片,在计算效能、大小、成本等方面都有着极大优势,未来随着通用AI指令集架构的开发,预计会出现最优配置的AI计算芯片。注释:PPA:POWER、PERFORMANCE、AREA,指芯片的算力、功耗和面积。来源:Intel官网;英伟达官网;公开网络数据;艾瑞研究院。0.00181015.745Intel-XEONIntel/Altera-Stratix10SoCNvidia-TESLAV100Google-TPUv2典型的云端计算芯片算力表现比较Performance(TFLOPs)CPUFPGAGPUASIC优点:通用性好,串行运算能力强;适用于逻辑运算;缺点:开发难度最大,大量的晶体管用于构建控制电路和高速缓冲存储器,运算单元占比少,架构限制了算力的进一步提升。优点:相比CPU,由于其多线程结构,拥有较强的并行运算能力,与FPGA和ASIC相比通用性更强;缺点:价格、功耗等不如FPGA和ASIC,并行运算能力在推理端无法完全发挥。优点:可对芯片硬件层进行灵活编译,且功耗远远小于CPU和GPU缺点:硬件编程语言难以掌握,单个单元的计算能力比较弱,硬件成本较高,电子管冗余,功耗可进一步压缩。优点:针对专门的任务进行架构层的优化设计,可实现PPA最优化设计、量产后成本最低;缺点:初始设计投入大,可编程架构设计难度较大,针对性设计会限制芯片通用性。6©2019.6iResearchInc.并非替代,与CPU共同满足新时代计算需求目前来看,AI芯片并不能取代CPU的位置,正如GPU作为专用图像处理器与CPU的共生关系,AI芯片将会作为CPU的AI运算协处理器,专门处理AI应用所需要的大并行矩阵计算需求,而CPU作为核心逻辑处理器,统一进行任务调度。在服务器产品中,AI芯片被设计成计算板卡,通过主板上的PCIE接口与CPU相连;而在终端设备中,由于面积、功耗成本等条件限制,AI芯片需要以IP形式被整合进SoC系统级芯片,主要实现终端对计算力要求较低的AI推断任务。来源:英伟达官网,公开网络数据。服务器级产品中通过PCB上PCIE接口与CPU组成异构计算单元通过SoC封装与CPU组成异构计算单元CPUGPUXPUDSPModemCameraISP4KVideoHifiAudioLPDDR4XUFSSensorProcessorSecurityEngineSoC7©2019.6iResearchInc.应用落地提供了商业化可行的算力解决方案在人工智能发展初期,算法已经通过数据中心(云端)在大数据分析、精准营销、商业决策等方面实现了成功地应用落地。而未来,智能化将会逐渐渗透进入能源、交通、农业、公共事业等更多行业的商业应用场景中,除了部署在云端进行数据分析等工作,人工智能还需要下沉到摄像头、交通工具、移动设备终端、工业设备终端中,与云计算中心协同实现本地化的、低延时的人工智能应用。考虑到任务算力需求,以及传输带宽、数据安全、功耗、延时等客观条件限制,现有云端计算解决方案难以独自满足人工智能本地应用落地计算需求,终端、边缘场景同样需要专用的AI计算单元。来源:艾瑞研究院自主绘制。算法下发计算下沉云端云端负责承载智能数据分析、模型训练任务和部分对传输带宽要求不高的推理任务。数据回传模型训练/推理边缘+终端基于对数据传输带宽压力、数据安全等因素的考量,边缘和终端侧承载了需要本地实时响应的推理任务。需要独立完成任务涵盖:数据收集、环境感知、人机交互以及部分的推理决策控制任务。终端SoC+IP:DSP/GPU/ASIC边缘智能服务器:GPU/FPGA/ASIC云数据机房智能服务器:GPU/FPGA/ASIC智慧安防超大数据量本地处理自动驾驶断网下独立本地处理其他物联网场景工业/农业等家庭数据安全、异构、实时响应移动互联网低功耗、数据安全云端与边缘侧人工智能应用场景对于AI芯片的需求8©2019.6iResearchInc.、市场根据AI芯片功能及部署场景将AI芯片分为:训练/推断、云端/边缘两个维度进行划分。训练端由于需要对大量原始数据进行运算处理,因此对于硬件的算力、计算精度,以及数据存储和带宽等都有较高要求,此外在云端的训练芯片应该有较好的通用性和可编程能力。推理端对于硬件性能要求没有推断端高,实证证明一定范围的低精度运算可达到同等推理效果,但同时这要求模型训练精度要达到较高水平。2、根据中金公司研究部数据显示,2017年,整体AI芯片市场规模达到62.7亿美元,其中云端训练AI芯片20.2亿美元,云端推理芯片3.4亿美元,边缘计算AI芯片39.1亿美元;到2022年,整体AI芯片市场规模将会达到596.2亿美元,CAGR57%,其中云端训练AI芯片172.1亿美元,CAGR53.5%,云端推断芯片71.9亿美元,CAGR84.1%,边缘计算AI芯片352.2亿美元,CAGR55.2%。注释:AI芯片细分市场规模单位:亿美元。来源:《AI芯片:应用落地推动产品多样化》——中金公司研究部2017-2022年AI芯片细分市场规模预测CAGR:53.5%CAGR:84.1%CAGR:55.2%9AI芯片行业概述1AI芯片应用场景及市场需求分析2AI芯片行业产业链及商业模式分析3AI芯片行业发展展望4企业推荐510©2019.6iResearchInc.应用场景:云计算云计算:共享规模化经济效益有效降低边际成本投入云计算是一种按使用计费的IT服务模型,实现对高可靠、可配置的计算资源池(服务器、存储、网络、应用程序和服务)的方便快捷的访问,资源可通过最少的管理工作快速的配置和发布。云计算具有:资源池、广泛的网络访问、按需自助服务、快速弹性膨胀、测量服务等5个基本特征。云计算服务模式主要包括:IaaS、PaaS、SaaS:1.IAAS-提供基本的计算(虚拟或专用硬件)、存储、网络资源,使用者在资源中部署运行任意应用程序和操作系统;2.PAAS-提供部署在云基础设施上的编程语言、库、服务和支持工具,为开发人员提供了一个自助服务门户而无需管理底层基础设施;3.SAAS-提供在云基础设施上运行的应用程序,程序运行管理皆由服务提供商负责。相比起传统IT模式,云计算模式可实现:降低用户初始IT投资成本及IDC机房维护费用并实现资本效益配置最大化、IT资源快速弹性扩展、数据价值的有效挖掘以及业务的快速上线部署等。来源:IBM。传统IT应用数据运行中间件O/S虚拟化服务器存储网络IaaS应用数据运行中间件O/S虚拟化服务器存储网络PaaS应用数据运行中间件O/S虚拟化服务器存储网络SaaS应用数据运行中间件O/S虚拟化服务器存储网络云厂商管理客户自行管理云计算服务模型11©2019.6iResearchInc.©2019.6iResearchInc.年全球服务器出货量及增速全球服务器出货量(万台)同比(%)490046006700101001243168225494756-6%46%51%270%298%296%20142015201620172014-2017年Amazon&阿里巴巴云计算建设资本支出Amazon(百万美元)阿里巴巴(百万美元)Amazon(%)阿里巴巴(%)云计算中心服务器及硬件市场规模云计算发展带动上游硬件市