2016年6月36氪研究院和璧隋珠,得之者富——大数据服务行业研究报告2报告摘要大数据是数据服务的重要部分,通过分析海量数据获得最大利润•大数据是数据服务中针对海量数据提供服务的部分。其价值在于从海量数据中提取有用信息,以方便企业针对市场及自身用户开展市场营销活动、进行市场预测与生产优化、通过风险控制最终实现经营活动的利润最大化。•数据处理与存储技术的快速发展与使用成本的显著下降使得通过网络录得的海量数据得以被分析并利用。随着互联网+的发展,多个行业所产生的数据得到记录,数据源的不断扩大与丰富为大数据产业奠定数据基础。我国大数据行业仍处于快速发展期,未来市场规模将不断扩大大数据行业核心数据:•目前大数据企业所获融资数量不断上涨,二级市场表现优于大盘,我国大数据行业的市场规模为数百亿元。随着互联网的不断普及与物联网技术的不断发展,未来市场规模将不断扩大,在垂直领域的应用程度将不断深化。•在通用型数据解决方案提供商中,拥有更丰富准确的数据来源、更多数量的客户、更高的客户忠诚度以及更多成功案例的提供商通常拥有更为强劲的实力。•垂直领域大数据应用提供商需要有更多垂直行业内的客户积累、行业数据积累、数据产品的易用性与实用性以及行业解决方案的过往成功案例。•2015年全球大数据市场规模将近1500亿人民币,同比增长24.2%;我国大数据市场规模为160亿元,仅占全球总市场规模的10.7%,但同比增长率为65.3%,是全球增长率的2.7倍。•预计2018年全球大数据市场规模将达到超过2500亿元,2015至2018年的复合增长率为21.8%。2018年我国大数据市场规模将超过500亿元,复合增长率为47.0%,是全球复合增长率的2.2倍。大数据服务行业研究报告2016.6目录Contents一.整体行业概述:大数据行业发展现状•大数据服务行业概述&发展背景•行业资本热度&市场规模•大数据服务产业链图二-1.行业细分领域:通用型服务分析•数据源采集服务•通用型解决方案提供服务•数据管理服务•投资价值判断二-2.行业细分领域:垂直行业应用•不同领域中大数据的应用•投资价值判断行业概述:大数据行业发展现状CHAPTERI•大数据服务行业概述&发展背景•行业资本热度&市场规模•大数据服务产业链图5大数据服务行业研究报告2016.6•数据服务多指数据采集、处理、应用与管理等相关服务。其价值在于从数据中提取有用信息,以方便企业针对市场及自身用户开展市场营销活动、进行市场预测与生产优化、通过风险控制最终实现经营活动的利润最大化。行业概述大数据是数据服务的重要部分,通过分析海量数据获得最大利润注:图中比例仅代表趋势,不代表任何具体数字•大数据是数据服务中针对海量数据提供服务的部分。多种来源的数据、不同的数据分析模型及快速发展的分布式计算使得海量数据处理成为可能。•随着互联网的不断普及与物联网技术的不断发展,未来大数据的应用场景将不断丰富,应用价值将不断提高,在数据服务中的比重也将越来越大。6大数据服务行业研究报告2016.6•根据Gartner给出的定义,大数据是“使用高效的信息处理方式以具备更强的洞察力、决策力和流程优化能力的海量、多样的信息资产”,其价值在于提高数据使用者的最终决策力。•本报告的主要研究对象为广泛意义上提供海量数据服务及相关行业应用的”大数据服务”。行业概述大数据帮助使用者从海量数据中获取有效信息,提高决策力•近些年来,大数据行业的热度不断提高。根据“BigData”一词的谷歌搜索指数可以看出,大约从2011年开始大数据一词逐渐进入公众视野,之后其搜索热度持续提高,成为谷歌搜索的热门词汇之一。7大数据服务行业研究报告2016.6•大数据作为数据本身具备广泛存在、非独占及多认知等特点,即多数行为均可产生数据、可被多次使用且有不同的使用方式;而“大”为之带来的特点则是体量巨大,处理速度较快、数据类型多样及商业价值较高。行业概述大数据拥有不同来源的海量数据,通过传感器采集等方式获取•相比传统数据服务,大数据服务拥有来自企业内部、外部市场及环境等不同来源的海量数据,通过传感器采集、互联网抓取等方式获取。快速发展的分布式计算及多样的数据分析模型使海量数据处理成为可能。8大数据服务行业研究报告2016.6•数据处理与存储技术的快速发展与使用成本的显著下降使得通过网络录得的海量数据得以被分析并利用。•Hadoop是由是一个分布式计算平台,覆盖于操作系统之上,能够实现分布式计算中的基础算法,同时为用户提供了编程和命令接口,极大地简化了用户编写分布式应用程序的工作量。行业背景分析Hadoop与NoSQL是大数据得以发展的重要数据存储与处理技术•NoSQL(NotOnlySQL)数据库泛指非关系型数据库,能够解决大规模数据集合的处理问题,特别是针对非关联性数据。NoSQL数据库包括Key-Value存储、列存储、文档型等多种类型,适用于多种场景。9大数据服务行业研究报告2016.6•数据源是指产生数据的原始媒体,包括物体和人体的各种相关信息,各个企业产生的外部、内部信息等。•2015年我国互联网普及率为50.3%,比上年增长2个百分点。随着信息技术的创新,互联网的普及,数据量会不断扩大。据IDC预测,至2020年全球所产生的数据量将达到近4万艾字节(1EB=1024*1024TB)。行业背景分析数据源的不断扩大与丰富为大数据产业奠定数据基础•理论上每个行业都会产生用户数据及企业运营数据,随着互联网+的发展,多个行业所产生的数据得到记录,数据源范围会不断扩大,所属行业会不断丰富。数据来源:中国互联网络信息中心,36氪研究院数据来源:IDC,36氪研究院10大数据服务行业研究报告2016.6•一级市场较看好大数据企业,融资数据快速增长,多数融资金额逾千万。从2010年开始,我国大数据行业的企业融资数量不断上升,其中2015年行业融资数量为59件,同比增长23%。在近六年的融资案例中,逾五成金额超过千万元。行业资本热度大数据企业所获融资数量不断上涨,二级市场表现优于大盘•二级市场对大数据服务提供商的投资热情同样很高,2013年至2016年6月的大数据指数显示,这一段时间内A股上市的大数据企业表现优于大盘的综合表现。•该指数以2012年12月31日为基日,以该日收盘后所有样本股的调整市值为基期,以1000点为基点,以A股上市的大数据服务企业为样本。数据来源:IT桔子,36氪研究院数据来源:36氪研究院11大数据服务行业研究报告2016.6•来自在线调查公司Statista的数据显示,在经历了快速增长期后,全球范围内的大数据服务进入了平稳增长的阶段。2015年全球大数据市场规模将近1500亿人民币,同比增长24.2%;我国大数据市场规模为160亿元,仅占全球总市场规模的10.7%,但同比增长率为65.3%,是全球增长率的2.7倍。•预计2018年全球大数据市场规模将达到超过2500亿元,2015至2018年的复合增长率为21.8%。考虑到我国大数据行业目前仍处于快速发展期,我们认为2018年我国大数据市场规模将超过500亿元,复合增长率为47.0%,是全球复合增长率的2.2倍。行业市场规模我国大数据行业仍处于快速发展期,未来市场规模将不断扩大•随着互联网+、云存储与物联网技术的不断发展,越来越多的行业所产生的行业数据、企业运营数据及用户数据得到记录,数据源范围会不断扩大,所属行业会不断丰富,其应用范围也会不断扩大,由大数据应用所产生的价值也会不断增长。数据来源:Statista数据来源:36氪研究院12大数据服务行业研究报告2016.6产业链图通用服务和垂直应用构成的解决方案提供商占据重要地位13大数据服务行业研究报告2016.6产业链图通用服务和垂直应用构成的解决方案提供商占据重要地位注:公司排名不分先后通用型大数据服务分析CHAPTERII-PartI•数据源采集服务•通用型解决方案提供服务•数据管理服务•投资价值判断15大数据服务行业研究报告2016.6•随着信息化技术的不断发展,曾经无法获取的数据被网络记录下来并加以应用,这些数据可以按照来源划分为互联网数据与物联网数据。物联网数据多指通过连接网络的传感器所采集的环境数据,互联网数据则多指由用户使用电脑、智能手机、平板电脑等不同联网终端所产生的基本信息与行为数据。•数据源采集商基于自身业务及背后的数据监测、传感器等方式采集互联网公开数据及用户行为数据,在进行简单的清洗梳理后向企业提供数据资源,在整个产业链中扮演数据提供者的角色。数据源采集服务信息化技术的发展使得数据被物联网及互联网记录并应用•除了以上这些联网数据采集方法之外,传统数据服务还有通过问卷采集用户数据这一重要方法,但其数据量通常较小,多为数百至数千样本。16大数据服务行业研究报告2016.6•安装在物联网上的传感器是大数据时代获取环境数据的重要采集方法之一,拥有数据来源范围广、数据准确度高、传输稳定等特点。目前国外较优秀的通过传感器进行数据采集的公司有Uptake、Helium等,国内暂时没有出现领军玩家。•Uptake是一家数据采集与分析服务平台,主要利用传感器采集包括建筑、航空、采矿、铁路等行业在内的数据并向相关企业与工程师提供预测结果,以提高运输、生产等的安全性,节约工业成本。数据源采集服务传感器是物联网数据的重要采集方法,目前赛道中多为国外玩家•Helium是一家联网传感器及数据服务提供商,其传感器可远程测量温度、湿度、气压、亮度以及运动,并回传相关数据进行收集与处理。图:Uptake产品布局图:Helium产品布局17大数据服务行业研究报告2016.6•随着智能终端的不断普及,App成为继网站之后了解用户在互联网上的信息与行为的又一重要数据来源。目前国内外通过App抓取用户在互联网上行为数据的采集商主要有AppAnnie、TalkingData、友盟等。•AppAnnie是一家移动应用数据采集服务商,通过从AppStore抓取数据,为企业用户提供涵盖iOS、Android、Windows等系统下各类App数据下载排名、用户使用行为及应用平台数据等相关服务。数据源采集服务智能终端上的App数据抓取成为互联网数据主要采集方式之一•TalkingData是一家第三方移动数据服务平台,主要为用户提供智能手机、平板电脑等移动终端下逾10万App的覆盖量、活跃用户数量等数据以及应用统计分析、游戏运营分析、移动广告监测等服务。18大数据服务行业研究报告2016.6•互联网时代除了抓取移动终端上各App的用户数据,还有在PC端通过API接口等工具抓取企业官网及其他网站上数据的方法。目前国内主要有友盟、聚合数据、发源地等企业提供网站数据抓取。•友盟+是2016年初由友盟、CNZZ、缔元信网络数据等三家公司合并而成的大数据服务提供商,主要提供网页与App数据统计、运营分析等服务,可监测网站访问量、流量来源、用户点击轨迹等数据。数据源采集服务PC端的网站流量及点击轨迹抓取是互联网数据的另一种采集方式•此外,当某一类型或某一领域的企业数量足够多,种类足够丰富,利用互联网将这些来自企业内部的数据进行采集、整理与挖掘,也可以对该类型或领域内的企业有一定的借鉴意义。图:友盟+产品布局及网站统计产品特点19大数据服务行业研究报告2016.6•大数据的通用型解决方案主要包括数据处理、数据可视化以及产品定位、企业管理、运营风险控制、危机预警与市场营销等部分。•数据处理是指对数据(包括数值与非数值数据)进行分析和加工的过程,包括对各种原始数据的分析、整理、计算、编辑等。其目的是从大量非结构化的数据中提取有价值的信息。•数据可视化则是通过图形图像化处理,针对数据处理的抽象结果进行视觉化表现,使之更加易读、易懂、易用的技术。•数据处理所得到的信息通常包括产品信息、企业运营信息、用户信息、目前市场信息等,企业根据这些信息做出产品定位与企业运营方面的业务经营决策。通用型解决方案可视化的数据处理结果形成企业管理、市场营销等解决方案20大数据服务行业研究报告2016.6