调研指导单位中国电子信息产业发展研究院调研发布单位中国大数据产业生态联盟调研执行单位《软件和集成电路》杂志社赛迪顾问股份有限公司赛迪智库软件产业研究所2017中国大数据产业发展白皮书1自2016年,中国大数据产业生态地图首次发布,在业内引起了很大的反响。如今一年时间已过,我们经过几个月的深入调研、研究,推出了2017中国大数据产业生态地图及白皮书。那么,与去年相比,中国大数据产业发生了怎样的变化?通过调查和研究,我们认为,与去年相比,2017年中国大数据产业最大的变化在于生态系统的完善。第一,从政策和政府支持层面,不仅有多项大数据产业发展政策出台,同时,各地也纷纷成立专门的大数据管理机构。过去一年,针对大数据产业发展的政策紧密出台,国家发改委、工信部、国家林业局、农业部以及各级省市政府都相继推出了促进大数据产业发展的意见和方案。而且,与以往相比,过去一年出台的大数据政策规划正逐渐向各大行业和各细分应用领域延伸,这表明我国大数据产业正大踏步进入应用时代。第二,从大数据企业自身发展方面,企业对于大数据的投入和研发持续加强,同时,更加注重合作和行业应用。第三,从用户层面来看,行业用户对于大数据的认识和接受度明显提升,一些企业已经开始应用大数据技术来进行业务和商业模式创新。特别是在金融、电信、政府、制造、教育等行业,大数据的成功应用案例不断涌现。这将会对大数据在国内行业市场的推广和落地带来巨大的推动作用。第四,从人才方面来看,随着越来越多的高校开设大数据专业,一直困扰中国大数据产业的人才问题,将会在未来几年内有望得到缓解。第五,从资本层面来看,投资方对于大数据企业的投资十分活跃,而且,在投资的同时,投资企业也在市场、管理等方面来帮助大数据企业进行提升。从投资事件和额度来看,过去一年中国大数据产业的投资增长迅速,情况显著好于美国。有了资本的推动和助力,国内大数据企业在产品研发、市场拓展等方面的投入力度也在不断加大。第六,人工智能产业的迅速升温也带动了大数据产业的发展。2017年国内人工智能产业成为各方关注热点,国务院也专门出台了人工智能产业发展规划,相信在未来几年内,国内人工智能产业将会迎来爆发式增长。作为人工智能产业发展的核心和基础之一,国内大数据产业也势必会水涨船高。当然,过去一年,国内大数据产业在快速发展过程中也暴露出一些问题,比如:大数据交易市场仍存在不规范、混乱的问题;大数据企业因快速发展,在管理、组织文化建设等方面仍存在短板等等,但总体而言,瑕不掩瑜。相信随着中国大数据产业生态系统的不断完善,在产业链各环节的共同努力下,中国大数据产业的发展必将日益健康、繁荣,中国的大数据企业也必将在世界舞台上占据一席之地。序2017年《中国大数据产业生态地图》白皮书23数据服务、基础支撑和融合应用相互交融,协力构建了完整的大数据产业链。●基础支撑层是整个大数据产业的引擎与核心,它涵盖了网络、存储和计算等硬件基础设施,资源管理平台、以及各类与数据采集、预处理、分析和展示相关的方法和工具。从数据流动的角度来看,除去硬件设施(网络、存储和计算)和资源管理平台,大数据架构还包括:前端的数据采集、中端的流处理、批处理、即时查询和数据挖掘等服务,以及末端的数据可视化服务。●在基础支撑层之上,融合应用层包含了与政务、工业、农业、金融、交通和电信等行业紧密相关的应用软件和整体解决方案。●数据服务层,则是围绕各类应用和市场需求,提供辅助性的服务,包括数据交易、数据资产管理、数据采集和预处理、数据分析和可视化、数据安全等。大数据产业链2017年《中国大数据产业生态地图》白皮书4在大数据蓬勃发展的浪潮下,传统的IT企业在寻求业务转型,而其他产业中的企业则在寻求数字化应用以促进业务的再腾飞。大数据产业链的三个层次(基础支撑、数据服务和融合应用)为上述企业的发展提供了广阔的空间。(1)对于传统的IT企业,它们可以在基础硬件、网络资源管理、基础软件等领域持续发力,升级传统业务,构建与大数据产业环境相匹配的新产品和新服务。对于新成立的大数据企业,它们则应该大数据产业生态地图5紧跟行业发展脉搏,从应用软件和解决方案入手,开拓新业务线。(2)对于传统产业中的企业,未来可以紧跟大数据产业发展趋势,结合业内新兴技术和思想变革既有业务模式。例如政府、金融、工业、医疗、农业、电信和交通等领域的企业可以结合各自的业务特色,整合并推动自身的大数据项目落地,逐步变革业务模式,促进企业数字化转型发展。(3)大数据产业生态中第三方数据服务提供者(如具备相关能力的企业和政府等组织)可以通过参与数据交易、数据采集加工和数据安全等业务,助推产业发展。2017年《中国大数据产业生态地图》白皮书6大数据产业增长迅速,产业规模持续放大。●基础支撑层,作为整个大数据产业链的核心环节,其2016年的规模为1335亿元,预计2017的规模为2246亿元,增长68.2%。而到2020年,这一产业的规模将达10700亿元。●融合应用层,是大数据产业未来迅速发展的着力点,其2016年的规模达到13000亿元,预计2017的规模为16998亿元,增长率为30.7%,到2020年,其规模将达38000亿元。●数据服务层,是围绕各类大数据应用需求,提供的辅助性的服务,2016年的规模达到202.9亿元,预计2017的规模为326亿元,增长率为60.6%,到2020年,其规模将达1350亿元。大数据产业规模增长迅速7调研发现,2016年大数据产业逐步形成了以京津冀、长三角、珠三角、中西部和东北地区为集聚发展区的发展格局,产业生态日渐成熟。京津冀地区发展情况最好,位列全国第一。珠三角地区仅此于北京,长三角地区发展水平也普遍较高。西部地区发展略微落后,但四川和贵州处于发展的领先地位。东三省中,辽宁处于领先位置,起到了一定的辐射带动作用。进一步考虑与区域大数据发展直接相关的政策、人才、投资和管理等要素,同样可以发现中国的大数据产业生态正加快完善和成熟。大数据产业区域集聚发展格局逐步形成2017年《中国大数据产业生态地图》白皮书82016年国家部委和各地方政府均出台了大量针对大数据产业发展的政策和建议,重点强调行业应用。国家部委层面,国家发改委、工信部、国家林业局、农业部,以及各级省市政府都相继推出了促进大数据产业发展的意见和方案,产业发展环境持续优化。各地方政府如贵州省、浙江省和福建省,也均在产业规划文本的基础上,大力推出相关的促进条例、实施计划和新区建设计划,拓展大数据应用案例的落地发展。大数据相关政策密集出台,行业应用是重点9从2016年教育部设立“数据科学与大数据技术专业”开始,截至目前全国分两批一共有32所高校开设了该项课程。该专业的课程体系相对完善,未来将为国家输出一大批专业素质高,应用能力强的数据科学人才。此外,部分高校开始推行大数据、云计算领域的校企合作办学,如2015年宁夏大学与AWS在本科教育实践领域加大合作,成立了亚马逊云计算学院。人才培养步入高速发展的通道2017年《中国大数据产业生态地图》白皮书102016年各省市政府积极布局大数据项目,投资项目增长迅速。从时间上看,除去春节假期和十一假期导致项目数略有下降以外,其余月份实施的项目均持续增长。从区域上看,广东、北京两地政府投资项目数领先,山东、河北、福建和江苏等东部省份位居全国前十,贵州省和河南省均有突出表现分列第三和第十。政府投资的大数据项目持续增长11继国务院颁布《促进大数据发展行动纲要》,工业和信息化部发布了《大数据产业发展规划(2016-2020年)》,各地方政府开始将大数据纳入地方经济社会发展规划。截至2017年6月,多个省、市相继成立了大数据管理和服务机构,统筹决策领导作用显著。政府加大对大数据产业的管理和服务力度2017年《中国大数据产业生态地图》白皮书12大数据的积累和应用条件也日益成熟。随着移动智能终端数量、IOT设备数量的快速增长,传统工业领域大数据项目的落地,以及各企事业单位信息系统数据的沉淀,经济社会可供采集和分析的数据量日益放大,为大数据分析奠定了基础。此外,单个硬件的计算和存储效率持续升高,为大规模计算的实施创造了可能。具体从大数据产业的时间演化来看:2005-2010年,第一波以金融、保险、银行、电信、电网、医疗为主的大客户群体陆续上线各类信息系统和业务系统,类似于ERP、CRM、OA、HIS等。按照3-5年的数据沉淀周期,大概到2013年形成了一定的数据规模。2012年左右,云计算和大数据等概念开始越来越多地被提及,以Hadoop为代表的数据分析架构、和以SAPBO、OracleBIEE和IBMCongos为代表的各类分析工具开始了企业级应用。2013年至今,贯穿数据采集、交互式查询、批处理、流处理、机器学习和可视化的大数据分析全流程得到广泛关注。与此同时,移动互联网快速发展,移动终端设备、IOT设备和工业设备量快速爆发,为大数据应用奠定了坚实的数据基础。在此背景下,各主要行业领域的大数据解决方案,以及相关软硬件供应商加速涌现,大数据市场快速进入应用阶段,结合具体业务场景的数据分析成为重中之重。大数据积累和应用条件日渐成熟13当前,大数据的应用场景日益丰富,金融、电信、政务、制造、智慧城市和物流等领域已成为大数据应用重点关注的对象。其他数据服务业务,如大数据交易、大数据资产管理、数据采集预处理、数据分析和可视化、大数据咨询、数据标准设立等,也在全国各地开始逐步兴起。整体而言,大数据的融合应用已开始在各行业普及,且其应用效益业已初步展现。大数据的应用场景日益丰富,应用效益初步显现2017年《中国大数据产业生态地图》白皮书14金融行业和电信行业由于信息化时间早,数据沉淀较为充足,在大数据应用方面领先其他各行业的发展。金融大数据方面,征信、风控和反欺诈是与金融业务对接紧密的三大应用领域。通过整合多渠道的数据,提取变量,构建大数据模型和用户画像,有助于定量评估客户信用、完善智能化和动态化的风控体系,推动智能身份识别和反欺诈。金融大数据还可以与统计学、机器学习、自然语言处理算法等相结合,推出以博取超额短期收益为目的的量化投资业务,以构建投资组合,收获长期收益为目的的智能投顾业务。此外,这些大数据还可以被用于促进精准营销,打造智能客服机器人。电信大数据方面,国内运营商通过内、外部应用同步拓展,实现了大数据在市场营销、网络优化和运营管理上的应用,并以金融等垂直领域为试点,拓展数据变现渠道。●从对外业务来看,国内外运营商存在部分差异。零售、医疗和智慧城市是国外运营商主要的大数据应用领域。金融和政府是国内运营商主要的大数据应用领域。运营商主要从基础设施供应(如云数据中心等)和数据服务供应着手,拓展业务。当前,基于用户属性、使用行为和位置信息形成的用户画像和人群模型,为各垂直行业的合作方提供了精准营销、客流统计、商业选址、信用分析、安全预警等数据支撑服务●对内业务则是国内运营商持续发力的重点,内部应用业务开展的更为深入和广泛,相关业务包括基于用户画像的精准营销、流失预警、网络优化、服务优化等。典型企业除去三大运营商自营的部门外,还有很多通信行业的服务提供商参与,如思杰、思科、华为和神州泰岳等。金融大数据和电信大数据持续领跑行业应用15随着中国智能制造2025战略的落地和推广,以及中国对政务效率提升的要求,工业大数据和政务大数据将成为未来大数据产业发展的热点。从工业大数据的发展来看,德国工业4.0、美国CPS和中国智能制造2025都不约而同地指向了工业领域的数字化和智能化。在此背景下,以实现自省性和自比较性为目标的智能装备制造、以实现无忧生产为目标的智能工厂、以全产业链协同优化为目标的智能服务,成为支撑新一轮工业转型升级的关键点。这些领域的典型的企业有Cosen带锯机床、丰田DENSO工业机器人、红领西服、GE的Predix工业互联网开放平台、中国船舶工业集团公司的船舶产业链智能管理系统等。从政府大数据角度来看,数据的采集和管理是难点,政府的各类数据存在丢失、难以共享、质量差、格式不统一、存储混乱、分析复杂度高等弊病。通过应用新