——2016中国大数据产业生态大会——2016.8.2钱国显暨中国大数据产业生态联盟成立大会第2页9:5010:3010:5011:309:00开幕致辞:中国电子信息产业发展研究院院长卢山工业大数据:中国工程院院士孙家广投资人眼中的大数据生态:达晨创业投资有限公司董事长刘昼主旨报告:北京大学教授、工业和信息化部原副部长杨学山标准建设助力国家大数据战略实施:北京理工大学副校长梅宏积极应对制造业成本新变化,增强我国制造业竞争力:赛迪智库工业经济研究所所长秦海林13:35……会议议程大数据生态现状大数据标准化实施国家大数据战略抓好大数据标准化体系建设助力国家大数据战略实施数据的指数增长模式:2003年全球产生数据仅5百万TB2009年全球产生的数据约8亿TB2012年全球产生数据约27亿TB2020年全球生产数据预计440亿TB信息化3.0以数据的深度挖掘与融合应用为特征的智慧化阶段2015年9月5日,国务院发布《促进大数据发展行动纲要》●2014年12月2日,全国信息技术标准化技术委员会大数据标准工作组成立●2016年5月大数据标准工作组发布《大数据标准白皮书2016》我国大数据生态状况大数据基础设施与分析技术主要依赖国外开源软件,但应用定制能力明显加强大数据分析基础与核心算法基本源自国外学术界,主要进行面向应用的优化互联网大数据应用达到国际先进水平,但政府行业数据开放程度低,学术界核心技术与算法理论研究大多面向应用中美大数据发展对比中国大数据处于农业时代,数据手工开采、生产率低;数据自给自足,极少交换美国大数据处于工业化萌芽,数据自动开采、生产率高;数据追求价值,分工交换大数据发展行动纲要解读《纲要》着重强调开放、共享、安全,体现国家层面统筹布局,并已形成分阶段目标体系统筹规划大数据基础设施建设大力推动政府部门数据共享稳步推动公共数据资源开放●跨部门数据资源共享共用格局基本形成●建成政府主导的数据共享平台,并在部分领域开展应用试点●实现政府数据集的普遍开放,形成一批有国际竞争力的大数据产品和企业,实现关键部门、关键数据自主可控大数据开放共享前景展望《纲要》十大工程1.政府数据资源共享开放工程2.国家大数据资源统筹发展工程3.政府治理大数据工程4.公共服务大数据工程5.工业和新兴产业大数据工程6.现代农业大数据工程7.万众创新大数据工程8.大数据关键技术及产品研发与产业化工程9.大数据产业支撑能力提升工程10.网络和大数据安全保障工程大数据产业将从自给自足的自然模式进入开放交换的工业模式数据生产数据开采数据处理数据分析数据价值大数据标准化实践1:开放、共享大数据标准研制面向政府需求,研制支撑数据开放共享的技术与管理标准,推进大数据资源建设2:大数据应用领域标准研制面向产业、行业需求,选择典型领域制定相关标准,助力产业创新发展与新兴业态培育3:大数据安全标准研制面向国家安全保障需求、个人隐私保护需求,制定标准保障大数据产业健康发展依托国家大数据战略,率先研制《纲要》开放、共享大数据标准电子商务大数据拟立项采集规范、仓库模型规范、应用指标体系;工业大数据拟立项服务标准化和实验验证系统、制造业产品元数据规范●面向国家安全●面向个人隐私与保护大数据产业链条融合应用产业基础支撑产业数据服务产业政务大数据民生服务大数据工业大数据农业大数据金融大数据零售大数据交通大数据电信大数据大数据硬件大数据计算大数据安全产品大数据可视化产品大数据存储管理大数据预处理软件大数据整体解决方案数据采集数据交易数据应用数据增值服务基于大数据的信息服务大数据主要技术数据可视化数据分析挖掘数据存储数据预处理数据采集●2D法●时间可视化●多维法●层次法●实时处理●Spark●Storm●机器语音●R语言●关联分析●用户画像构建●推理预测●知识图谱●NLP●R语言●关联分析●分布式架构●Hadoop●MapReduce●数据库体系●NoSQL●NewSQL●MPP混合架构●Lambda架构●数据清洗●遗漏值处理●噪音数据●数据集成●实体识别●数据冗余●数据归约●维度归约●数值归约●硬件采集●传感技术●RFID●软件采集●系统日志抓取●企业特定API、网络众包大数据核心能力布局融合服务数据采集平台计算数据存储信息安全保障数据挖掘数据资源规划可视化展现工业大数据的主要来源:工业大数据,是指工业领域所产生的海量数据,包括信息化数据、物联网数据、以及跨界数据。信息化数据网络数据、文档、图纸、模型、视频等物联网数据数控、电子、机械等跨界数据气象、地理、环境等工业大数据信息化大数据应用与服务数据源:企业或组织互联网数据第三方数据•内部运行数据•营销数据•新闻、博客、论坛•社交媒体、移动APP•评论•行业统计•指标•调查报告互联网数据概况:新浪微博10亿账号微信公众号超800万百度贴吧超2000万国内备案网站数超450万移动APP超300万Google等境外网站应用等信息化大数据应用方向舆情监测网络调研精准营销人物画像竞争分析新闻素材企业征信多元商业模式数据交易软硬件销售第三方数据服务融合信息服务大数据多元商业模式:大数据多元应用:数据应用模型语料库+算法模型+人机互动模型优化文本情感模型舆情预警模型口碑分析模型政策评估模型城市形象模型其他细分行业模型人物画像模型人物画像真实信息言论倾向网络信息网络行为习惯活跃度大数据信息安全大数据安全挑战■过去的安全防护方案无法满足大数据业务、技术要求实时在线计算:传统加解密的防护措施成为计算性能的瓶颈海量数据的访问控制需要动态的数据权限功能来满足安全管控要求实时的数据流动,传统的安全管控机制,如:安全监控、流程审批等存在局限性频繁的数据流转和交换,使得数据泄露不再是一次性的,通过二次组合非敏感的数据可以形成敏感数据,造成敏感数据泄露■新的安全挑战亟需新的安全解决方案在法律、管理及技术上如何的有效保护用户隐私通过数据分析所形成的更有价值的衍生数据,如何进行敏感度管理数据加工过程中需要使用大量敏感数据,如何保障数据在加工过程中对使用者不可见分布式的计算节点易被伪冒攻击,如:欺诈、重放、DOS等数据混合计算,如何确保数据资源在存储、计算等过程中的安全隔离Thanks—2016中国大数据产业生态大会—