广东省大数据标准体系规划与路线图(2018-2020)(征求意见稿)指导单位:广东省经济和信息化委员会编制单位:广东省大数据标准化技术委员会工作组二〇一八年五月一、广东省大数据标准体系(一)编制原则以《广东省促进大数据发展行动计划2016-2020》及《珠江三角洲国家大数据综合实验区建设实施方案》为基础,以继承、发展、创新、提高为出发点,全面梳理国际标准、国家标准、行业标准及地方标准,结合大数据技术及产业发展现状与趋势分析,建立适应广东省大数据产业发展需求的标准体系。标准体系建设遵循以下原则:急用先行、成熟先上。对大数据领域急需的开放共享、交易流通等标准重点投入,先行研制;对国内外已有的数据分析、处理、数据质量、数据安全等相关国际标准及研究成果,优先支持等同转化。面向需求、注重实效。从产业信息化和产业数字化发展的要求出发,面向我省电子政务、电子商务及重点行业的数字化服务需求,把规范服务行为、提升服务质量、培育新型服务模式为抓手,调动行业各参与方推进标准化工作的积极性,提升标准的科学性、合理性和有效性。资源整合、统筹规划。以培育并形成完善的大数据服务市场为总体目标,明确标准化工作思路、内容及具体的推进措施,整合数据资源,统筹产业规划,破除数据孤岛,强化应用服务,保障大数据标准服务体系目标清晰、技术可行、结果可见。(二)标准体系框架图大数据标准体系1技术0基础3工具2安全21通用要求22隐私保护.....5管理4应用.....51数据运维52数据治理43数据交易41数据开放13检测与评估12处理与分析关键技术11数据质量.....45数据应用42数据共享44数据访问06语义分析03参考架构02术语05元素集04元数据01总则32应用类工具31系统类工具......132风险检测.............311平台基础设施312预处理工具314分布式计算工具315数据库316平台管理类工具313存储类工具321应用分析智能工具322可视化展示工具........421数据开放总则422数据开放目录423数据开放平台.....131模型评估.........451电子政务大数据454科学大数据452工业大数据453电子商务大数据大数据标准体系框架图..........111通用数据112主数据113事务数据114产品数据121数据收集122数据预处理123数据分析124数据可视化.....125区块链.....07分类分级(三)标准体系说明1.标准体系设计依据按照国家《信息化发展战略纲要》、《关于促进大数据发展行动纲要》、《大数据产业发展规划(2016-2020年)》、《关于运用大数据加强对市场主体服务和监管的若干意见》及广东省《广东省促进大数据发展行动计划(2016-2020年)》、《珠江三角洲国家大数据综合试验区建设实施方案》等政策文件对标准化工作的要求,制定广东省大数据标准体系。标准体系共划分为“基础—技术—安全—工具—应用—管理”等6个子体系。2.标准体系框架明细标准体系采用树形结构,分层级展开,层与层之间是包含与被包含关系,平行层之间是平行并列关系。第一层是大数据通用标准体系。包括基础类标准(0)、技术类标准(1)、安全类标准(2)、工具类标准(3)、应用类标准(4)、管理类标准(5)。第二层的分类情况及原则如下所述:(0)基础标准为整个标准体系提供包括总则、术语、参考架构、元数据、元素集、语义分析、分类分级等通用的基础性标准。(1)技术类标准主要是对大数据相关的技术进行标准化规范。包括:数据质量标准、数据处理与分析关键技术标准、数据评估技术标准等。其中数据质量标准主要参考ISO8000数据质量系列标准,该系列标准主要是对数据质量的把控,并根据当前我省大数据产业发展需求,等同或修改后采用国际标准;数据处理与分析关键技术标准主要是针对数据从收集到使用过程中的关键技术进行规范;检测与评估技术主要是针对数据挖掘过程中的方法和工具及数据本身进行的包括模型、风险、等保等方面的评估。(2)安全类标准主要是针对通用的安全和大数据环境下隐私数据的保护,其中通用要求基于信息安全技术的系列标准;隐私数据则重点针对智能移动设备存储数据及与信息主体利益密切相关的数据。(3)工具类标准主要是从数据使用过程中的过程性工具和终端应用类工具进行规范,主要包括系统类工具和应用类工具;系统类工具标准细分为平台基础设施、预处理工具、存储类工具、分布式计算工具、数据库、平台管理类工具等;应用类工具包括应用分析工具、可视化工具等。(4)应用类标准从发挥数据价值的角度出发,将应用分为数据访问、开放、共享、交易及行业应用等环节。行业应用类标准主要针对电子政务、工业、电子商务、医疗、科研等领域共性或专用的大数据应用标准进行研制。(5)管理类标准是大数据标准的重要支撑,贯穿于数据生命周期的各个阶段。该部分主要是包括数据运维和数据治理,其中数据运维包括数据库维护、运行维护、运行安全及大数据系统及相关工具等方面的运维及服务等方面的标准;数据治理包括数据资产管理、大数据解决方案设计、数据管理能力成熟度评价等。二、广东省大数据标准制修订建议表根据广东省大数据标准体系框架,通过广泛征集广东省大数据相关高校、科研院所及企业的标准制定修订意见、标准制修订需求、参与研制大数据标准的意愿以及国际标准、国外先进标准、国家标准的实施情况、制修订规划和研究重点,并结合当前广东省大数据产业发展的现状及重点范畴、技术研发趋势、产业市场需求,提出广东省大数据产业标准制修订工作的标准建议项目表。同时经对制修订建议标准的重要性和紧急性进行技术比对、市场调研、专家研讨等工作,收集192项大数据相关的标准(其中国标已发布8项,已立项37项,拟研制60项),并综合分析整理出了标准制修订优先级,优先级用★表示,★越多表明重要性越高,推荐级别越高。优先级的确定依据安全性、可靠性、适用性的通用标准级别高于产品标准;重点产品、共性技术标准级别高于普通产品;成熟技术或产品标准高于在研技术或产品;国际标准采标以我省当前大数据产业发展现状综合评级等原则进行星级评估。序号一级分类二级分类标准名称优先级备注10基础标准01总则大数据标准化指南国标拟研制2大数据总体规划指南302术语信息技术大数据概念术语--GB/T35295-2017已发布4非结构化数据管理术语503参考架构信息技术大数据技术参考架构--GB/T35589-2017已发布6信息技术大数据参考架构第1部分架构与应用指南ISO/IECTR20547-17信息技术大数据参考架构第2部分用例和需求ISO/IECTR20547-28信息技术大数据参考架构第3部分参考架构ISO/IECTR20547-39信息技术大数据参考架构第4部分安全与隐私ISO/IECTR20547-410信息技术大数据参考架构第5部分标准路线图ISO/IECTR20547-511信息技术大数据基于参考架构下的接口框架国标在研20171083-T-4691204元数据信息技术数据元素值格式记法--GB/T18142-2000已发布13信息技术数据元素值表示--格式记法国标在研20101507-T-49614信息技术元数据属性国标在研2010-3325T-SJ1505元素集大数据最小数据集规范16教育数据元素集17金融数据元素集18交通数据元素集19食药监数据元素集2006通用要求大数据通用数据资源规范21信息技术大数据分类指南国标在研20171082-T-46922非结构化数据查询语言231技术01数据质量信息技术数据质量评价指标国标在研20141203-T46924数据质量检测技术要求25数据能力成熟度评价模型国标在研20141184-T46926大数据解决方案基本评估规范国标拟研制27信息技术科学数据引用国标在研20141194-T46928数据溯源描述模型国标在研20141202-T469序号一级分类二级分类标准名称优先级备注291技术01数据质量信息技术数据溯源描述模型--GB/T34945-2017已发布30主数据的语法和定义ISO8000-11031主数据源ISO8000-11032主数据准确性ISO8000-11033主数据完整性ISO8000-11034多媒体数据语义描述要求--GB/T34952-2017已发布3512处理与分析关键技术通用数据导入接口规范国标在研20141204-T46936大数据通用数据采集要求37大数据存储格式通用要求规范38大数据分布式存储参考模型第1部分:概述37大数据分布式存储参考模型第2部分:基本概念38大数据分布式存储参考模型第3部分:体系结构39大数据存储数据库第1部分:体系结构43大数据存储数据库第2部分:数据规范44大数据通用资源描述及信息数据编码规范45数据预处理的基本技术要求46信息技术大数据分析总体技术要求国标拟研制47大数据分析过程模型参考指南49大数据平台通用软件开发工具包规范50信息技术大数据互操作技术指南国标拟研制512安全21通用要求区块链安全标准体系研究国标拟研制52基于区块链的电子货币安全技术标准研究国标拟研制53信息技术大数据安全参考架构国标拟研制54信息技术大数据安全分级指南国标拟立项55信息技术大数据脱敏指南国标拟立项56信息技术大数据系统软件安全技术要求国标拟立项57信息技术大数据跨集群安全技术框架国标拟立项序号一级分类二级分类标准名称优先级备注582安全21通用要求信息技术大数据平台安全技术要求国标在研59数据安全能力成熟度模型国标在研60政务信息共享数据安全规范国标拟立项61政务信息资源安全分级指南国标拟研制62工业互联网平台安全要求及评估规范国标拟研制63大数据服务安全可控评价指标国标拟研制64混合云安全技术要求国标拟研制65网络安全态势感知数据规范国标拟研制66政务信息共享安全标准体系研究国标拟研制67能源企业大数据应用安全防护指南国标拟研制68人工智能安全标准研究国标拟研制69云服务数据安全指南国标拟研制70个人信息告知同意指南国标拟研制71政务云网络安全服务接口指南国标拟研制72工业互联网平台安全标准体系研究国标拟研制7322隐私保护信息安全技术大数据中的隐私保护框架国标拟立项74信息安全技术个人隐私保护评估方法国标拟立项75个人信息安全影响评估指南国标拟立项76信息安全技术个人信息保护管理要求国标在研20130323-T46977信息安全技术移动智能终端个人信息保护技术要求--GB/T34978-2017已发布78信息安全技术个人信息保护指南国标拟研制79具备数据留存功能的网络安全产品个人信息保护测评技术要求研究国标在研803工具31系统类工具信息技术大数据存储与处理平台技术要求国标在研20171598-T-46981信息技术大数据存储与处理系统功能测试规范国标在研20171081-T-46982信息技术大数据分析系统基本功能要求国标在研20160597-T-46983信息技术大数据分析系统功能测试规范国标在研20171065-T-46984大数据系统建设及操作指南规范序号一级分类二级分类标准名称优先级备注853工具31系统类工具智能硬件通用大数据接口规范国标拟研制86信息安全技术大数据面向大数据应用的基础计算平台基本性能要求国标在研20171066-T-46987实时数据库通用接口规范国标在研20141183-T46988非结构化数据查询语言89信息技术大数据系统通用规范国标在研20171082-T-46990健康医疗大数据平台安全技术指南国标在研91非结构化数据访问接口规范