医药卫生科学数据共享网政策与法规系列文档科学数据资源管理方式(征求意见稿)(本稿完成日期:2008年5月)医药卫生科学数据共享管理机制课题组MSDS/T×××—20080第一章科学数据资源管理科学数据资源是科学数据共享的内容体现,要围绕科学数据用户对科学数据资源的实际需求和应用进行科学合理的分类、处理与服务。第一条数据分类数据分类须根据数据内容和表现形式、数据的加工形态进行划分,以确定数据资源的管理方式。1.按数据内容和表现形式分类科学数据按照数据内容和表现形式划分为地理数据、文本数据、元数据、其他数据。地理数据:指和空间地理位置相关的、以空间坐标表达的数据。文本数据:地理数据的属性数据、文字与表格表现形式的数据。元数据:核心元数据须参见科学数据共享工程技术标准《科学数据共享核心元数据》,涉及地理信息的扩展元数据须参见中华人民共和国国家标准《地理信息元数据》,其他扩展元数据可参见相关领域元数据标准。2.按数据的加工形态分类科学数据按照数据的加工形态划分为原始数据、基础数据、加工数据和深加工数据。原始数据:指通过直接观测、监测、遥感、调查等手段直接获取的未经任何处理的原始记录,这些数据可能不能为用户所直接使用。基础数据:指经过简单加工处理而生产的可以直接为用户所使用的数据。加工数据:对基础数据进行进一步加工处理和统计分析的数据。深加工数据:为专一、特殊用途、特定用户特别加工处理的数据。3.数据保密分级根据《GB/T7156-1987文献保密等级代码》,将数据划分为6个保密级别,分别为公开数据、国家内部数据、部门内部数据、秘密数据、机密数据、绝密数据。(1)公开数据:指数据可以向国外提供,可以进行国际交换。也就是可以提供国际范围共享的数据,该类数据主要包括那些国家间、地区间及国际机构相互交流、使用的数据。(2)国家内部数据:指数据可以在国内提供和交换。(3)部门内部数据:指数据可以在系统或系统某部门进行内部发行和交换。(4)保密数据:指数据内容涉及国家一般秘密的数据。MSDS/T×××—20081(5)机密数据:指数据内容涉及国家重要秘密的数据。(6)绝密数据:指数据内容涉及国家核心机密的数据。第二条数据存储(1)数据存储应遵循数据共享的原则,采取分布式网络存储为主,集中式数据存储为辅的方式。(2)数据本身的管理采用元数据管理方式,应采用统一标准的元数据管理工具进行元数据库的管理和维护。第三条数据更新建立有效的数据更新方式,实现数据的定期、有效更新。按照事件数据的发生周期进行数据的定期更新。具体要求见下表。数据项更新周期备注变更周期较长数据根据数据的更新周期确定若干年更新一次变更周期为1年以上年度数据每年更新一次年中数据每半年更新一次更新周期为半年的数据季度数据每个季度更新一次月度数据每月更新一次每周数据每周更新一次每天数据每天更新一次即时性数据事件发生后1小时之内更新或按照行业更新要求对数据的实时性要求较高,短期内需公布的数据当更新数据量累积超过原有共享数据存量的5%或每三个月,各单位应将加盖单位公章的数据更新报告提交科学数据共享工程办公室备案。第四条数据备份管理(1)具有高可靠的、规范性的备份管理体系。(2)实现数据的全自动备份、跨平台集中管理。(3)对介质的有效管理、数据的自动恢复、历史数据归档。(4)网络数据库是系统运行的重要部分,每周应进行一次备份操作,以防止由于系统意外故障造成数据信息丢失。MSDS/T×××—20082第五条数据资源整合、改造、重组由于数据共享原有各类数据和信息基本是按照专业技术人员的实际使用特点进行加工和建库的,数据的显示和查询等应用一般只能由专业技术人员操作,不适合各个行业共享应用的要求,因此需要进行针对性的整合、改造和重组。1.在数据库规范的基础上规范化改造(1)动态显示框架设计与应用专题图层实现。(2)根据设计框架模板,对数据库进行结构优化和重组。(3)根据专题图显示要求,对专题信息进行跨库重组。并开发相应的数据库管理、查(4)多源数据的格式统一、标准统一、库结构统一,实现统一的数据资源接口。2.数据资源整合针对数据库中各类数据基本上处于单层数据状态,必须对数据层与数据层之间进行整合。(1)行政区划变更引发的数据变动的整合。(2)不同图层间因投影方式不统一引发的数据标准问题的整合。(3)多数据层之间整合,这些数据层无法叠加在一起,只能分别以单数据层方式显示,特别在需要将某些数据层合并时,由于标准不统一会发生大量数据丢失现象,需要加以整合。(4)多种比例尺、矢量与非矢量的数据无缝连接与整合。3.非结构化数据的改造和重组针对段数据库建设中,收集了大量非结构化资料,必须设计新的数据结构来管理和查询类似资料,并实现聚焦型查询和应用。(1)按照一定固定查询条件将非结构化资料进行分类。(2)以基础地理数据为底图进行拼合。(3)按照基本应用数据层进行信息加工。(4)遵循行业应用特点进行重组和再分解。(5)将拼合、分解后的数据进入数据库,进行统一管理。4.面向对象的数据应用根据数据使用对象的不同,设计针对不同用户特点的几类数据终端查询程序和查询界面,并设计不同的用户授权模式和检测程序。第二章数据产出与服务为了保证国家科学数据中心科学数据的共享交换,必须遵循统一的数据标准MSDS/T×××—20083和规范,按照统一的数据服务模式,优先采用国家、行业标准,积极采用国际标准,结合实际的数据产出与服务,进行数据产品的管理与发布。第六条数据产品管理(1)建立规范化的数据产品管理机制,保证共享系统的健康持续发展。(2)数据产品的格式为公开的交换数据格式。(3)数据产品包括光盘介质、纸介质。(4)数据产品的提供须和用户的使用权限建立对应关系,具有无偿使用科学数据权限的用户应无偿提供给用户;其余用户双方建立协议关系提供数据产品。第七条用户分类根据共享用户对数据的使用性质对用户分为四类,分别为公务用户、公益性用户、经营性用户和公众用户,对四种用户分别设立不同权限。(1)公务用户:为政府部门开展公务活动而使用科学数据的用户为公务用户。公务用户作为政府职能的实际行使者,具有最大限度无偿使用科学数据的权利。(2)公益性用户:科学研究、教育等为社会公益性事业非营利性服务而使用科学数据的用户为公益性用户。享受最大限度无偿使用科学数据的权利。(3)经营性用户:社会中为营利性活动使用科学数据的用户,为经营性用户。双方建立一定的协议确认使用科学数据的权利。(4)公众用户:在日常生活中使用科学数据的一般社会公众用户,为公众用户。可公开发布的、能够满足公众用户一般需求的科学数据须面向公众用户无偿发布。第八条数据发布基于网络和GIS技术建立B/S结构的数据共享网站,实现基于浏览器的共享数据快速浏览、下载和应用。服务要面向国内和国际用户,建立中文和英文网站,必要时要建立专门网站。(1)地理数据的发布以WEBGIS方式发布,并可以为权限用户提供查询、下载服务。(2)元数据的发布应为所有用户提供查询、下载服务。(3)文本数据的发布应为权限用户提供查询、下载服务。(4)下载数据的格式应为公开的数据交换格式。(5)提供专业的数据应用工具下载服务。(6)应提供用户多种直接进入数据库的途径,至少应包括:通过搜索引擎检索结果进入方式、通过元数据进入方式、通过数据分类进入方式等。MSDS/T×××—20084(7)应提供符合本科学数据中心(网)数据检索、查询特点的搜索引擎。搜索结果除列表显示外,还应当向用户提供缩微图查询方式或多行数据内容的表结构浏览方式等多种信息展示服务模式。第九条数据开放性服务(1)根据用户的权限提供对数据的检索查询服务。(2)对于某些特殊要求的用户,系统可以作为一个开放实验室的方式,可以提供给这些用户进行使用。第十条数据加工(1)系统具有对原始数据进行不同层次的加工的能力,以便于维护系统数据,同时为不同的用户提供数据特殊加工服务。(2)数据加工包括对局部数据的合法性校验、数据纠错、坐标配准、空间数据和属性数据的匹配、地理数据拼接等;对数据的提取、统计分析,产出不同专题的数据等;为特殊用户加工特定要求数据等。(3)系统可以合理的方式提供打印介质、光盘等输出介质的服务。第三章数据共享技术平台管理作为国家科学数据共享平台的核心内容,必须健全并完善管理国家部门、行业领域的数据共享基础平台,以及与之相关的技术标准、规范、信息安全等。应该坚持5个原则:规范化、网络化、实用化、可扩展、安全性。共享系统设计的响应处理能力应至少满足30个并发用户查询、浏览、下载数据的需要。第十一条机房条件保障1.机房场地和环境具有独立的机房作为工作场地,面积应不小于100-150平米;空间环境(包括温度、湿度、空调、通风、噪声、尘土等一系列指标)等各方面环境因素保证计算机运行的稳定。机房的环境要符合中华人民共和国国家标准《电子计算机机房设计规范GB50174-93》(1993年2月17日国家技术监督局、中华人民共和国建设部联合发布1993年9月1日实施)。2.机房安全机房电源环境要做到防火、防水、防雷、安全用电和烟雾探测报警。配备大型UPS电源,保证服务器的不间断供电。配备安装机房监控系统作为保障。对配电系统、环境系统、消防系统、保安系统、网络系统进行监测、监视、报警。配备应急照明设备。MSDS/T×××—20085各种设备应有专人负责定期检修。3.机房管理规定建立、健全机房管理制度,制订管理细则。凡进入机房的人员必须遵守机房管理制度。第十二条网络平台管理1.基本原则网络设计必须满足以下基本原则。硬件配置满足系统功能和性能的要求,必须保证系统运行的实时性、可靠性、稳定性和安全性;计算机和网络设备必须是标准化设备,开放性能好,满足不断优化、平滑升级和投资保护的需要;系统中的关键部分满足冗余配置。2.主干网主干网要求高带宽、高速度,达到千兆以太网以上;同时,具备高可靠性、高安全性和易扩展性、易升级性。为了保证数据网络的整体性和连通性,下一级数据网络的技术体制必须与上一级兼容。网络将设置与Internet相连的统一出口,要求其链路带宽不得低于10Mbit/s。3.互联协议互联网接入采用TCP/IP协议。4.域名规划按照科学数据共享工程总体设计,规划国家科学数据中心、分中心的域名,由科学数据共享工程办公室统一管理并授权使用。5.备份网络信道定期测试网络备份信道的连通性和工作性能,保证网络畅通以及和异地备份系统的连接。第十三条硬件系统管理1.网络设备局域网核心数据交换机须满足网络系统的高速性能、可靠性、可扩展性、开放性、安全性和先进性。须定期进行网络连通测试和性能监测等,确保网络的连通效率和使用效率。MSDS/T×××—200862.服务器对国家科学数据中心所配置的专用业务服务器,包括互联网应用、数据库、数据库备份、用户应用服务等的功能须明确划分,并与实际使用相符合。须定期监测各专业应用服务器的运行情况、性能和效率。3.存储设备存储设备是为满足海量数据(TB级)、大量的I/O吞吐及高端应用存储需求而设置的。须定期监测存储设备的使用情况,定期进行效能优化处理。第十四条软件系统管理1.操作系统操作系统属于底层支撑系统,要求由专门的管理人员来维护,定期对系统进行升级、修补系统漏洞,监测和优化操作系统与数据库系统及其他应用软件的工作效能。2.数据库数据库的管理采用分布式结构管理,并严格遵循国际开放标准和规范。定期对数据库进行必要的监测和优化,提高检索速度,完善备份恢复策略。3.应用软件应用软件是数据共享系统的核心支撑平台,涉及种类很多,包括WebService、WebGIS、GIS、数据处理等,也涉及到多个厂商的技术支持。对于这些软件的维护和管理须分门别类来进行,建立相应的维护流程,保证应用软件的可靠、高效运行。4.应用软件开发应根据业务的需求,遵照《共享系统软件设计规范》规定的步骤和方法进行。应用软件必须通过业务主管部门鉴定、验收,并经过一定时期的准业务运行后,方可投入正式业务运行。第十五条系统安全管理1.系统用户管理为了确保系统及数据安全,对系统所有用户进行统一的管理。技