中科院中科院中科院中科院““““十一五十一五十一五十一五””””科学数据库建设子项目指南科学数据库建设子项目指南科学数据库建设子项目指南科学数据库建设子项目指南一、一、一、一、指南说明指南说明指南说明指南说明依据中科院“十一五”信息化规划中建设数据应用环境的任务,现在我院“十一五”信息化专项中设立“中科院数据应用环境建设与服务”项目。项目根据“统筹规划,整合集成,公开共享,服务科研”的原则,将面向全院需求统筹规划数据资源中心建设,重点实现科学数据的整合集成与公开共享,强化数据服务与应用,推进科学数据在科研活动中的全面应用。其目标是优化我院数据应用环境,形成科学数据资源网格与共建共享机制,提升科学数据应用水平,成为支撑我院乃至我国科技创新的重要信息化基础设施之一。根据“中科院数据应用环境建设与服务”项目总体方案,项目的重点任务包括:1.数据资源中心建设数据资源中心建设数据资源中心建设数据资源中心建设:主要目标是面向我院重要数据资产备份、长期保存的需求,建设存储能力6PB以上的海量数据存储设施,初步形成全院统一的、健壮且可扩展的海量数据存储与应用支撑环境。2.科学数据库建设科学数据库建设科学数据库建设科学数据库建设:主要目标是整合形成一批重点数据库,形成科学数据资源网格,实现科学数据共建共享,重点形成若干个学科领域网格应用示范,推进科学数据在科研中高水平与深层次的应用。3.数据应用环境的应用与服务数据应用环境的应用与服务数据应用环境的应用与服务数据应用环境的应用与服务:面向应用需求,优选资源,对数据资源进行必要的加工整理,并形成持续发展的机制,使得数据资源中心变成一个优质资源的汇聚地。基于这些资源,提供广泛的服务,使数据增值,得到广泛应用。本指南涵盖科学数据库建设,由院信息化工作领导小组办公室(院信息办)公开发布,目的是遴选确定若干个主题数据库、专题数据库、参考型数据库及科学数据网格示范的承担单位及其对应的项目内容。二、二、二、二、注意事项注意事项注意事项注意事项1.本指南仅向院内单位公开发布。2.项目申请单位必须是院内法人单位。鼓励联合申请,牵头申请单位应与协作单位之间签订联合申请协议。3.项目申请必须针对主题数据库、专题数据库、参考型数据库、科学数据网格示范中的某一项任务。多于一项任务的项目申请将视为无效申请。4.项目申请的主要内容已获院信息化专项经费资助的,不再重复资助。5.对项目负责人的有关要求和规定:(1)应具备相应的工程及科研实力和基础。(2)必须具有中华人民共和国国籍,具有副高级以上专业技术职务的在职人员,并在所申报项目的技术方面有两年以上的工程或研究工作经历。6.对项目申请单位的有关要求(1)具有3年以上科学数据积累与建库基础。(2)具有相应的数据库建设与服务人才队伍。(3)接受院信息办的领导、管理与监督。(4)配套落实相应运维费。(5)承诺按照院数据应用环境建设与服务项目统一的标准规范、管理制度与运行机制为院内外用户提供数据共享服务。承诺建成的数据库及相关成果纳入我院数据资源中心统一管理与服务体系。(6)一个单位只能牵头申请一个数据库(主题库或专题库或参考型数据库)建设。鼓励联合申请。(7)签订任务书的同时,与数据应用环境建设与服务项目的总承担单位签订建设和运行服务协议,以确定各自的责任、权利与义务。7.申报程序(1)项目申请单位须按照中科院信息化专项项目课题申请书格式填写申请书,否则不予受理。申请书一式十份(盖单位公章),同时以电子邮件方式提交申请书的WORD文档。(2)项目申请单位须在申请截止日期前送达。(邮寄以寄出日期邮戳为准。封面注明:项目申请书。)8.受理截止日期2008年10月31日9.申请书送达地址:北京市西城区三里河52号中科院办公厅信息化工作处邮编:100864联系人:吴丽辉电话:68597554E-mail:wulihui@cashq.ac.cn三、三、三、三、指南内容指南内容指南内容指南内容1.项目目标面向重大科研应用需求,加强对长期积累数据资源的规范化整理与集成,形成若干个主题数据库、专题数据库和参考型数据库,通过数据整理,盘活存量数据资源,带动增量数据资源建设,形成科学数据资源体系;同时通过构建科学数据网格示范,支撑数据密集型应用,深化数据应用与服务,大幅度提升数据应用水平。通过“十一五”期间科学数据库建设,在院内形成科学数据资源共建共享的模式与机制,保障我院科学数据库持续稳定发展。2.项目主要建设内容(1)若干个主题数据库主题数据库是面向特定的学科或应用领域,由若干逻辑相关的数据库整合形成,具有统一的标准规范,并建立统一服务系统的重点数据库。通过主题数据库实现对已有数据库的整合与提升,更好地支持各学科领域的研究工作。主题数据库建设内容包括:按照规范的内容模型与数据模式,对被整合的数据库内容进行补充完善和规范化加工、整理;按照数据库之间的内在逻辑,将各数据库内容规范地纳入主题数据库,并保证主题数据库的内容与被整合数据库的内容的一致性;对主题数据库的数据质量进行控制与评估;建立数据服务平台,为用户提供统一的数据共享服务;按照我院科学数据共享政策的要求,分级分类共享主题数据库中的数据。主题数据库项目支持原则:面向学科发展的需求,按照统一的标准规范,对已有数据库进行整合;支撑本学科研究工作,推动本学科数据持续积累与整合;基于互联网提供数据共享服务;数据资源共建共享。(2)若干个专题数据库专题数据库面向重大研究计划或者项目,服务于重大研究计划或者项目的数据积累和科学研究工作,并逐步实现开放共享。专题数据库要针对重大研究计划和项目提出技术解决方案,不仅需要实现研究项目或者计划中数据的有效管理与集成,还需要实现数据库与模型的结合,提供数据应用的环境与工具,使得数据能够直接在模型中进行分析和计算。专题数据库建设内容包括:按照统一的内容框架与数据规范,对重大科研计划或者项目产生的数据进行加工、整理和入库;同时,面向重大科研计划或者项目需求,有计划地补充和集成外部数据资源;构建数据应用环境,不仅提供统一的数据访问服务,而且满足科研人员数据分析、计算与可视化的需求;对专题数据库的数据质量进行控制与评估;按照我院科学数据共享政策的要求,在一定范围内有计划地共享数据。专题数据库项目支持原则:具有重大的应用背景,科研应用中产生丰富的数据资源,并按照统一的标准规范对数据资源进行整理与集成;对科研应用具有关键性的支撑作用;提供方便、易用的数据应用环境;提供一定范围的数据共享服务,并具有明确的数据公开共享计划。(3)若干个参考型数据库参考型数据库是以我院有特色、有长期积累的数据库为基础,建成符合国际或国家标准、有严格质量控制与管理、具有完整性和权威性的数据库,是对数据进行标准化和产品化深加工后形成的相对完整的数据集。参考型数据库服务于广泛的用户群体,是我院多年来积累的特色资源,要求数据规范、数据质量有保证、学科内容权威。参考型数据库建设内容包括:按照通用的数据标准或者规范对数据进行加工、整理,统一纳入参考型数据库;采取严格的数据质量控制措施,保证进入参考型数据库的数据质量;构建统一的数据服务平台,面向全社会提供便捷的数据共享服务。参考型数据库项目支持原则:具有自有的、丰富的数据资源,并能按照国际、国家或者行业标准对数据进行规范的整合与集成;是科学研究中的基础性、权威性数据;具有形成数据产品的潜力;能提供多种方式的、面向全社会的服务。(4)若干个科学数据网格示范重点面向资源整合的需求,利用数据网格技术,在有基础或需求的学科领域建设若干示范性科学数据网格。这些示范网格需使用标准的、开放的协议和界面,将物理上分布的数据库,按照统一的内容模型、交换格式或者视图,在逻辑上联结成一个整体,提供透明的、可靠的数据保存、访问、分析、互操作以及传输服务。科学数据网格示范建设内容包括:按照统一的技术框架和协议,建成科学数据网格,实现分布式、异构资源的集成整合;研究开发科学数据网格环境下的数据应用工具,重点包括数据挖掘、分析与可视化的工具;负责科学数据网格系统的运行管理与服务,实现与我院科学数据服务门户系统集成。科学数据网格示范项目支持原则:支持主题库、专题库或参考型数据库的建设,并得到实际应用;形成可推广的数据网格中间件、工具或者服务;具有数据网格研发工作基础和前期成果;具有稳定的研发和服务队伍。3.项目主要考核要求(1)主题数据库具有科学规范、逻辑清晰、内容完整的数据库结构,实现了相关数据库或者数据资源的规范化集成与整合,并提供完整的技术文档;遵循我院科学数据库建设与服务统一的标准规范;数据库内容具有一定的规模与丰富度,能完整地满足某一方向科学研究的数据需求,主动为相关领域一批典型的重大项目或应用提供数据服务(累计不少于8个典型应用),在科学研究中发挥显著作用;主题数据库在项目执行期间累计访问人数不少于30万人次,并具有较高的数据下载量,形成一批稳定的用户群;通过互联网提供7X24小时在线数据共享服务。(2)专题数据库具有科学规范、逻辑清晰、内容完整的数据库结构,实现了相关数据库或者数据资源的规范化集成与整合,并提供完整的技术文档;遵循我院科学数据库建设与服务统一的标准规范;实现重大科研计划或者项目内数据的有效管理与共享,支撑一批重要科研成果的产生;提供若干数据分析、处理与可视化的工具。(3)参考型数据库具有科学合理、规范、逻辑清晰、内容完整的数据库结构,实现了相关数据库或者数据资源的规范化集成与整合,并提供完整的技术文档;遵循我院科学数据库建设与服务统一的标准规范;数据库内容规范、质量可靠,具有权威性;实现若干增值数据产品或者增值服务案例;参考型数据库在项目执行期间累计访问人数不少于40万人次,具有广泛的用户群体;通过互联网提供7x24小时服务。(4)科学数据网格示范提供稳定服务的科学数据网格,实现物理上分布的数据资源在逻辑上统一、透明访问;在1个以上主题库、专题库或参考型数据库中得到实际应用;提供3种以上数据挖掘、分析与可视化工具软件,并实现工具软件与网格中数据资源的集成服务;遵循我院科学数据库建设与服务统一的标准规范。4.项目完成年限2010年12月31日前。5.项目经费来源及构成每个重点数据库(主题库、专题库或者参考型数据库)院信息化专项经费资助的额度一般不超过200万元,每个科学数据网格示范院信息化专项经费资助的额度一般不超过100万元。鼓励申请单位自筹或从国家、地方等其它渠道获取经费。所需运维经费由建设单位自筹解决。