科学数据库中国科学院计算机网络信息中心肖云提纲•背景•组织方式•数据资源•系统平台•标准规范•支撑服务•成果与奖励•发展规划背景•中国科学院是国家从事自然科学研究的最高机构•科学家长期的科研实践中产生和积累了大量宝贵的数据资源•由于管理方法上的落后,在科学数据库项目启动前,这些数据并没有得到充分的开发和利用•二十世纪六十年代数据库技术的发展使得大量科学数据的有效存储、管理、开发和应用成为可能•七十年代,中科院化学领域的一些研究所开始建设它们自己的数据库•1983年,中科院提出了“科学数据库及其信息系统”的重大项目背景(Cont.)•中国科学院科学数据库是一个大规模、多学科的科学数据库群•科学数据库项目不仅是一个研究项目,也是一个工程项目•科学数据库已经在很多领域中发挥了重要作用–学术和科研–工业界–信息咨询–教育背景(Cont.)•国家计委重大工程项目(1986-1995)•中科院重大项目(1986-1990)•自然科学基金委员会网络应用重大项目(1995-1996)•中科院基础研究特别支持项目(1991-2000)•中国科学院“十五”信息化建设重大项目,与网络、超级计算环境一起作为科学院信息化基础设施,得到重大支持(2000-2005)组织方式•项目组织结构图科学数据库专家委员会有机所动物所微生物所地理所······科学数据库办公室计算机网络信息中心中国科学院科学数据库中心组织方式•科学数据库专家委员会–科学数据库的学术领导机构–由中科院各研究所的著名专家组成–负责政策制定,经费管理,项目评审与考核等•科学数据库办公室–负责科学数据库的日常管理–在专家委员会的领导下组织和管理科学数据库项目•科学数据库中心–组织平台和标准规范建设–提供运行服务的基础环境–提供支撑服务•建库单位–专业数据库建设数据资源•截止2003年年底–建库单位:45个–专业数据库数量:313个–数据量:8.2TB–数据服务网站:45个–上网数据量:4.3TB数据资源(Cont.)地球科学(19个主体数据库、149个专业数据库)主体数据库建库单位专业数据库数典型专业数据库中国自然资源数据库地理科学与资源研究所49水资源数据库、农业经济、土地资源数据库、工业经济、气候资源数据库、城市经济、森林资源数据库、综合经济、草场资源数据库、人口与劳动力子库、野生动植物数据库、自然灾害、渔业资源数据库、宏观环境子库、能源资源数据库、交通运输邮电、旅游资源、农村能源数据库、主要农产品价格数据库、中国及周边地区基础地理要素数据库、中国县界数据库、全球DEM数据库、70年前后遥感影像数据库、NOAA-AVHRR遥感影像数据库、中国及周边地区1平方公里NOAAAVHRRNDVI(归一化植被指数)数据库、中国及周边地区1平方公里NOAAAVHRRTs(地表温度)数据库等中国湖泊数据库南京地理与湖泊研究所1中国湖泊数据库中国湿地数据库东北地理与农业研究所102000年中国湿地遥感解译数据子库、1995年中国湿地遥感解译数据子库湿地专题图数据子库、全国湿地外业调查属性数据库、青藏高原湿地动态数据库、三江平原湿地动态数据子库、若尔盖湿地分布区遥感解译数据子库、长江、黄河源头部分湿地分布区遥感解译数据子库、东北及内蒙东部湿地区土地利用动态数据、人类活动对湖沼系统的影响数据子库等中国土壤数据库南京土壤研究所7中国土种数据子库、土壤质量监测数据子库、NPK养分循环数据库、区域农田生态研究数据库、1:100万土壤空间数据库、1:400万土壤空间数据库等东北黑土农业生态数据库东北地理与农业研究所5自然资源、农业生态基础、农业信息、科学研究、图库(属科学研究子库部分)等亚热带区域农业生态数据库亚热带区域农业所3农业生态系统要素数据库、亚热带区域资源数据库、区域农业土壤肥力定位监测数据库数据资源(Cont.)地球科学(19个主体数据库、149个专业数据库)主体数据库建库单位专业数据库数典型专业数据库中国山地环境与灾害数据库成都山地灾害与环境所3中国山地基础数据库、中国山地灾害数据库、中国西南山地环境数据库黄土高原水土保持数据库西安水土保持所4黄土高原水土保持专题研究数据库、黄土高原水土保持图形图象数据库、黄土高原水土保持野外定位监测数据库中国寒区旱区特色数据库兰州寒区旱区所15极地冰冻圈数据库、干旱陆面过程数据库、沙坡头生态网络数据库、柯尔泌生态网络数据库、平凉雷电数据库、黑河试验数据库、闪电数据库、西部环境与水土资源数据库、沙尘暴数据库、古气候数据库等新疆资源生态环境数据库新疆生态与地理所6新疆生态环境信息数据库、新疆植物资源数据库、新疆动物资源数据库、新疆土壤资源数据库、新疆旅游资源数据库等中国岩矿地球化学数据库广州地球化学所9中国矿物数据库、中国岩石数据库、中国陨石数据库、中国矿床数据库、中国有机岩石学数据库、中国地质分子标志物数据库、珠江三角洲污染源数据库、中国同位素年代学数据库、中国元素地球化学数据库大地构造图件数据库长沙大地构造研究所4数字大地构造边界数据库、数字大地构造地质要素数据库、数字岩石圈与动力学参数数据库、构造地质与大地构造成果图件库大气科学与环境数据库大气所4大气科学与环境数据库、大气科学算法与模式数据库、大气科学文献数据库、图形软件数据库数据资源(Cont.)地球科学(19个主体数据库、149个专业数据库)主体数据库建库单位专业数据库数典型专业数据库全国资源环境遥感数据库遥感所12植被指数数据库、系列栅格图形数据库、遥感卫星影象数据库、1:10万栅格图形数据库、1:25万栅格图形数据库、1:50万栅格图形数据库、1:100万栅格图形数据库中国遥感卫星地面站检索库遥感卫星地面站1遥感卫星图象检索数据库动力大地测量资源环境库武汉测地所2海洋科学数据库青岛海洋所3南海海洋数据库南海海洋研究所7南海水文气象数据库、南海地质与地球物理数据库、南海岛礁地质数据库、南海海洋生物数据库、南海海洋化学数据库、热带海湾生态数据库、南海海洋文献信息数据库中国古生物学与地层学库南京古生物所4中国早古生代立典剖面的古生物学、地层学数据库、中国晚古生代典型剖面的古生物学、地层学数据库、中国大植物化石数据库、中国重要微体古生物化石数据库等数据资源(Cont.)生物科学(13个主体数据库、104个专业数据库)主体数据库建库单位专业数据库数典型专业数据库中国微生物资源数据库微生物所48中国微生物菌种数据库、中国细菌名称数据库、中国植物志英文版数据库、生物化学词汇数据库、古生物学词汇数据库、中国灵芝数据库、中国放线菌数据库、中国真菌高精度图象数据库以及各种核酸、蛋白质等国际镜像数据库中国动物数据库动物所5中国脊椎动物分类代码数据库、中国动物物种编目数据库、中国濒危和保护动物数据库、动物名称数据库、中国动物志数据库等中国西南地区动物资源库昆明动物研究所10西南地区保护珍稀濒危特有动物数据库、云南蝴蝶资源数据库、云南澜沧江流域动物编目数据库、中国脊椎动物分布名录数据库、国自然保护区数据库、云南森林昆虫数据库等中国植物数据库植物所2中国植物数据库、中国植物图象数据库等植物图谱数据库武汉植物研究所5中国水生维管束植物图谱数据库、中国特有种子植物图谱数据库、中国饲用植物图谱数据库等中国西南植物资源数据库昆明植物所5西南植物标本数据库、中国芳香植物数据库等热带亚热带植物学基础库华南植物所4热带亚热带植物物种数据库、植物细胞学数据库、植物微形态数据库、常绿阔叶林基础数据库中国水生生物数据库水生生物所11中国淡水鱼类生物多样性信息数据库、长江经济、特有、珍稀鱼类资源数据库、中国鱼类寄生虫数据库、中国内陆水体底栖动物数据库、中国鲸类动物资源数据库、中国淡水藻类信息数据库、中国水生病毒图像数据库等数据资源(Cont.)生物科学(13个主体数据库、104个专业数据库)主体数据库建库单位专业数据库数典型专业数据库病毒数据库武汉病毒研究所3病毒保藏数据库、病毒模式标本数据库、病毒遗传资源数据库等中国核酸序列数据库上海生命科学研究院1中国人核算序列数据库中国水稻基因数据库国家基因研究中心3水稻基因序列数据库、水稻基因CDNA表达序列标签(EST)数据库、水稻基因组注释、分析数据库.基因电脑克隆和多态性库生物物理研究所6EST序列数据库、电脑克隆新基因候选序列库、冠心病高血压相关SNP数据库、猪SNP数据库、人mRNA可变剪接数据库、猪mRNA可变剪接数据库等基因组生物信息学数据库北京基因组研究所11%人类基因组子库系统数据资源(Cont.)物理和化学(6个主体数据库、43个专业数据库)主体数据库建库单位专业数据库数典型专业数据库高能物理与相关学科库高能物理研究所1高能物理与相关学科数据库工程化学数据库过程工程所7物性及热化学数据库、相变数据库、非电解质体系汽液相平衡数据库、聚合物溶液相平衡数据库、共混聚合物相容性数据库、晶体结构数据库、化学品安全与处置数据库化学专业数据库上海有机所17红外光谱数据库、化合物命名和结构数据库、质谱数据库、化学反应数据库、国外化学核心期刊数据库、化学配方数据库、农药数据库、药物数据库、化学名词、三维化学结构数据库、化工产品、性质和厂商数据库、化工产品和企业(中国)、二维结构、三维结构、天然产物三维结构数据库、药物和天然产物数据库、中药数据库、化合物活性和毒性数据库应用化学数据库长春应化所3碳-13NMR数据库、稀土萃取数据库、稀土物性数据库理化性能及分析数据库大连化物所3中药手性数据库等化学物质毒性数据库计算机网络信息中心2化学品安全数据库,RTECS数据库等数据资源(Cont.)天文与空间科学(2个主体数据库、13个专业数据库)主体数据库建库单位专业数据库数典型专业数据库天文数据库国家天文台6CDS星表数据库、天文资料数据库、综合天文文献数据库、天文学文摘数据库、天文光盘文献数据库等空间环境数据库空间中心7空间环境基础数据库、空间物理交互数据资源(SPIDR)系统镜像库、Cluster卫星族科学数据库等能源(2个主体数据库、12个专业数据库)中国能源经济数据库北京能源所5宏观经济子库、常规能源子库、可再生能源和农村能源子库等可再生能源与环保数据库广州能源所7水合物相平衡数据库、水合物热物性数据库、水合物视频、太阳能利用数据库、生物质能基础研究数据库、固体废弃物数据库、文献情报等材料(3个主体数据库,12个专业数据库)材料数据库沈阳金属所6金属材料腐蚀数据库、材料故障诊断数据库等光学系统数据库长春光机所4光学镜头数据库、光学材料数据库纳米材料基础数据库中科院纳米中心2纳米专利数据库、纳米材料数据库等其他中科院专家数据库院人教局、网络中心1专家数据库系统平台•为科学数据库的共享、服务和集成应用提供基础环境和技术平台–硬件环境•大型数据服务器•海量数据存储–软件平台•以数据网格技术为核心的中间件平台硬件平台•超级数据服务器–TFLOPS(万亿次)计算能力•海量存储–20TBSAN磁盘阵列联想深腾6800软件平台•科学数据网格中间件体系结构SecuritySystemApplicationGridAPIDataRes.BrokerUniformAccessInt.LocalDataSystemInfo.Servicecoordinatedaccesstomultipledataresourcesuniformaccessinterfacetosingledataresourcelocaldatamanagementsystem,couldbeDBMSorfilesystemapp-oriented,unifiedprograminterfaceapplicationsdatabases软件平台•中间件平台主要模块结构元数据标准通用元数据管理工具安全体系通用数据管理工具数据目录管理工具访问控制工具包信息服务子系统数据访问子系统图像数据处理工具数据量统计分析工具系统平台中间件应用服务与工具集其他软件平台•中间件平台目前完成的主要工作–信息服务子系统•GIS导航系统1