中医药行业数据库建设现状分析*中国中医研究院中医药信息研究所崔蒙中医药行业的数据库建设起源于上个世纪80年代,经过20余年的建设已经取得了初步的成果。到目前为止,已经有数十个中医药大学、学院及研究院所建设了各种规模不同的、近百个中医药信息数据库,初步实现了中医药信息数字化。1.现代文献型及事实型数据库建设现状分析中医药现代文献型及事实型数据库的建设开始于上个世纪80年代,至今已经开展了20余年。目前,已经形成了以国家中医药管理局中国中医药文献中心及其分中心为主体的中医药文献型及事实型数据库群,这些数据库已经均投入使用。其主要数据库如下表所示:数据库名称研制单位年限及数据量数据源形式中国中医药期刊文献数据库中国中医药文献检索中心收录1984-2003年的40余万条数据国内900余种生物医学期刊文献型中国中医药新闻数据库中国中医药文献检索中心收录1989-2003年的3万余条数据国内中医药相关报刊文献型疾病诊疗数据库中国中医药文献检索中心收录4000余种疾病的相关中西医诊断及治疗数据权威书籍事实型中国中药数据库中国中医药文献检索中心收录了约8500种中药相关数据权威书籍事实型中国方剂数据库中国中医药文献检索中心收录了约90000余首方剂相关数据权威书籍事实型中药化学数据库中国中医药文献检索中心收录了3000余种中药化学成份的相关数据权威书籍事实型中国医药产品数据库中国中医药文献检索中心收录了7000多种中西药品的相关数据各药品生产机构的介绍材料事实型国家基本药物数据库中国中医药文献检索中心收录了列入国家基本药物的825种中西药品的相关数据权威书籍事实型中药新药品种数据库中国中医药文献检索中心收录了85年以来的中药新药品种的相关数据相关资料事实型中药非处方药数据库中国中医药文献检索中收录了中国政府四批发布的2000余种非处方药的权威书籍事实型心中药信息中国藏药数据库中国中医药文献检索中心收录了约500条数据权威书籍以及近年来藏药临床应用的最新信息事实型中国医药企业数据库中国中医药文献检索中心收录了7000余家医药企业的相关数据相关资料事实型方剂现代应用数据库中国中医药文献检索中心收录了7000余条现代中医药文献中有关方剂应用的相关数据相关期刊及书籍事实型中国医院数据库中国中医药文献检索中心收录了全国各地区级以上14000余家医院的相关信息数据相关资料事实型中国医药卫生科技成果数据库中国中医药文献检索中心收录了1979年至2002年全国3900项中医药科研成果的相关数据相关资料文献型中医药题录数据库上海市中医药科技情报所分中心1950-1996年相关期刊文献型中医药文摘数据库上海市中医药科技情报所分中心1993-1998年相关期刊文献型中药数据库上海市中医药科技情报所分中心1994-1995年相关期刊文献型中医药专题数据库上海市中医药科技情报所分中心1993-1998年共分为13个专题相关期刊文献型中医中西医结合肿瘤数据库上海市中医药科技情报所分中心1993-1998年相关期刊文献型上海百名老中医学术经验资料多媒体光盘数据库上海市中医药科技情报所收录了上海市百名老中医学术经验数据相关资料事实型上海市中医资源及运行情况综合统计信息管理系统上海市中医药科技情报所分中心收录了上海市中医资源的统计数据相关资料事实型上海市中医药科研成果库上海市中医药科技情报所分中心1960-2003年上海市中医药科研成果数据相关资料文献型上海市中医药专家库上海市中医药科技情报所分中心每年更新上海市副高以上中医药专家的数据相关资料事实型中医药学术期刊外科专病全文检索系统上海中医药大学分中心1990-2001年相关期刊文献型中国中医药年鉴数据库上海中医药大学分中心1995-1997年相关期刊文献型美国FDA与中医药相关政策文献检索系统上海中医药大学分中心2001年相关资料文献型中医药学术期刊题录数据库上海中医药大学分中心1982-2001年相关期刊文献型中药药性、药效、药理成方数据库上海中医药大学分中心收录了500余种中药药性、药效、药理成方数据相关资料事实型中医脉管炎文摘数据库上海中医药大学分中心1990-2001年相关期刊文献型古今气功数据库浙江中医药研究院分中心1949-1998年相关期刊、书籍文献型浙江省建国以来中医药科研成果管理数据库浙江中医药研究院分中心1949-1995年浙江省中医药科研成果的相关数据库相关资料文献型吉林省中医中药研究科技成果数据库吉林中医中药研究院分中心1958-1999年吉林省中医中药研究科技成果的相关数据相关资料文献型高血压病专题文献数据库河南省中医药研究院分中心1949-2003年相关期刊文献型心脑血管病专题文献数据库河南省中医药研究院分中心1949-2003年相关期刊文献型糖尿病专题文献数据库河南省中医药研究院分中心1949-2003年相关期刊文献型湖南省中医药科技资料管理系统湖南中医药研究院分中心湖南省中医药科技资料相关数据相关资料事实型全国医药期刊中医药文献目录文档微机动态处理系统湖南中医药研究院分中心1991-2001年相关期刊450种文献型全国中医药、中西医结合科技文献综述微机检索系统湖南中医药研究院分中心1995-2001年相关期刊450种文献型中医药治疗肝病文献检索系统湖北中医学院分中心1980-1992年相关期刊文献型男性计划生育文献湖北中医学1980-1992年相关期刊文献型检索系统院分中心中医药治疗脑血管疾病文献检索系统湖北中医学院分中心1980-1992年相关期刊文献型气功文献检索系统湖北中医学院分中心1980-1992年相关期刊文献型中医药治疗风湿类疾病专题数据库湖北中医学院分中心1984-2001年相关期刊文献型台湾医药卫生文献数据库福建中医学院分中心收录1970-1998年24460余条数据。40余种台湾生物医学类、卫生类期刊文献型台湾研究机构数据库福建中医学院分中心收录1998年台湾1291研究机构的相关资料相关资料事实型台湾名人数据库福建中医学院分中心收录1998年台湾2701名人的相关资料相关资料事实型台湾中医药分析咨询系统福建中医学院分中心包括台湾中医药科研课题库、台湾中医药专家库、台湾中医药纪事库、台湾中医期刊库、台湾中医药文摘库、台湾中医药学位论文库、台湾中医师名录库、台湾中医药教育库、台湾中医机构库台湾中医药图书库等10个数据库相关期刊、资料文献型及事实型台湾野生食用植物库(多媒体)福建中医学院分中心收录台湾地区可供食用的86科256种野生或栽培植物相关资料事实型台湾药用植物资源库福建中医学院分中心收录1028条台湾药用植物资源的相关数据相关资料事实型台湾制药产业数据库福建中医学院分中心收录了台湾制药产业的相关数据相关资料事实型台湾医疗机构数据库福建中医学院分中心收录了台湾医疗机构的相关数据相关资料事实型台湾信息产业数据库福建中医学院分中心收录了台湾信息产业的相关数据相关资料事实型全球畅销药品数据库福建中医学院分中心收录了全球畅销药品的相关数据相关资料事实型中药方剂研究数据库广州中医药大学分中心收集中药和方剂的相关信息相关资料事实型从上述资料不难看出,中医药现代资料数据库的建设已经具有一定的规模,几乎涉及到中医药信息的各个方面。但同时也存在着严惩的问题。这主要表现为:一是重复建设的现象严重,造成大量资源浪费;二是持续性建设状态不好,相当一批数据库没有能够保持维护;三是无论是事实型还是文献型数据库,多为单表型数据库,给数据的进一步利用和挖掘造成了很大的困难。因此,在今后的工作中,应注意尽可能集中全国中医药行业的数据库建设力量,共建共享,最大可能的避免资源重复建设;同时注意对已建数据库的维护,使其能够持续发展,不断更新;另外,还要注意对数据库的深层加工,提高数据库的附加值,增加数据的可利用度,更好的为中医药事业的发展做出贡献。2.结构型数据库建设现状分析由于目前文本挖掘技术,尤其是中文文本挖掘技术还很不成熟,因此,提高数据利用度的一个重要方面就是建设结构型数据库,只有在结构型数据库的基础上才有可能较好地实现数据挖掘。目前,国内外中医药结构型数据库的建设还很不完善,尚未涉及到中医药信息的各个方面,但已经开展的工作,为中医药结构型数据库的建立,以及进一步的数据挖掘奠定了较好的基础。北京中医药大学的任廷革教授开发研制的结构型古代中药数据库已经具有一定规模。国家中医药管理局中国中医药文献检索中心利用虚拟研究中心平台,联合全国十多家中医药大学、学院及科研机构于2002年开始建设结构型中药科技基础信息数据库。该数据库共设计了中药单味药、中药品种、中药生药材鉴定、中药药理、中药临床药理、中药毒理及中药化学成分等七个单表数据库,七个数据库共设立了158字段,通过关联形成了一个统一的结构型数据库,使用户可通过该数据库方便地获得相关中药的全部权威的科技基础信息数据。为了保证数据加工的一致性,该数据库设计了26张标准表,为全国十多家参与工作的技术人员提供标准词汇。到2003年底,该数据库收录的中药单味药数据将达到11000种。为了保证中药科技基础信息数据库的数据的准确性,收入该数据库的全部数据均来自国家或行业标准、权威工具书以及中医院校的统编教材。目前该数据库已经通过国际互联网投入使用。通过该数据库的关联检索功能,专业人员可方便地检索到所需资料,并可方便地获得所需要地归类资料,如归属某一经、归属某一性味、含有某一化学成、具有某一功效、能够治疗某一证候、某一症状、某种疾病等的全部中药材资料。但从总体情况看,中医药行业的结构型数据库的开发还很不完善,尤其是涉及中医医疗领域的结构型数据库几乎还是空白,需要加大开发力度,以便为中医药数据的深度挖掘和充分利用奠定基础。3.数据仓库建设现状分析研究数据仓库技术是为了更好地对具有高维、小样本特点的中医药科学实验数据实现统计分析,提高数据的利用程度。基于以上考虑,中国中医药文献检索中心及其分中心在2001年利用虚拟研究中心平台开展了基于数据仓库技术的中药科学实验信息数据库建设的研究。该数据仓库收录了自1990年以来公开出版的中文生物医学期刊上的有关中药单味药、方剂、化学成份在药理、临床药理、毒理方面进行研究的一次实验文献。收录原则为全面收录中药实验研究的一次文献数据,转载或综述性文章均不进行收录。该项研究采用计算机数据仓库技术,以忠实原文献内容为原则,首先对中药实验数据进行了调研,认为中药科学实验研究范围广泛、内容不集中,因此具有数据分散及高维、小样本的特点,难以进行统计分析,严重阻碍了中药科学实验数据的利用。为此,该项研究建立了具有十五个空间维(文献出处、单味药、化学成分、方剂、剂型、疾病、证候、症状、病理生理、效应部位、微生物、药理分类、临床药理分类、毒理分类、指标)的中医药科学实验信息数据库,十五个维基本全面表达了中药科学实验数据的内涵值,可以支撑数据的分析。十五个维表均采用了规范的数据,同时又拥有灵活的排列组合方式,可以根据需要进行数据组合。中药科学实验信息数据库提供了用户应用平台,构建了数据查询与应用界面,作为中药实验数据仓库首次服务于用户,成为中药学科及相关专业必备的工具。由于中药数据仓库技术起点高、结构清晰、数据抽取主题概念明确,因而提供了最大的服务与应用空间。同时,本平台具备数据统计与频次排序,提供了数据评价的功能。本数据库具有以下特点:(1)数据结构设计合理,数据加工规范,具备一般数据库查询的功能。(2)提供了检索数据的自身评估功能,存在着远期数据增值能力:应用平台提供的十五维检索途径,从不同的入口进入以获得不同的统计结果;如:通过疾病入口,可以进行与中药材、化学成份、方剂研究相关的数据组合检索,用户根据研究需求,扩充或限定检索,获得所需的研究数据,并同时获得数据频次的统计,为研究提供一定的思路。中药科学实验信息数据库应用平台有可能为中药知识发现与挖掘提供新的途径。4.古代文献数据库建设现状分析中医药古代文献是中医学的宝贵财富,中医学的发展是在继承基础上的发展,因此,中医古代文献的利用对中医学的发展具有至关重要的作用。中医药古代文献数字化的工