基础数据库群生存现状与发展设想作者:刘静自从1987年开始建立中医药文献分析检索系统以来,我们陆续建立了各种文献事实型数据库,尤其在从2000年成立的中研信公司以来,可以说是各种文献事实型数据库的一个大的飞跃,在中医药文献数据库、成果数据库、新闻数据库等基础上,先后建立了临床医学数据库、中国中药数据库、新药品种数据库、中国医院数据库、药品企业数据库、科研机构数据库、现代方剂临床应用数据库、中药方剂数据库、国家基本药数据库、0TC数据库等等二十余个数据库。这些数据库大大丰富了我们中医药在线网站的网上检索信息,为临床、科研、教学及管理提供了大量的信息,在一定程度上促进了中医药事业的发展。一、基础数据库群现状与存在问题:现有的基础数据库群均为事实型的单表平面数据库,存储了大量的文献和数据,但整个数据库的层次感很不清晰,有一些数据库检索很专业,保证了检索的查全率、查准率,在一定程度又限制一般人员对数据库的利用。有些数据库将几十年的数据一次性的形成了数据库,新的数据及进展研究更新维护就存在一定的难度,还有一些数据库具有相同的属性,但是没有形成一个相应的数据库群或者数据库组,使用人员如果不熟悉我们的数据库性质,也就很难在同组或同群数据库中进行检索,数据库的利用就没有发挥到最大的程度。还有一些数据库缺少相关的支持数据库,感觉很单薄,还应开发一些相关的产品。1、数据库检索专业性,限制了数据库的利用:这个问题主要是表现在中医药文献数据库,文献数据库自从建立以来,已经将近二十年,它的建库技术是非常专业非常成熟的,已经积累了43万余条数据,通过标引人员及文摘员的加工,本数据库可以从主题词、特征词等方面进行非常精确的检索。但是随着计算机技术的飞速发展,中医药文献数据库没有全文、检索技术太专业化等特点也充分暴露,既使一个专业的标引员没有经过严格的训练和一定量的实践也难以完成一个项目的精确检索。要想熟练的使用中医药文献数据库,必须进行专业培训,要付出大量的人力和精力。一般使用人员登录到检索界面后,首先感到无从下手,例如要检索人参的药理学,如果只是在文题中检索人参药理学,可能就一篇也没有或者很少量的文献,如果用主题词人参和主题词药理学来检索,又会检出大量的非人参药理学的文献,也就是说文献数据库检索人性化还有待于提高。2、数据库的维护更新非常困难:例如中国中药数据库,目前是全国唯一的一个中药单味药数据大全型数据库,收录的中药条目已达10500余条,它是将中药单味药研究几十年甚至几百年的数据全部收录了,那么它目前所面临的主要问题就是更新维护困难,一个单味药的药理研究进展、化学研究进展、毒性研究进展、资源调查研究等等跟踪困难,对收集到的资料认证更不是我们数据库制作人员力所能及的。等待这方面的新专业书籍出版,再采集资料更新维护,是解决问题的一个方面,但将长期使中国中药数据库处在一个停滞发展的阶段,即使有新书也不能确定内容是新的,依然存在对资料的认证难度,所以更新维护这种类型的数据库遇到了相当的困难,可以说比重新制做一个新数据库还困难。3、数据库放置分散,相关数据库没有形成组群,不利于相关资料的查找:这个问题主要表现在中药企业与药品数据库,这是一个相关数据库最多的群体,现有数据△国家科技部科技基础性工作专项资金项目(2001DEA30039)库为中药新药品种数据库、OTC数据库、中药企业数据库、中药产品数据库、新药保护品种数据库、成方标准数据库,以及相关的企业报表99年、20年数据库等。目前均是单表排列,如果一个检索人员不熟悉以上相关的数据库,检索起来难度很大,极有可能只检索了某个数据库,而对相关的数据库没有进行利用。如果将这些数据合并成一个数据库,又会发生许多人为的错误,因为许多基础数据是从方方面面收集来的,不是第一手材料,本身就带有许多加工中的错误与不准确的信息,而且一但合成,字段即可达几十甚至上百,实际上更将造成检索的不方便,例如三年的企业报表,本身的字段就不一样,合成一个就非常困难。相应的问题还表现在方剂数据库中,目前我们有两个方剂数据库,分别为中药方剂数据库、现代方剂临床应用数据库,也是单表排列,如果不熟悉的检索人员可能会漏检,或产生困惑。而对方剂目前科研人员比较关注的内容,如方剂的配伍规律、方剂的药理、方剂的药化等研究,仍然没有很好的文献服务方式。4、数据库缺少支持系统,非常单薄:这一问题主要表现在临床医学数据库,现有的临床医学数据库共有数据3000余条,作为一个与人密切相关的数据库,略显单薄,数据太泛泛,没有一个相关的支持数据库。如现在临床比较关注的诊断标准与疗效标准,常用药物的使用方法手册等等,都没有建立相应数据库。临床医学是一个非常大而广泛的概念,在这个大概念下,我们现有的数据库就很单薄,没有可纵向服务的功能。5、小型数据库表的利用:现阶段我们小型数据库表基本上没有涉及,例如:第一批中止药品生产批准文号的品种名单、市售中药制剂及不良反应、卫生部认定的健康相关产品检验机构等等,这些数据对于现有的数据库没有合适的位置和群组,也就不能及时的上网和利用。二、基础数据库的发展设想1、中医药文献数据库:中医药文献数据库现有的建库技术非常成熟和专业,也有了悠久的历史。本数据库作为基础之基础数据库,现在还承担着为中药实验数据库及中医药报提供数据源的责任,因此我认为在现阶段只能保持现状。全文数据库也不是本数据库的发展方向,因为已经有了清华同方,我们不能够在资金及人力均处于弱势的情况下强行竞争。检索专业化是本数据库的一个特点,在现阶段也不应对其进行改造。我个人认为本数据库的发展方向是产品的再次开发和利用,中医药文献数据库每年约有43000余条的新数据更新,这些数据均是最新的研究动态、最新的科研成果、最新的研究方向,我们在其中挑选目前科研人员最感兴趣的专题,进行分类加工,转换检索重点及方式,分别建成小型的支持数据库,补充到中药数据库群及方剂数据库群中,使那些更新维护有困难的数据库能够跟上时代的发展,具体方法我将在中药数据库群与方剂数据库群中介绍。2、中国中药数据库:单味药的药理、化学成份、毒性、配伍等研究历来是科研人员关注的重点,而且又是本数据库维护的困难所在。利用中医药文献数据库中新数据,进行分类加工,可以形成单独的支持数据库,如可建立单味药药理研究进展数据库、单味药化学成份研究进展数据库、单味药毒理研究进展数据库等等,可将文献数据库中近5年的单味药药理数据更改成下列的著录方式:药名、项目名称、研究单位、参加人员、数据来源(出处)、简介等,如果一篇文献中出现二味中药的药理研究,如五味子、黄芪,那么相应的生成两条记录,分别是五味子和黄芪。检索人员只要在药名中录入要检索的药名,检索出来的就是本味中药的最新药理研究进展,即可为中国中药数据库起到了支持作用,又可大大方便检索人员,进行傻瓜检索。以此类推,可以根据需要制作多个数据库。3、临床医学数据库:目前本数据库略显单薄,与本数据库相关的支持数据库几乎没有,建议可建立一个临床诊断标准及疗效标准数据库,采集的资料可用临床最常用的卫生部颁部的《新药(中药)临床研究指导原则》及中华人民共和国中医药行业标准《中医病证诊断疗效标准》中的症状、证候及疾病的诊断标准与疗效标准。还可建立一个《临床医师临床用药手册》数据库,数据源可广泛采集各种临床医师用药手册等等。将以上三个数据库作为临床医学数据库群来使用,还可根据需要再考虑开发与本数据库群相关的数据库。4、中药企业与药品数据库:将现有数据库中药新药品种数据库、OTC数据库、中药企业数据库、中药产品数据库、新药保护品种数据库、成方标准数据库,以及相关的企业报表99年、20年数据库等形成一个数据库群,将可利用的相关字段关联,如通过检索药名可以查到本药品的单产量及全国产量、本药品的厂家一般情况、本药品的标准、新药的报批情况及作为OTC的使用方法,通过厂名可以检索到厂家的一般情况、生产的药品产量、厂家的固定资产等情况及药品的以上相关情况。将企业报表99、20、21进行分类加工,使其可以查到一个厂家三年不同的情况,如利润总额在前300位的变化。目前由于国家计委这三年的报表均不一样,还需认真探讨如何加工。5、中药方剂数据库:建立方剂数据库群,除包含现有的中药方剂数据库及现代方剂临床应用数据库外,可将文献数据库中近5年的复方药理、复方化学、复方配伍规律等数据进行分类加工,建成方剂药理进展数据库、方剂化学成分研究进展数据库、方剂规伍规律研究进展数据库,著录方式改为:方名、药物组成、项目名称、科研单位、参加人员、数据来源、简介等,做成系列支持数据库,检索人员可通过查找方名或组成等,快速查找相关内容。6、小型数据库表的利用:可将第一批中止药品生产批准文号的品种名单、市售中药制剂及不良反应、卫生部认定的健康相关产品检验机构等等材料制作成小型数据库,分别加入相应的数据库群组中,或者做成一些弹出的网页,放置在相应的数据库群组中,这样可以及时的形成一些具有检索价值的数据库,这些小型数据库表加工容易,如果有新的数据就可快速将其替换,对大型而又维护困难的数据库起到一定的支持作用。三、小结我想通过以上数据库的相应改造,以及网上检索系统的相应改造,就会增加我们现有数据库的层次感,使数据库的使用更简单、更快捷、信息更全面、更有针对性。要想达到这一步,也还是需要艰苦的工作和繁琐的劳动,以及各方领导与技术部门等方方面面人员的共同努力。