信息科学与技术在古籍整理中的应用中国中医研究院柳长华2003-11-19古籍整理20年1981年7月14日上午,陈云同志的秘书王玉清同志到北京大学召集座谈会。会上传达了陈云同志关于整理古籍的重要指示。陈云同志指出:“整理古籍是一项很重大的工作,工作量很大,关系到子孙后代。古籍仅作标点、校勘、注释还不够,青年人读不懂,要作今译,要使搞理工的人也能懂得,争取做到能读报纸的人多数都能看懂。要下决心,搞个领导班子,搞个规划,十年、二十年、三十年,第一个十年先把基础打好,把愿意搞的人组织起来;第二个十年也要有一班人接上去;第三个十年再接上去,逐步壮大。搞上三十年,就能培养出相当一批人,就不会后继无人了。尽管国家现在有困难,也要花点钱。八个亿、十个亿、二十个亿。当然钱不是一下子拿出,一下子花完,是逐年用的。”中央的七条指示1981年9月17日,中共中央书记处根据陈云的意见,讨论了整理我国古籍的问题,作出了七条指示。1、整理古籍,把祖国宝贵的文化遗产继承下来,是一项十分重要的、关系到子孙后代的工作。2、整理古籍,需要有一个几十年陆续不断的领导班子,保持连续的核心力量。3、为办好整理古籍这件事,尽管国家现在有困难,也要花点钱,并编造一个经费概算,以支持这项事业。4、整理古籍是一件大事,得搞上百年。当前要认真抓一下,先把领导班子组织起来,把规划搞出来,把措施落实下来。5、------国家卫生部的响应1982年1月16日,卫生部党组开会,研究贯彻中共中央关于古籍整理文件的精神,决定对中医古籍进行整理出版。2月3日,将会议记要发送人民1982年6月7日至12日,卫生部在北京召开了中医古籍整理出版规划工作座谈会,中医界一些知名专家、学者出席了会议。崔月犁部长到会讲了话。通过讨论,初步拟定了中医古籍整理出版的九年规划和落实措施。决定建立“卫生部中医司中医古籍整理出版办公室”,机构设在人民卫生出版社,办理日常工作。中医古籍整理出版办公室成立1982年7月22日,国务院古籍整理出版规划小组组长李一氓同志请卫生部崔月犁部长、吕炳奎司长及人民卫生出版社刘学文社长、刘广洲研究员座谈,强调了中医古籍整理出版的重要性和迫切性。指出这是上对祖先、1983年1月18日,中医古籍整理出版办公室正式成立,任命宋志恒同志为中医古籍整理出版办公室主任,办公室挂靠人民卫生出版社。3月11日正式启用印章。自此,中医古籍整理出版的具体工作,均由古籍办负责。九年规划中古办成立之后,宋志恒同志与人民卫生出版社白永波、刘广洲、呼素华等同志,联系国内一部分著名中医专家,着手制定中医古籍整理出版1983年3月22日,卫生部(83)卫中字第13号“关于落实《伤寒论》等六本经典著作整理任务的通知”中,将《伤寒论》、《素问》、《灵枢》、《针灸甲乙经》、《难经》、《本草经》6种书列为第一批重点整理的书目。与此同时,由人民卫生出版社组织,并征求了国内部分中医专家的意见,制定了中医古籍整理出版九年规划,拟定整理书目共561种。第一批任务1983年4月21日至27日,卫生部中医司在沈阳召开了中医古籍整理出版座谈会,出席会议的有承担任务的负责人和有关专家。讨论落实1982年至1990年中医古籍整理出版规划中第一批12种古籍的整理出版任务。会议草拟了《关于十二种中医古籍整理出版工作中若干具体问题的规定》。12种古籍与主编人为:《素问》郭霭春、《灵枢》史常永、《脉经》沈炎南、《难经》金寿山、吴文鼎、凌耀星、《太素》李克光、《病源》丁光迪、《甲乙经》张灿玾、《本草经》马继兴、谢海洲、尚志钧、《伤寒论》任应秋、刘渡洲、《金匮要略》何任、《中藏经》李聪甫、《内经知要》缺。第二批任务1983年8月20日至25日,卫生部中医司在青岛召开了“全国中医古籍整理出版规划落实工作会议”,出席会议的有23个盛市、自治区卫生厅、局中医负责人和中医专家。中医司司长田景福同志主持会议,并作重要讲话。会议落实了中医古籍整理出版第二批任务,共200种医籍。落实古籍整理分片负责、分级管理的组织工作。全国划为十片,有十位学术牵头人,时有“十老”之称。最后一次工作会1986年3月18日至21日,国家中医药管理局在北京召开了“全国中医古籍文献整理研究座谈会”。田景福副局长到会讲话,会议总结了前四年的工作,研究了下一步的任务。这次会议是中医古籍整理出版工作的最后一次会议。古籍出版情况十一种重点中医古籍,目前已出版九种(尚余《黄帝内经太素》、《灵枢经》二书)。规划中的561种古籍,据不完全统计,80%已经落实并整理完毕,人民卫生出版社出版了300余种。繁荣了中医学术列入规划的古籍,是经过中医界一大批知名学者们论证后而确定的书目,代表着全部中医古籍中较为精粹的一部分内容。每种古籍都是请具有较高学术造诣的学者承担,因此,这部分书的整理出版,达到了二十世纪末的最高水平。从其效果来看,这样一大批中医古籍的整理出版,首先为学习和研究中医学的人们,解决了一个读什么书、读好书的问题。重要的是这部分古籍的广泛流通,为繁荣中医学术,起到了巨大作用。培养了人才1982年以来的中医古籍整理,一个突出的特点是汇集了一批著名学者参与此项工作。既煅炼了队伍,又培养了一批专门人才。八十年代初,有一大批中青年中医工作者参与了此项工作。中国中医研究院于85、86年先后举办了二期古籍整理研修班,88、89年又委托北京师范大学为中医界举办了二期古籍整理进修班。通过学习和实践,提高了他们对中医古籍整理研究的认识,增长了才干。其中有一大批人走上了专职从事古籍整理研究的道路,他们在各自的工作岗位,经过多年的煅炼,在古籍整理和教学岗位上发挥了重要作用,有的已经成为学术界的骨干或知名中青年学者,形成了一支稳定的专业队伍。促进了机构建设中古办建立初期,全国仅有几家中医文献教研室,至八十年代末,相继建立中医文献研究所、室的院校和研究院有15家。一些研究所室的建立,地方政府给予了很大支持。经过十几年的发展,某些研究所、室已形成较大规模。具有博士学位授权点的有三家,具有硕士学位授权点的有11家。现有专职人员近百人。上述研究机构,有一批已经形成学术方向和研究特色。这种良好局面,是历史上所没有过的。促进了中医文献学理论的发展随着中医古籍整理研究的深入开展和人才培养的需要,一些著名学者十分重视对文献学理论的研究。九十年代以来,相继出版了多种中医文献学的论著。有代表性是马继兴的《中医文献学》、史常永的《实用中医文献学》、张灿玾的《中医古籍文献学》。这些理论的产生,标志着中医文献学科的成熟。对于医史文献学科的发展和人才培养,具有十分重要的意义。佘部长的一块心病2001年2月20日,卫生部副部长兼国家中医药管理局局长佘靖在2001年全国中医药工作会议上所作的工作报告中指出:“要牢固树立正确的中医药继承发展观,继承与发展并举,积极吸收和利用现代科学技术方法研究中医药,促进中医药科技进步和创新,努力实现中医药现代化。”指出当前和今后一个时期中医药继承发展的工作重点之一是“要着重做好对中医药古代文献的系统整理研究,对历代各种学说和流派进行研究,进一步做好名老中医药专家学术经验的继承”。构成中医学传统的是什么所谓传统,是文化发展中体现连续性的东西,是构成每一代人由以出发的前提的东西。构成中医学传统最重要的是它所拥有的一些经典,并具体反映在读书人的知识来源上,这在中医学继承和发展过程中具有特殊的意义。中医古籍是中医学全部知识的主要载体,理所当然的成为继承的主要内容。势在必行的古籍数字化继承发扬已成为中医学发展的主题,许多人认为中医学继承不够。但是,现实给我们的徵象却是古代文献离我们越来越远,中医学的本色越来越少。中医学有近万种古籍,对这海量文献的整理研究需要专门人才,但这方面的人才培养越来越困难。社会对中医古籍有着持续的需求,由于人才的缺乏,造成古籍整理研究水平不高。古籍数字化不是“梦之田园”,而是“田园之梦”。古籍数字化的性质传统的古籍整理延续了二千多年,不断在发展,古籍数字化不是代替古籍整理,是在传统基础上的发展、延伸。古籍数字化属于文献学和古籍整理的范畴,古籍的数字化工作必须是以相关领域的学者为主导,才可能向正确的方向发展,纯粹的技术专家不可能将古籍数字化。既然古籍数字化属于古籍整理和学术研究的范畴,那么就必须遵循古籍整理的基本原则,懂得学术研究的基本思维过程。因此,古籍数字化应该遵循古籍整理的一般过程和一般规则,而现有的数字古籍大多没有达到古籍整理的最低标准。古籍数字化的两个关键问题关键问题之一:古文献的知识表示方法知识的表示是研究知识从自然记载形式过渡到适合计算机处理的表示形式,在此基础上实现对知识的处理(指对知识的获取、知识的推理、知识的存取以及操作和管理等)。关键问题之二:古文献数字化技术标准通过技术标准的建立,对文献进行统一的解析、标引,构建结构化文献型数据库。什么是知识表示知识表示是研究知识从自然记载形式过渡到适合计算机处理的表示形式,在此基础上实现对知识的处理。全部中医古文献是一个巨大的知识系统,中医古籍知识表示方法的应用研究是一项开创性工作。从信息说起信息:是事物自身显示其存在方式和运动状态的属性,是客观存在的事物现象。信息概念有二个重要层次:一个是没有任何约束条件的本体论层次,一个是受主体约束的认识论层次。本体论:信息是一种客观存在的现象。认识论:主体所感知或表述的事物的状态、变化方式与属性。文献信息传播“文献”一词的产生,首见于《论语·八佾》:“子曰:夏礼吾能言之,杞不足徵也;殷礼吾能言之,宋不足徵也。文献不足故也,足则吾能徵之矣。”文指文章典籍,献是贤人。前代的文献传之后世,往往需要经师的解说才能够理解并代代相传。文章和贤人结合,造成了知识信息的传播。如校勘、训诂等等。信息二重性的实践《论语•阳货》:“子曰:天何言哉?四时行焉,百物生焉,天何言哉?”本体无意识,它被意识所感知。就“知识”来说,纯粹的“本体”是不存在的。中医古文献真实文本自然语言信息加上人的感知理解,我们对文献知识信息的计算机表示提出了:知识元=文本知识(本体论)+知识元语义概念(认识论)全部中医古籍是构成中医学的根本实体。我们把这巨大实体分解到“知识元”。加上专家的解析,形成实体与认识共存的知识库。以知识元为基础的知识表示框架知识元是知识系统中不可再分的最小的知识单元。在文献语言中,知识元的表现形式是由多个词语相互关联而构成的语句。如“黄帝问曰:医之治病也,一病而治各不同,皆愈,何也?岐伯对曰:地势使然也”。这段话的核心概念是“因地制宜”。又如:“太阳病,发热,汗出,恶风,脉缓者,名为中风”。此段话的核心概念是“太阳中风证”。知识元的构成知识元是由一个核心概念和一些围绕这个核心概念的词语构成的。元概念--知识元中的核心概念称为元概念。语言中的多个词语相互关联而产生语义,元概念即是通过对语义的分析而抽取出来的,这种被抽取的概念称作“知识元的语义概念”,简称为“元概念”。元概念的表述可以是一个词,也可以是一个语句。语义成分--附属于知识元语义概念的词语、词组或短语被称为“语义成分”。语义成分可以是固定或相对固定的实词或专业术语,也可以是词组或短语。知识元中的语义成分,其本质是组成这个元概念的基本义素。如《伤寒论》:“太阳中风,脉浮紧,发热恶寒,身疼痛,不汗出而烦躁,大青龙汤主之。”这是一个知识元,它的元概念是“大青龙汤证”。其中的“太阳中风”、“脉浮紧”、“发热恶寒”、“身疼痛”、“不汗出”、“烦躁”、“大青龙汤”,是构成这个元概念的语义成分。尝试建立一个古籍整理新模式XML是一种可扩展的置标语言。最近与清华同方集团共同开发的一个XML古文献数字化技术加工系统古籍解析标引系统古籍远程建库系统2000年以来,我们在国家中医药管理局、国家科学技术部和中国中医研究院的支持领导下,逐步组建了一支中医古籍的整理研究和数字化建设队伍。今年在清华同方集团的技术支持下,建立了一个虚拟古籍数字化