基于主动学习的传统中医症状本体构建方法研究综述

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

基于主动学习的传统中医症状本体构建方法研究综述领域本体的构建方法是当前本体研究的热点问题之一。已被广泛应用于知识工程、自然语言处理、系统建模、信息处理、信息检索和语义Web、软件复用等领域之中。但是,目前的领域本体的创建还缺乏系统的、针对所有领域的、工程化的方法。本文介绍一种基于主动学习的传统中医症状本体的文本知识自动获取方法的设计和实现。通过引入领域本体,实现半结构化文本知识的完全自动获取。该方法具有较好的通用性,把人们从繁重的手工劳动中解放出来,并能极大地提高中医知识获取的效率和应用价值。【关键词】领域本体中医症状名语义标注主动学习本体(Ontology)是近年来计算机及相关领域普遍关注的一个研究热点,本体可以促进各种领域之间的交流,这种交流实现了给定领域中不同知识的重用和共享。作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,已被广泛应用于知识工程、系统建模、信息处理、数字图书馆、自然语言理解、语义Web等领域之中。“传统中医”领域知识主要来源于古中医文献、临床记录、老中医经验手稿等。这些知识的主要载体常常是非结构或半结构的数据。中医诊断是通过对症状的总体观察和分析得到结果。由此可知中医古籍文献中症状名识别问题十分重要。如何让计算机对自由文本中症状名自动分析获取知识,进行病症诊断是知识工程领域需要解决的难题。知识服务离不开大型知识库的支持。仅仅依靠繁重的手工劳动来建设大型知识库,必将严重影响知识服务的能力和质量。因此,目前当务之急是寻求一种通用的自动的文本知识获取方法。传统的文本知识获取方法主要有两种:一种是采用通用的算法处理自然语言文本,从文本中抽取概念以及概念之间的关系。这种方法知识获取量大,但所获取的知识类型较单一,知识的表示形式也相对简单。另一种方法是通过与知识工程师进行交互,使用一些知识获取平台或管理环境,实现知识的获取。这种方法不仅手工工作量大,而且通用性也较差。鉴于现有文本知识获取方法的缺陷,本文提出一种从古籍文本的表征及内容特征出发,抽取实义词,为实现中医文献标引和检索从单汉字层次向词、概念层次的过渡。基于主动学习的方法进行文本标注,再进行自动领域本体构建。本文第1、2章介绍本体以及领域本体发展;第3章介绍传统中医症状本体的研究背景与意义;第4章介绍基于主动学习的传统中医症状本体构建方法可行性分析及结果和性能评价;第5章总结全文。1研究的范畴和发展现状1.1本体的概述本体最早是一个源于哲学的概念,是一种对“存在”的系统化解释,用于描述事务的本质。后来知识工程学者借用了这个概念,在开发知识系统时用于领域知识的获取。近年来,本体的概念被越来越多的应用于计算机知识工程领域,用于对客观世界的存在进行系统化描述,方便知识的重用和交互。本体是用于描述一个领域的术语集合,其组织结构是层次结构化的,可以作为一个知识库的骨架和基础。1.2本体的分类目前关于本体的研究非常广泛,尤其是在国外,许多研究组织和机构都研究建立了各种各具特色的本体。针对目前出现的各种各样的本体,也出现了不同的分类方法,最为广泛的分类方法是根据本体应用主题,将这些为数众多的本体划分为五种类型:领域本体、通用或常识本体、知识本体、语言学本体和任务本体。领域本体主要有以下作用:可以明确专业术语、关系及其领域公理,使其形式化;在人与人之间、人与机器之间达到共享;实现一定程度的领域知识复用。此外,Guarin也提出以详细程度和领域依赖度两个方面对本体进行划分。其中,根据本体对领域的依赖程度由高到低可分为四个类别:顶级本体(top-levelOntologies)、领域本体(domainOntologies)、任务本体(taskOntologies)和应用本体(applicationOntologies)。1.3本体的应用领域目前,本体已经被广泛应用于知识工程、自然语言处理、数字图书馆、信息检索和Web异构信息的处理、软件复用、面向对象技术和语义Web等领域。典型的应用有:(1)基于语义的信息检索,特别是网络搜索引擎和数字化图书馆。(2)基于本体的数据集成、机器学习等。(3)领域本体的应用。(4)语义Web服务。(5)在线元数据管理和自动信息发布。1.4本体研究的现状对本体的研究和应用近年来发展很快。在1998年6月,第一届“信息系统中的形式化本体论国际会议”的召开标志着这一领域在逐渐走向成熟。从国外的研究情况来看,20世纪80年代末至90年代初,哲学领域的概念“Ontology”被AI领域所借鉴,本体的建模方法也初步确立,本体论把知识工程中的知识向更深入的方向推进。近年来,国外对本体建模作了大量研究并将其运用于知识工程领域。主要代表为:(1)万维网联盟W3C(WorldWideWebConsortium)的研究;(2)德国卡尔斯鲁厄大学的RudiStuder,AlexanderMaeche和以他们为首的AIFB研究所从事的创建基于本体的知识门户和语义门户研究;(3)美国斯坦福大学的知识系统实验室(KSL)对本体建模工具和本体应用层面的研究。与国外相比,国内无论是在理论研究、实证研究还是在技术手段的实现和应用方面都相对落后,与国外高水平的研究相比存在很大差距。国内对于本体的研究大约始于20世纪90年代初。目前,国内进行本体研究的主要有三支科研力量。一是中国科学院计算所、数学所、自动化所的若干实验室,代表人物是陆汝铃院士、金芝博士、武成岗、曹存根等人。二是哈尔滨工业大学计算机系,代表人物是王念滨博士。三是浙江大学人工智能研究所,代表人物是博士生导师高济教授。

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功