信息资源组织方法论 本体方法 - 上海图书馆

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

信息资源组织方法论本体方法刘炜wliu@libnet.sh.cn目录•什么是本体?•本体有什么作用?•本体如何发挥作用?•本体如何生成•本体应用举例•本体是概念体系的规范«Aspecificationofaconceptualization»(Gruber,1993)•“本体是对概念体系的明确的、形式化、可共享的规范说明”“AnOntologyisaformalandexplicitspecificationofasharedconceptualisationofadomainofinterest”Studer1998)。•本体是对于存在的研究或科学thescienceorstudyofbeing(见牛津英语辞典)什么是知识本体?Ontology建模元素•类(classes)或概念(concepts)–对象的集合•关系(relations)–在领域中概念之间的交互作用,如子类关系•函数(functions)–特殊的关系,关系的前n-1个元素可以唯一决定第n个元素。如Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。•公理(axioms)–代表永真断言,如概念乙属于概念甲的范围。•实例(instances)–代表元素,就是对象。本体的功能和作用•在人、机器(表现为软件代理)以及人与机器之间共享对于信息及结构的共同理解•实现一定程度的领域知识的重用•知识本体可以明确领域假设,使领域公理得到明确描述从而达成共知•对于领域知识进行分析、明确,并使其形式化Whydevelopanontology?•Tosharecommonunderstandingofthestructureofinformationamongpeopleorsoftwareagents•Toenablereuseofdomainknowledge•Tomakedomainassumptionsexplicit•Toseparatedomainknowledgefromtheoperationalknowledge•Toanalyzedomainknowledge本体对于世界的假设•世界是由对象组成的Thereareobjectsintheworld.•对象有属性特征可以被赋值Objectshavepropertiesorattributesthatcantakevalues.•对象之间有各种关系Objectscanexistinvariousrelationswitheachother.•属性与关系并不是一成不变的Propertiesandrelationscanchangeovertime.•不同的时间会发生不同的事情Thereareeventsthatoccuratdifferenttimeinstants.•总是有一些事件发生一些过程有一些对象会参与Thereareprocessesinwhichobjectsparticipateandthatoccurovertime.•世界以及其中的对象会有不同的状态Theworldanditsobjectscanbeindifferentstates.•一个事件会引起另一些事件或状态Eventscancauseothereventsorstatesaseffects.•对象会有许多部分组成Objectscanhaveparts.[Chandrasekaran,etc1999]本体对于数字图书馆的作用•提供与描述型元数据有关语义描述的知识地图•提供资源库领域知识的规范描述•提供元数据映射方案,集成到数字图书馆体系中的元数据服务中,成为协议的一部分•提供智能代理与信息环境之间基于语义的理解机制•作为跨平台、跨系统之间的通信中介•分布环境下查询请求的语义理解•数字图书馆中的数据挖掘本体方法弥补元数据方法的不足•元数据方案不具有普遍适用性。无法克服特殊性与一般性的矛盾,而形式化的知识本体可以提供一种在元数据方案之间自动映射的机制,通过语义Web服务的体系架构进行实现;•元数据应用难以实现元数据方案本身的进化,而知识本体可以提供信息系统的其它视图,只需要通过自动或半自动的手段应用新的元数据方案;•元数据方案自身难以对不同知识体系、不同“粒度”的资源进行描述,而知识本体正是起到这个作用,从而实现异构资源和系统之间的语义联系;•单纯的元数据方案对于数字资源的整个生命周期的描述非常困难,而采用以诸如FRBR模型为基础的知识本体,这个问题便迎刃而解,不同生命周期的知识产权属性也非常易于描述;本体的功能实现书目数据二次文献网络资源裸数据全文库……内容层本体映射本体模型本体层元数据收获元数据映射服务智能代理元数据层浏览检索表现层本体的特点•共享:Sharedunderstandingwithinacommunityofpeople•描述:Declarativespecificationofentitiesandtheirrelationshipswitheachother•推理:Constraintsandrulesthatpermitreasoningwithintheontology•服务:Behaviorassociatedwithstatedorinferredfacts知识表达工具本体的实现方法比较本体方法的实现机制•本体开发工具•内容采集或创建系统•存储于检索系统•本体推理中介、软件、服务……•应用集成仅仅有形式化的本体是不够的,就像叙词方法必须要有情报检索系统支持一样。本体也需要实现机制和系统支持,包括:本体描述举例WK0dc.Creatordc.Title“约翰克里斯朵夫”WK1hasTranslationhasRelation手稿MN0Format“手稿”罗曼罗兰DateofBirth1866Biograph.........MN1hasRelationEV0CreatesMN4hasRelationFormat“电影”Duration“2小时”ST4inStateEV1InvolvesrdfType“平明版”atTime“1952”MN2EV2InvolvesrdfType“安徽文艺版atTime“1990”Format“精装”“平装”ST1ST2hasOutputhasOutput………hasInput图2:ABC本体模型描述傅雷翻译作品《约翰克里斯朵夫》DateofBirth1866Biograph.........傅雷Translator………本体描述语言OWL•由DAML+OIL发展而来•基于RDF和RDFS•分3个版本Lite/DL/Full知识本体的创建建立本体的目标、范围、需求分析概念(词表)汇总本体关系分析本体形式化本体维护/修订本体信息本体领域本体知识共享系统知识库本体创建阶段本体维护阶段本体操作阶段反馈最终用户领域专家本体需求分析•(1)所构建的知识本体覆盖的学科领域,该学科领域资源的基本状况。•(2)知识本体的建设目的、任务要求、实现的社会与经济效益。•(3)利用知识本体的基本用户与核心用户,用户需求的基本特点。•(4)较之其他资源系统,知识本体将提供什么样的服务。•(5)知识本体和其他资源系统的关系,包括资源的进一步映射和整合。•(6)知识本体在建设时间、进度上的要求。本体规划•(1)明确计划中要达到的工作目标,论证工作的重要性和必要性。•(2)明确工作的具体任务和要求,每一时期的中心任务和工作重点;对任务进行层层分解,列出工作责任矩阵,确定完成工作的优先次序。•(3)明确计划中各项工作开始和完成的时间,在任务分解的基础上进行统筹规划,以便进行有效的控制和协调。•(4)说明完成计划的方式方法、具体措施,对资源进行合理分配和集中使用,并进行综合平衡。•(5)规定控制标准和工作指标,也就是说必须做到什么程度、达到什么标准才算完成了计划。本体构建•复用•利用工具确定本体概念间关系•(1)确定领域知识本体的核心概念集•(2)构建领域知识本体概念关系•(3)将本体概念及关系模型化本体编码•本体的形式化编码阶段就是用选定的本体语言来描述知识本体•多种方法都可以描述本体,例如关系数据库、逻辑、OWL…,主要要看如何实现本体评价•(1)本体的完整性。即本体是否包括了该领域重要概念,概念及关系是否完整,概念的等级、层次是否多样化。•(2)本体的清晰性。即本体中的术语是否被清晰无歧义的定义。除了规范的主题、分类术语外,对本体进化产生的概念是否给出明确、严格的语义定义。•(3)本体的一致性。即本体中的概念间的关系在逻辑上是否严密、一致,能否支持本体在语义逻辑上的推理。•(4)本体的可扩展性。即本体可否顺利实施进化,本体能否在层次结构上可扩充,在语义上可丰富与完善,能否加入新的术语概念。•(5)本体的兼容性。即本体的开放性和互操作性,本体能否和其他领域本体及相关资源系统进行映射,包括系统层、逻辑层、语义层、表现层等的兼容和互操作。本体工具•本体工具一般可以区分为:本体开发工具(Developmenttools)与本体映射工具(MappingTools)•前者包括:Protégé-2000,OntoEdit,OilEd,WebODE,Ontolingua等•后者包括:PROMPT,ONION,OBSERVER,Chimaera,FCA-Merge,GLUE等。•我们因为不涉及具体的应用,所以不关注映射工具。但是本体领域一直极为关注不同本体的集成、映射等,所以映射工具也是十分重要的一块。评价本体开发工具的指标•互操作性:包括把其他本体导入到此开发工具;把用此开发工具编辑出的本体导出为各种本体语言等•知识模型的表达能力(Expressivenessoftheknowledgemodel)•灵活性、可变性(Scalability)•可扩展性(Extensibility)•推理的支持程度Availabilityandcapabilitiesofinferenceservices•可用性(Usabilityoftools)本体工具比较的一个案例•这是一个全面的对本体工具的对比。共对比了52个本体工具•本体的种类•普通(一般或常识)本体(高层本体或顶层本体)•领域本体•术语本体TerminologyOntologies•形式本体FormalOntology•混合本体Mixedontology•表现本体Representationalontologies•任务/方法本体TaskandMethodOntologies•局部本体Regionalontology通用本体CommonOntologies•关于世界的最一般的认知capturegeneralknowledgeabouttheworld•设计最一般的标识和概念,如时间、空间、状态、时间等providebasicnotationsandconceptsforthingsliketime,space,state,eventetc•因此对于许多领域都有用asaconsequence,theyarevalidacrossseveraldomains•e.gontologyaboutmereology(part-ofrelations)•(UpperOntologyortop-levelontology--generalleveldescriptiveterms)领域本体DomainOntologies•关于领域知识的本体capturetheknowledgerelatedwithaspecificdomain•e.g.electronic,medical,mechanic,digitaldomain术语本体TerminologyOntologies•Anontologywhosecategoriesneednotbefullyspecifiedbyaxiomsanddefinitions.•例如WordNet。Anexampleofaterm

1 / 38
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功