语义数据的含义就是语义(semantic)。简单的说,数据就是符号。数据本身没有任何意义,只有被赋予含义的数据才能够被使用,这时候数据就转化为了信息,而数据的含义就是语义。语义可以简单地看作是数据所对应的现实世界中的事物所代表的概念的含义,以及这些含义之间的关系,是数据在某个领域上的解释和逻辑表示。中文名语义外文名semantic定义数据的含义含义对数据符号的解释领域性特征编辑语义具有领域性特征,不属于任何领域的语义是不存在的。而语义异构则是指对同一事物在解释上所存在差异,也就体现为同一事物在不同领域中理解的不同。对于计算机科学来说,语义一般是指用户对于那些用来描述现实世界的计算机表示(即符号)的解释,也就是用户用来联系计算机表示和现实世界的途径。语义是对数据符号的解释,而语法则是对于这些符号之间的组织规则和结构关系的定义。对于信息集成领域来说,数据往往是通过模式(对于模式不存在或者隐含的非结构化和半结构化数据,往往需要在集成前定义出它们的模式)来组织的,数据的访问也是通过作用于模式来获得的,这时语义就是指模式元素(例如类、属性、约束等等)的含义,而语法则是模式元素的结构。主观特征编辑由于信息概念具有很强的主观特征,目前还没有一个统一和明确的解释。我们可以将信息简单的定义为被赋予了含义的数据,如果该含义(语义)能够被计算机所“理解”(指能够通过形式化系统解释、推理并判断),那么该信息就是能够被计算机所处理的信息。关于知识的概念目前没有明确的定义,一般来说,知识为人类提供了一种能够理解的模式用来判断事物到底表示什么或者事情将会如何发展。从知识的陈述特性上来看,知识即指用来描述信息的概念、概念之间的关系,以及概念在陈述具体事实时所必须遵守的条件。从这一点看,对于信息的语义以及信息语义之间的关联关系的描述本身就是一种知识的表达,因此在许多研究中,往往将语义的描述等同于知识的描述。本体的含义Studer认为“本体是共享概念模型的明确的形式化规范说明”。这个定义的说明体现了本体的4层含义:1概念模型(conceptualization)通过抽象出客观世界中一些现象的相关概念而得到的模型,其表示的含义独立于具体的环境状态。2明确(explicit)所使用的概念及使用这些概念的约束都有明确的定义。3形式化(formal)本体是计算机可读的,即能被计算机处理。4共享(share)本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。本体的目标本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。总的来说,构造本体可以实现某种程度的知识共享和重用,以及提高系统通讯、互操作、可靠性的能力。本体的构建出于对各自问题域和具体工程的考虑,构造本体的过程各不相同。目前没有一个标准的本体的构造方法。不过在构造特定领域本体的过程中,有一点是得到大家公认的,那就是需要该领域专家的参与。最有影响的是Gruber(TowardPrinciplesfortheDesignofOntologiesUsedforKnowledgeSharing)在1995年提出的5条规则1.清晰(Clarity)本体必须有效的说明所定义术语的意思。定义应该是客观的,与背景独立的。当定义可以用逻辑公理表达时,它应该是形式化的。定义应该尽可能的完整。所有定义应该用自然语言加以说明。2.一致(Coherence)本体应该是一致的,也就是说,它应该支持与其定义相一致的推理。它所定义的公理以及用自然语言进行说明的文档都应该具有一致性。3.可扩展性(Extendibility)本体应该为可预料到的任务提供概念基础。它应该可以支持在已有的概念基础上定义新的术语,以满足特殊的需求,而无须修改已有的概念定义。4.编码偏好程度最小(Minimalencodingbias)概念的描述不应该依赖于某一种特殊的符号层的表示方法。因为实际的系统可能采用不同的知识表示方法。5.本体约定最小(MinimalontologicalCommitment)本体约定应该最小,只要能够满足特定的知识共享需求即可。这可以通过定义约束最弱的公理以及只定义通讯所需的词汇来保证。目前大家公认在构造特定领域的本体的过程中需要领域专家的参与。本体工程工具●DOGMA●DogmaModeler●KAON●OntoClean●OnToContent