基于空间信息语言学特征的概念模型构建

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1基于空间信息语言学特征的概念模型构建杜清运(武汉大学资源与环境科学学院,430070,武汉)E-mail:qydu@telecarto.com【摘要】本文以空间信息与语言同为人类进行空间相关交流手段这一功能隐喻为基础,总结地图学、地理信息科学、知识工程等学科与语言学模型相关的理论研究成果,探讨空间信息语言学模型对地理信息科学发展的理论意义,包括学科范式观点、本体论观点、方法论观点和定性观点等方面的意义。引言空间信息是人类对于现实世界认识的重要组成部分。对于地球表面具有空间分布位置差异的空间实体所产生的空间信息,历来就和人类对客观世界的认识和改造息息相关。除了人类所共有的文字语言和音乐外,地图被称为人类信息交流的第三语言。在以地图为中心的空间信息世界中,由于人的参与,人的知识在地图制图和地图使用各环节中保证了空间信息的正确传输,而这些知识除了关于地理学、社会学、数学、美学等之外,还有关于空间信息本身的知识。地理信息系统和地图学不同,它在本质上是排斥人作为主体的作用的,计算机取代人作为理想中的主体。我们希望计算机具备强大的管理、处理与分析空间信息的能力,人则可以转而从事更高级的智力劳动。这种主体的转移意味着计算机必须具备承担传统上由人来完成的智力劳动的能力。在地理信息系统中,由于使用计算系统来取代人的智力活动,知识成为核心问题,迫切需要对过去凭经验和直觉行事的知识基础进行总结和重构,使其成为计算机可以接受和实现的形式。到目前为止,我们对空间信息本身的认识还是分散的、经验性的和非形式化的,特别是针对地理信息系统的计算模型需求,于是造成在空间数据模型上的混乱和不完备性,以及空间数据处理特别是基于知识的数据处理得不到进一步发展。在现阶段,认识到空间信息本身结构研究的重要性之后,就迫切需要找到一个合适的理论框架来包容和指导空间信息结构的研究。1空间信息的概念模型地理信息系统是涉及空间信息的概念系统。由于地球表面的无限复杂性,要在计算机这样一个有限容量和处理能力的系统中表达,无可避免地要涉及抽象与综合。真实世界的信息须通过选择、表达、量化等过程才能最终成为计算系统所能管理和处理的内容。所有这些都与模型的概念相关。模型具有层次之分。在地理信息系统中,我们通常提到的三个层次是概念模型、逻辑模型和物理模型,该划分方法源自于数据库设计理论。在计算系统中,这三类模型的内容是完全不同的:概念模型涉及人对表达对象的认知和反映,是客观对象在人脑中的表达;逻辑模型是与计算系统相关的对概念模型的进一步抽象与表达;物理模型则是上述两个模型在特定的计算系统中的实现。随着知识工程的研究进展,在对知识表达模型的研究中,Brachmann(1979)提出了更为详尽的层次观。他认为,在知识中存在五个层次的基本元素。该分类的主要特点是在逻辑层次与概念层次之间增加了认识层次,弥补了“逻辑层次上的基本元素的极端概括和内容无关”与“在概念层次上它们又获得了不考虑任何内部结构的、整体性的意图意义”之间的巨大鸿沟。Guarino(1994)在分析上2述分类以后,进一步指出在认识层次和概念层次之间依然缺少一个层次,即本体层次,本体层次的引入可以加强对知识本身的(形式化)表达的关注,而不是单单注重形式推理的研究(如表1)。空间信息概念模型的问题应该得到足够的重视。知识工程的模型层次观一定程度上代表了所有计算系统的问题。从后面的讨论我们将看到,语言学模型的引入意味着从本体论、认识论和语言三个不同方面对空间信息结构的关注,具有哲学、语言学、认知科学等强烈的理论背景,以及人工智能与知识工程的技术方法背景。表1本体层次的主要特征层次基本概念主要特征解译逻辑层次谓词形式化任意的认识层次结构元素结构任意的本体层次满足意义公设意义约束的概念层次认知元素概念化主观的语言层次语言元素语言主观的2传统的地图语言学模型地图语言学模型存在着多种角度和层次,但一个主要关注点是对地图及其数字形式的概念模型,整体上属于宏观语言学的范畴。对一门学科而言,概念模型与学科范式密切相关,对学科的定位与方向有极大的影响。在这方面,以Lyutyy(1998)的观点最具代表性。他认为地图学目前正处在从运行-技术范式和方法论范式向现象学范式的转变过程中,而现象学范式即地图语言学范式。除此之外,有众多的学者从不同侧面提出了地图的语言学模型,但研究重点和目标各有不同。首先是对地图本身结构的关心。方法大多是采用符号学和语言学理论对地图作为语言或符号系统的语言单位、语法和语义的研究(Schlichtmann,1979-1999;Pravda,1993)。试图利用不同符号学派的理论解释地图及其组成部分,形成地图的符号化观点体系。其次,从传输论的角度出发研究过程和结构中的地图符号学问题,如结合符号学理论的地图传输模型、地理信息的心理结构研究等(Stolle,1984)。另外,还有从功能及词语等角度对地图符号之间及自身层次关系的研究,以Wood和Fels(1986)以及MacEachren(1995)的研究较为典型。地图语言学的另一个主要关注侧面是从计算机地图制图和地理信息系统方面展开的,整体上属于微观语言学的范畴。这些关注大多受模式识别、计算语言学等学科对语言学成果引用的启发,将地图作为自然语言或某种人工语言的类比物(Youngmann,1978;Taketa,1979;Du,1997-1998)。与前述的地图符号学和语言学研究不同,该研究的主要兴趣点在于数字地图及空间信息的概念模型及其形式化描述、表达及自动处理,其典型特点是对不同层次上的“语言实体”——语音、语法和语义单位及其复合单位,以及这些语言实体之间的不同关系(地图语法)的关心。数字地图及空间信息的形式化描述最终为其自动理解及智能化处理提供前提条件。3空间信息的语言学模型地图的语言学模型尽管出现的相对较晚,但发展势头很强。无独有偶,在地理信息科学领域,空间信息的认知与语言学方面也受到了广泛注意(Mark,1988,1989)。要确立空间信息的语言学模型,有几个基本问题是必须澄清的。33.1地图与空间信息地图以及图像、绘画、照片、文字、图表等都是真实世界传统的表达形式。在众多的表达形式中,地图是真实世界最重要的表达形式:同文字、图表相比,地图是一种模拟或图形表达形式,与图像、绘画相似;而同图像、绘画相比,地图又有自己独特的特性,即数学基础的严密性、表达内容与范围的选择性和符号的强调性等。地理信息系统中的空间信息也是真实世界的一种表达。在特性上,它继承了一切传统的表达形式(如在多媒体计算系统中),是传统表达形式的数字表达,实现与集成于计算系统中。由于在计算系统中空间信息的表达脱胎于传统的真实世界表达方式,尤其是地图表达方式,所以地理信息系统中空间信息可以看成是传统表达形式尤其是地图表达形式的数字化对等物。但是,地图的数字表达毕竟不完全等同于模拟地图,其区别主要表现为:符号特性:模拟表达是通过图形符号及其关系描述真实世界,符号在建立图上内容与真实世界概念的联系上具有重要意义。而在数字表达中,符号被数字化成所谓的特征码和其它属性;离散特性:模拟表达能够在一定程度上真实地再现真实世界的连续性,而数字表达由于计算系统固有的离散特征必须进行离散化。从某种意义上说,数字表达是模拟表达的再表达;集成特性:模拟表达受介质容量和图形表达内部机制的制约,无法表达超越载负量的图形与属性数据;而数字表达则不受影响,有可能将多种尺度、多种类型、多种时态的信息集成在一起;关系表达:在模拟表达中,空间关系一般是通过符号间的关系反映的,空间关系的提取主要依赖人的认知过程;而在数字表达中,空间关系往往需要显式化存贮或者计算。尽管如此,空间信息的表达特性并没有实质性的改变,尤其是作为表达本质的约定性并没有丧失,数据的选择性、强调性等反映出来的抽象及概括特征均得以保持。3.2自然语言系统和图形语言系统有关自然语言与图形语言系统的联系与区别,语言学家早就注意到了。从语言学角度来说,主要是自然语言的听觉及线性特征,以及诸如航行信号或图画作为另一种形式的视觉及多维(同时)特征。作为图形语言系统典型代表的地图语言与自然语言的类比不仅来源于语言学家及符号学家的思考,而且也在地图学领域得到了重视。根据Berlyant(1994)的总结,地图语言学概念认为:地图学是地图语言的科学;是符号学的一个分支;地图是利用制图语言系统编制的一种特殊的文本;理论研究的主要方向是地图语言理论、语法及制图语言系统和文本自动构建方法的发展和完善;地图学应主要和符号学及语言学、信息理论、计算机图形学和地理科学加强接触。随着计算机制图和地理信息系统的发展,数字地图和地理信息系统理论体系的完整构建也是领域工作者致力研究的课题,地理信息科学及其研究对象——空间信息也需要一个坚实的理解范式来指导和包容该领域的研究。语言类比在地理信息领域也找到了支持者(Youngmann,1978;Taketa,1979;Nyerges,1991)。其思想延续了地图语言学的理念,但目的有所变化,其主要目的是对地图知识的信息组织进行形式化,包括语言学、计算机科学、认知科学、地理学和地图学等不同领域的学者均不同程度地接受并加入了研究行列(MarkandFrank,1992)。3.3空间信息的语言学模型从语言学的角度对空间信息的分析来源于不同的认知论和方法论背景。首先,从认知论的角度看,语言是人类所独具的一种种属属性,它似乎是人类心理过程唯一的窗口(Mark,1991)。不少哲学家认为,人的思想或信念其实就是语言,也有人退一步但坚持认为,4我们只有通过对语言的研究才能把握思想,没有不通过语言表达而独立存在的思想。Russell甚至认为,语言和世界具有相同的结构,可以借助于分析语言的结构而认识世界的结构(徐友渔,1996)。从方法论的角度看,语法、语义、语用结构的系统分析方法为许多现代科学提供了方法论指导,特别是在计算机科学、计算机视觉、人工智能、知识工程、模式识别等领域(沈清等,1991;王润生,1995;童頫等,1992)。到目前为止,在空间信息领域所发展的语言学模型大致可以分为以下两个从不同角度入手而又彼此密切相关的大类,一类是从自然语言中的空间概念分析入手,以改善目前在空间信息概念模型上的不足,其中的代表性成果是美国国家地理信息与分析中心(NCGIA)第2号研究动议“空间关系语言”的研究(Mark,1988-1992;Frank&Mark,1991;Egenhofer,1998);另一类是借用符号学和语言学模型来解释和处理地图、数字地图以及地理信息系统中空间信息本身的问题,即将空间信息看成是一种空间形式的特殊语言形式,并利用语言学的语法、语义和语用研究手段来分析和认识空间信息的内部结构及分析与应用(Youngmann,1978;Taketa,1979;Nyerges,1991)。其中主要来自于地图语言学研究的延伸(Head,1999)、模式识别中的结构识别方法等(沈清,1991)。就其目的而言,大都可以归入宏观语言现象和微观语言现象的分析。4空间信息语言学模型的意义本文对语言学模型的关注主要是从方法论意义上展开的,即将空间信息表达看作是自然语言的类比,以建立空间信息作为一种二维图形语言的语音、语法与语义理论。之所以从这方面入手,一是传统的地图语言学具有良好的开端,但终止于对地图符号理论的功用;二是现有的地理信息科学缺乏一个统一、有效的学科范式,而语言学模型无论从哪个方面都具有填补该项空白的潜力。采用语言学模型作为空间信息的概念模型具有以下明显的特点及优势。4.1学科范式观点范式是一个科学共同体(community)公认的理论;是“专业领域已经接受的具体问题解决方案”,构成一个范式的是“坚强的信念网络——概念的、理论的、工具的和方法论的”(Kuhn,1970)。Kuhn发明了该术语,并在科学发展的模式环境下讨论了范式对科学进步所起的作用,科学的发展就是通过“原始科学”、“常规科学”、“革命科学”到新的“常规科学”的周而复始的过程,而不同范式的接纳和抛弃在该进程中

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功