多尺度为基础的基础地理信息的分类和编码WenwenTian1*,XinyanZhu1,LianDuan11测绘遥感信息工程国家重点实验室武汉大学武汉,中国*联系作者,电子邮件:geotww@foxmail.com摘要—地理信息编码是一项对空间数据组织的基本使能技术,是地质信息查询,检索和数据挖掘的关键[1]。目前,地理数据共享和更新的需求日益迫切,地理信息编码没有统一的标准而且应用领域混乱。基于传统的编码方法的不足,本文探讨了地理信息的规模,空间,语义和时间的特性,提出了一种新的编码模式,在空间,语义和时间维度上扩大当前编码方法。例如,它适用SGST编码模型在解决地方的地理数据库,并建立了多尺度表示更新机制。本文阐述了解决地方基础地理信息,例如,用SGST编码模型解决地方的地理数据库,并建立了多尺度表现更新机制。关键词:地理信息代码;多尺度;SGST编码I.引言统一的地理信息编码的基础是实现不同系统之间的地理信息交换,整合,更新,分享的成功。地理信息分类与编码,建立基础地理信息分类体系,这应该在基础地理信息采集,存储,检索,分析,输出和交换时给地理信息要素独特的身份,来增加识别他们。然而,目前地理信息共享与更新需求变得日益迫切,地理信息编码标准却是无管制和不统一的,应用行业多种多样,这使得“一物多码一码多物”现象成为一个需要解决的问题。这样的问题不仅制约了地理信息在不同的部门的流通和同步,但同时也带来了挑战传统ID码的技术。ISO/TC211提供了一个高层次的地理数据专业分类方案其中地理数据为-元数据标准,目的是为了分组和搜索可用的地理数据集,或一组地理数据集的关键字。[2].中国,“基础地理信息分类与代码标准(GB/T13923-93)发出,以满足多尺度基础地理信息采集,数据库建设,数据交换和共享的电流要求。[3].现行的国际标准和国家标准只是给一个粗略的分类编码框架,它在地理信息分类和编码起指导作用。[4].目前大多数行业的标准不走规模化,包括地理要素的语义,时空特性在内。两者都不能满足时空变化,多尺度数据共享和地理要素的更新要求。许多专家学者已经研究了地理信息分类与编码,在不同的领域提出了各种方法,如道路,城市信息化。[5,6].然而,本研究受到地理信息和地理信息编码制图的特性三个关键功能的限制,很少注意的时空变化和多尺度的表达,这不是为了方便描述空间数据库的更新传播和数据共享。[7,8].本文的其余部分安排如下。第2节介绍参与本方法的多尺度编码模式。第3节提出SGST(尺度网格语义的时间)的分类和基于所述尺度,空间,语义和四维立体编码笛卡尔机制的时间编码模型的细节。第4节说明解决了地方基础地理信息作为例子,并建立了多尺度表示更新机制。第5节通过提供未来研究方向总结全文。II.多尺度编码模型有效的地理信息分类编码模型可以保证的地理信息的科学性唯一性,这有利于不同的发展下数据的更新和分享。基于多尺度的扩展SGST分类编码模型,强调从简单的比例尺绘制的规模概念,规模大小,空间位置,语义层次和时间序列。该方法扩展了以前的传统分类编码方法和模型,只注重语义的地理信息和属性信息分类和编码,分类及地理要素编码按照地理信息本质特征。该SGST分类和编码模式不仅保证了地理要素规模,空间,语义和时间含义的编码被发现,也使得要完成的地理要素代码的唯一性,这对于数据在不同行业之间的流通和共享提供了理论依据。基于多尺度基础地理信息分类编码方法是四维立体代码系统,第一个是尺度特征代码,这是两个代码基于地形图模式和相关地形要素分类与编码,第二个维度是空间网格代码;第三维是属性代码,它扩展了国家基础地理信息分类与代码标准(GB/T13923-93);第四维是时间的代码,里面设施版本号技术对地理要素时间序列编码。地理信息SGST代码是由一个十进制数代码组成。其基本结构可以如下所示的?SGSTID=规模ID+网格ID+语义ID+时空IDIII.方法该SGST分类编码模型由四部分组成,其中包括尺度特征代码,空间网格代码,属性代码和时间代码实现。具体方法的绘述在本节的相关部分。A.规模功能代码有1:500,1:1000,1:2000,1:5000,1:10000,1:25000,1:5万,1:10万,1:25万,1:50万和1:10万的地形图架构及相关地理信息分类和国家基础地理信息分类与代码(GB/T13923-93)标准的代码。根据GB/T13923-93,规模特征代码已经把0-992位是由订单分配给当前规模的国家标准。例如,1:500规模分类与代码规模扩展代码是指定为00,1:1000比例尺代码分配为01。剩下的尺度可以通过相同的方法来完成,不同尺度都给予相应的尺度特征代码。如果需要的话,也有足够的码来扩展。尺度特征代码提供用于实现同一个地理元件在不同尺度之间的分层关系的表达,这表明地理要素的不同尺度之间的层次关系依赖有效链表达为基础。尺度特征代码可以元数据存储在空间数据库中,以标识地理元素的比例大小。指定的代码显示在表如下:定义元数据规模代码表定义属性的语义树定义版本号表定义网格大小计算网格数尺度特征代码属性代码时间码空间网格代码SGST分类和编码模型图1.SGST分类编码模型地图比例尺尺度特征代码1:500001:1,00001............1:1,000,00010B.空间网格码地理元素的位置信息被引入到地理信息编码在地理元素,它主要包括两部分,该目标区域的网格划分和规则来确定空间网格码的空间特性的代码。1)网格划分按一定的大小,目标区域在给定的地图比例尺是段成正方形网格中,如果分割的正方形网格具有多个地理元素,则分段被划分成一个新的水平大小,直到它具有有限的地理元素可可以增加识别。目标区域的左上角向下点被选择为坐标,并确定X,Y轴的原点。根据四叉树的原则,基本网格大小定义为Gi=2nm的(N=1〜10),下一级网格大小被定义为Gi+1=2N-1米。根据在所述目标区域的地理元件的数量,密度和复杂性,在n值决定[1]。如果有更高的密度和复杂的目标区域中的地理元素的分布,在n值应取低(N=1〜3);如果地理元件具有较低的密度和不太复杂的分布,那么在n值应取中间值(N=4〜8);如果地理要素具有非常低的密度分布简单,那么n值应采取高数(n=9〜10)。网格划分的显示如下的例子:表I.尺度特征代码表G=2n-1G=2nm图2.网格划分方法2)空间网格编码规则地理元素的空间网格代码有两个规则:主码的生成和副代码的分布。地理要素的空间网格代码的主要代码采用的是由计算机程序产划分了网格的莫顿二进制代码。莫顿码是线性四叉树的编码。基本的想法是,没有必要记录中间节点和指针,只记录叶节点,这是由地址码表示的叶子节点的位置。地理要素排列位置可以通过已知的莫顿码来计算。该代码的算法是非常有效的劈裂和合并操作,其在随后的算法有效性描述的细节。空间特性码的计算方法如下所述:a.计算从地理要素对目标区域的膜生物反应器基准点的中心点的距离;集A(X,Y)作为一个地理要素的膜生物反应器的中心点,O(X0,Y0)为坐标原点的距离可以描述如下:2020)()(yyxxD(1)b.根据地理要素的划分网格的大小,计算地理要素的小数等级;该等级数可以由下式来计算,GyyJGxxI00int,int(2)c.十进制排名被转换成二进制排名;22)(,)(JJII(3)d.通过网格编码的二进制排名计算地理要素的莫顿码。2)(JIMT(4)e.然后MT的二进制代码被转换为十进制码。102)()(MTMT(5)地理要素的空间网格码的副代码是使用传统的ID码技术,用户在网格中的每个地理要素分配的序列号。命名或序列号分别为相应的实体独立性副代码。C.属性代码目前,有属性信息的分类两种传统的方法:线分类和面分类[8]。线路类别也称为层次分类,国家标准化指导和一些论文已经作出原理和分类方法的详细说明,总结了其主要内容。实践证明行分类和刻面分类都有它的优点和缺点。在地理信息的分类,高层次的定性信息分类适合使用线分类;罗威级别的定量信息是适合采用刻面分类。地理信息分类与编码通常被分为两种类型:基本信息(或称框架数据)和主题信息(或部门数据),即地理信息=基础地理数据+主题数据。虽然该方法是利用基础地理信息登记主题信息去建设数据库,来适应当前的行业现状,专业部门的地理信息通常不会是基本信息的基础上取得的,因此在实现注册过程中有很多的困难。SGST代码属性的分类和编码模式是基于国家基础地理信息分类和编码(GB/T13923-93),语义树的概念,提供了一种有效的方法,为各部门确定了地理元素的唯一代码。国家标准的缺点在于对属性分类和编码太过简单,SGST分类编码模型,根据国家标准的扩展规则,需要当前不同部门的领域本体来考虑扩展了属性分类和代码。一些地理要素的相似距离,也可以通过内置的语义树,来计算确定它们是否是相同的地理要素的一个重要因素。D.时态代码大多数GIS软件是以传统的空间数据模型为基础上,没有把地理信息的时间特征考虑在内,使历史数据的管理和更新,带来了一些瓶颈。SGST模型的时空编码采用版本号编码方法,根据地理要素更新的时间顺序。每次更新的时间被定义为一个快照的版本号,它被作为元数据表存储在空间数据库中。版本管理使用线性版本模型。地理要素是根据版本号顺序记录在相应地图比例尺的数据库。线性版本号被描述为如下图所示。IV.实验A.编码范例据SGST编码模型,本文选择了解决一个区域面积的元素作为实验系统。在这个例子中,膜生物反应器的中心点大楼A(X0,Y0)的1:1万数据库是(645.33,756.65),这是在23日,2009年5月更新的。坐标为O(X,Y)值的原点被定义为为O(0,0)。网格的尺寸G=2nm的=32M(N=7)的中间值,根据一个事实,即地理元件具有低的密度和不太复杂的分布。建筑物的属性是310300,这是一个简单的构造,国家地理信息分类与代码标准(GB/T13923-93)进行检查。1)尺度特征代码据在SGST编码模型尺度特征代码的编码方法,规模特征代码为04。2)空间网格代码空间网格代码的主要代码的计算公式如下:CCCCCCCCCCCCCC35CCCFundamentalclassificationandcodethefristlevelcodethesecondlevelcodethethirdlevelcode图3.属性代码语义树VV2V3Vn....T1T2T3Tn图4.线性版本号2)010100(20)17.20int(32033.645intI2)010101(23)65.23int(32065.756intJ102)1301()010101000101(MT副代码是06,这是分配给网格划分和专家经验产物的数量。因此,空间网格代码130106。3)属性代码构造物的属性是310300,其代码可涉及过国家标准。因为构造物不属于特殊领域或部门,因此本文中的属性代码是没有必要通过语义树延伸的。4)时间代码时间代码是0003,这是在空间数据库获取的记录。SGSTID=规模ID+网格ID+语义ID+时空ID=(041301063103000006)B.基于SGST代码更新传播机制在多尺度表达中,在较高尺度的一个地理要素可能包括在较低尺度的几个地理要素,所以地理要素的编码在几个关键的地图比例上,因此同一要素的不同尺度的代码通过一定的编码运算方法可以联系在一起。当较低级别的数据被更新或修改时,较低级别的数据的修改可以通过各级之间的逻辑链路传播到目标级尺度用于实现多尺度自动化,协同更新传播。基于SGST分类编码模型的更新传播机制的细节进行描述。从细节来描述基于SGST分类编码模型的更新传播机制。首先,通过检测最详细尺度的时间的代码来找出变化的地理要素,然后,构建不同地图比例尺下有着尺度特征代码的地理要素的逻辑链路和属性代码;来更新高层次的逻辑链路。V.结论本文综述了基础地理信息编码的现有方法,从尺度,空间,语义和时间