第二章-空间数据的性质-B-2012

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.1地理世界的概念模型与数据模型2.2空间数据的性质2.3空间数据的不确定性第2章空间数据的性质NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.1地理世界的概念模型与数据模型NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•空间数据的特殊性质使得很多传统的数据分析方法和技术不能够直接应用于空间数据的分析,大量基于GIS的空间分析技术与传统的数据统计分析技术有着本质的不同,其原因在于这些分析方法和技术是基于空间数据性质的。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.1.1地理世界的概念模型--对象和场人类一般以两种观念认识世界,一种认为世界由离散的实体构成,另外一种认为世界是连续的场。于是,离散的对象和连续的场就构成了表示地理世界的两种基本方式,它提供了概念层次上地理世界的认知模型。离散实体又称为对象,通过其独特的局部化特征相互区别,并通过其拥有的特定属性的个体被识别。其重要特征是对象可被计数。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•维数是离散实体的显著特征,在离散的世界观中,实体自然地被抽象为点、线和多边形(面)3种类型。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•离散对象观将现实世界作为一个能够容纳概念对象、基本对象和复合对象的空间。•在离散对象方法中,空间对象的几何形态及其属性特征共同构成地理信息的完整表示,其属性信息是所描述的地理实体的特性,不因为这个实体位置的不同而改变。•离散对象也可以用来表示连续变化的场,如用等高线表示地形的连续起伏等。在每一条线上要素点的值处处相等;线的稀疏密集表示空间变化的梯度。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•场的观点--用连续表面描述地理现象的方法。它认为世界被很多变量描述,每一个变量在任何可能的位置都是可量测的。•连续场描述的是在空间—时间框架下地理变量的空间变化。•场的表示:在数字世界中完全地表示连续空间是不可能的,所有表示连续世界的空间数据模型都是某种程度的近似,这些模型包括规则的空间点、不规则的空间点、等值线、规则单元格、不规则三角网,以及多边形等NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGYNANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•不规则多边形表示场是经常使用的一种近似技术,是典型的用适量数据模型表示连续场的技术,植被覆盖类型、土壤类型和气候类型区等地理场经常使用不规则多边形表示。•在这种情形下,需要多边形不重叠并完整地覆盖所研究的空间范围。Voronoi多边形是经常使用的表示地理场的模型,它又称为Thiessen多边形。Voronoi多边形与Delauney三角形密切相关,根据一组空间点,可首先构造Delauney三角形,然后对三角形的边进行垂直等分即可导出Voronoi多边形。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•Voronoi多边形常用于气象和水文中,这是在假设观测点代表最邻近的空间位置的基础上,快速构造观测点所代表的空间区域的方法。•但Voronoi多边形的大小主要依赖于观测点分布的疏密,并且可能存在一个观测点不合理地代表了一个很大的区域,而其中的数值处处一致。•这一模型表示场的适合性受到点分布合理性的制约,在样本点的疏密程度变化合理的区域中场的表示好;而样本极度稀疏的区域将会忽视其空间变化。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY总之,离散对象和连续场概念模型是建立在两种地理世界认知观的基础上,它反映了地理世界的复杂性及认知的复杂性。基于离散对象和连续场,GIS实现了两种有效的空间数据模型,即矢量数据模型和栅格数据模型。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.1.2GIS空间数据模型——矢量和栅格•离散对象和连续场提供了关于表示地理世界的两种不同的概念视图,但是两者都不能解决任何地理现象数字化表示问题。•以数字形式表示地理数据的方法是栅格和矢量。原理上,两者都可以用编码场和对象,但是在实践中栅格与场、矢量与对象之间形成了强烈的联系。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.栅格数据•在栅格表示中,地理空间被划分成矩形单元格矩阵,通常使用正方形单元格。所有的地理变化通过对单元格赋予性质或属性来表示。单元格也被称为像素。•当信息以栅格形式表示时,每个单元格都有一个数值描述其属性特征,单元格内部的细节变化信息都丢失。•常用的编码方式有:最大份额法、中心点法。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.矢量数据•在矢量数据表示中,所有的线通过点之间的直线连接。•为了获取以矢量形式表示的区域对象,只需要形成多边形顶点的点被获取。这种方法比较简单,并且比栅格表示的效率更高,因为栅格表示多边形需要列出所有的单元格。•为了在栅格中精确地表示一个区域,就必须使用非常小的单元格,单元格的数量会成比例地增加。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.1.3属性数据的测度•属性是描述实体特征的变量。地理信息中属性的范围极其广泛,有些属性是自然或环境的而另外一些是社会或经济的。•区分属性信息的测度类型很重要,因为它规定了支撑量测的数字系统的规范性质,并决定了什么样的算术运算有效,以及使用什么样的统计过程。•从量测层次上可将属性数据分为离散尺度的或连续尺度的,定性的或定量的。虽然这两种分类方法对数据的性质给出了区分,但是不足以明确地定义变量的运算分析方法。•一般划分为名义、序数、间距、比率等属性。其中前两种属于离散尺度和定性的层次,后两者属于连续尺度和定量的层次。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGYNANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1)名义属性:是最简单的属性类型,即对地理实体的测度,本质上是对地理实体的分类。名义属性包括数字、文字,甚至颜色。即使名义属性是数值的,对其应用算术运算也是没有意义。2)序数属性:序数属性定义的类型之间存在等级关系。在序数属性中,属性值具有逻辑顺序。序数属性遵循明确定义的顺序,无论相继的属性之间的间距已知或未知。序数数据本质上是一种分类等级数据,即类型必须分为不同的等级。序数数据可以进行优先级的比较运算。对名义和序数数据能够进行分类计数,所以常被称为离散变量,或定性变量。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY3)间距属性:是一种对地理实体或现象的数量测度方法。间距属性测度的是一个值对于另一个值差异的幅度,但不是该值和真实零点之间的差值。由于间距属性的数值测度不是基于自然的或绝对的零点,因此数量关系的运算受到限制。间距属性值之间的加减算术运算是有效的,但是乘法和除法是无效的。间距属性数据还可以使用均值、标准差等进行描述。4)比率属性:是数值和其真实零点之间的差异幅度的测度。两个比率数值之间的加减乘除算术运算都有效。对于比率属性的数据可以实施各种数学运算。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY间距属性和比率属性是在连续尺度上的数据测度,可以是所定义的连续区间上的任何位置上的数值。二者之间的重要区别是间距数据没有自然的起点(或其量测的起点是相对的),而比率数据定义在绝对的起点上。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY在地理分析中必须注意属性数据的类型特征,因为不同的属性测度规定了可应用的数学运算方法。在GIS中,属性值是和地图对象相关联的,为了对地图对象规定允许的地图运算还必须区分空间广延量和空间强度量。例如,区域的面积是空间的广延量,当两个区域合并后的新的地图对象获得的是两个区域面积的和。密度是空间强度量。在空间单元聚集后为了获得空间强度量的正确的值,分子和分母必须分别聚集。这对于空间插值、可视化以及统计分析都有影响。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.2空间数据的性质NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY空间数据的特殊性质是多方面的,包括空间异质性、空间自相关、可塑性面积单元问题(MAUP)等。这些特殊性质直接影响了空间数据分析和建模的方法。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.2.1空间依赖性与空间异质性1.空间依赖性空间数据最为著名的特征就是Tobler的地理学第一定律所描述的特征:空间上距离相近的地理事物的相似性比距离远的事物相似性大,它所反映的就是空间数据的空间依赖性。其含义是在空间的某一位置i处,某个变量的值与其近邻位置j上的观测值有关,可写成式(2.1)的形式:假设每一种地理现象由一个过程及其表述的环境定义,那么过程表示现象的基本因素的变化,环境表示现象的观测框架(即空间和时间)。空间依赖性表示环境对于过程的重要影响。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•传统的统计学理论假设观测是独立的,并服从独立同分布。因为空间依赖性的存在,在空间分析环境中是一个不能接受的假设。此外关于残差分布的假设同样受到空间依赖性的影响。•空间依赖性程度是通过空间自相关测度的,这是两个直接关联的概念。•空间自相关的指标有两种类型:全局测度和局部测度。全局方法对研究区域的整体给出一个参数或指数,而局部方法提供和数据观测点等量的参数或指标。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.空间异质性•空间异质性是空间数据的第二个特性。异质性源于各地方的独特性质,表示空间数据的变化的不平稳性。•空间异质性与空间上行为关系缺乏稳定性有关,这一特性也称为空间非平稳性,意味着功能形式和参数在所研究区域的不同地方是不一样的,但是在区域的局部,其变化是一致的。•空间非平稳性是空间数据这一特征的数学表述,各向同性是与此概念密切相关的一个概念,即假设模式在所有方向上是一样的。对于大部分空间数据而言,假设空间过程非平稳和各向异性能更为真实地反映地理问题的实质。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY异质性或非平稳性的存在导致了分析中另外的问题,即需要强调空间—过程相互作用的局部性质。于是,缺乏局部分析能力的全局模型和全局统计量对于地理问题而言不是很好的工具,因为在很多情况下,全局模型或统计量平均了空间和过程之间的复杂相互作用。对于空间异质性或局部性质的强调引起了人们对以局部分析为基础的模型的兴趣。局部分析模型的结果是随着空间而变化的,而不是全局模型的单一结果。使用全局模型的一个重要的后果是空间数据的误差和不确定性可能有空间聚集的倾向,即在地图上的某些空间区域出现较大的误差和不确定性。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY根据空间异

1 / 49
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功