地理建模

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

地理建模第一章1.地理建模的步骤:问题分析:明确研究对象和研究目的,问题所依据的事实和数据资料来源是什么,是否真实,并确定问题的类型,是确定型还是随机型,是需要建模还是模拟?模型假设:列举并分析模型可能相关的许多因素,并通过假设把所研究的问题进行简化,明确模型中需要考虑的因素及在问题中所起的作用,以变量或参数的形式表达这些模型。建立模型:运用数学知识和数学技能技巧来描述问题变量之间的关系,通常可以用数学表达式来描述。模型求解与分析:对已建立的模型进行数学上的求解,对模型中的参数得出估计值,并对此进行分析,以得到最优决策或控制。模型检验:把模型的运行结果与实际观测进行比较,如果与实际相合或基本一致,则说明是符合实际问题的,反之则返回到建模时的假设,检查地理要素的选择是否准确合理,再给出修正,重复过程。模型应用:解决实际问题。2.地理建模方法:地理建模方法主要有两个过程,分别为地理系统分析和地理系统综合。地理系统分析是地理系统综合的基础和前提,是简化、分解、建立简化数学模型的过程,而地理系统综合是把经过地理系统分析的客观系统,按其要素之间的关系,各级系统连接的规律,彼此逐级连接起来,形成从简单到复杂、从低级到高级的地理系统的过程,事实上也就是一个地理建模的过程。地理系统综合的过程就是地理系统模拟和建模的过程,两者往往是同义的。地理系统分析和地理系统这两种地理系统研究和建模方法,通过地理系统的各个地理要素间的数量分析而相互连接起来。第二章:一、地理数据的种类:地理数据是用一定的测度标准去衡量地理要素而取得的地理信息,不同的测度标准可以产生不同类型的地理数据,它们分别反映地理要素的不同特征。地理数据根据表达方式的不同,分为定量数据和定性数据两类。定量地理数据包括间隔尺度数据、比例尺度数据;定性地理数据则包括有序数据、二元数据、名义尺度数据。间隔尺度数据是一种定量地理数据(可以用数量表示),它以连续的量来表示地理要素,并根据地理要素不同的性质采用不同度量单位作为标准。其特点是数据间不仅能比较大小,而且能定量表示这种差异,没有自然0值。它是地理数据类型中最常见的一种,是统计分析的基础。比例尺度数据是一种定量地理数据(可以用数量表示),以连续的量表示地理要素,但须事先规定一个基点(可以是间隔尺度数据的某个量),并将其它量换算为基点的比例,故又称指数/百分比。在统计分析中,一般可以用于间隔尺度数据的技术也可以用于比例尺度数据。有序数据是一种定性地理数据,不表示连续的量,而只表示次序或等级关系。二元数据也称0-1数据,是一种定性地理数据,表示地理要素的性质,以列成矩阵的0、1变量表示,变量数比地理要素性质类型少1.通过二元数据矩阵将地理要素的定性、定量数据联系起来进行的数量分析方法称为数量化方法。名义尺度数据是一种定性地理数据,可以用文字或字符表示,是用来表示地理要素的类型数据。在众多事物中只根据其固有特征进行区分时,可采用名义尺度数据。二、空间地理数据:空间地理数据是空分析的对象,是描述地理空间一定范围内空间实体及其相互关系的数据。根据地理系统的基本特征,空间数据可以分为属性数据、几何数据、关系数据。属性数据:描述空间实体的属性特征的数据。几何数据:描述空间实体的空间特征的数据。关系数据:描述空间实体之间拓扑关系的数据。空间数据表示模型主要有三种:栅格数据模型、矢量数据模型、栅格-矢量一体化数据模型。栅格数据模型是指地理空间作为一个整体被划分为规则的格网,空间位置由格网的行、列表示。格网的大小反映了数据的分辨率。主要有三角形,正方形,六边形格网。缺点是一个栅格只能赋予一个特定的值,不利于多要素内容的表达。矢量数据模型:将地理空间作为一个空域,地理要素根据其空间形态特征分为点、线、面等,点用空间坐标表示,线由一串坐标表示,面是由线形闭合多边形表示。栅格矢量一体化数据模型:是结合栅格和矢量数据模型的优点提出的一种数据模型。在栅格矢量一体化数据模型中,面状数据用矢量边界的方式表示,同时也用栅格方式表示,线状数据一般用矢量方式表示,如果将矢量方式表示的现状对象也用像元空间填充表达,则能力、够将矢量和栅格的概念统一起来,形成栅格矢量一体化的数据模型。栅格矢量数据一体化模型,本质上是以栅格为基础,结合栅格和矢量数据模型优点的空间数据模型。三、地理系统要素统计量构造地理系统要素统计量的建立,有利于定量地刻画某种地理要素特征,并且可以使其时间和空间差异的对比采取数值形式,还可以对各要素之间的关系做定量分析。根据已经应用的地理系统要素统计量,它们的构造特点如下:(1)对于现象分布的集中程度和离散程度,往往与平均值相联系或与最大、最小值相联系,构造出刻画地理特征的相对指标。(2)构造地理要素在地区分布上的集中和离散程度,往往采取计算坐标或将分布范围面积进行比较,确定中心坐标或求出面积比例。(3)构造地理要素的地区分布形态的统计量,往往采取实际分布状况与其最小外接圆面积作对比的方法。(4)构造与发展速度有关的地理要素的统计量,往往采用指数函数或对数函数的形式,若是均一的发展速度,则采取线性函数的形式。(5)构造与发展速度变化有关的地理要素的统计量,往往采取求导数或偏导数的方法。(6)地理因素的复杂性,多元统计分析被引入。对于统计量的构造要求:信息便于收集、信息的可靠性大、在时间与空间上可比、并且能够准确反映要素的特征。此外,在计算上还应简捷方便。四、数据变换处理为了使不同量纲、不同数量级的数据能放在一起比较,通常需要对数据进行变换处理。所谓数据变换,是将原始数据矩阵中的每个元素,按照某种特定的运算把它变为一个新值,而且数值的变化不依赖于原始数据几何中其他数据的新值。常用的变换方法有:中心化变换、规格化变换、标准化变换和对数变换等。标准化变换方法是对变量属性进行变换处理,首先对列中心化,再用标准差进行标准化。设数据矩阵为(xij)m×n,(m为样本数,n为变量数),每列元素均值为𝑥𝑗̅=∑𝑥𝑖𝑗𝑛,方差为𝑠𝑗=√∑(𝑥𝑖𝑗−𝑥𝑗)2𝑛−1,则元素xij经标准化变换为𝑥𝑖𝑗′=𝑥𝑖𝑗−𝑥𝑗̅𝑠𝑗,其中i=1,2,…,m;j=1,2,…,n.经变换后,每列数据的均值为0,方差为1.使用标准差标准化处理后,在抽样样本改变时,它仍然保持相对稳定性。规格化变换方法是从数据矩阵的每一个变量中找出其最大值和最小值求差(极差),再从每一个原始数据中减去该变量的最小值后除以极差,得到规格化数据。设数据矩阵为(xij)m×n,对于第j列(j=1,2,…,n)的元素xij,其最大值记为max{xij},最小值记为min{xij},则元素xij经规格化变换为𝑥𝑖𝑗′=𝑥𝑖𝑗−min{𝑥𝑖𝑗}max{𝑥𝑖𝑗}−min{𝑥𝑖𝑗},其中i=1,2,…,m.经规格化变换后,每列最大值为1,最小值为0,其余数据取值在(0,1)中。中心化变换方法是一种标准化处理方法,先求出每个变量的样本平均值,再从原始数据中减去它,就得到中心化后的数据。设数据矩阵为(xij)m×n,每列元素均值为𝑥𝑗̅=∑𝑥𝑖𝑗𝑛,则元素xij经中心化变换为𝑥𝑖𝑗′=𝑥𝑖𝑗𝑥𝑗̅,其中i=1,2,…,m;j=1,2,…,n.变换后,每列数据之和均为0,平方和为该列数据方差的(n-1)倍,任何不同两列数据的交叉积为这两列的协方差的(n-1)倍。第三章:相关与回归地理模型一、相关系数及其衍生指标相关是指两个或两个以上的要素间相互关系是否密切。在研究这种关系时并不专指哪一个是自变量,哪一个是因变量,可视实际情况确定。相关分析仅限于测定两个或两个以上变量具有相关关系者,其目的是计算出表示两个或两个以上变量间相关程度和性质。相关系数是用来度量直线相关程度和方向的指标。相关程度是指两个要素之间的关系有多密切,相关方向则是指两个变量变化方向是否相反,可分为正相关、负相关、零相关。相关系数的常用计算公式为r=∑(𝑥−𝑥̅)(𝑦−𝑦̅)√∑(𝑥−𝑥̅)2∑(𝑦−𝑦̅)2。当|r|0.95为显著相关,|r|≥0.8为高度相关,|r|0.3认为不相关。偏相关系数由于地理系统是一种多要素系统,所以一个要素的变化就要影响到其它要素的变化,因此它们之间存在着不同程度的相关关系。如专门研究某一个要素对另一个要素的影响或相关程度,而把其它要素的影响视为不变(除去其它要素的影响),单独研究那两个要素之间的相关关系时,则称为偏相关。对应地,偏相关系数可以由相关系数法来计算。其中“.”后的是视为常量的要素。举例:𝑟12.3=𝑟12−𝑟13𝑟23√(1−𝑟132)(1−𝑟232).复相关系数实际上,一个要素的变化往往受多种要素的综合影响,用单相关或偏相关分析的方法不能反映各要素的综合影响,就需要用复相关分析加以解决。复相关就是研究几个要素同时与某一个要素之间的相关关系。复相关系数是度量复相关程度的指标,可利用单相关系数和偏相关系数求得。有k个自变量时,因变量y与它们的复相关系数为𝑅𝑦.12…𝑘=√1(1𝑟𝑦12)(1𝑟𝑦2.12)(1𝑟𝑦3.122)…(1𝑟𝑦𝑘.12…(𝑘−1)2).复相关系数必大于或等于单相关系数的绝对值,大于等于由同一系列资料所求得的偏相关系数的绝对值,即R1.23≥|r12.3|。相关系数的显著性检验记f为使用资料对数,α为信度。偏相关系数的显著性检验一般用t-检验法,计算式为t=𝑟12,34…𝑚√1−𝑟12,34…𝑚2√𝑛𝑚1,其中,r12,34……m为偏相关系数,n为样本容量,m为自变量个数。求出t值后,再查t分布表,可得出不同的显著水平的临界值tα。ttα表示偏相关显著;t≤tα表示偏相关不显著。复相关系数的显著性检验,可用F-检验法:,计算公式为F=𝑅𝑦.12…𝑘21−𝑅𝑦.12…𝑘2𝑛−𝑘−1𝑘,式中,n为样本容量,k为自变量个数。求出F值后再查F分布表,可得出不同的显著水平的临界值Fα。FFα0.01为极(0.01水平上)显著;Fα0.05≤FFα0.01,复相关在0.05水平上显著;Fα0.10≤FFα0.05,0.10水平上显著;FFα0.10不显著。二、回归分析与相关分析的异同(应先名词解释)回归分析是从针对完全精确但由于观测资料的误差而可能不确定的函数关系,以及没有确定性的关系、但在统计意义上存在着某种类型函数关系的统计相关关系进行,用数理统计的方法,寻找出并用回归方程来表示。主要内容包括从一组地理数据出发,确定这些要素间的定量数学表达式,即回归模型;根据一个或几个要素的值来预测或控制另一个要素的取值;从影响某一地理过程中的许多要素中,找出哪些要素是主要的,哪些要素是次要的,这些要素之间又有些什么关系。相关分析是计算出两个或两个以上变量相关程度或性质。项目相关分析(回归分析的基础)回归分析相同点研究和处理变量之间相互关系的一种数理统计方法研究对象和内容相同不同点主要研究要素(变量)间联系密切程度问题主要研究要素(变量)间联系的数学表达式(地理建模)没有严格的自变量和因变量之分有严格的自变量和因变量之分x,y均为随机变量仅有y为随机变量测定相关程度和方向用回归模型进行预测和控制第4章趋势面分析地理模型一、趋势面分析趋势面分析是运用数学方法,以数学模型来模拟地理数据的空间分布及其区域性变化趋势的方法。它能够解决大量非线性模型的问题。采用趋势面来拟合回归方程,计算趋势面的数学表达式主要有多项式函数和傅里叶级数,最常用的是多项式函数。趋势面分析是一种光滑的数学曲面,它能集中地代表地理数据在大范围内的空间变化趋势,可以表示为实际曲面=趋势面+剩余面。其中,趋势面对应于一个确定的函数,受大范围的系统性因素控制,反映地理系统及其要素的区域性变化的规律;剩余曲面则一般对应于一个随机函数,主要受局部因素和随机因素的控制,反映地理系统及其要素局部性的变化特点。对应于趋势面上的某观测点上的观测值,也由确定性函数的趋势值和随机性函数的

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功