1计量地理学期末第二章1.地理数据有哪几种类型,各种类型地理数据之间的区别和联系是什么?答:地理数据就是用一定的测度方式描述和衡量地理对象的有关量化指标。按类型可分为:1)空间数据:点数据,线数据,面数据;2)属性数据:数量标志数据,品质标志数据地理数据之间的区别与联系:数据包括空间数据和属性数据,空间数据的表达可以采用栅格和矢量两种形式。空间数据表现了地理空间实体的位置、大小、形状、方向以及几何拓扑关系。属性数据表现了空间实体的空间属性以外的其他属性特征,属性数据主要是对空间数据的说明。如一个城市点,它的属性数据有人口,GDP,绿化率等等描述指标。它们有密切的关系,两者互相结合才能将一个地理试题表达清楚。2.各种类型的地理数据的测度方法分别是什么?地理数据主要包括空间数据和属性数据:空间数据——对于空间数据的表达,可以将其归纳为点、线、面三种几何实体以及描述它们之间空间联系的拓扑关系;属性数据——对于属性数据的表达,需要从数量标志数据和品质标志数据两方面进行描述。其测度方法主要有:(1)数量标志数据①间隔尺度(IntervalScale)数据:以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对量。②比例尺度(RatioScale)数据:以无量纲的数据形式表示测度对象的相对量。这种数据要求事先规定一个基点,然后将其它同类数据与基点数据相比较,换算为基点数据的比例。(2)品质标志数据①有序(Ordinal)数据。当测度标准不是连续的量,而是只表示其顺序关系的数据,这种数据并不表示量的多少,而只是给出一个等级或次序。②二元数据。即用0、1两个数据表示地理事物、地理现象或地理事件的是非判断问题。③名义尺度(NominalScale)数据。即用数字表示地理实体、地理要素、地理现象或地理事件的状态类型。3.地理数据的基本特征有哪些?1)数量化、形式化与逻辑化2)不确定性3)多种时空尺度4)多维性4.地理数据采集的来源渠道有哪些?1)来自于观测、测量部门的有关专业数据。2)来自于统计年鉴、统计公报中的有关自然资源及社会经济发展数据。3)来自于有关单位或个人的不定期的典型调查数据、抽样调查数据。4)来自于政府公报、政府文件中的有关数据。5)来自于互联网(internet)的有关共享数据。6)来自地图图件。主要包括各种比例尺的地形图、专题地图等。7)来自遥感数据。8)其他来源的有关数据,如室内实验分析数据。29)来自于档案、图书等文献资料中的有关数据。5.数学方法和地理信息系统在地理数据处理中各自发挥什么样的作用?答:1)运用数学方法,建立地理数学模型,从更高,更深层次上揭示地理问题的机理。数学方法可以通过定量化的计算和分析对地理数据进行处理。2)地理信息系统在处理空间数据和海量数据方面的功能是非常强大的,而GIS相关软件如ARCGIS等将空间数据域属性数据完美结合,处理起来更方便。第8题:对比I值可以看到1999年,2001年,2002年,2003年,2004年的集中化程度基本相似,其中1999年的集中化程度最高,2004年的集中化指数最低。第9题:结论:如果将各组分数据从小到大排列则洛伦兹曲线会是程下凹的曲线。如果这样操作,集中化指数的计算值公式将会是I=RMAR比较I值可知:1999年的集中化指数最大,2004年的集中化指数最小。并且集中化指数和从大到小排序的结果一样。根据指数越大集中化程度越大知道,1999年的集中化程度最大,2004年的集中化程度最小。3第10题第11题:第四章1、什么是相关系数?单相关系数、偏相关系数和复相关系数在计算上有什么联系?三者在检验上有什么区别?相关系数:相关系数是用来测定地理要素之间相互联系密切程度的数值;三者联系:单相关系数是两个要素之间的相关系数密切程度的数值;偏相关系数的计算要在单相关系数的基础上,不考虑其他要素的影响,单独研究两个要素之间的相关系数密切程度的数值;复相关系数的计算要同时用到单相关系数和偏相关系数。检验上的区别:一般情况下,①相关系数的检验,是在给定的置信水平下,通过查相关系数临界值表来完成的②偏相关系数的检验,一般采用t-检验法③复相关系数的显著性检验,一般采用F检验法。2、什么是秩相关系数?试比较单相关系数和秩相关系数?秩相关系数:秩相关系数又称等级相关系数,或顺序相关系数。是将两个要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。实际上,它是位次分析方法的数量化。比较:43、什么是地理回归分析?相关分析和回归分析的联系和区别是什么?地理回归分析:回归分析方法,就是研究要素之间具体数量关系的一种强有力的工具,运用方法能够建立反应地理要素之间具体数量关系的数学模型,即回归模型。联系:相关分析要依靠回归分析来表现现象数量相关的具体形式。回归分析必须依靠相关关系来表明变量之间的密切程度。区别:①相关分析是用一个指标表明现象间依存关系的密切程度,回归分析是根据相关关系的具体形态选择一个适合的数学模型,来近似地表达变量的平均变化关系。②相关分析中没有自变量因变量,而回归分析中必须确定自变量和因变量。③相关分析中的每一个变量都是随机的,回归分析中自变量是一般变量,因变量是随机变量。④相关分析没有预测功能而回归分析有。4、什么是地理过程时间序列?地理时间序列分析在地理学中有什么用途?时间序列,是要素(变量)的数据按时间顺序变动排列而形成的一种数列,它反映了要素(变量)随时间变化的发展过程。地理过程的时间序列分析,就是通过分析地理要素(变量)随时间变化的历史过程,揭示其发展变化规律,并对其未来状态进行预测。用途:时间序列对分析地理过程的发展具有重大意义,即空间的时间性。是当代地理学最重要的研究课题之一。地理过程的时间序列对分析事物的变化发展更具有全面的预测性,因此也是当代地理学家十分注重的领域。例如,从时间序列变化趋势中的长期趋势中,可以看出:对于一个国家或地区来说,随着经济发展,GDP、人均可支配收人、储蓄额等,一般具有长期上升的趋势;死亡率,则因为医疗技术的进步及生活水平的提高而具有长期向下的趋势。再如,几乎所有产品在整个生命周期中都经历了不同的长期趋势。2.季节变动(S)再例如,从时间序列的季节变动中可以看出:电风扇与冷气机在夏季的销售量多而冬季少;5一天的交通流量在上下班时间出现高峰,而其余时间流量较为稳定;圣诞节前玩具的销售量增加;暑假旅游活动增加;等等。5、什么是多元回归模型?多元回归模型和一元回归模型相比有什么特点?多元回归模型是用来进行回归分析的数学模型(含相关假设)称为回归模型,只含有一个回归变量的回归模型称为一元回归模型否则称为多元回归模型。特点:多元回归模型是描述多个要素之间的相关关系,一元线性回归模型描述的是两个要素之间的相关关系。一元回归是一个主要影响因素作为自变量来解释因变量的变化。而在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归。总的来说,多远回归模型的特点:一是解释变量的个数:多个变量;二是模型的经典假设不同:多元回归模型比一元回归模型多了“解释变量之间不存在相关关系”的假定;三是多元回归模型的参数估计式的表达更为复杂。6.什么是系统聚类分析?系统聚类方法有哪些?其距离是如何计算的?系统聚类分析是一门多元统计分类法,根据多种地学要素对地理实体进行划分类别的方法。对不同的要素划分类别往往反映不同目标的等级序列,如土地分等定级、水土流失强度分级。系统聚类方法:直接聚类法,最短距离聚类法,最远距离聚类法;距离:绝对值距离、欧氏距离、明科夫斯基距离、切比雪夫距离。P125-1267.什么是主成分分析?主成分分析的步骤有哪些?主成分分析,就是一种把原来多个变量转化为较少的几个综合指标(主成分)的统计分析方法。从数学角度来看,主成分分析实质上就是一种降维处理方法。步骤:P136(1)计算相关系数矩阵(数据需要先进行:标准化处理)(2)计算特征值与特征向量(3)计算主成分贡献率及累计贡献率(4)计算主成分载荷系数(5)计算主成分的得分8.什么是马尔可夫预测方法?使用马尔可夫预测法进行地理预测时需要遵循的6基本要求是什么?马尔可夫预测方法,就是一种预测事件发生的概率的方法。它是基于马尔可夫链,根据事件的目前状况预测其将来各个时刻(或时期)变动状况的一种预测方法。要求:状态转移概率矩阵必须具有一定的稳定性。因此,必须具有足够的统计数据,才能保证预测的精度与准确度,即:马尔可夫预测模型必须建立在大量的统计数据的基础之上。这一点也是运用马尔可夫预测方法预测地理事件的一个最为基本的条件。9.是否所有的马尔可夫过程都存在终极状态?为什么?不是。原因:马尔可夫预测计算过程包括第k个时刻状态概率的预测和终极状态概率预测。如果某一事件在第0个时刻(或时期)的初始状态已知,利用递推公式,就可以求得它经过k次状态转移后,在第k个时刻(时期)处于各种可能的状态的概率。而终极状态概率是经过无穷多次状态转移后所得到的状态概率,它只是马尔可夫预测结果中的某种可能的状态的概率。10、趋势面分析的基本原理是什么?除了多项式形式以外,是否可以用其他函数形式拟合趋势面,为什么?基本原理;通常把实际的地理曲面分解为趋势面和剩余面两部分,前者反映地理要素的宏观分布规律,属于确定性因素作用的结果,而后者则对应于微观局域,是随机因素影响的结果。不可以,原因:地理要素的空间分布曲面,大多数都是非线性的,寻找这些非线性曲面的数学方程式比较困难,通常采用多项式的形式进行拟合。15、7第五章1、什么是空间数据的统计分析,它与传统的统计分析方法有何区别,为什么不能用传统的统计分析方法解决空间统计分析问题?(1)空间统计分析,即空间数据的统计分析,是现代计量地理学中一个快速发展的方向领域。(2)区别:①传统的统计学不考虑样本的空间分布,而地统计学考虑。②研究对象;随机行(变量),既具有随机性又有结构性。③试验:可重复性,不可重复性。④样本间:相互独立性,空间相关性。(3)原因:空间数据间并非完全独立,而是存在某种空间联系和关联性,传统的统计分析方法的基本出发点是样本独立检验,而空间依赖性的存在打破了大多数传统的统计分析方法中样本相互独立的基本假设,因此无法直接用传统的统计方法分析解释与地理位置相关的空间数据关联和依赖性。2、全局Moran指数是怎样计算和检验的?它与Geary系数有何关系?(1-2)草稿笔记(3)①由于全局Moran指数不能判断空问数据是高值聚集还是低值聚集,Getis和Ord于1992提出了全局G系数。②Moran指数和Geary系数是两个用来度量空间自相关的全局指标。Moran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度。③Geary系数与Moran指数存在负相关关系。3、什么是空间联系的局部指标(LISA),它满足哪两个条件?空间联系的局部指标,条件:(1)每个区域单元的LISA,是描述该区域单元周围显著的相似值单元之间空间集聚程度的指标;(2)所有区域单元LISA的总和与全局的空间联系指标成正比例。5、为什么说局部Gi统计量不属于LISA?局部Moran指数却属于LISA?(1)局部Moran指数Ii满足条件:其一,每个区域单元i的Ii是描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标;其二,经过简单的推导,容易证明:局部Moran指数与全局Moran指数存在比例关系:ΣIi=S0I.所以,局部Moran指数Ii是一种描述空间联系的局部指标,即LISA。8(2)局部G统计量不属于LISA,因为局部Gi统计量和全局G统计量没有比例关系。6.Moran散点图的意义什么?在Moran散点图中,第一、二、三、四象限分别表示什么含义?定义:用来研究局部的空间不稳定性,对空间滞后因子Wz和z数据对进行了可视化的二维图示。Moran散点图的四个象限:①第一象限代表高观测值的区域单元被同是高值的区域所包围的空间联系形式②第二象限代表了低观测值的区