计量地理学大题:最短路径、最优区位、洛伦茨曲线、回归分析、聚类分析、马尔可夫题型:填空名词简答综合。大家加油!最后一科考试了干巴爹!第一章1、计量地理学P1:是将数学和电子计算机技术应用于地理学的一门新兴学科,它是随着生产发展的需要和科学技术的进步而产生和发展起来的,反映了地理学朝着定量化方向发展的新趋势。2、计量地理学的三大学派:P3(1)艾奥瓦的经济派:此学派受经济学影响较深,着重探讨经济区位现象健互相内在联系及其组合类型;(2)威斯康星的统计派:该学派以发展和应用统计分析方法为其主要特征;(3)普林斯顿的社会物理学派:把物理学原理应用于社会现象的研究,发展了理论地理学中的引力模型、位势模型、空间相互作用模式。3、“新三论”P7:突变论、耗散结构、协同学“老三论”P7:系统论、控制论、信息论第二章1、空间数据P16:对于空间数据的表达,可以将其归纳为点、线、面三种几何实体以及描述它们之间空间联系的拓扑关系。2、地理数据的基本特征:P19(1)数量化、形式化和逻辑化:数量化、形式化、逻辑化是数学的基本特征;地理数据的数量化、形式化与逻辑化,是对地理问题进行数学描述和定量化研究的前提,是一切数学方法在地理学中应用的先决条件;(2)不确定性:地理系统的复杂性决定了地理数据的不确定性;各种原因所导致的数据误差;(3)多种时空尺度:由于地理学的研究对象具有多种时空尺度,所以描述地理对象的地理数据也具有多种时空尺度的性质;(4)多维性:对于一个地理对象,它的具体意义往往需要从空间、属性、实间三个方面进行综合描述。3、统计分组:是根据研究目的,按照一定的分组标志将地理数据分成若干组。步骤:P24①求极差R(全距):R=Xmax-Xmin(一组数据的最大值和最小值)②确定组数n:组数的多少是根据样本容量的多少确定的,一般说,样本容量大,组数可多一些,反之就少。可用Sturges公式计算:n=1+3.32lgN③计算组距h:即一组两头分界点距离h=R/N④计算组限Yi:即各组分界点的数值。第一组下限y=Xmin-½h;第一组上限=下限+组距⑤计算组中值:m=(上限+下限)/2集中化指数是一个描述地理数据分布的集中化程度的指数。A——实际数据的累计百分比总和;R——均匀分布时的累计百分比总和;M——集中分布时的累计百分比总和。集中化指数在[0,1]区间上取值。4、简述描述地理数据一般水平的指标P25①平均值:指所有数据的和与样本总量的商,并分为分组的平均数和未分组的平均数。②中位数:指将各个数据从小到大排列,居于中间位置的那个数,且中位数在频数分布图中居于中央,把面积等分为左右两部分,在累计频率图上,累计频率为50%所对应的数值③众数:指数据中出现频数最多的那个数,且在频数分布图上居最高点。5、描述地理数据分布的离散程度的指标P27①极差:指所有数据中最大值与最小值之差。②离差:指每一个地理数据与平均值的差,它代表着每一个地理数据与平均值的离散程度。③离差平方和:指各个地理数据与平均值之差的平方的总和,它从总体上衡量一组地理数据与平均值的离散程度。④方差:指各个数据分别与其平均数之差的平方的和的平均数。⑤标准差:指方差的平方根。(方差与标准差是从平均概况衡量一组地理数RMRAI据与平均值的离散程度。)⑥变异系数:表示了地理数据的相对变化(波动)程度6、描述地理数据分布特征的参数:P28(1)偏度系数:它测度了地理数据分布的不对称性情况,刻画了以平均值为中心的偏向情况。g1<0,表示负偏,即均值在峰值的左边;g1>0,表示正偏,即均值在峰值的右边;g1=0,表示对称分布。(2)峰度系数:它测度了地理数据在均值附近的集中程度。标准正态分布的峰度系数g2=0;g2>0,表示地理数据分布的集中程度高于正态分布;g2<0,表示地理数据分布的集中程度低于正态分布。7、洛伦茨曲线和集中化指数计算P30第三章讲义内容1、点状分布的测度:①最邻近距离的测度:地理事物点状分布的相对位置与其最邻近点之间的距离,是点型配置的重要特征。顺序法和区域法所求得的最邻近距离的合计是一致的,但更高级位的平均距离是不一致的。点型分布为随机型或均等型时用区域法,点型分布为凝集型时用顺序法。②中间位置的测度:中项中心:两条相互垂直的直线的交叉点,这两条直线一般取南北向和东西向,每条直线将点状分布的点子二等分。平均中心:也称分布重心,其确定方法如下,1任意在分布图上作x轴和y轴,通常这种数轴画在分布点的西侧和南侧。2确定每一点的x轴和y轴坐标。3计算x坐标轴和y坐标轴的平均值x,y,这里x,y就是平均中心c的坐标(x,y)③离散程度的测度。2、网络图的概念:是一些点以及由点连成的直线所组成的图形,与通常所说的几何图形,函数图像完全不同,分为有何图与无何图。3、运输系统网络的4个特征:①结点的直通性:表现在环中结点与网络中其他环路结点的联结状况,以及运输流在结点上与网络中其他结点的联结状况。②道路系统的里程:以最小里程为标准,从哪一站出发到各站的里程最少。③道路系统的运输量(吨公里):以运输量最少作为标准确定从哪一站出发到各站最优。④考虑中转——运输费用的综合影响把中转因素考虑进去,会造成费用的增加。第四章1、偏相关系数与复相关系数的区别:(1)偏相关系数:概念:在多要素所构成的地理系统中,先不考虑其他要素的影响,单独研究两个要素之间的相互关系的密切程度时,称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。偏相关系数的性质:①偏相关系数分布的范围在-1—1之间;②偏相关系数的绝对值越大,表示其偏相关程度越大;③偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数。偏相关系数的显著性检验,一般采用t检验法。(2)几个要素与某一个要素之间的复相关程度,用复相关系数来测定。复相关系数的性质:①复相关系数介于0到1之间;②复相关系数越大,则表明要素之间的相关程度越密切。复相关系数为1,表示完全相关。复相关系数为0,表示完全无关;③复相关系数必大于或至少等于单相关系数的绝对值。复相关系数的显著性检验,一般采用F检验法。2、一级偏相关系数的计算P91公式(4.1.4)(4.1.5)(4.1.6)3、回归分析的计算P954、偏回归系数的意义P98:是当其他变量Xj(j不等于i)都固定时,自变量Xi每变化一个单位而使因变量y平均改变的数值。5、时间序列的组成成分:P108①长期趋势(T):是时间序列随时间的变化而逐渐增加或减少的长期变化之趋势。②季节变动(S):是时间序列在一年中或固定时间内,呈现出的固定规则的变动。③循环变动(C):又称景气循环变动,是指沿着趋势线如钟摆般地循环变动。④不规则变动(R):是指在时间序列中由于随机因素影响所引起的变动。6、时间序列的组合模型:P110(1)加法模型:加法模型假定时间序列是基于四种成分相加而成的。(2)乘法模型:乘法模型假定时间序列是基于四种成分相乘而成的。7、常用的聚类要素数据处理办法:P124(1)总和标准化法:分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和;(2)标准差标准化:得到的数据各要素的平均值为0,标准差为1;(3)极大值标准化:所得的新数据,各要素的极大值为1,其余各数值小于1;(4)极差的标准化:得到的数据,各要素的极大值为1,极小值为0,其余的数值均在0和1之间。8、常见的距离有P126:绝对值距离、欧式距离、明科夫斯基距离、切比雪夫距离9、主成分分析原理P135:是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度看,这是一种将维处理技术,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多的反映原来较多变量指标所反映的信息。10、主成分分析的步骤P136(1)计算相关系数矩阵(2)计算特征值与特征向量(3)计算主成分贡献率及累计贡献率(4)计算主成分载荷11、趋势面适度的逐次检验:P143①求出较高次多项式方程的回归平方和与较低次多项式方程的回归平方和之差;②将此差除以回归平方和的自由度之差,得出由于多项式次数增高所产生的回归平方差;③将此均方差除以较高次多项式的剩余均方差,得出相继两个阶次趋势面模型的适度性比较检验值F。12、马尔克夫预测大题P14613、五种相关分析的原理和概念1相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。2秩相关系数:又称等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。3偏相关系数定义:在多要素所构成的地理系统中,先不考虑其他要素的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。4复相关系数:反映几个要素与某一个要素之间的复相关程度。14、最短和最远距离聚类法P130第五章:1、确定空间权重矩阵的规则:(1)简单的二进制邻接矩阵:Wij={1当区域i和j相邻接;0其他}(2)基于距离的二进制空间权重矩阵:Wij={1当区域i和j的距离小于d时;0其他}2、Moran指数和Geary系数是两个用来度量空间自相关的全局指标。Moran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度,而Geary系数与Moran指数存在负相关关系。P1593、Moran指数I的取值一般在-1和1之间,小于0表示负相关,等于0表示不相关,大于0表示正相关;Geary系数C的取值一般在0和2之间,大于1表示负相关,等于1表示不相关,而小于1表示正相关。4、Moran指数可以用标准化统计量Z来检验n个区域是否存在空间自相关相关关系:当Z值为正且显著是,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布;当Z值为零时,观测值呈独立随机分布。P1615、全局G统计量的计算公式P163显著的正Gi值表示在该区域单元周围,高观测值得区域单元趋于空间集聚,而显著的负Gi值表示低观测值的区域单元趋于空间集聚,其具有能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式。局部G统计量不属于LISA,因为局部Gi统计量和全局G统计量没有比例关系。6、Moran散点图的四个象限:分别对应于区域单元与其邻居之间四种类型的局部空间联系形式。①第一象限代表了高观测值的区域单元被同是高值的区域所包围的空间联系形式。②第二象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式。③第三象限代表了低观测值的区域单元被同是低值的区域所包围的空间联系形式。④第四象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。7、地统计学:是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关性和依赖性的自然现象的科学。P1698、变异函数的参数:变异函数有四个非常重要的参数,即基台值、变程或称空间依附范围、块金值或称区域不连续性值和分维数。第六章单纯形表P192第七章1、投入产出分析:又叫“部门平衡”分析,或称“产业联系”分析。P2132、投入产出模型,按照时间概念,可以分为静态投入产出模型和动态投入产出模型。静态投入产出模型,按照不同的计量单位,可以分为实物型和价值型两种,前者是按实物单位(如千克、吨等)计量的,后者是按货币单位(如元、美元等)计量的。3、价值型投入产出模型:①按横行建立数学模型,与实物型投入产出模型是类似的,反映各部门产品的生产与分配使用的情况,描述了最终产品与总产品之间的平衡关系。叫做产品分配方程组,它表明,对于每一个部门来说,其总产品等于从该部门流向其他部门的产品与最终产品之和。②按列建立模型,则反映了各部门产品的价值形成过程,反映生产与消耗之间的平衡关系。叫做费用平衡方程组,它反映物