计量期末总复习(完善版)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

章节回顾要点归纳考试形式计量地理学期末复习资料一、章节回顾第一章绪论第一节计量地理学的形成和发展第二节计量地理学中的数学方法第三节计量地理学评价及其应用第二章地理数据的来源及其预处理第一节地理数据的类型划分第二节地理数据的基本特征第三节地理数据的来源说明第三章地理数据处理第一节地理数据的统计处理第二节地理数据的分布测量第四章相关分析方法第一节相关分析的计算问题第二节相关分析方法的应用第五章简单线性回归模型●回归分析与回归函数●简单线性回归模型参数的估计●拟合优度的度量●方程显著性的假设检验●回归系数的假设检验●回归模型预测●实际应用第六章趋势面分析方法趋势面分析的一般原理趋势面模型的适度检验趋势面分析应用实例第七章系统聚类分析模型第一节聚类要素的数据处理第二节距离的计算第三节直接聚类法第四节最短距离聚类法第五节最远距离聚类法第八章马尔可夫预测方法第一节几个基本概念第二节马尔可夫预测方法第三节应用案例第九章时间序列分析(不做要求)第一节时间序列的概念和表示方法第二节时间序列分析的基本原理第三节趋势拟合方法第四节季节变动预测第十章AHP决策分析方法•第一节基本原理•第二节分析过程•第三节计算方法•第四节方法评价•第五节应用案例第十一章主成分分析主成分分析的基本原理主成分分析的计算步骤主成分分析的软件实现主成分分析方法应用实例第十二章探索性空间统计分析(不做要求)第一节基本原理与方法第二节应用实例二、要点回顾地理数据•地理数据是用一定的测度方式描述和衡量地理对象的有关量化标志,是对地理问题进行定量化描述和研究的基础,是一切数学方法在地理学中应用的先决条件。观测数据观测数据是指通过观测仪器获取的数据,包括台站观测数据、定点观测数据、遥感观测数据等。实验数据实验数据是指利用实验仪器设备分析样品或模拟环境动力得到的数据,主要包括样品分析数据和模拟实验数据。统计数据统计数据是指通过全面统计或随机抽样调查获得的数据,主要包括统计年鉴数据、抽样调查数据、测量统计数据等。空间数据空间数据主要用于描述地理实体、地理要素、地理现象、地理事件及地理过程的产生、存在和发展的地理位置、区域范围及空间联系。属性数据属性数据主要用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征,包括数量标志数据与品质标志数据两种。地理计算地理计算(Geocomputation)的实质是借助于现代化的计算理论、计算方法和计算技术,通过对“整体”和“大容量”的地理数据进行处理,揭示复杂地理系统的运行机制,探索和寻求新的地理系统理论。平均数•平均数是集中趋势指标中最重要的一种指标,代表研究对象的一般水平。一般地,平均数包括算术平均数和几何平均数两种类型,能反映出同质总体和样本数值的平均水平和一个数列的数值的“集中趋势”。平均发展速度平均发展速度反映社会经济现象在一个较长时期内的平均发展水平。•X0为基期(或基年)数据•n为间隔年数(不包括基年)nngxxx平均发展速度的求解公式:平均增长速度平均增长速度反映社会经济现象或人口在一个较长时期内的平均递增速度。•X0为基期(或基年)数据•n为间隔年数(不包括基年)平均增长速度=平均发展速度-101nnrxxx平均增长速度的求解公式:中位数•中位数也称中央值,是地理数据按大小顺序排列,位居中间的那个数值。众数•众数是一个地理观测(或调查)系列中出现频数(次数)最多的数。它也有典型性和代表性。极差•极差是指所有数据中最大值与最小值之差,计算公式为:}{min}{maxiiiixxR离差离差是指每一个地理数据与平均值的差,计算公式为xxdii离差平方和离差平方和是它从总体上衡量一组地理数据与平均值的离散程度,其计算公式为:221()niidxx方差(Variance)方差是从平均概况衡量一组地理数据与平均值的离散程度。方差计算公式为:nixixn12)(12标准差(Std.deviation)标准差为方差的平方根,计算公式为:niixxn12)(1如果以样本方差对标准差进行估计,则计算公式为:1)(12nxxSnii变异系数变异系数表示地理数据的相对变化(波动)程度,其计算公式21()1100%100%1niivxxSCnxx罗伦次曲线•20世纪初,意大利统计学家罗伦次(M.Lorenz),首先使用累计频率曲线研究工业化的集中化程度。后来,这种曲线就被称之为罗伦次曲线。基尼系数基尼系数用于对经济发展、收入分配等均衡(不均衡)状况,进行定量化的描述。基尼系数的计算假若罗伦次曲线的解析式为:显然,该曲线下方区域的面积为:对应于绝对均衡分布,其罗伦次曲线就是正方形的对角线,其下方区域的面积为R=1/2。XXfXfGd)(212/1)(2/11010XXfAd)(10]1,0[)(XXfY(2.5.6),。锡尔系数锡尔系数又称锡尔熵,有两个锡尔系数指标,即锡尔系数T和锡尔系数L。如果以人口比重加权,锡尔系数L的计算公式为式中:n为区域(部门)个数;为i地区(部门)收入占全区(各部门总计)的份额;为i地区(部门)的人口占全区(各部门总计)的份额。)log(1iiniiyppLiyipiy如果以收入比重加权,则锡尔系数T的计算公式为锡尔系数越大,就表示收入分配差异越大;反之,锡尔系数越小,就表示收入分配越均衡。niiiipyyT1log和为两要素的平均值。niiniiniiixyyyxxyyxxr12121)()())((yx相关系数又称等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。)1(61212nndrniixy秩相关系数普通最小二乘法假设有两个地理要素(变量)x和y,x为自变量,y为因变量。则一元线性回归模型的基本结构形式为:参数A,B未知,需要根据yα与xα的观测值采用最小二乘法来估计。设a和b分别为参数A和B的最小二乘估计值(拟合值),则得到一元线性回归模型为:公式(5.2)代表x与y之间相关关系的拟合直线(回归直线)。参数a和b的最小二乘估计对事件的全面预测,不仅要能够指出事件发生的各种可能结果,而且还必须给出每一种结果出现的概率。马尔可夫(Markov)预测方法,就是一种预测事件发生的概率的方法。它是基于马尔可夫链,根据事件的目前状况预测其将来各个时刻(或时期)的变动状况的一种预测方法。马尔可夫(Markov)预测方法•马尔可夫(Markov)预测中,状态指某一事件在某个时刻(或时期)出现的某种结果。状态•马尔可夫(Markov)预测中,状态转移过程事件的发展,从一种状态转变为另一种状态,称为状态转移。状态转移过程马尔可夫过程在事件的发展过程中,若每次状态的转移都仅与前一时刻的状态有关,而与过去的状态无关,则这样的状态转移过程就称为马尔可夫过程。主成分•1、主成分分析——是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。•2、主成分分析的基本原理:•假定有n个地理样本,每个样本共有p个变量,构成一个n×p阶的地理数据矩阵:当p较大时,在p维空间中考察问题比较麻烦。为克服这一困难,需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标。•综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间彼此独立。•综合指标(即新变量)选取方法:最简单的形式就是取原来变量的线性组合,适当调整组合系数,使新的变量之间相互独立且代表性最好。•3、主成分分析的计算步骤•(1)计算相关系数矩阵•(2)计算特征值与特征向量•(3)计算主成分贡献率及累计贡献率•(4)计算主成分载荷•(5)计算各主成分得分•4、主成分分析的应用实例•例:表8.1给出的数据为某地区农业生态经济系统各区域单元相关指标数据,运用主成分分析方法可以用更少的指标信息较为精确地描述该地区农业生态经济的发展状况。拟合优度•拟合优度(GoodnessofFit)是指回归直线对观测值的拟合程度。显然若观测点离回归直线近,则拟合程度好;反之则拟合程度差。度量拟合优度的统计量是可决系数(亦称确定系数)。趋势面分析趋势面分析,是利用数学曲面模拟地理系统要素在空间上的分布及变化趋势的一种数学方法。它实质上是通过回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。对计量地理学的评价对于计量地理学,产生了三种评价观点:①“反定量化”——反对地理学定量化研究,认为地理现象十分复杂,不能用简单的数学方法来解释,对数学方法采取拒绝和否定态度。代表人物:史密斯(D.Smith)、奥格登(P.Ogden)等。②“定量化”——推崇地理学定量化,认为数学方法不仅是一种分析技术,而且能够导出普遍性规律,能够解决地理学传统研究方法所不能解决的理论问题。代表人物主要有克里斯塔勒(W.Christaller)、帮吉(W.Bunge)乔莱(R.Chorley)、哈格特(P.Haggett)等。③“非定量化”——认为数学方法只是地理学研究方法之一,只能用来研究地理要素之间的数量关系和地理事物的空间格局,不能用来描述和解释地理规律,不能导出地理学理论,但其观点摇摆不定。普通最小二乘法的基本原理见前面。相关分析与回归分析的区别和联系地理数据的基本特征一、数量化、形式化与逻辑化二、不确定性三、多种时空尺度四、多维性地理数据的来源渠道(一)来自于观测、测量部门的有关专业数据。(二)来自于统计年鉴、统计公报中有关自然资源及社会经济数据。(三)来自于有关单位或个人的不定期典型调查数据、抽样调查数据。(四)来自于政府公报、政府文件中的有关数据。(五)来自于档案、图书等文献资料中的有关数据。(六)来自于互联网(internet)的有关共享数据。(七)来自地图图件。主要包括地形图、影像地图、专题地图等。(八)来自遥感数据。主要包括各种航空遥感数据和卫星遥感数据。(九)其他来源的有关数据。地理数据的时间特征要求(一)数据的即时程度(二)数据的时段长度(三)数据的时间完整性(四)数据的时间同步性(五)数据的时间代表性(六)数据的时序间隔相关系数的计算与检验相关系数的计算1.定义:和为两要素的平均值。niiniiniiixyyyxxyyxxr12121)()())((yx(3.1.1)2.说明:-1==1,大于0时正相关,小于0时负相关。的绝对值越接近于1,两要素的关系越密切;越接近于0,两要素的关系越不密切。月份123456789101112月平均气温t/oC3.845.8811.314.416.516.213.810.86.74.7降雨量p/mm77.751.260.154.155.456.84555.367.573.376.679.6伦敦的月平均气温与降水量3.实例:相关系数的检验相关系数是根据要素之间的样本值计算出来的,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。f0.100.050.020.010.0011234567891011120.987690.900000.80540.72930.66940.62150.58220.54940.52140.49730.47620.45750.996920.950000.87830.81140.75450.70670.66640.63190.60210.57600.55290.53240.9995070.980000.934330.88220.83290.78870.74930.71550.68510.65810.63390.61200.9998770.990000.958730.917200.87450.83430.79770.

1 / 100
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功