计量地理学作业一、填空题1.计量运动,主要是由美国地理学家发起的,早期主要集中在几所大学。由于各校所持观点不同,研究方向不同,从而形成了各种不同的学派。其中,主要有如下三大学派:衣阿华的经济派、威斯康星的统计派、普林斯顿的社会物理学派。2、在聚类分析中,常用的聚类要素的数据标准化处理方法有如下几种:总和标准化、标准差标准化、极大值标准化、极差标准化。3、风险型决策问题的常用决策方法:最大可能法、期望值法、灵敏度分析法、效用分析法等。4.属性数据分为数量标志数据和品质标志数据。5.众数是总体中出现频数或次数最多的数。6.回归平方和的自由度为自变量的个数或K。7.地理要素的空间分布类型有点状分布、线状分布、离散区域分布和连续的区域分布四种类型。8.概率密度函数积分就成为分布函数。9.将实际的地区数据与标准分布进行比较,用以测度经济地理现象在空间分布的程度采用空间洛伦兹曲线。10.绘制累积频数图时,横坐标表示组距或组中值,纵坐标表示累积频数。11、计量地理学的研究对象大致为下列三个方面空间与过程的研究、生态研究、区域研究。12、地理数据的基本特征:数量化、形式化与逻辑化、不确定性、多种时空尺度、多维性。13、参数检验中常用的方法有U检验、T检验、F检验。15、一般而言,地理数据具有以下几个方面的基本特征:数量化、形式化、逻辑化,不确定性,多种时空尺度,多维性。16、描述地理数据一般水平的指标有平均值、中位数、众数;描述地理数据分布的离散程度的指标有极差、离差、离差平方和、方差与标准差、变异系数;描述地理数据分布特征的参数有标准偏度系数、标准峰度系数。17、什么是秩相关系数:是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。18、线性规划问题的可行解:在线性规划问题中,满足约束条件的一组变量x=(x1,x2,…,xn)T为可行解,最优解:使目标函数取最大(或最小)值的可行解称为最优解。19、在目标规划模型中,除了决策变量外,还需引入正、负偏差变量,其中,正偏差变量表示决策值超过目标值的部分,负偏差变量表示决策值未达到目标值的部分。20、主成分分析的计算步骤:①计算相关系数矩阵,②计算特征值与特征向量,③计算主成分贡献率及累计贡献率,④计算主成分载荷。21、多元线性回归模型的显著性检验中,回归平方和U的自由度为自变量的个数k,剩余平方和的自由度为n-k-1,n为样本个数。二、单项选择题1.符号S2表示(A)。A.样本方差B.样本标准差C.总体方差D.总体标准差2.以下说法正确的是(D)A.总的离差平方和用y的估计值与算术平均值的离差平方和来表示B.总的离差平方和用y的估计值与几何平均值的离差平方和来表示C.总的离差平方和用y的观测值与几何平均值的离差平方和来表示D.总的离差平方和用y的观测值与算术平均值的离差平方和来表示3.关于网络图的叙述哪个是正确的(C)A.网络图按比例尺画B.点和线条的位置是固定的C.线段不代表真正的长度D.具有几何图形的意义5.在单峰负偏态的分布上,下列叙述正确的(C)A算术平均数=中位数=众数B算术平均数众数中位数C算术平均数中位数众数D算术平均数>中位数>众数7.线性回归在0.05水平上显著的是(B)AF≥F0.01BF0.01≥F≥F0.05CF0.05≥F≥F0.10DF<F0.108.如果是小样本数据的均值检验,应该采用(A)At检验Bu检验CF检验D以上都不对9.进行判别分析时,已知YaYc,属于A类,YbYc,属于B类,现有未知类函数值小于Yc,则其属于CAA类BC类CB类DD类10.下面有关小概率原则说法中正确的是(B)A小概率原则事件就是不可能事件B当一事件的概率小于显著性水平α时,认为该事件为不可能事件C基于”小概率原则”完全可以对某一事件发生与否作出正确判断D总体推断中可以不予考虑的事件11.区域法测定临近距离一般分成(A)个区域。A6B5C4D8三、名词解释题1、方差:各各离离差差平平方方和和除除以以其其数数据据的的个个数数。。2、中项中心:两条相互垂直的直线的交叉点,这两条直线一般取南北向和东西向,每条直线把点状分布的点子二等分。3、贝叶斯准则:把已知的地理数据分成几类(或几组),然后计算出未知地理类型或区域归属于各已知类型(或组)的概率值,它归属于哪一类的概率值最大,就把它划归该类(或组);另外,还可计算出划归各已知类的错分损失,即错分哪一类的平均损失最小,就把它判定为该类。4、计量地理学:应用数学方法和电子计算机技术进行地理学研究的方法。又称数量地理学。5、罗伦兹曲线:罗伦兹(Lorenz)是美国统计学家,他提出一种频率累积曲线,是用观察数据的累积百分数绘成的曲线,即罗伦兹曲线,该曲线主要用于不同地理现象在区域分布上的差异,查明它们的地区分布特征和规律。6、最近邻点指数:实际最邻近距离与理论最邻近距离之比。7、中位数(也称中央数):将地理数据按从大到小排列,居中间位置的那个数。8、离差(偏差、离均差):指每一个地理数据与平均值的差,代表每一个数据与平均值的离散程度。计算公式为:10、计量运动:从上世纪50年代末期开始,首先在美国掀起了建立地理学法则的热潮。然而,究竟怎样建立地理学法则?不同学者从不同的角度作了探索,但一般都是将数学、物理学、社会学、经济学的理论和方法引入地理学,探求地理事物的空间格局,其共同之处在于都是开展地理学定量化研究,建立定量模式。这种定量化研究之热潮,就是所谓的计量运动。1963年,美国地理学者鲍顿(I.Burton)称这一运动为“计量革命”。11、比例尺度数据:这种数据是以连续的量来表示地理要素。以无量纲的数据形式表示测度对象的相对量。12、方差:离差平方和的平均数为方差。13、最近邻点指数:实际最邻近距离与理论最邻近距离之比。14、趋势面分析:是利用数学曲面模拟地理系统要素在空间上的分布及变化趋势的一种方法。它实质上是通过回归分析原理,运用最小二乘法拟合一个二元函数(自变量为二维平面坐标),模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。15、二项分布:又称为贝努里(Bernoulli)分布,是一种具有广泛应用的离散型随机变量的概率分布。其定义为:设有n次试验,各次试验是相互独立xxdii的,每次试验某事件出现的概率都是p,某事件不出现的概率都是1-p,记为q,则对于某事件出现k(k=0,1,2,.,n)次的概率分布为:16、明科夫斯基距离:),,2,1,(11mjixxdpnkpjkikiji和j代表两个地点(或两个样品),xik代表第i个地点第k个指标的值,xjk代表第j个地点第k个指标的值。17、相似系数:设有n个地点,每个地点有m个特征值,如把每个地点的特征值看作是多维空间的一个向量,则两个地点之间的相似程度可用两个向量间夹角的余弦来表示。i和j代表两个地点(或两个样品),xik代表第i个地点第k个指标的值,xjk代表第j个地点第k个指标的值。18、相关系数(r):相关系数是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。i和j代表两个地点(或两个样品),xik代表第i个地点第k个指标的值,xjk代表第j个地点第k个指标的值。五、问答题),...,1,0(,)1(}{nkppkXPknkknCmkjkmkikmkjkikijxxxx12121cosjjiiijmkjjkmkiikmkjjkiikijlllxxxxxxxxr12121)()()()(1.如何用顺序法求得最临近距离。1)在某一地区分布n个点,以任意一点作为基准点,测定从这一点到其它全部点的距离rih(h≠i,h=1,2,…n)2).其次测定从基准点i到区域边界的最短距离rib,在所测定的n-1个距离中,选出rih≦rib条件的距离(这一条件称为边界条件),假定选出的是p个距离,从小到大顺序排列为ri1,ri2,ri3,…,rip。3).若i有j个此种距离,则称rij为i的第j级距离。矩阵第一列的要素和就是最邻近距离的合计。用其除以n1,得最邻近平均距离。2、回归分析与相关分析的联系与区别:联系:二者都是研究和处理变量之间相互关系的一种数理统计方法区别:1)相关分析主要是研究要素(变量)之间联系的密切程度,并没有严格的自变量与因变量之分;而回归分析则主要是研究要素(变量)之间联系的数学表达形式,因而就有自变量与因变量之分.2)相关分析中所涉及的变量与全是随机变量,而回归分析中因变量是随机变量,自变量可以是随机变量,也可以是非随机的确定变量.通常的回归模型中,我们总是假定是非随机的固定变量.3)回归分析可由自变量的取值来预测,延长或插补和控制因变量的取值,所以回归分析尚有地理预测的性质.3、主成分分析的计算步骤是什么?(见课件)①对原始数据进行标准化处理:消除数量级和量纲的影响。②计算相关系数矩阵rij(i,j=1,2,…,p)为原变量xi与xj的相关系数。③计算特征值与特征向量解特征方程,求出特征值,并使其按大小顺序排列,即pppppprrrrrrrrrR2122221112110,21p分别求出对应于特征值的特征向量ei=[ei1,ei2,…eij]④计算主成分贡献率及累计贡献率贡献率:主成分分析把p个原始变量x1,x2,…,xP的总方差分解为p个不相关的变量z1,z2,,zP,方差之和=λ1+λ2+…+λp。主成分分析的目的就是为了减少变量的个数,一般是不会使用所有p个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来大的影响。由此可进一步得到i主成分的方差占总方差的比例称此方差比例为主成分Zi的贡献率。第一主成分的贡献率最大,这表明Zi综合原始变量x1,x2,…,xP的能力最强,而x2,…,xP的综合能力依次减弱。累计贡献率:若只取前m(mp)个主成分,则称为主成分z1,z2,…,zm的累计贡献率,累计贡献率表明z1,z2,,zm综合x1,x2,…,xP的能力。通常取m,使得累计贡献率达到一个较高的百分数.一般取累计贡献率达85-95%的特征值λ1,λ2,…,λm所对应的第一,第二,……,第m(m≤p)个主成分。⑤计算主成分载荷主成分Zi与变量Xj的相关系数称为主成分负荷量.因此,第i个特征向量ei的第j个分量eij描述了第j个变量对第i个主成分的重要性,它与Zi和Xj之间的相关系数成比例。),,2,1(1pipkki),,2,1(11pipkkikk),,2,1,(),(pjiexzplijijiij⑥计算各主成分得分:根据下列公式计算主成分得分Z1=ll1x1*+ll2x2*+…+llpxp*z2=l21x1*+l21x2*+…+lp1xp*……………………zm=lm1x1*+lm2x2*+…+lppxp*xp*为标准化后的数据.得到主成分得分矩阵:4、最短距离法进行聚类分析(见课件)5、相关系数的性质有哪些?(1)相关系数可正可负;(2)相关系数的区间是[-1,1];(3)具有对称性;即X与Y之间的相关系数(rXY)和Y与X之间的相关系数(rYX);(4)相关系数与原点和尺度无关;(5)如果X与Y统计上独立,则它们之间的相关系数为零;但是r=0不等于说两个变量是独立的。即零相关并不一定意味着独立性;(6)相关系数是线性关联或线性相依的一个度量,它不能用于描述非线性关系;nmnnmmzzzzzzzzzZ212222111211(7)虽然相关系数是两个变量之间的线性关联的一个度量,却不一定有因果关系的含义;6、地理数据的标准化原因和目的是什么?常见标准化方法有哪些?涉及到通过各种途径和手段所得到的有意义的地理数据。要素(或指标)的量纲、数量级和数量变化幅度的差异,有可能突出某些数量级特别大的变量对分类的