2020年3月9日11时51分1空间计量经济学简介ABriefIntroductiontoSpatialEconometrics金融学院吕勇斌2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。2Topics空间计量经济学的基础空间滞后模型计量分析空间误差模型计量分析地理加权回归模型分析空间计量经济分析软件包:GeoDa+SAM+ArcGIS+R(SpDep)+Lesage(SET)+Spacestat+Winbugs空间计量的应用研究案例2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。3Definition:Whatisspatialeconometrics?简单地说,空间计量经济学(SpatialEconometrics)就是空间经济的计量。即:是以空间经济理论和地理空间数据为基础,以建立、检验和运用经济计量模型为核心,运用数学、统计学方法与计算机技术对经济活动的相互作用(空间自相关spatialdependence)和空间结构(空间异质性spatialheterogeneity)问题进行定量分析,研究空间经济活动或经济关系数量规律的一门经济学学科。2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。4Definition:Whatisspatialeconometrics?一般认为,与其具有密切关系的学科主要是空间统计学(SpatialStatistics)、计算经济学(computationalEconomics)和地理信息系统(GeographicInformationSystem,GIS)。数据驱动(data-driven)和模型驱动(model-driven);时间序列(timeseries)分析转向空间数据(spatialdata)分析。2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。5空间数据分析空间数据(spatialdata)也可以成为地理数据,是以不同的方式和来源获得的数据,如地图、统计数据等,这些数据都具有能够确定空间位置的特点。百度百科:空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据,是一种用点、线、面以及实体等基本空间数据结构来表示人们赖以生存的自然世界的数据,以坐标和拓扑关系的形式存储。空间数据的拓扑关系2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。6空间数据分析数据分析包括探索阶段和证实阶段空间数据分析分为两类:探索性空间数据分析(exploratoryspatialdataanalysis,ESDA)和确认性空间数据分析(affirmablespatialdataanalysis,ASDA)。前者对应空间统计方法,后者对应空间计量模型。空间数据分析的一般程序:首先用探索性空间数据分析直观地描述空间数据,直接探索隐藏在数据中的关系、模式和趋势等,获得问题的理解和相关知识(发现问题);然后运用空间计量经济学方法更深入地研究所发现的问题,并为相关理论提供经验证据(研究问题)。2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。7探索性空间数据分析:箱线图2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。8探索性空间数据分析:直方图2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。9探索性空间数据分析探索性空间数据分析(ESDA)是一种具有识别功能的空间数据分析方法,将统计学和现代图形计算技术结合起来,用直观的方法展现空间数据中隐含的空间分布(随机、分散、聚集)、空间模式(时空关联)以及空间相互作用等特征。“让数据自己说话”两类工具:第一类,全局空间相关性,一般用Moran指数I(Moran,1950)、Geary指数C(Geary,1954)来测度;第二类,局部空间相关性,一般用G统计量、Moran散点图和LISA来测度。2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。10全域空间相关性全域空间自相关(GlobalSpatialAutocorrelation)是从区域空间的整体上刻画区域创新活动空间分布的集群情况。在许多实证研究中,Moran’sI和Geary’sC是常用方法,已在大量文献中出现,尤其是前者。Moran’sI是最早应用于全局聚类检验的方法(Cliff和Ord,1973)。因此,以下重点介绍常用的Moran’sI指数的计算及检验过程。2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。11全域空间相关性检验与分析Moran’sI定义如下:其中,,,表示第个地区的观测值(如专利数),为地区总数(如省域),为二进制的邻近空间权值矩阵,表示其中的任一元素,采用邻近标准或距离标准,其目的是定义空间对象的相互邻近关系。ninjijninjjiijWSYYYYWIsMoran11211))(('niiYYnS12)(1niiYnY11iYinijW2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。12全域空间相关性检验与分析Moran’sI指数取值一般在-1到1之间。大于0表示正相关,代表相邻地区的类似特征值出现集群(Clustering)趋势,接近于1时表明具有相似的属性聚集在一起(高值与高值、低值与低值);小于0表示负相关,接近于-1时表明具有相异的属性聚集在一起(高值与低值、低值与高值);若为接近于0,则表示属性是随机分布的,或者不存在空间自相关。2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。13全域空间相关性检验与分析对于Moran指数I,可以用标准化统计量Z来检验n个区域是否存在空间自相关关系,Z的计算公式为如果Moran’sI的正态统计量的Z值均大于正态分布函数在0.05(0.01)水平下的临界值1.65(1.96),表明区域创新在空间分布上具有明显的正向相关关系。)()(IVARIEIZ2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。14全域空间相关性检验与分析Geary系数C计算公式如下式中:C为Geary系数;其他变量同上式。Geary系数C的取值一般在[0,2]之间,大于1表示负相关,等于1表示不相关,而小于1表示正相关。ninjniiijninjjiijxxwxxwnC111211221局部空间自相关检验与分析局部空间自相关分析方法包括3种:空间联系的局部指标(localindicatorsofspatialassociation,LISA));G统计量;Moran散点图。Anselin(1995)提出了局部Moran指数,定义为:可进一步写成式中:和是经过标准差标准化的观测值。jjijiixxwSxxI)()(2iijjijiixxxxwxxnI2)()()(jjijiTjjijizwzzzzwnzizjz局部Moran指数局部Moran指数检验的标准化统计量为正的局部Moran指数Ii,表示一个高值被高值所包围(高-高),或则是一个低值被低值所包围(低-低)。负的局部Moran指数Ii,表示一个高值被低值所包围(高-低),或则是一个低值被高值所包围(低-高)。)()()(iiiiIVARIEIIZG统计量类似的,Getis和Ord(1992)开发了一个Geary指数的局部聚类检验,称为Gi指数(Gistatistic)全局G统计量的计算公式为对每一个区域单元的统计量为ijijjijiijxxxxwG/ijjjijixxwG/对统计量的检验与局部Moran指数相似,其检验值为显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区域单元趋于空间集聚,与Moran指数只能发现相似值(正关联)或非相似性观测值(负关联)的空间集聚模式相比,具有能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式。)()()(iiiiGVARGEGGZMoran散点图以(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示。全局Moran指数,可以看作是Wz对于z的线性回归系数,对界外值以及对Moran指数具有强烈影响的区域单元,可通过标准回归来诊断出。由于数据对(Wz,z)经过了标准化,因此界外值可易由2-sigma规则可视化地识别出来。MoranscatterplotMoran散点图的4个象限,分别对应于区域单元与其邻居之间4种类型的局部空间联系形式:第一象限(高一高,标记为HH):它表示一个高经济水平的区域被其它高经济水平的区域包围;或者说,一个高经济水平的区域和它周围的经济区域他们有较小的空间差异程度;第二象限(低一高,标记为LH):它表示高经济水平的区域包围着一个低经济水平的区域,也就是说该区域的经济水平相比较周围邻居是比较低的,意既该区域经济的空间差异的程度是比较大的;。第三象限(低一低,标记为LL):它表示该区域和它周围的其他区域都是低经济水平的区域,也就是说这个区域的经济水平是比较低的,表现为这个区域和它的邻居区域经济的空间差异程度是比较小的;第四象限(高一低,标记为HL):它表示一个区域是高经济水平,而周围其他的区域是低经济水平,也就是这个区域的经济水平是比较高的,而且这个区域经济是有比较大的的空间差异程度的。与局部Moran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值之中的哪种空间联系形式。并且,对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。将Moran散点图与LISA显著性水平相结合,也可以得到所谓的“Moran显著性水平图”,图中显示出显著的LISA区域,并分别标识出对应于Moran散点图中不同象限的相应区域。2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。26空间权值矩阵的确定在讨论空间依赖性和空间异质性问题之前,首先需要做的工作是量化样本数据的区位因素(quantitativerepresentationofspatialrelationships)。在区域经济管理研究中,将空间效应因素引入经济管理过程的研究,建立空间计量经济模型进行空间统计分析时,一般要用空间权值矩阵(WeightsMatrix)来表达空间相互作用。对位置的量化一般依据“距离”而定:空间距离和经济距离2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。27空间距离的形式1、相邻距离(Contiguity)-A“neighbor”isdefinedbasedoncommonbordersorcommoncorners.根据地图上所研究区域的相对位置,决定哪些是相邻的,并用“0-1”表示,即“1”表示空间单元相邻,“0”表示空间单元不相邻。对于一个具有n个空间单元的系统,相邻矩阵W是一个nⅹn稀疏的0-1矩阵,对角线为0(习惯上,空间单元不与自身相邻),相邻元素为1。2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。28(1)(2)(3)(5)(4)(6)2020年3月9日11时51分天行健,君子以自强不息;地势坤,君子以厚德载物。29空间距离的形式几种相邻关系:(1)线性相邻(Linearcontiguity)(2)“车”相邻Rookcontiguity–commonborders.(3)“象”相邻Bishopcontiguity–commonc