第讲空间计量经济学初步地理学第一定律世界上万千事物的状态都可以由一个三维的空间坐标系与一个一维的时间坐标系来唯一刻画。时间或空间上距离相近的两个事物的状态是相互关联的,即不能被认为是相互独立的,且两事物越是接近,它们状态的相关性越强。当两点距离为零(实则是同一个体),它们将完全相关。越是相距遥远的事物相关性越弱,当两事物之间距离为无穷远,可近似地认为两者完全不相关。概述空间计量经济学(spatialeconometrics)空间计量经济学作为现代微观计量经济学(micro-econometrics)的一个分支,是旨在为处理截面数据或面板数据中的空间效应(spatialeffect),空间相关性(spatialdependence)与空间异质性(spatialheterogeneity)发展专门的建模、估计与统计检验方法。一、概述概述在时间序列分析中,时间自回归过程将时刻t的反应变量与过去时刻的变量相联系,表示一时刻所发生的事件受过去时间发生事件结果的影响。如:概述空间相关性是指一地所发生的事件,行为与现象,会直接或间接影响到另一地发生的事件行为和现象。因此某一处的观测与其他各地观测之间存在着函数关系。其一般表达为空间相关性的根源1.观测数据地理位置接近(geographicalproximity)由于地理位置的接近而导致的空间相关性是空间相关性最初始的定义,与地理学第一定律吻合。这种相关性是环境,地质等学科中的普遍现象。空间相关来源空间相关来源2.截面上个体间互相竞争(competition)和合作最典型的例子是在一个寡头竞争的市场中,厂商对自己产品定价时将同时对市场上其他厂商的价格作出反应,最后决定的价格将是博弈的均衡点。3.模仿行为(copycat)在一群体中,个体会重复或模仿一个或几个特定个体的行为。例如在班级中中游成绩的学生会以成绩优秀的学生为榜样,竞争性体育比赛中,选手会以领先选手为心中目标,在以上这些情况下,如果不考虑空间相关性,所建立的模型会和真实模型相差甚远。空间相关来源4.溢出效应(spillovereffect)溢出效应是指经济活动和过程中的外部性对未参与经济活动和过程其中的周围个体的影响。散发有毒气体的植物会对周围的植物产生有害的影响,屋主拥有一座漂亮花园也显然对周围邻居有正效应。同样不断加强的贸易往来所带来的经济利益对地区性国家多边联盟的形成具有正的溢出效应。空间相关来源5.测量误差A,B,C三处的观测本来是相互独立的,但是研究者由于无法准确识别A,B和B,C相邻的边界,而将整个区域分成两个部分I和II,在图中用两中颜色表示。显然,由于I和II共享B,所以有理由相信,I和II上的观测是空间相关的。空间相关来源假设随机变量,和互相独立,当时,可以证明不为零。我们把这种空间相关性的来源称为测量性误差。这一来源说明,当我们处理带有空间特性的数据时,无论经济理论是否明确显示空间相关性,我们都应该在设定模型形式时候对空间相关性给予足够重视和相应考虑。测量误差空间统计学VS空间计量经济学首先,空间统计学的理论是空间计量经济学发展的基础。正如计量经济学其他分支的发展都广泛借助统计学的理论,空间计量经济学也尽可能吸收一切可以利用的现存有关空间统计的理论。其次,统计学的应用范围不仅限于经济学一门学科。某一空间统计学理论最初就是为处理经济学中的空间效应而提出,之后完全可能被应用到除经济学外的其他学科。空间计量经济学补充和扩展了空间统计学。概述最后,正如Anselin(1988)所认为,空间统计学是以数据为出发点的(data-driven),而空间计量经济学是以模型为出发点的(model-driven)。这说明,由经济学问题建立合适的刻画相关性的计量模型,并发展相关的估计,假设检验,预测方法才是空间计量经济学的主要任务。概述空间权重矩阵计量经济学经常用线性模型来近似非线性模型,即可将近似写成记矩阵的元素为,它的对角元素都为零。二、空间自相关一般我们无法利用容量为的样本去估计个参数。为了确保模型参数可识别,我们需要对的形式加以限制。最常用的限制方式之一就是假设其中称为空间权重矩阵(spatialweightingmatrix),它刻画的是截面上个体之间空间相关的结构,是一个无量纲的矩阵。称为是空间自回归系数,表示了空间相关性在给定空间结构下的方向和强弱。空间自相关二元相关(0-1相关)例1.1.1.在地图上的个子区域中,如果和具有相邻的边界(boundary),则定义,否则。空间自相关,1nijW,0nijW以上定义的空间权重矩阵有如下两大缺点:(1)按以上定义,空间权重矩阵总是一个对称阵,这显然是不符合有些情况的,例如现实中存在作用是单向或非对称双向的情形(模仿效应),(2)0-1元素的设置无法区分各邻居空间作用的强弱。空间权重矩阵011100101000110011100010001101001010ijW克服以上两个缺点的办法之一是,定义其中分子可以理解成是和的边界相同部分的长度,分母是与其他相邻接的个体边界的总长。根据这一定义所得的权重矩阵如下所示:空间权重矩阵,,,1nijnijnnijj以上定义的权重矩阵的合理性在于,如果j和i同时和k相邻,则由于j与k和i与k相邻的边界长度不同,j和k对i的空间作用分别不同,正比于它们与i相接的边界的长度。空间权重矩阵101/31/31/3001/201/20001/41/4001/41/4/1/20001/20001/31/301/3001/201/20nijijijj注意:•对于模型而言,权重矩阵W的元素是非随机的、外生的。基于一个距离衰减函数、社会网络结构、经济距离、k个最邻近、经验流量矩阵等也可以确定空间权重,尽管这些选择可能间接表明空间权重的确定是相当任意的。附1.基于距离的空间权值矩阵•根据距离标准,为:•基于距离的空间权值矩阵(DistanceBasedSpatialWeights)方法是假定空间相互作用的强度是决定于地区间的质心距离或者区域行政中心所在地之间的距离,是一种在实践应用中常用的空间权值矩阵。ijW不相邻);和区域之外(即区域在距离和区域当区域;相邻)和区域之内(即区域在距离和区域当区域jidjijidjidWij01)(•在这种情况下,不同的权值指标随距离dij的定义而变化,其取值取决于选定的函数形式(如距离的倒数或倒数的平方,以及欧氏距离等)。•当然,还需要定义一个门槛距离,超过了某给定的门槛距离则区域间的相互作用可以忽略不计。附2.经济社会流量空间权值矩阵•除了使用真实的地理坐标计算地理距离外,还有包括经济和社会因素的更加复杂的权值矩阵设定方法。•比如,根据区域间交通运输流、通讯量、GDP总额、贸易流动、资本流动、人口迁移、劳动力流等确定空间权值,计算各个地区任何两个变量之间的距离。空间权值矩阵的选择•尽管二进制的空间邻近权值矩阵并非适用于所有的空间计量经济模型,但是,处于某些情况下的实用性,空间统计学家在构建空间计量模型时的首选就是从二进制的邻近矩阵开始的。•一般是先从空间邻近的最基本二进制矩阵开始,逐步选择确定空间权值矩阵。•关于各种权值矩阵的选择,没有现成的理论根据,一般可考虑空间计量模型对各种空间权值矩阵的适用程度,检验估计结果对权值矩阵的敏感性,最终的依据实际上就是结果的客观性和科学性。•Anselin(1999,2003)研制开发的空间统计分析软件GeoDa095i可以直接生成邻近矩阵来测算并确定地区之间的空间效应。空间滞后算子定义的空间滞后(列向量)为的第i行是,这正是i所有邻居的加权平均,赋予邻居的权为。有时为了更加突出加权平均的含义,我们可以令的每一行权数之和为1。空间滞后算子地区YWAWBWcWDWEWF空间滞后算子A1200.50.30.50022.3B150.300.300023.5C350.30.5000.30.518.8D170.30000.3020E28000.30.500.524F20000.300.3031.5为什么进行归一化处理?归一化处理(行和单位化)将原来空间矩阵的每一个元素分别除以所在行的元素之和,这使得变得不再具有量纲。由于将变得与具有相同的量纲,空间自回归系数因此具有更加清晰准确的含义,它可以被解释成空间相关的方向与大小,且不同模型之间还可以进行直接的比较。想一想数据的空间自相关•在统计学中,我们用样本相关系数说明两个变量之间的相关:22()()()()iiiixxyyrxxyy全局空间自相关指标•1.Moran指数(Moran’sI)•W是二进制权数。111122111112211()()()()()()(;)nnnnijijijijijijnnnnnijiijijiijnniiiinWXXXXWXXXXIWXXSWXXXSXnn•Moran’sI的取值一般为[-1,+1],解释同相关系数。•正空间自相关:相似的观测值在空间集聚;•负空间自相关:相似的观测值在空间分散;•无空间自相关:观测值在空间分布上没有规律(完全随机)。2y地区YWAWBWcWDWEWFA12-9.101110082.3B15-6.110100036.8C3513.9110011194D17-4.110001016.6E286.9300110148F20-1.10010101.14yYY地区A-108.8455.05-126.3536.91-62.869.70B-136.0536.84-84.5624.70-42.076.49C-317.45-84.56194.04-56.7096.53-14.91D-154.1924.70-56.7016.56-28.214.35E-253.96-42.0796.53-28.2148.02-7.42F-181.406.49-14.914.35-7.421.14*Ayy*Byy*Cyy*Dyy*Eyy*Fyy地区A055.1-12636.9100B-1360-85000C-317-850096.5-14.91D-154000-280E0096.5-28.210-7.42F00-150-7.40合计-608-30-1298.760.9-22.33**AAWyy**BBWyy**CCWyy**DDWyy**EEWyy**FFWyy6(607.6929.51129.298.760.922.33)(82.336.819416.6481.14)166719.220.71237916I•2.Geary指数C•Geary’C相当于时间序列中的DW统计量,I相当于一阶自相关系数。•〔DW=2(1-ρ)〕2112111(1)()12()nnijijijnnnijiijinwxxCIwxx•全局G统计量ijiiijiiijWXXGXX局部空间自相关•空间联系的局部指标(Localindicationsofspatialassociation:LISA)描述该区域单元变量与周围区域单元的相似程度(即变量的集聚程度),与全局空间相关指标成比例。•包括局部Moran’sI、局部Geary’sC和Moran散点图。11211()()()nniijjiijjiinniiiinXXWXXnxWxIXXxi=1.LocalMoran’sI2.LocalG统计量ijiiijjWXGX3.Moran散点图Moranscatterplot(Moran'sI=0.511)Residentialburglaries&vehicletheftsper1,000householdsWzz-3-2-10123-2-10124174651649484511447131226442582715281862191029113532343