Stata中的空间自回归模型

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Stata中的空间自回归模型刘迪@StataCorp目录1为什么需要空间自回归模型?2实例:得克萨斯州犯罪率3Stata之Sp系列命令的概述目录1为什么需要空间自回归模型?2实例:得克萨斯州犯罪率3Stata之Sp系列命令的概述为什么需要空间自回归模型?Everythingisrelatedtoeverythingelse,butnearthingsaremorerelatedthandistantthings.—Tobler圣安东尼奥的犯罪率可能影响休斯顿的犯罪率。然而,巴黎的犯罪率却很难受到它的影响,因为这两个城市距离得太遥远了。纽约市某个街区的白血病发病率的上升可能会影响周边街区的白血病发生率。虽然白血病没有传染性,但是一些无法观测到的因素可能是空间相关的(例如环境污染,核辐射)。为什么需要空间自回归模型?经典的线形回归模型无法将空间的相关性考虑进去。空间自回归模型(SpatialAutoregression,SAR)可以包括空间相关的因变量和空间相关的误差项。SAR模型帮助我们理解空间距离的影响。这个空间距离既可以是地理意义上的,也可以是抽象的(例如社交网络)。SAR模型帮助我们理解如下的问题:某个空间单位的自变量X的变化如何影响其它空间单位的因变量y?目录1为什么需要空间自回归模型?2实例:得克萨斯州犯罪率3Stata之Sp系列命令的概述实例:得克萨斯州犯罪率高犯罪率县的周边大部分是高犯罪率地区。低犯罪率县的周边大部分是低犯罪率地区。实例:得克萨斯州犯罪率一些学者试图分析德州的失业率对犯罪率的影响。他们假设一个县的犯罪率会影响其它的县。他们需要1建立一个模型,其中一个县的犯罪率可以影响其它县的犯罪率。2估算出一个县失业率的变化如何影响其它县的犯罪率。空间自回归模型我们需要一个模型以便考虑到犯罪率的空间相关性。hratei= 0+ 1unemploymenti+hrateneighborsofi+errors我们用一个矩阵W来定义neighbors.W即县与县之间的空间相关性的强弱。hrate= 0+ 1unemployment+Whrate+errors利用空间权重矩阵定义空间关系的强弱一个空间权重矩阵W总结了n个空间单位之间的关系强弱。W=266666640w12w13:::w1nw210w23:::w2n..................wn1wn2:::037777775nnW是一个nn的矩阵且wij0。wij反映了空间单位i对空间单位j的影响。我们不考虑自身的影响,所以对角线元素wii都为零。空间邻接矩阵(Spatialcontiguitymatrix)我们先看三个紧邻彼此的县。简单起见,我们叫它们A,B,和C。一种空间权重矩阵叫做邻接矩阵,其中接壤的两个县被定义为邻居。例如,W=ABCA010B101C010空间相反距离矩阵(Spatialinverse-distancematrix)在这个例子中,我们假设距离是没有方向之分的(A到B的距离和B到A的距离是一样的)。我们可以基于距离的倒数来建立空间相反距离矩阵。W=ABCA01/501/125B1/5001/75C1/1251/750使用spmatrix来定义空间权重矩阵让我们先看看数据,其中_CX和_CY是一个县地理中心的经度和纬度。.usetexas,clear(S.Messneretal.(2000),U.Ssoutherncountyhomicideratesin1990).list_CX_CYcnamehrateunemploymentin1/7,abbreviate(12)_CX_CYcnamehrateunemployment1.-100.2715636.275086Lipscomb0.001.732.-101.893136.273254Sherman0.003.343.-102.5959136.27355Dallam18.312.284.-101.3535136.272304Hansford0.004.015.-100.8156136.273178Ochiltree3.654.876.-100.8148235.840515Roberts0.003.247.-100.2694835.839961Hemphill0.004.14邻接矩阵定义两个接壤的县为邻居.spmatrixcreatecontiguityW使用spregress来计算SAR模型hrate= 0+ 1unemployment+Whrate+errorsspregresshrateunemployment,dvarlag(W)gs2sls选项dvarlag(W)意味着因变量(dependentvariable,hrate)的空间权重平均值(空间滞后项,spatiallag)。选项gs2sls意味着估计方法为广义空间二阶最小二乘法(generalizedspatialtwo-stageleast-squaresestimator)。使用spregress来计算SAR模型.spregresshrateunemployment,dvarlag(W)gs2sls(254observations)(254observations(places)used)(weightingmatrixdefines254places)SpatialautoregressivemodelNumberofobs=254GS2SLSestimatesWaldchi2(2)=14.23Probchi2=0.0008PseudoR2=0.0424hrateCoef.Std.Err.zP|z|[95%Conf.Interval]hrateunemployment.4584241.1525033.010.003.1595237.7573245_cons2.7209131.6531051.650.100-.51911435.960939Whrate.3414964.19148651.780.075-.0338103.7168031Waldtestofspatialterms:chi2(1)=3.18Probchi2=0.0745为了解释计算结果,我们需要首先理解空间溢出效应(spatialspillover)。理解空间溢出效应(I)我们先做一个实验。请考虑以下一个具体的问题。如果达拉斯的失业率增加到20%,其它县的犯罪率会如何变化?基于spregress的计算结果,我们可以用以下三步回答这个问题。1基于原始的数据,预测各个县的犯罪率。2改变达拉斯的失业率至20%,再次预测各个县的犯罪率。3计算两次预测值的差值,将差值绘至得克萨斯州的地图上。理解空间溢出效应(II).preserve/*savedatatemporarily*/../*Step1:predicthomiciderateusingoriginaldata*/.predicty0(optionrformassumed;reduced-formmean)../*Step2:changeDallasunemploymentrateto20%,andpredictagain*/.replaceunemployment=20ifcname==Dallas(1realchangemade).predicty1(optionrformassumed;reduced-formmean)../*Step3:Computethepredictiondifferenceandmapit*/.generatedoubley_diff=y1-y0.grmapy_diff,title(Globalspillover)..restore/*returntooriginaldata*/理解空间溢出效应(III)因为空间溢出效应不仅仅局限在和达拉斯直接接壤的邻居县,我们将这种溢出效应称为全局溢出(globalspillover)。空间溢出效应的秘密hrate= 0+ 1unemployment+Whrate+errors1达拉斯的失业率上升至20%。2达拉斯的犯罪率会随之升高。3和达拉斯接壤的邻居县随之受到影响,它们的犯罪率随之上升。4而与达拉斯邻居县接壤的邻居地区犯罪率也随之变化。这个过程不断扩散,直到所有的县都受到影响,但是距离达拉斯遥远的县收到的波及很微弱。空间溢出效应的动态过程使用estatimpact来计算空间溢出效应.estatimpactprogress:100%AverageimpactsNumberofobs=254Delta-Methoddy/dxStd.Err.zP|z|[95%Conf.Interval]directunemployment.4666538.15398613.030.002.1648466.7684609indirectunemployment.1910068.15655811.220.222-.1158414.497855totalunemployment.6576605.25193662.610.009.16387391.151447dydx是失业率对犯罪率的边际效应。直接效应(directimpact)为0:47,所以一个县的失业率对本县的犯罪率的平均边际效应为0:47。间接效应(indirectimpact)为0:19,所以一个县的失业率对其它县的犯罪率的平均边际效应为0:19。平均直接效应(Averagedirectimpact)失业率的直接效应是指一个县的失业率对同一个县的犯罪率的边际效应。达拉斯失业率的直接效应(Directimpact,DI)DIDallas=dhrateDallasdunemploymentDallas平均直接效应是指所有县失业率的直接效应的平均值。AveragedirectimpactTexas=1254(DIDallas+DIHouston+:::)平均间接效应(Averageindirectimpact)间接效应是指一个县的所有邻居县的失业率对于本县的犯罪率的边界效应的总和。达拉斯的间接效应(Indirectimpact,IDI)IDIDallas=dhrateDallasdunemploymentHouston+dhrateDallasdunemploymentBrazos+:::(wherethe:::doesnotincludedhrateDallasdunemploymentDallas)平均间接效应是指所有县间接效应的平均值。AverageindirectimpactTexas=1254(IDIDallas+IDIHouston+:::)平均总体效应(Averagetotalimpact)一个县的总体效应是指所有县的失业率对本县犯罪率的边际效应的总和(其中,所有县包含本县)。达拉斯的总体效应(Totalimpact,TI)TotalimpactDallas=dhrateDallasdunemploymentDallas+dhrateDallasdunemploymentHouston+:::=DirectimpactDallas+IndirectimpactDallas平均总体效应是指平均直接效应和平均间接效应的和。Averagetotalimpact=Averagedirectimpact+Averageindirectimpact使用margins和predict做政策分析如果每个县的失业率都下降1%,犯罪率会受到怎样的影响?.margins,at(unemployment=generate(unemployment))///at(unemployment=generate(unemployment-1))AdjustedpredictionsNumberofobs=254Expression:Reduced-formmean,predict()1._at:unemployment=unemployment2._at:unemploym

1 / 45
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功