提纲4.1空间点模式的概念与空间分析技术4.2基于密度的方法—样方计数法与核函数法4.3基于距离的方法4.4G函数与F函数4.5K函数与L函数4.6K函数的扩展—二元模式与空间-时间模式4.1空间点模式的概念与空间分析技术空间点模式的概念•在地图上,居民点、商店、旅游景点、流行病、犯罪现场等都表现为点的特征,有些是具体的地理实体对象,有些则是曾经发生的事件的地点。•离散地理对象或事件(点)的空间分布模式对于城市规划、服务设施布局、商业选址、流行病的控制等具有重要的作用。•根据地理实体或事件的空间位置研究其分布模式的方法称为空间点模式,这是一类重要的空间分析方法。空间点模式的概念•点模式是研究区域R内的一系列点[S1=(X1,Y1),S2=(X2,Y2),…,Sn=(xn,yn)]的组合,其中Si是第i个观测事件的空间位置。研究区域R的形状可以是矩形,也可以是复杂的多边形区域。•图4.1是点在研究区域中的各种分布模式。空间点模式的概念•在研究区域中,虽然点在空间上的分布千变万化,但是不会超出从均匀到集中的模式。因此一般将点模式区分为3种基本类型:–聚集分布–随机分布–均匀分布•对于区域内分布的点集对象或事件,分布模式的基本问题是:这些对象或事件的分布是随机的、均匀的,还是聚集的?•研究分布的模式对于探索导致这一分布模式形成的原因非常重要。如果这些点对象存在类型之分,或者随时间产生变化,那么还需要深入研究的问题是一类点对象的分布模式是否依赖于另外一类点对象的分布模式,或者前期的点模式是否对后期的点模式产生影响。空间点模式的概念•从统计学的角度,地理现象或事件出现在空间任意位置都是有可能的。如果没有某种力量或者机制来“安排”事件的出现,那么分布模式可能是随机分布的,否则将以规则或者聚集的模式出现。•若点模式为规则或聚集模式,则说明地理世界中的事物可能存在某种联系。•一种现象的分布模式是否对另一种现象的分布模式产生影响也是点模式需要解决的重要问题。点模式空间分析方法•空间点模式的研究一般是基于所有观测点事件在地图上的分布,也可以是样本点的模式。•由于点模式关心的是空间点分布的聚集性和分散性问题,所以形成了两类点模式的分析方法:–第一类是以聚集性为基础的基于密度的方法,它用点的密度或频率分布的各种特征研究点分布的空间模式;–第二类是以分散性为基础的基于距离的技术,它通过测度最近邻点的距离分析占的空间分布模式。•第一类分析方法主要有样方计数法和核函数方法两种;第二类方法主要有最近邻距离法,包括最近邻指数(NNI)、G-函数、F-函数、K-函数方法等。点模式空间分析方法•对点模式的空间分析,应注意空间依赖性对分布模式真实特征的影响。空间依赖性所产生的空间效应可能是大尺度的趋势,也可能是局部效应。–大尺度趋势称为一阶效应,它描述某个参数均值的总体变化性;–局部效应也称为二阶效应,它是由空间依赖性所产生的,表达的是近邻的值相互趋同的倾向,通过其对于均值的偏差计算获得。点模式空间分析方法•一阶效应一般用点过程密度λ(S)描述,指在点S处单位面积内事件的平均数目(P.J.Diggle,1983)。用数学极限公式可定义为:ds是指在点S周围一个足够小的邻域;E表示数学期望;Y(ds)是ds内事件的数目。}))(({lim)(0ssdddYEss点模式空间分析方法•点模式的一阶效应有两种分析方法:–样方计数法–核密度方法•样方计数法首先将研究区域划分为面积相等的子区域,即样方,并根据每一个样方中的事件数量来计算和概括统计量,然后将计数值除样方的面积得到点分布的密度。•样方计数方法给出的是空间点的密度变化,缺点是将信息聚集到面积单元中,引起信息的损失。•核密度估计是使用原始的点位置产生光滑的密度直方图的方法。点模式空间分析方法•二阶效应通过研究区域中两个足够小的子区域内事件数目之间的相互关系来描述。用数学极限公式可表示为dsi和dsj分别表示si和sj周围足够小的邻;E表示数学期望;Y(dsi)、Y(dsj)分别指dsi和dsj两个小区域内的事件个数。}))()(({lim),(0,jijijissssdsdsjidddYdYEss点模式空间分析方法•点模式的二阶性质通过点之间的距离进行研究,如最近邻距离。•最近邻距离的估计有两种技术,即随机选择的事件与其最近邻之间的距离,或随机选择的空间上的位置与最近邻的事件之间的距离。•空间依赖性可通过可视的方式检查近邻事件距离的概率分布。–聚集事件通常在低值端表现出陡峭的部分,而规则分布则在高值区域具有陡峭的曲线形式。–K-函数允许考虑的不仅是最近邻的事件,还依赖于过程是各向同性的基本假设。点模式的可视化与探索性分析•表示空间点模式的最常用的方法是点状地图。•空间点模式的探索性空间数据分析的目的在于导出概括的统计量或画出观测分布以研究特定的假设,所使用的检测方法是一阶或二阶效应。完全随机模式与点模式建模•空间点模式分析技术的目的是解释观测的点模式,分析过程包括:–基于一阶或二阶性质的计算分析–建立完全随机模式(CSR)–比较或显著性检验•CSR是建模中的一个关键过程,用来检验过程是否是CSR的方法有很多,包括χ2检验、K-S检验,以及蒙特卡罗检验等方法。4.2基于密度的方法—样方计数法与核函数法基于密度的方法——样方计数法1.样方分析的思想•样方分析(Quadratanalysis,QA)是研究空间点模式的最常用的直观方法。•基本思想是通过点分布密度的变化来探索空间分布模式:–一般用随机分布模式作为理论上的标准分布;–将QA计算的点密度和理论分布作比较,判断点模式属于聚集分布、均匀分布,还是随机分布。•QA的计算过程:–首先,将研究的区域划分为规则的正方形网格区域。–其次,统计落入每一个网格中点的数量。由于点在空间上分布的疏密性,有的网格中点的数量多,有的网格中点的数量少,还有的网格中点的数量为零。–再次,统计出包含不同数量的点的网格数量的频率分布。–最后,将观测得到的频率分布和已知的频率分布或理论上的随机分布(如泊松分布)作比较,判断点模式的类型。基于密度的方法——样方计数法2.样方分析的方法•QA中对分布模式的判别产生影响的因素有:样方的形状,采样的方式,样方的起点、方向、大小等,这些因素会影响到点的观测频次和分布。•QA分析中样方的形状一般采用正方形的网格覆盖,但也可定义其它样方形状,如圆形、正六边形等。•不管采用何种形状的样方,形状和大小必须一致,以避免在空间上的采样不均匀。•由于QA估计的点密度随着空间而变化,保持采样间隔的一致性非常重要。•除规则网格外,采用固定尺寸的随机网格也能够得到同样的效果。基于密度的方法——样方计数法基于密度的方法——样方计数法•样方方法分析空间点模式时,样方的尺寸选择对计算结果会产生很大的影响。•根据Greig-Smith于1962年的试验以及Tylor和Griffith、Amrhein的研究,最优的样方尺寸可根据区域的面积和分布于其中的点的数量确定:其中Q是样方的尺寸(面积);A为研究区域的面积;n是研究区域中点的数量。这就是说最优样方的边长取。nA/2基于密度的方法——样方计数法•当样方的尺寸确定后,利用这一尺寸建立样方网格覆盖研究区域,统计落入每一个样方中的点的数量,统计包含0,1,2,3,…,个点的样方的数量,建立其频率分布。•根据观测得到的频率分布和已知点模式的频率分布的比较,判断点分布的空间模式。•观测的频率分布与己知频率分布之间差异的显著性是推断空间模式的基础,通常采用Kolmogorov-Simirnov检验(简写为K-S检验)。基于密度的方法——样方计数法•如用80个样方计算美国俄亥俄州的164个城市的分布模式。城市作为点实体。基于密度的方法——样方计数法QA计算的各种模式下不同数量城市的样方的频率分布基于密度的方法——样方计数法3.样方分析中点模式的显著性检验•常用的检验方法包括:根据频率分布比较的K-S检验,根据方差均值比的χ2检验。•1)K-S检验–K-S检验的基本原理是通过比较观测频率分布和某一“标准”的频率分布,确定观测分布模式的显著性。首先假设两个频率分布十分相似。如果两个频率分布的差异非常小,那么这种差异的出现存在偶然性;而如果差异大,偶然发生的可能性就小。基于密度的方法——样方计数法(1)假设两个频率分布之间不存在显著性的差异。(2)给定一个显著性水平α,例如100次试验中只有5次出现的机会,则α=0.05。(3)计算两个频率分布的累积频率分布。(4)计算K-S检验的D统计量,即(5)计算作为比较基础的门限值,即如果是两个样本模式比较,则(6)如果计算得出的D值大于Dα=0.05这一阈值,可得出两个分布的差异在统计意义上是显著的。检验的基本过程如下:基于密度的方法——样方计数法•在排除了均匀分布模式的基础上,还需要进一步分析模式是否来自于随机过程产生的点模式。•随机分布的点模式通过泊松过程产生。泊松分布的数学公式是:•泊松分布的含义为,当事件x取值k时的概率分布。在样方分析中含义为,当研究区域中有n个随机分布的点时,恰好有1,2,…,k,…,n个点落入一个样方中的概率。λ=n/m,指平均每个样方中包含的点的数量。!)(kekxpk基于密度的方法——样方计数法•为简化泊松分布的概率计算,先给出x=0时的概率,然后给出概率计算的递推表达式:•到x=k时的递推公式:基于密度的方法——样方计数法2)方差均值比的X2检验•在比较一个空间点模式是否与随机分布模式相似时,除了使用K-S检验外,还可以根据泊松方程的参数λ进行比较。•泊松分布的一个重要特性是:均值=方差=λ。这就启示我们可以使用均值和方差的比值作为点模式是否相似于随机分布的判断准则。•定义方差均值比为,这里,如果空间点模式接近于:泊松分布,则R1。_2XSR__X基于密度的方法——样方计数法2)方差均值比的X2检验•为了通过R推断点模式是否来自于泊松过程,首先假设m个样方中分别有(n1,n2,…nm)个事件的计数,然后用均值和方差比定义一个检验统计量I(也称分散性指数):•对于CSR,I服从X2m-1分布,根据样方计数可以方便地计算I,然后将I和显著性水平为α的值进行比较,推断点模式是否来自于CSR。如果I显著地大于X2m-1,表示聚集分布;如果I显著地小于X2m-1,表示均匀分布。xxxxsmIii12_2)()1(基于密度的方法——样方计数法2)方差均值比的X2检验•还可以利用方差均值比定义一个聚集性指数ICS(indexofclustersize)判断点模式的类型。ICS定义为:•在CSR中,ICS的期望E(ICS)=0;如果E(ICS)0,表示聚集分布模式;如果E(ICS)O,表示规则分布模式。1)(_2xsICS基于密度的方法——样方计数法4.样方计数方法的问题–理论上可以将观测点模式和任何已知特征的点模式作比较。通常先采用视觉观察的方法,假设点的分布模式和哪一种特征分布相似,然后进行统计量的计算和检验。–然而样方技术存在一定的限制,样方方法只能获得点在样方内的信息,不能获取关于样方内点之间的信息,其结果是样方分析不能充分区分点分布模式。基于密度的方法——样方计数法•上图所示的两个分布模式,图中(a)、(b)分别是8个点在4个样方中的分布。•在视觉上是两个不同的模式,(a)更加分散,(b)非常聚集。使用样方技术将产生相同的结果。•原因是样方技术不能计算样方内点之间的空间关系信息;当样方格网划定后,人为地割裂了点之间的空间关系。•用点分布的空间关系信息识别空间模式的方法是最近邻方法。基于密度的方法——核函数1.核密度的概念与方法–核密度估计法(kerneldensityestimation,KDE)认为地理事件可以发生在空间的任何位置上,但是在不同的位置上事件发生的概率不一样。点密集的区域事件发生的概率高,点稀疏的地方事件发生的概率低。–KDE和样方计数法相比较,KDE更加适合于用可视化方法表示分布模式。基于密度的方