空间分析空间插值分析概述最近邻法距离反比法趋势面法样条法克里金法精度评定及方法选择2观测站数据由于意外而缺失一些点的数据无法观测而获得由离散点到空间连续曲面1.概述3什么情况下需要空间插值?012345678901234567890123456701234567离散点数据转换成连续的表面数据修补数据中的缺失采样点数据空间分布建模未知数据插值已知数据4空间插值能解决什么问题?1.概述距离衰减效应空间位置上越靠近的点,越可能具有相似的观察值;而距离越远的点,其特征值相似的可能性越小。地理学第一定律地理事物或属性在空间分布上互为相关,存在集聚、随机、规则分布。无论用哪种插值方法,根据统计学假设可知,样本点越多越好,而样本的分布越均匀越好。5空间插值需要顾及什么因素?1.概述整体插值和局部插值确定性插值和地统计插值精确插值和近似插值6空间插值的分类1.概述整体插值:用研究区所有采样点数据进行全区特征拟合。整个区域的数据都会影响单个插值点,单个数据点变量值的增加、减少或者删除,都对整个区域有影响。典型例子:全局趋势面分析7整体插值和局部插值1.概述ARCGIS全局趋势面分析局部插值:只使用邻近的数据点来估计未知点的值。样条函数插值法距离倒数插值Kriging插值(空间自由协方差最佳内插)8整体插值和局部插值1.概述全国气象监测站点分布IDW局部插值结果确定性方法基于未知点周围点的值和特定的数学公式,来直接生成平滑的曲面;地统计方法基于自相关性(测量点的统计关系),根据测量数据的统计特征产生曲面;由于建立在统计学的基础上,因此不仅可以产生预测曲面,而且可以产生误差和不确定性曲面,用来评估预测结果的好坏。9确定性方法和地统计方法1.概述精确插值:产生通过所有观测点的曲面。在精确插值中,插值点落在观测点上,内插值等于估计值。近似插值:插值产生的曲面不通过所有观测点。当数据存在不确定性时,应该使用近似插值,由于估计值替代了已知变量值,近似插值可以平滑采样误差。10精确插值和近似插值1.概述空间插值分析概述最近邻法距离反比法趋势面法样条法克里金法精度评定及方法选择11基本原理最近邻点法由A.H.Thiessen提出,又叫泰森多边形方法。它采用一种极端的边界内插方法,即只用最近的单个点进行区域插值(区域赋值)。因此,用最近点属性值代替,即泰森多边形内的插值点都是用其中心点的属性值代替。122.最近邻法?基本原理泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其它数据点的距离,并用其内数据点进行赋值。132.最近邻法分布均匀时效果好分布差异性多大时不适用于最近邻插值?用于只有少数缺失值时,对缺失值进行填补数据缺失到什么程度,不能采用最近邻插值方法?可插值性问题!最近邻法的适用性142.最近邻法优点插值结果图变化只发生在边界上,在边界内都是均质的和无变化的;适用于较小的区域内,变量空间变异性不是很明显的情况;快速插值,符合人们思维习惯;不需其他前提条件,方法简单,效率高。不足精度一般,受样本点的影响较大;实际应用中,效果常不十分理想。最近邻法的优点与不足152.最近邻法最近邻法实际应用162.最近邻法1998年全国年平均降水数据最近邻法插值结果特征:用泰森多边形插值方法得到的结果图变化只发生在边界上,在边界内都是均质的和无变化的;适用于较小的区域内,变量空间变异性也不很明显的情况;符合人思维习惯,距离近的点比距离远的点更相似,对插值点的影响也更明显;优点:不需其他前提条件,方法简单,效率高;缺点:受样本点的影响较大,只考虑距离因素,对其他空间因素和变量所固有的某些规律没有过多地考虑。实际应用中,效果常不十分理想。最近邻法评价172.最近邻法182.最近邻法最近邻法的拓展-线性插值法此方法适用于三角网网格内的插值。假设ABCD为一平面,三顶点(x,y,z)坐标已知,现求A点的插值。插值函数为:把B、C、D三点的坐标带入上式,联立就可以解出三三个系数,从而求出A的内插值。空间插值分析概述最近邻法距离反比法趋势面法样条法克里金法精度评定及方法选择19距离反比插值方法最早由Shepard提出的,并逐步得到发展和推广应用。每个采样对插值结果的影响随距离增加而减弱,因此距离目标点较近的样点赋予的权重较大。基本原理靠的越近越相似!203.距离反比法反距离加权法(IDW)基本原理213.距离反比法输入原始数据点值;确定插值点平面坐标;寻找与插值点最近的几个原始数据点,同时求出他们与插值点的距离,即根据下式计算插值点值,即重复上述各个步骤,求出所有插值点的值。优点简便易行;可为变量值变化很大的数据集提供一个合理的插值结果,不会出现无意义的插值结果;全局最大和最小变量值都散布于数据之中。不足对权重函数的选择十分敏感;易受数据点集群的影响,结果常出现一种孤立点数据明显高于周围数据点的“牛眼”分布模式;距离反比很少有预测的特点,内插得到的插值点数据在样点数据取值范围内。反距离加权法(IDW)的优缺点223.距离反比法反距离加权法(IDW)的实际应用233.距离反比法1998年全国年平均降水数据IDW法插值结果搜索半径-固定对固定型半径,搜索距离一定,所有在该半径内的样点参与计算。可预先设定一个阈值,当给定半径内搜索到的点小于该值时可扩大搜索半径,直到达到该阈值为止。搜索半径-可变设定参与计算的样点数是固定的,则搜索的半径是可变的。这样对每个插值点的搜索半径可能都不同,因为要达到规定的点数所需要搜索的区域是不一样的。控制反距离加权的参数—搜索半径243.距离反比法权重过高,较近点的影响较大,拟合表面更细致(不光滑);权重过低,较远点的影响增加,拟合表面更光滑。控制反距离加权的参数—权重如何控制反距离加权的参数—权重??可利用一线状和面状数据集来限制样点的搜索。线状数据集可作为平坦地表的悬崖或脊状障碍物,并且只有位于同侧的样点才符合要求。253.距离反比法不同权重系数(W)和搜索半径(R)的影响W=2,R=230W=2,R=150W=2,R=600W=4,R=600263.距离反比法反距离加权法(IDW)的一个改进---按方位取点!273.距离反比法?空间插值分析概述最近邻法距离反比法趋势面法样条法克里金法精度评定及方法选择28把实际的地理曲面分解为趋势面和剩余面两部分,具体地,趋势面法将样本点的实测点Zi变换分解为两部分,表达为:前者反应地理要素的宏观分布规律,属于确定性因素作用的结果;后者则对应微观区域,被认为是随机因素影响的结果。趋势面法分析294.趋势面法趋势面分析是通过回归分析原理,运用最小二乘法拟合一个非线性函数。主要是模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。在气象要素空间插值计算中,数据往往是二维或者多维的,在这种情况下趋势面方程需要用二元二次或者高次多项式表示,其中二元一次趋势面、二元二次趋势面、二元三次趋势面方程分别表达为:趋势面法分析304.趋势面法一般地讲,N值越大,拟合精度越高。拟合精度C以下式表示,通常C为60%~70%时,该多项式就能够揭示空间趋势。一次多项式二次多项式三次多项式4.趋势面法趋势面法的多项式31优点产生平滑的曲面;结果点很少通过原始数据点,只是对整个研究曲产生最佳拟合面;优点是易于理解便于计算。缺点高次多项式在数据区外围产生异常高值或低值;空间采样选择会影响结果。4.趋势面法趋势面法的优缺点324.趋势面法趋势面法的实际应用331998年全国年平均降水数据趋势面法插值结果空间插值分析概述最近邻法距离反比法趋势面法样条法克里金法精度评定及方法选择34样条插值的目标就是寻找一表面s(t),使它满足最优平滑原则;利用样本点拟合光滑曲线,使表面曲率最小;优点是简单计算量小,保留局部细节;缺点是估计误差困难,样本点稀少时效果差,不适用于在短距离内属性有较大变化的地区。5.样条法样条法原理35不适用于在短距离内属性有较大变化的地区,否则估计结果偏大。样条内插的误差不能直接估算,同时在实践中要解决的问题是样条块的定义以及如何在三维空间中将这些块拼成复杂曲面而又不至于引入原始曲面中所没有的异常现象等问题。5.样条法样条法评价365.样条法样条法的实际应用371998年全国年平均降水数据样条法插值结果空间插值分析概述最近邻法距离反比法趋势面法样条法克里金法精度评定及方法选择38克里金插值由南非采矿工程师克里格(D.G.Krige)于1951年首次提出,故命名为“克里金”法,后经法国著名地理数学学家G.Matheron发展深化。最优无偏估计插值优点是便于估算精度缺点是计算量大6.克里金法克里金插值(Kriging)39半方差:定量描述区域性变化的第一步,它为空间插值、优化采样方案提供了有益信息。半方差的估算公式:半方差图:拟合后半方差图的用途是确定局部内插需要的参数6.克里金法402.5m-5m的间隔下的半方差图5m-10m的间隔下的半方差图6.克里金法间隔容差的影响41块金值(c0,Nuddget):当h=0时的非零变率,由不可解释的原因引起;基台值(c0+c;sill):半变率曲线变平缓时的变率值,表明在某个距离上样本点不再存在相关性,通常等于数据集的方差;变差值(range):当基台值出现时的h值(sill95%时的h值).重要的是原点附近半变率图的形状,越是最近的点对插值结果的影响越大。空间自相关部分:C/(c0+c)6.克里金法半变率图的组成42球面模型指数模型线性模型高斯模型6.克里金法半方差拟合模型43某个方向有更高的空间自相关性存在。6.克里金法各向异性446.克里金法克里金插值(Kriging)451998年全国年平均降水数据克立金法插值结果空间插值分析概述最近邻法距离反比法趋势面法样条法克里金法精度评定及方法选择46交叉验证交叉验证法(cross-validation),首先假定每一测点的要素值未知,而采用周围样点的值来估算,然后计算所有样点实际观测值与内插值的误差,以此来评判估值方法的优劣。各种插值方法得到的插值结果与样本点数据比较。“实际”验证将部分已知变量值的样本点作为“训练数据集”,用于插值计算;另一部分样点“验证数据集”,该部分站点不参加插值计算。然后利用“训练数据集”样点进行内插,插值结果与“训练数据集”验证样点的观测值对比,比较插值的效果。7.精度评定及方法选择精度评定47对每种插值方法重复下面的步骤,实现对不同插值方法的比较:从数据集中除去一个已知点的测量值;用剩余的点估计除去点的值;比较原始值和估计值,计算出估计值的预测误差。针对每个已知点,进行上述步骤,然后评价不同插值方法的精确度。常用的评价指标是均方根(RMS):2,,11RMS()niactiestiZZn7.精度评定及方法选择交叉验证48计算每个点的RMS计算某种插值方法的平均RMS?????123选择某种插值方法457.精度评定及方法选择交叉验证49精确性:参数的敏感性:有些方法对参数的选择相当敏感,而有些方法对变量值敏感。后者对不同的数据集会有截然不同的插值结果。希望找到对参数的波动相对稳定,其值不过多地依赖变量值的插值方法。耗时:一般情况下,计算时间不是很重要,除非特别费时存储要求:同耗时一样,存储要求不是决定性的。可视化、可操作性(插值软件选择):三维的透视图等。7.精度评定及方法选择插值方法的选择50