第九讲-地统计学

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

地统计学分析方法黑鹏飞heipf06@mails.tsinghua.edu.cn主要内容地统计学的简单介绍定义应用范围使用步骤变异函数具体计算及应用变异函数的计算变异函数的重点参数及其意义变异函数的简单应用事件:在科学实验中,为着某种目的需要,常常在不变的一定条件下,对某一现象进行着多次重复的观测与实验,实验结果中发生的现象叫“事件”。必然事件:如果在每一次实验中,某事件在一定条件下必定发生,则为必然事件。不可能事件:如果在每一次实验中,某事件在一定条件下不可能发生,则为不可能事件。随机事件:介于“必然事件”和“不可能事件”之间即随机事件。随机变量:实验中,对于每一事件ω,都对应着一个实数Z(ω),而Z(ω)又是随着实验结果不同而变化的一个变量,则称Z(ω)为随机变量。如:1)打靶击中取1,未击中取0。Z表射手射击得分,是一个随机变量,可取0或1。2)某段时间内候车人数Z,可取0至最大容量。3)单位面积上土壤元素含量Z,可取[0,T],T为某常数221(,)[()()]211[()()]{[()][()]}22xhVarZxZxhEZxZxhEZxZxhcov(,)[()()]XYEXEXYEY2[][]VarZEZEZ协方差:标准差:变异函数(本节将要学到):基本概念地统计法区域化变量协方差函数变异函数平稳假定本征假定块金值基台值变程地统计学定义Matheron(1962)给地统计学下过一个较早的定义;“地统计学即以随机函数的形式体系在勘查与估计自然现象中的应用。”1970改为:“以区域化变量理论在评估矿床中的应用(包括采用的各种方法和技术)。”但是地统计学近20年的发展表明,它不仅仅在地质学中应用,而且在土壤、农业、气象、海洋、生态、森林和环境治理方面也开始应用。地统计学定义地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关相依赖性的自然现象的科学。地统计学的发展在5O年代初期,南非矿山工程师D.G.Krige等人在金矿储量估计上提出了该方法的雏形。此后法国统计学家G.Matheron对早期零散研究归纳、整理和系统化,在60年代提出区域化变量和半变异函数,形成了地统计学的理论基础。地统计学的发展由于地统计学可在有限的离散数据基础上无偏最优预测(或模拟)连续的空间分布,且得到预测的不确定性估计,因此,其应用领域也从地质、矿业逐渐拓展到土壤、水资源、农业、气象、海洋、生态、环境等领域,其方法体系也从稳态、单变量、线性、参数和空间静态演化到非稳态、多变量、非线性、非参数和时空动态层面。1977年桂林冶金地质研究所情报室率先把地统计学引入我国,之后候景儒、王仁铎、孙洪泉等人深化了地统计学方法在我国地质、矿业领域的应用.然而相比其他国家,我国在环境、水资源、生态等领域应用依旧甚少口。地统计学与经典统计学的区别经典统计学研究的变量必须是纯随机变量。该随机变量的取值按某种概率分布而变化。而地统计学研究的变量不是纯随机变量,而是区域化变量。该区域化变量根据其在一个域内的空间位置取不同的值,它是随机变量与位置有关的随机函数。因此,地统计学中的区域化变量既有随机性又有结构性。经典统计学所研究的变量理论上可无限次重复或进行大量重复观测试验。而地统计学研究的变量则不能进行这样的重复试验。因为区域化变量一旦在某一空间位置上取得一样品后,就不可能在同一位置再次取得该样品,即区域化变量取值仅有一次。地统计学与经典统计学的区别经典统计学的每次抽样必须独立进行,要求样本中各个取值之间相互独立。而地统计学中的区域化变量是在空间不同位置取样,因而,两个相邻样品中的值不一定保持独立,具有某种程度的空间相关性。经典统计学以频率分布图为基础研究样本的各种数字特征。地统计学除了要考虑样本的数字特征外,更主要的是研究区域化变量的空间分布特征。因此,地统计学的主要研究是围绕着变量空间分布理论和估计方法。地统计学的在生态学中的引入随着生态学理论研究的深入,尤其是景观生态学的发展,许多生态学家认识到空间异质性在许多生态学理论中起中心作用,并引起高度重视,成为90年代生态学理论研究的新的重点。空间异质性是指系统或系统同性在空间上的复杂性和变异程度,包括系统属性的空间组成,空间构型和空间相关。它在生物学系统各个层次上都存在,是许多基本生态学过程和物理过程在时间和空间连续系统上长期作用的结果。鉴于地统计法在研究空间异质性的优点,从85年开始引入生态学的研究。地统计学在生态学研究中的应用对空间格局的尺度、几何形状、变异方向进行定量地分析和有效地估计,并将空间格局与生态学过程联系起来;它为生态学家在各种尺度上进行空间抽样时,提供最优的抽样方法;它可以帮助景观生态学家建立景观模型,并进行景观模拟;环境因子的地统计学分析有助于生态学家更深刻地了解生命有机体(个体、种群和群落)空间变异的机制。地统计学在生态学研究中的应用最近几年的研究表明:地统计学无论是在土壤的空间格局等植物群落的空间变异,还是在景观干扰格局等方面的研究,都显示出经典统计学不可替代的优越性。重要概念:区域化变量Matheron(1963)将区域化变量的定义:以空间点x的三个直角坐标xu,yv,zw为自变量的随机场Z(xu,yv,zw)=Z(x),称为区域化变量,或区域化随机变量。(场:设在空间某区域内定义标量函数或矢量函数,则称定义在空间区域内的函数为场)区域化变量的理解区域化随机变量与普通随机变量不同,普通随机变量的取值按某种概率分布变化而变化,而区域化随机变量则根据其在一个域内的位置取不同的值。换句话说,区域化随机变量是普通随机变量在域内确定位置上的特定取值,它是与位置有关的随机函数。区域化变量的理解区域化变量具有两方面的含义,即:观测前Z(x,y,z)是一个场,观测后Z(x,y,z)是一个普通的空间三元函数或空间点函数值。(这一点类似于概率统计中的随机变量,在抽样前它可以看成一个随机变量,抽样后则为一个具体的实数值,只有这两方面理解了才可以真正理解区域化变量的概念)随机函数是由区域性和随机性结合起来产生的概念。一方面,数据维值来自于一个物理环境(时间,空间),并且在一定程度上依赖于其所处的在该区域的位置,它们是区域化的。另一方面,区域化值z(xi)不能用一个简单的确定型函数Z(x)来模拟。对样品值进行观察会发现,Z(x)的行为随机函数模型的建立非常复杂。像其他许多数据参数的作用机制不能确定的情况一样,这里选择利用概率论方法,也就是说,这个作用被认为是随机的。样品数据可以视为随机作用的结果。区域化变量举例:1)年降水量和蒸发量;2)土壤厚度分布。既服从地带性规律,同时又受随机性(不确定性)因素的影响.因此它们是典型的区域化变量。区域化变量在数学和统计学意义的属性首先,区域化变量是一个随机函数,它具有局部的、随机的、异常的性质;其次,区域化变量只有一般的或平均的结构性质,即变量在点x与x+h(h为空间距离)处的数值Z(x)与Z(x+h)具有某种程度的自相关,这种自相关依赖于两点间的距离h及变量特征。这就体现其结构性。区域化变量在研究具体变量时的特性①空间局限性区域化变量被限制在一定的空间范围内。如景观中某一种群的斑块(Patch),群落中某一林分类型,树木种子的散布范围等,这一空间范围称为区域化变量的几何域。在几何域或空间范围内,变量的属性最为明显。在几何域或空间范围之外,变量的属性表现不明显或表现为零。在景观生态学中空间格局特性表现为景观的空间异质性。区域化变量在研究具体变量时的特性②不同程度的连续性具有较强的连续性;只具有平均意义下的连续性;在某些特殊意义或情况下,连这种平均意义下的连续性也不存在。例如,森林土壤中有效氮的含量即使在两个非常靠近的样点上,也可能有很大的差异,表现出不连续。这种现象称为“块金效应”。区域化变量在研究具体变量时的特性③不同类型的各向异性区域化变量如果在各个方向上的性质变化相同,更确切地讲变异相同,则称为各向同性。若在各个方向上的变异不同,则称其为各向异性。分析各向同性或各向异性,主要是考虑区域化变量在一定范围内样点之间的自相关程度。当超出一定范围之后,相关性减弱或消失。Rossi等认为生态学中的区域化变量,各向同性是相对的,而各向异性则是绝对的。变异函数的提出由于区域化变量具有上述特点,应该有一种合适的函数或模型来描述,它既能兼顾到区域化变量的随机性又能反映它的结构性。具体做法就是提出简单的空间变异性的表达式,并导出求解问题的相容条件和运算方法。为此,G.Matheron在60年代提出了空间协方差函数和变异函数。尤其是变异函数能同时描述区域化变量的随机性和结构性,为从数学上严格地分析区域化变量提供了实用工具。协方差(又称半方差)在概率论中,随机向量X,Y的协方差定义为:若Z(x)、Z(x+h)为区域化变量Z(x)=Z(x1,x2,x3)在空间点x和x+h处的两个随机变量,定义Z(x)的自协方差函数:cov(,)[()()]XYEXEXYEY((),())=[{()-[()]}{()-[()]}]covZxZxhEZxEZxZxhEZxh二阶平稳假设:随机变量Z(x)的空间分布规律不因位移而改变,即()211()()()[()NhiiichZxZxhmNh((),())=[{()-[()]}{()-[()]}]covZxZxhEZxEZxZxhEZxh2[(),()][{()-}{()-}][()()-]()(,)CovZxZxhEZxmZxhmEZxZxhmChxxhD()()ZxhZxm变异函数变异函数是地统计学所特有的样本工具。在一维条件下变异函数定义为:当样本点在一维x轴上变化时,区域变量Z(x)在点x、x+h处值Z(x)、Z(x+h)的差的方差一半,被定义为区域化变量Z(x)在x轴方向上的变异函数,记γ(x,h)则221(,)[()()]211[()()][[()][()]22xhVarZxZxhEZxZxhEZxEZxh二阶平稳假设和本征假设的应用要估计方差值,即估计变异函数值,就要估计数学期望E[Z(x)-Z(x+h)]2,因而必须有足够的若干对Z(x)和Z(x+h)的值。才可能通过求[Z(x)-Z(x+h)]2的平均数的方法来估计E[Z(x)-Z(x+h)]2,但在地统计学中,空间抽样只能得到一对这样的值Z(x)和Z(x+h),不可能在空间上同一点取得重复,这就在统计推断上出现了困难。为了克服这个困难,能够使用变异函数,必须对区域化变量Z(x)进行区域化二阶平稳假设和本征假设。本征假定条件1:E[Z(x)-Z(x+h)]=0(对所有的x,h)条件2:Var[Z(x)-Z(x+h)]=E[{Z(x)-Z(x+h)}2]=2γ(h)1(,)[()()]?2xhVarZxZxh变异函数设Z(x)为区域型随机变量,并满足二阶平稳和本征假设,则变异函数:即:其中:h为两个样本点分隔距离,Z(xi)和Z(xi+h)分别为区域化变量Z(x)在空间点xi和xi+h的观测值。211()[()-()][()-()]22hVarZxZxhEZxZxh()211()[()-()]2()NhiiihZxZxhNh例:Z(x1)=4,Z(x2)=3,Z(x3)=4,Z(x4)=5,Z(x5)=7,Z(x6)=9,Z(x7)=7,Z(x8)=8,Z(x9)=7,Z(x10)=7(xi=i)解:由图可以看出,当分隔距离较小时,变异函数越小。当两点间距离增大到某一值(h=6)后,变异函数在某一值上下波动。变异函数的参数通过变异函数曲线图可以得到3个重要参数块金值C0(Nugget)基台值C0+C(Sill)变程a(Range)块金值C0(Nugget)根据半方差的定义,当h=0时,半方差等于零。但是,在实际的

1 / 72
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功