聚类分析、判别分析、趋势面分析在地质学科中的应用动态研究团队成员童仁剑201411567吴佩201411619王家乐201411571韩丹201411590计算机地质学指导老师:方世跃副教授聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究摘要随着地质学科研究的发展深入,数学地质的多元统计分析在学科中应用越来越频繁。在介绍了聚类分析、判别分析、趋势面分析原理的基础上,分别就其在地质各学科中的应用进展展开综述。研究表明三大理论在地质各学科中都有所研究,它丰富了地质学科半定量、定量化研究方法,其自我改进或与其它理论相结合进行地质对象的综合分析是地质数据处理的未来发展趋势。关键词:聚类分析;判别分析;趋势面分析;多元统计分析;数学地质聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究1引言数学地质(MathematicalGeology)作为地质学分支学科,是六十年代以来迅速形成的一门边缘学科。它是地质学与数学及电子计算机相结合的产物,目的是从量的方面研究和解决地质科学问题。它的出现反映地质学从定性的描述阶段向着定量研究发展的新趋势,为地质学开辟了新的发展途径。数学地质方法的应用范围是极其广泛的,几乎渗透到地质学的各个领域。随着地质学科研究的发展深入,数学地质的多元统计分析在学科中应用越来越频繁。聚类分析、判别分析、趋势面分析作为多元统计重要组成部分,在解决地质问题时扮演着重要角色。本文首先将介绍3大理论的基本原理,然后就三大理论在地质学科中的应用进展展开论述,最后对上述内容进行了总结。聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究2三大理论基本原理2.1聚类分析基本原理物以类聚,人以群分,聚类就是将物理或抽象的对象,按照对象间的相似性进行区分和分类过程。在这一过程中没有教师的指导,是一种无监督的分类,是将数据集划分为若干组或类的过程,并使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象则是不相似的,相似或不相似的度量通常就是利用距离来进行描述。通常聚类的方法大致可以分为以下几类:基于划分的方法、基于分层的方法、基于密度的方法、基于网格的方法和基于模型的方法。常见的聚类分析方法有:快速聚类法、模糊聚类法、灰色聚类法、神经网络聚类法等。聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究2.2判别分析基本原理所谓判别分析法,是在己知的分类之下,一旦有新的样品时,可以用此法选定一个判定标准,以判定将该新样品放置于哪个类中。解决问题:已知某种事物有几种类型,从各种类型中各取一个样本,由这些样本设计出一套标准,使得从这种事物中任取一个样本,可以按这套标准判别它的类型。根据判别中的组数,可以分为两组判别分析和多组判别分析;根据判别函数的形式,可以分为线性判别和非线性判别;根据判别式处理变量的方法不同,可以分为逐步判别、序贯判别等;根据判别标准不同,可以分为距离判别、Fisher判别、Bayes判别法、逐步判别法以及非参数判别法等。2三大理论基本原理聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究2.3趋势面分析原理趋势面分析是拟合数学面的一种统计方法,它是用数学方法计算出一个数学曲面来拟合数据中的区域性变化的“趋势”,这个数学面叫做趋势面,方法的过程叫做趋势面分析。趋势面是一种抽象的数学曲面,它抽象并过滤掉一些局域随机因素的影响,使地理要素的空间分布规律明显化。这个函数趋势面分析的实质是通过回归分析原理,运用最小二乘法拟合一个二元非线性函数,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。从总体上反映了采样数据的区域性变化趋势,称之为趋势面部分;采样数据的实测值与这个函数的对应值之差,成为残差部分,它反映了局部性的变化,可以认为是由局部因素和随机因素造成的。趋势面分析法可以滤去随机干扰,圈出局部异常带。2三大理论基本原理聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究3.1聚类分析在地质学科中的应用进展聚类分析广泛应用于地质学科的工程地质,水文地质、能源地质、地灾评价、地环评价和岩样分类等方面。在工程地质方面,魏伟青等人将越江隧道所处工程地质分为若干类别,利用数据挖掘发现隐藏在地质数据中的内在规律,针对越江地铁隧道地质特点,构建了地质安全评价指标体系,并以武汉地铁四号线越江隧道为例,通过K-means快速聚类方法对比不同K值和不同评价指标设定的多组聚类结果,与不同类型盾构管片的实际分布情况进行比较,验证了该方法的可行性和结果的合理性[1]。通过对湘耒高速公路红层路堑边坡的坡高、坡长、岩性、强度、节理裂隙、地下水、岩层产状和厚度、岩体结构等的调查,李志勇等人弄清了红层边坡工程地质特征,然后在此基础上对红层路堑边坡进行工程地质及系统聚类,两种分类结果一致,表明其结果可做为边坡稳定性分析和防护设计的依据[2]。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究在水文地质方面,杨国勇等人为了较全面地考虑煤层顶板导水裂隙带发育高度的影响因素,在结合大量生产实践的基础上,分别从开采厚度、开采深度、工作面斜长、岩石抗压强度、岩层组合特征等因素进行分析,对各影响因素构造了影响指标并进行量化,采用层次分析法研究影响因素的权重,采用模糊聚类分析法对工作面的裂隙带发育高度进行聚类。10个工作面的数据验证结果表明:开采厚度是影响导水裂隙带发育高度的主要因素之一,其他几个因素也是影响导水裂隙带发育的主要因素。研究所得结果与经验值和实测值都基本相似,为煤矿预测煤层顶板裂隙带发育高度提供了一种新的方法[3]。王国利等人将模糊聚类理论与模型应用于水文地质条件定量化分析的探索。这种方法在理论上能比较全面、真实地反映地下水的客观实际,同时该方法在邯邢铁矿田的地下水水化学分析中得到了较好的应用[4]。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究在能源地质方面,刘刚等人介绍了用灰色聚类方法进行圈闭评价的基本原理,并给出了圈闭灰色聚类评价的计算方法和参数,经胜利油田9个圈闭实例验证,结果可靠[5]。针对杉木树矿井地质构造,徐凤银等人确定了10个评价指标,探讨了模糊聚类分析划分矿井地质构造复杂程度类型的具体方法,然后定量确定出不同类型构造对应各个评价指标的取值范围[6]。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究在地灾评价方面,张海燕等人改进了系统聚类分析方法,引入了权重系数,运用阀回归模型进行数据拟合,准确划分了灾害易发区[7]。于远祥等人利用灰色聚类分析的相关理论,在确立评价指标体系原则及要求的基础上,建立基于区域多源信息融合的地质灾害综合评价指标体系和评价模型,对陕西铜川地区的区域灾害程度进行了定量评价并得到地质灾害的聚类区划图谱[8]。针对公路工程沿线地质灾害发育的特点,根据地质环境条件、已经发生和可能发生的地质灾害情况,张剑波等人构建相应的地质灾害危险性评价指标体系。应用灰色聚类分析法对该路段地质灾害危险性进行综合定量研究[9]。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究王建国等人运用GIS技术空间数据分析方法和聚类分析法确定了4类地质灾害聚类区[10]。通过构建基于模糊聚类分析的地质灾害损失程度评价模型,选取最优距离计算方法,薛凯喜等人对不同时间段分区域进行了地质灾害损失程度评价[11]。王滨等人确定了泥石流灾害主因子,利用快速聚类法对各主因子综合得分进行聚类分析,根据聚类分析结果判定了各泥石流爆发的危险程度等级[12]。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究在地环评价方面,孟庆凯等人以以重庆市黄桶娅地区为例,建立了模糊聚类分析数学模型,对矿山地质环境进行了评价[13]。杨毅结合神木县矿山开发实际情况,从区域地质环境背景、矿山开发强度和矿山地质环境问题现状三个方面选取评价因子,进行量化,建立评价模型,选用模糊综合评判和灰色聚类方法对神木县矿山地质环境影响分别进行了评价分析[14]。在岩样分类方面,吴晓军等人运用聚类分析中的最长距离法,可变法,可变类平均法对样品进行分类,取得了良好效果[15]。王秀杰等人基于神经网络聚类分析对超基性岩样品进行了分类,并对比了模糊K均值聚类法,表明聚类结构神经网络对地质数据进行聚类分析更灵便[16]。王家乐__实例:运用聚类分析对施工地岩土体分类,采用了塑性指数、孔隙比和压缩模量这3个土性指标。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究3.2判别分析在地质学科中的应用进展判别分析广泛应用于地质学科的工程地质,水文地质、煤田地质和岩体分级、地质灾害、石油地质等方面。在工程地质方面,孟凡奇等人运用逐步判别分析原理,在多个评价因子中按其对泥石流沟判别能力贡献的大小进行筛选,应用改进的层次分析法对筛选后的评价因子进行赋权,进行了单沟泥石流危险度评价的实例验证,表明真实可靠性更强[17]。基于Fisher判别分析法,姜春露等人对桂林市岩溶塌陷区进行了预测,并与逐步判别、神经网络判别等方法结果进行了比较[18]。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究在水文地质方面,主要应用于矿井突水水源的识别和水文地质类型划分上。周健等人应用距离判别分析理论,结合矿井含水层的水化学分析资料,选取6种离子组分的浓度作为突水水源识别的判别因子,建立矿井突水水源识别的距离判别分析模型[19]。鲁金涛等人采用主成分分析(PCA)与Fisher判别分析相结合的方法建立突水水源判别模型[20]。尔后,宫凤强又提出基于主成分分析与距离判别分析法相结合的突水水源识别方法[21]。孙文洁等人基于Fisher判别分析法对开滦矿区水文地质类型进行了划分,结果符合规范要求和实际情况[22]。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究在煤田地质方面,李春萍等人运用Bayes判别分析模型对煤巷围岩进行了分类[23]。朱卓慧等人选取了煤层开采深度、顶板岩性、地质构造复杂程度、煤层倾角、煤层厚度、开采方法、有无煤柱、炮采或综采8项指标,提出了预测预报冲击地压危险性的距离判别分析方法[24]。董陇军等人基于Fisher判别理论建立了急倾斜煤层顶煤可放性分类的Fisher判别分析模型[25]。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究在岩体分级方面,姚银佩等人在距离判别分析法分类岩体质量等级的基础上,采用加权马氏距离对样本中各指标进行加权处理以区分其重要性,得到加权距离判别分析模型,表明该方法更准确有效[26]。文畅平选用岩石质量指标、完整性系数、单轴饱和抗压强度、纵波波速、弹性抗力系数和结构面摩擦因数等6个指标作为判别因子,建立了Bayes判别分析模型[27]。王家乐__实例:判别分析在判别不同风化程度的花岗岩方面的应用。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究韩丹__在地质灾害方面,朱敏利用Fisher判别分析法建立了边坡稳定性分析的Fisher判别模型。王鸣采用判别分析法分别建立多总体马氏距离判别模型、Fisher判别模型及Bayes判别模型预测滑坡稳定性。刘磊磊、张绍和等将距离判别分析模型引入泥石流危险度评价。王文川,吴海波等利用判别分析法提出了Fisher判别分析泥石流预报模型。杨旭祥、侯克鹏等基于Bayes判别分析理论,利用泥石流资料作为训练样本,建立了泥石流预测的Bayes判别分析模型。孟凡奇、李广杰等运用了逐步判别分析原理,在多个评价因子中按其对泥石流沟判别能力贡献的大小进行筛选,从而确定泥石流沟的评价因子。3三大理论应用进展聚类分析、判别分析、趋势面分析在地质学科中的动态应用研究吴佩__在石油地质方面,田国华从大庆长垣以东特低渗透油藏测井物理参数的概率分布特征出发,确定了特低渗