化探单元素异常统计内容1、异常IDID2、样品个数N3、异常面积S4、样品最大值Max5、样品最小值Min6、异常下限T7、算术平均值nXiXn18、几何平均值ngXinX1log19、标准离差1)XX(n1i2__0nSi=10、异常衬度TXAc11、异常规模TXSAd12、异常NAP值SANAPc浓集克拉克值(C)计算公式:某元素的克拉克值XC变化系数(Cv)计算公式:XSCv致矿系数(Z)计算公式:Z=Cv(全区)+10×Cv(剔高值后)+100×高值比例+C,高值是大于3倍的标准离差。化探背景分析中位数:505050)50(fFHXMe偏度:24)(1)(13231nXXfnXXfnRiiii峰度:963)(1)(14242nXXfnXXfnRiiii正态检验:ifxFxF|)()(|max1Xi:组中值或含量值;fi:Xi所对应的频数;H:组距;X50:包括累计频率50%在内的所在组的组下限;F50:累计频率50%所在组之前的累计频率;f50:包括累计频率50%所在组的组频率;F(X):为经验累计频率;F1(X):为理论累计频率。R型聚类分析iiijijSXXX'其中:njijXnX11;1)(12nX(XSnjiijininikkijjikkinijjikkjjjkjkX(XX(XX(XX(XSSSr11221)())()(式中:rkj为第j个变量和第k个变量的相关系数;Xji为第j个变量第i个样品的观测值;Xj与Xk为第j个和第k个变量的平均值。Q型聚类分析(min)(max)(min)'iiiijijXXXXX(i=1,2,…,P;j=1,2,…,n)其中:P,n分别为变量数和样品数;Xi(max)及Xi(min)分别为数据中第i个指标的极大值与极小值PiikijjkPX(XD12/)((j,k=1,2,…,n;j≠k)式中:Djk为第j个样品与第k个样品的距离系数;Xij为第i个变量第j个样品的观测值。因子分析数学原理:设有一批含p个变量,n个样品的观测数据,如果其变量为X1、X2、……、Xp,它们的综合变量记为F1、F2、……、Fm(m≤p),其数学表达式为pmpmmmppppXaXaXaFXaXaXaFXaXaXaF........................22112222121212121111要求1......21212211paaa(k=1,2,……,m)系数ija由下列原则决定:1、Fi与Fj(ij,i、j=1,2,……,m)互相无关2、F1是X1、X2、……,Xp的一切线性组合中方差最大;F2是与F1不相关的X1、X2、……、Xp所有线性组合中方差最大的;……;Fm是与F1、F2、……、Fm-1都不相关的X1、X2、……、Xp所有线性组合中方差最大。回归系数:222XXYXXYXXXXYXYb标准差:22XXX22XYY相关系数:YXYXXYrYXbrXYrb回归分析1、多元线性回归分析研究某一变量与多个变量之间的线性关系(某两变量之间的非线性关系有时也可以转化为线性关系)。这是以大量收集到的观测数据为基础,找出相关变量之间的内部规律性,以定量形式建立一个因变量与另一个自变量(或另几个自变量)之间关系的数学表达式,从而可以根据一个或几个变量的观测值来预测(预报)另一个变量的估计值,并能从多个指标变量中找出对所研究的问题起重要作用的某些指标。2、多元逐步回归分析是以大量收集到的观测数据为基础,建立某一个变量与另一个变量(或几个变量)之间关系的数学表达式。逐步回归是在多元回归基础是派生出来的一种算法,它能从众多的变量(或预先尽可能多地考虑一些变量)中自动挑选重要变量(指标或因子),并确定其数学表达式的一种统计方法。3、正交化回归分析与线性回归不同,它不一定建立随机变量与全体变量之间的关系,而是一种具有挑选因子的方案。线性回归和逐步回归仅考虑因变量(一个或多个)与自变量(多外)之间的关系,而不考虑自变量本身之间的关系,因而信息有重复的可能,而降低某一独立因素的相对权系数。这种重复也因具体问题的不同,对回归效果就有一定的影响。正交化回归不仅考虑自变量与因变量之间的关系,而且还要考虑自变量本身之间的相互影响。即是将自变量因子进行正交化,排除自变量之间的相互影响,得到一组新的正交化了的因子,再建立新因子与因变量之间的回归方程,并还原到非正交化、非正规化的回归方程,作为建立预报模型之用。对应分析对应分析是在R-型与Q-型因子分析基础上发展起来和一种多元统计方法,它把R-型和Q-型因子分析结合起来,综合考虑变量之间、样品之间及变量与样品之间的关系。它揭示了R-型与Q-型分析之间的两重性,以较少重要的几个公共因子的综合指标去研究对象在成因上或空间上的联系,应用载荷平面投影图进行地质解释与推断,在地质学的应用可以包括:对矿床成因的解释;成岩(成矿)的物质来源、作用方式、作用因素;含矿岩体的预测、评价;地球化学的研究等。根据R-型与Q-型分析具有的对偶性,由R-型分析结果很容易地得Q-型分析结果,它可以克服由于样品容量大而对Q-型因子分析所带来计算上的困难,把变量和样品同时反映到同一坐标轴(因子轴)的一张图形上,更便于地质解释与推断。相关分析1、典型相关分析是研究两组地质指标(或变量)之间相关关系的一种统计方法。它揭示了两个因素“集团”之间的内部联系,而两个因素“集团”的内容和变量数目又可以不同,这就决定了它在解决地质问题上的许多特点,在地质上用来研究二组地质特征之间的关系。用以研究地质成因和地质体对比。如研究某种矿物成分与其围岩成分的关系;研究古生物群同古地理环境之间依存关系;两条区域剖面的化学成分、岩石成分的对比等等。典型相关分析的目的,是在两组众多地质变量中分别寻找若干对(每对为若干个变数的线性组合)有代表性、且具有相关关系的综合指标,通过研究两组综合指标间的关系来反映两组地质变量间的主要作用因素和作用形式。2、秩相关分析是研究一组观测值与另外一组观测序列之间的相关关系,在矿床统计预测中,研究各种控矿地质因素和找矿标志与矿化的相关关系,查明这样的因素与标志最有利的数值范围,即查明找矿有利的统计标志。两个观测序列的秩相关系数:)1(6122nndP其中d为对比序列的序差;n为对比序列的等级数。3、相关频数比值法:筛选因子(变量)的目的在于从大量的预报因子中选出与预报量相关较好,而因子之间相关较差,即因子独立性强的若干较优因子,由它们组成数学模型使预报效果达到最佳。计算公式化:第i个因子的相关频数比iiinnm'ni:变量Xi报对的频数,指预报量Y=1时Xi=1,Y=0时Xi=0n’i:因子间相关频数,指Xi因子在各样本个体中的报错时,相应样本个体其它因子重复报错的总频数。特征分析特征分析是一种对定性描述资料的多元统计方法,其理论简单,通过对已知模型区内各变量间相互关系的定量考察,来确定每个变量的权系数,用于预测的原则是类比法。可综合处理各种数据,尤其适用于多类型定性描述资料的综合处理。在地质找矿过程中常用于预测与评价找矿远景区,亦可用来挑选控矿的重要变量。方法原理:从乘积矩阵Z’Z(Z为原始数据矩阵)和匹配矩阵T出发,采用主分量分析的雅可比法(Jacobi)寻找最大特征值(λ1)及其相应的一组特征向量(bij),来确定各标志的权系数,建立模型与变量线性关系,同时得到预测区的综合指标——关联值,提供定量评价、预测。点聚图0-1法%100NN判错的样品数区分率隶属度和贴近度1、根据在集合上的隶属函数,按隶属原则识别对象,判定其属于哪一个类型;2、根据各弗晰两两间的贴近度,按择近原则,确定哪两个弗晰集最贴近。1、隶属度设有n种类型,m种指标,则第i种类型在第j种指标上的隶属函数为:XbabaXaaXaaXbabaXbaXbaXAijijijijijijijijijijijijijijijijij)2()2()2()2()1()1()1()1(2)2(2)1(01110其中aij(1)和aij(2)分别是第i类元素第j种指标的最小值和最大值;bij2=2σij,而σij2是第i类元素第j种指标上的方差,给定一具体对象X*,设它的m个指标为X1*、X2*、…、Xm*,令mjXASjiji1*)(min又若niSSii1)max(0则认为此对象属第i0类Ai0。2、贴近度已知有n种类型(A1,A2,…,An),它们都有m种指标,均为正态型弗晰变量,相应的参数分别为(aij(1)、aij(2)、bij)(i=1,2,…,n;j=1,2,…,m),其中aij(1)=min(Xij),aij(2)=max(Xij),bij2=2σij2,σij2是Xij的方差,待判断对象B的m个指标分别是具有参数(aj,bj)(j=1,2,…,m)的正态型弗晰变量,则B与各类型的贴近度为:jijjijijjijjijijjijijjijjijijjijjijjijjijjijjijabbabbaaaaaaaabbabbaabbaabbaaBA)()()()(021112110),()2()2()2()2()1()1()1()1(2)2(2)1(又记),min(BASiji若有niSSii1)max(0则按贴近原则,可以认为此B与Ai0最贴近。信息量预测信息量计算法是通过计算各地质因素和找矿标志所提供的找矿信息量,定量地评价各地质因素和标志对指导找矿的作用,借以选择与矿化关系密切的变量;同时根据每个单元中各标志信息量总和的大小,评价每个单元相对的找矿意义,用以对找矿远景区进行预测。标志Xj指示有矿的信息量:SSNNIjijlg式中:Nj—具有标志Xj含矿单元数;N—研究区内的含矿单元数;Sj—具有标志Xj的单元数;N—研究区内单元数。有用信息量:njjIKI1式中:K—有用信息水平(一般取0.75);n—信息量为正值的标志个数;预测单元找矿信息量临界值:rijrIrI11(r为有矿单元个数)原生晕元素分带序列令原始矩阵数据为X=[Xij];其中Xij为线金属量数值;i为标高或水平点距序号i=1,2,…,n;j为元素的种类序号j=1,2,…,m。1、确定每个元素的规格化系数Kj,对X矩阵进行规格化变换从每个元素中挑选出最大值Kj得M个最大值,从这M个最大值中,以最大数量级的Kj为100,次大数量级的Kj取值为101,……,其余以此类推,得规格化系数矩阵mKKKK0021得规格化数据阵:A=XK=[aij]2、确定分带指数由A计算出mjijiiab11(i=1,2,…,n)得nnbbbB002211所以分带指数矩阵为:D=BA=[dij]3、计算变化梯度公式11max1maxkiijkjnkiijkjjddddG式中:dkjmax表示第j个元素的最大分带指数。4、确定分带序列的方法如下1)在同一行里即同一水平(或标高)只出现一个元素的最大分带指数时,不用考虑变化梯度的大小,按标高自上而下排列分带序列。2)在同一水平(或标高)出现两个或两个以上的最大分带指数时,可由变化梯度的大小顺序和标高自上而下排列分带序列。GRD数据变换标准化变换:jjijijSXXX其中Xij是原始观测值,Xj是第j个变量的算术平均值,Sj是第j个变量的标准差,i为样本数,j为变量数。正规化变换: