数学地质信息管理学院王玉兰E-mail:wyl@cdut.edu.cn,wang_wyl@163.comTel:13551261068课程重点内容1、变量研究–一般地质变量研究–区域化变量研究2、数学地质的基本理论和方法–预测方法–储量计算方法2、空间分析方法及模拟基本理论–空间数据特征分析–空间数据插值方法–空间数据估计方法–随机模拟基本方法3、地质统计学基本概念–研究对象的非均质性分析–研究对象特征值空间展布的克立格估计地质变量的研究信息管理学院王玉兰E-mail:wyl@cdut.edu.cn,wang_wyl@163.comTel:13551261068主要内容•一般地质变量–基本概念–地质数据的类型及特点–常见的统计分布模型–地质数据的统计特征及应用–地质数据的参数估计及检验–地质变量的类型–地质变量的选择–地质变量的变换•区域化地质变量–概念–性质–统计特征地质变量--基本概念•地质变量(Geologicalvariable)–用于描述地质研究对象特征的随时间或地质对象空间位置的变化而变化的量。•随机变量(StochasticVariable)–无法事先给出结果的量;–若对于条件组S下的每一个可能的结果w,都有唯一的实数值X(w)与之对应,则称X(w)为一个随机变量,记为X•总体(population)–研究对象的全体•样本(sample)•频率、概率及分布(Frequency/Probability/Distribution)•参数、统计量•中心极限定理–样本数据趋于无穷大时,样本平均值的分布趋于正态分布(均值相同,方差为n分之一)•统计推断与置信度(HypotheticalTest)地质数据的类型及特点•统计学:定性数据,定量数据•信息系统:数值型,文献型•数量概念完整性程度:名义型,有序型,间隔型,比例型等•数学定量描述:纯量,向量,定和,坐标数据•数据与对象的关系:地址性,归属性,准则性,因素性•地球科学专业:地质、地球化学、地球物理,遥感影像等•应用:原始数据和方法数据地质数据的类型及特点•定性数据–名义型–有序型•定量数据–间隔型–比例型地质数据的类型及特点•地质数据的特征–综合性–混合总体性–方向性–条件性–定和性或定向性常见的统计分布模型•研究目标–考查地质变量的统计分布特征,便于选择恰当的统计特征量。混合性、对称性•研究意义–分布函数具有重要的鉴别和成因分析意义–分布函数可用于选择模型,做必要的估计,便于模拟–作为进一步统计工作的基础•常见的分布模型–正态分布(单变量、多变量)–对数正态分布、三参数对数正态分布–二项分布–泊松分布混合总体分布•混合分布的类型–由多成因总体构成的统计总体的分布即混合总体分布–多峰型混合分布–对称正态混合总体•混合总体的分解–概率格纸法–解析法–投影法–迭代法地质数据的统计特征及应用•均值•方差•变异系数•协方差•相关系数统计参数估计及检验•参数估计–点估计(矩估计\最大似然估计\最小二乘估计)–区间估计•假设检验–u检验–t检验–F检验–χ2检验–偏度峰度检验地质变量的类型•观测变量:可通过预测直接描述或刻划研究对象特征的变量,原始变量•乘积变量:为强化分辨效果通过对观测变量做乘积组合所得的变量•综合变量:综合构造或计算综合•伪变量:为计算需要而设置的特殊变量地质变量的选择与提取•目的:–使变量结构达到最优化–降维–寻找解决特定问题的变量组合•原则:–以地质研究为基础–多方法综合•注意:–多信息、多知识时尽量多选择–尽可能选择代表强的变量–对数学方法所选结果的实际意义做分析地质变量的选择与提取•选择方法:–图解法(点聚图、雷达图)–相关系数法•简单相关系数•偏相关系数•秩相关系数–信息量计算法–秩和检验法–二态变量•特征长度法•相关频数比值法–K-L变换法(因子分析法、主成份分析法))1(61:1.1::21222,12,22,1,2,12,,1,nndrrrrrrSSSrniixxyxxxyxyxxyxyxyx秩相关系数偏相关系数简单相关系数SSjNNjIAjPBAjPIBPAjBPIBAjBAjBAj//lg)()|(lg)()|(lg:信息量pjijBinjijAinpijbLBAABaLAnpaA11*:*::,,,][特征长度乘积矩阵特征长度个矿个特征地质变量的取值及变换•取值:–取样分析、测量等•变换–目的•变正态•变量纲•线性化•降维处理地质变量的取值及变换•变换方法–标准化变换—变换后变量均值为0,方差为1;适用于量纲和数值大小不一的连续型变量–正则化变换--变换后变量最大值为1,最小值为0;适用于量纲和数值大小不一的连续型变量–均匀化变换--变换后变量均值为1;适用比例型的变量–反正弦变换—使原始数据变换到0-90度之间,使负偏分布变为近正态分布,适用于百分比类的变量–反余弦变换—使原始数据变换到0-90度之间,使弱正偏分布变为近正态分布,适用于百分比类的变量–平方根变换—变换使中等正偏分布变为接近正态分布,适用于服从普阿松分布的离散型变量,变换后能使方差相对稳定.–对数变换—变换使对数正态分布(较大正偏)变为接近正态分布,适用于服从普阿松分布的离散型变量,变换后能使方差相对稳定.)ln(::)10/(cos:)10/(sin::::][**1*1**minmaxmin***cxxcxxxxxxxxxxxxxxsxxxxXijijijijnijijnijijjijijjjjijijjjijijpnij对数变换平方根反余弦变换反正弦变换均匀变换极差变换标准化变换地质变量的取值及变换•变换方法–化直变换—使曲线化为直线的变换•双曲线化直•幂函数化直•指数函数化直•对数函数化直•一般非线性函数的处理iibxbxxxfixfxfydeyxbaydeydxyxbayxb))((!1)()(lg100)(0地质统计学--区域化地质变量•变量:随时间及研究对象的空间位置或其它相关因素的变化而变化的特征量,Z(x)。•随机变量:其变化结果带有不确定性或具有一定概率分布的变量。•地质变量:特指描述地质研究对象特征的变量;可以是随机的;也可能是确定性的;也可能是既有随机性又有结构性(确定)的;•区域化变量:描述研究对象的随空间位置变化而变化的特征量;是以空间点x的坐标为自变量的随机场Z(xu,xv,xw)=Z(x)区域化变量—概念•定义:令x=[xuxvxw]T为空间点坐标–以空间点x的坐标为变量的随机场Z(xu,xv,xw)=Z(x)–每次观测得到一个现实z(x),是空间点函数;–如岩石的孔隙度、地层的厚度、金矿的品位、空气污染指数、地下水位水位等–区域化过程•功能:Z(x)是一种特殊的随机函数,又是与空间相关的,因此可反映变量的空间结构性与随机性;可用于描述研究对象的特征变化区域化变量—概念•特性:–空间局限性:在某个限定区域(几何域)内有效–连续性:不同的区域化变量有不同程度的连续性,由变异函数描述;–异向性:区域化变量在不同方向上可能存在不同的变化,各向异性、各向同性–空间相关性:在一定范围内呈现空间相关性,超出范围相关性减弱至消失–变异性的可叠加性:区域化过程的多次叠加使得变异结果也呈现叠加的现象区域化变量—概念•协同区域化及协同区域化变量:•在实际中,一种区域化现象可能需要用多个相关变量描述。如储层,从物性方面可用孔隙度、渗透率、饱和度等来描述。对固体矿床一般不是单一矿种而往往是共生矿,地球化学元素也是相关共生,如铅锌矿床中Pb\Zn;•这种处于同一空间域的区域化变量,既有统计相关又有空间相关,称为协同区域化变量区域化变量性质—平稳假设与内蕴假设•平稳假设:stationaryassumption设一随机函数Z(x),其空间分布规律不因平移而改变,即若对任一向量h,关系式•G(z1,z2,z3…;x1,x2…)=G(z1,z2,z3…;x1+h,x2+h…)•成立,则该随机函数Z为平稳随机函数;对任意h,两个k维随向量•{Z(x1),Z(x2),…,Z(xk)}和{Z(x1+h),Z(x2+h),…,Z(xk+h)}•同分布,(k任意有限整数)要求:Z(x)的各阶矩均存在且平稳区域化变量性质—平稳假设与内蕴假设•二阶平稳假设:在整个研究区内,区域化变量Z(x)的期望存在且为常数:•E[Z(x)]=m在整个研究区内,区域化变量Z(x)的空间协方差存在且平稳:•Cov[Z(x),Z(x+h)]=E[Z(x)Z(x+h)]-m2=C(h)•当h=0时有Var[Z(x)]=C(0)区域化变量性质—平稳假设与内蕴假设•内蕴假设:intrinsicassumption•当区域化变量的协方差函数不存在时,先验方差无限,不满足二阶平稳假设,定义内蕴假设:在整个研究区内,区域化变量Z(x)的增量Z(x)-Z(x+h)的期望为0:•E[Z(x)-Z(x+h)]=0在整个研究区内,区域化变量Z(x)的增量Z(x)-Z(x+h)的方差函数存在且平稳:•Var[Z(x)-Z(x+h)]=E[Z(x)-Z(x+h)]2区域化变量性质—平稳假设与内蕴假设•准平稳假设与准内蕴假设:•当区域化变量只在有限大小的邻域内是二阶平稳的或内蕴的,则称该区域化变量满足准平稳假设或准内蕴假设区域化变量统计特征•自协方差•自相关系数•变异函数•协方差函数内容•一般地质变量–基本概念–地质数据的类型及特点–常见的统计分布模型–地质数据的统计特征及应用–地质数据的参数估计及检验–地质变量的类型–地质变量的选择–地质变量的变换•区域化地质变量–概念–性质