露天煤矿排土场地下水环境监测点优化肖晗,刘志斌辽宁工程技术大学环境工程教研室,辽宁阜新(123000)E-mail:xiaohan0318@yahoo.com.cn摘要:为了长期监测地下水受污染情况,了解其变化规律,在满足地下水监测需要的基础上,应尽可能地节省费用。这就需要选取具有代表性的水井作为监测点,拟采用对应分析法研究监测点和监测项目内在俩逆向和他们之间的因果关系,以实现监测点的优化。本文通过大量真实可靠的数据对阜新市新邱露天矿地下水的17个监测点分为四类,选取有代表性的5个监测点进行监测,大量节省人力物力,完成监测点的优化。关键词:地下水;监测点优化;对应分析中图分类号:X51地下水污染区的监测点优化1.1监测点优化概述地下水水质监测点的布设是一个复杂的过程,它不仅要考虑排放污染物的主要流经途径的下游方向、可能影响到的范围及其敏感地区等,还要恰好深入地下污染层面。因此,为了长期监测地下水受污染情况、了解其变化规律,在满足地下水质监测需要的基础上,应尽可能地节省费用,这就需要选取具有代表性的水井作为监测点,同时去掉一些次要监测点,实现监测过程优化。目前常用的优化方法有聚类分析法[1]、主成分分析法[2]、对应分析法等[3]。阜新新邱露天煤矿排土场淋溶水对附近地区地下水造成了严重污染,为了确定污染区范围,对附近区域17眼水井采样并进行了水质分析。为了研究监测点和监测项目的内在联系和它们之间的因果关系,运用对应分析法对它们内在联系和分布特征进行了分析,以实现地下水环境质量监测点的优化。1.2对应分析法的基本原理及步骤对应分析(Correspondenceanalysis)也称关联分析、R-Q型因子分析,是近年新发展起来的一种多元相依变量统计分析技术,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。主要应用在市场细分、产品定位、地质研究以及计算机工程等领域中。原因在于,它是一种视觉化的数据分析方法,它能够将几组看不出任何联系的数据,通过视觉上可以接受的定位图展现出来。对应分析是由法国人Benzenci于1970年提出的,起初在法国和日本最为流行,然后引入到美国。对应分析法是在R型和Q型因子分析的基础上发展起来的一种多元统计分析方法,因此对应分析又称为R-Q型因子分析。在因子分析中,如果研究的对象是样品,则需采用Q型因子分析;如果研究的对象是变量,则需采用R型因子分析。但是,这两种分析方法往往是相互对立的,必须分别对样品和变量进行处理。因此,因子分析对于分析样品的属性和样品之间的内在联系,就比较困难,因为样品的属性是变值,而样品却是固定的。于是就产生了对应分析法。对应分析就克服了上述缺点,它综合了R型和Q型因子分析的优点,并将它们统一起来使得由R型的分析结果很容易得到Q型的分析结果,这就克服了Q型分析计算量大的困难;更重要的是可以把变量和样品的载荷反映在相同的公因子轴上,这样就把变量和样品联系起来便于解释和推断。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。它最大特点是能把众多的样品和众多的变量同时作到同一张图解上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性。另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分类,而且能够指示分类的主要参数(主因子)以及分类的依据,是一种直观、简单、方便的多元统计方法。对应分析法整个处理过程由两部分组成:表格和关联图。对应分析法中的表格是一个二维的表格,由行和列组成。每一行代表事物的一个属性,依次排开。列则代表不同的事物本身,它由样本集合构成,排列顺序并没有特别的要求。在关联图上,各个样本都浓缩为一个点集合,而样本的属性变量在图上同样也是以点集合的形式显示出来。其基本步骤如下[4,5,6]。1.2.1建立监测数据矩阵设有n个监测点(样本),每个监测点监测m个污染物(变量),则原始监测数据矩阵为X如下所示,其中ijx(i=1,2,…,n;j=1,2,…,m)为第i个采样点第j个污染物浓度。X=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nmnnmmxxxxxxxxxLMOMMLL2122221112111.2.2对原始数据做标准化处理X按行求和:∑=•=mjijixx1i=1,2,…,n(1-1)X按列求和:∑=•=niijjxx1j=1,2,…,m(1-2)总和:∑∑===nimjijxT11(1-3)1.2.3对原始数据作对应变换jijiijijxxTxxxz••••−=i=1,2,…,n;j=1,2,…,m(1-4)其中,ijx为数据阵X中的元素,ijZ为新数据阵中的元素。1.2.4矩阵Z的协方差阵RnmijTrZZR×==)((1-5)其中,∑==nkkjkiijzzr1i,j=1,2,…,m1.2.5R-型因子载荷阵A和Q-型因子载荷阵B首先求协方差阵的特征值iλ,并由大到小排列,即021≥≥⋅⋅⋅≥≥mλλλ,以及与其对应的特征向量ie(i=1,2,…,m);然后确定临界概率临p(一般取0.85~0.90),由临界概率确定主因子个数k,使其累积贡献率≥α临p,既:∑∑==mjikii11λλ≥临p(1-6)则R-型因子载荷阵A为:A=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡kmkmmkkkkeeeeeeeeeλλλλλλλλλLMOMMLL221122221211212111其中,ije(i=1,2,…,m,j=1,2,…,k)为主因子相应的特征向量。由于R-型和Q-型的非零特征值相同,上面所求出的特征值也是Q的特征值,Q的特征向量ijv(i=1,2,…,n,j=1,2,…,k)为矩阵B=TZZ的特征向量,从而到得Q-型因子载荷阵B:B=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡knknnkkkkvvvvvvvvvλλλλλλλλλLMOMMLL2211222212112121111.2.6点图分类R型的最大和次大的两个特征值1λ和2λ及其相应的特征向量为1e和2e,而Q型的最大和次大的两个特征值也是1λ和2λ,其相应的特征向量1v和2v,在Rm空间以11λe,22λe分别记为F1和F2,在Rn空间以11λv,22λv分别记为G1和G2。于是,每一个污染物(变量)和监测点(样本)分别在因子平面F1-F2和G1-G2上对应于一点。使两个因子平面的两条直角坐标轴重合,这样,样本和变量点标在同一个因子平面上,并将邻近的样本点(监测点)和变量点(污染物)归为一类,从而可以进行优选样本点和变量点并对其进行解释和推断。研究区各监测点位地下水水质分析结果(mg/L)Tab.1-1Researchareavarioustestpointspositiongroundwateranalysisresult测点总硬度SO42-Cl-溶解性总固体高锰酸盐指数NO3--NNa+1#193.554.641.64200.9016.2014.002#157.562.415.63201.086.4015.003#193.580.636.46501.179.6017.004#139.563.262.46700.7519.8027.005#306.0109.280.66501.0527.4016.006#501.0261.338.78290.8723.5626.197#744.0208.8177.515510.9333.1239.348#1100.0549.6226.921111.4830.9557.519#929.0408.7109.018871.0328.4085.3610#789.0423.456.710681.3418.8558.2711#1520.0710.0292.030361.3437.3940.7812#859.0317.4195.218891.2534.9026.8013#649.0223.2157.214021.5630.3855.3014#1478.0435.2608.724901.5342.86103.5815#647.0364.235.59841.306.6636.2516#623.0291.1137.813481.0627.9055.1117#608.0383.517.59271.187.3031.35根据新邱露天矿排土场地下水各监测点统计资料见上表,将上表中的监测点和监测项目按公式(1-1)~(1-4)进行计算。变换后德新数据矩阵Z:⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−=0015.00015.00013.00178.00423.00483.00148.00102.00042.00005.00046.00011.00003.00099.00012.00114.00016.00167.00356.00375.00059.00089.00045.00028.00223.00953.00341.00096.00217.00063.00017.00093.00083.00207.00068.00189.00027.00012.00152.00051.00182.00074.00270.00110.00039.00048.00042.00088.00017.00136.00043.00009.00286.00318.00402.00251.00177.00039.00023.00072.00281.00007.00015.00064.00063.00016.00048.00016.00155.00014.00049.00065.00016.00120.00109.00313.00010.00018.00091.00004.00098.00270.00220.00100.00043.00232.00032.00040.00096.00127.00048.00126.00166.00021.00321.00059.00238.00381.00005.00003.00050.00272.00116.00161.00224.00083.00018.00075.00040.00138.00033.00001.00218.00167.00045.00069.00010.00170.00028.0Z应用公式(1-4)~(1-6)算得的特征值及其贡献率如表1-2所示。由表1-2可知,特征值1λ、,故主因子个数k=2。解得的载荷因子矩阵A、B如下。表1-2特征根及其贡献率Tab.1-2Characteristicrootandtechnicalprogressfactor污染因子特征根贡献率累积贡献率10.02290.5980.59820.00960.2510.84930.00320.0840.93340.00150.0390.97250.00080.0210.991660.00020.0050.996870.00010.0031以第一主因子F1(G1)的载荷为横坐标,以第二主因子F2(G2)载荷为纵坐标,将17个监测点(样本)和7个污染物(指标)标定在同一个直角坐标系上,如图1-1所示。经综合分析可知,污染物(变量)和监测点(样本)可以分为四类:第Ⅰ类包括1、3、5、6、7、8、9、11、12、13、16号监测点和5、6、7号污染物(高锰酸盐指数、NO3--N、Na+),第Ⅱ类包括10、15、17号监测点和1、2号污染物(总硬度、SO42-),第Ⅲ类