基于传播特征的土壤重金属污染分析摘要本文通过对城市土壤地质环境考察数据的分析成功解决了当地土壤重金属的污染程度,污染原因以及污染来源等一系列问题。对于问题一,本文采用griddata二维插值的方法,用MATLAB将附件1中取样点的x,y,z值和附件2中取样点重金属元素的浓度结合起来绘制出重金属元素的二维分布图,再加入采样点处海拔形成的等高线最终得到各元素在该城区的空间分布,详见图1到图8;对于不同区域重金属污染程度的分析,首先用临近点插值的方法绘制出该城区的空间分布图,然后通过单因子指数法分别对各城区的各个元素进行污染程度的分析,最后采用内梅罗指数法将8种元素综合分析,得出结论:工业区,交通区和生活区重度污染,公园绿地区中度污染,山区轻度污染。其中污染程度:工业区交通区生活区。对于问题二,首先标准化处理数据,采用变异系数检验和Kolmogorov-Smimov正态检验,确定该地区受到人为影响。然后使用matlab计算相关系数矩阵,寻找元素关联度。查阅相关资料,了解元素理化性质确定污染原因后得出结论:影响该城区的环境质量,造成重金属污染的主要区域是生活区,工业区和交通区。主要原因有三点:一是城市居民生活垃圾的乱丢乱放,二是重金属的开采、冶炼和加工以及各种工业活动废气废水的排放,三是汽车尾气的排放,汽车燃料的燃烧以及车轮胎与地面造成的磨损。对于问题三,首先建立距离矩阵,分析传播特征及数据特点。根据一般扩散规律,污染程度随距离衰减。把每点当作污染源在扩散范围内以500m为步长记录各元素最高污染指数,将满足规律的点作为疑似污染源。运用主成分分析法进行分类,被同一类别多元素标定的确定为主要污染源。模型求解为整体8种元素分为两类,一类是Cr、Cu、Cd、Zn、Pb、Ni,另一类是Hg和As,第一类主要污染源在(3299,6018),(3573,6213)附近,疑似污染源坐标分别为(8079,0),(6395,10443),(12644,14943),(9095,16414);第二类主要污染源在(4742,7293),(4948,7293)附近,疑似污染源为(6869,7286)(9095,16414)。关键词:griddata二维插值单因子指数法Kolmogorov-Smimov正态检验相关性主成分分析穷举法一、问题重述随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。对城市土壤地质环境异常的查证,以及。如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。按照功能划分,城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,分别记为1类区、2类区、……、5类区,不同的区域环境受人类活动影响的程度不同。现对某城市城区土壤地质环境进行调查。为此,将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(0~10厘米深度)进行取样、编号,并用GPS记录采样点的位置。应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。另一方面,按照2公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。本文根据测得的数据,对城市表层土壤的重金属污染进行分析,并通过建立数学模型研究如下四个问题:(1)给出8种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。(2)通过数据分析,说明重金属污染的主要原因。(3)分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。(4)分析你所建立模型的优缺点,为更好地研究城市地质环境的演变模式,还应收集什么信息?有了这些信息,如何建立模型解决问题?二、问题分析2.1问题一分析题目要求给出8种重金属元素在城区的空间分布并分析不同区域的污染程度。由于取样点位置是离散的点,因此我们采用插值的方法,用MATLAB还原出重金属元素的空间分布,然后用单因子指数法对不同元素进行分析并引入了可兼顾极值突出最大值的多因子环境指数内梅罗指数进行综合考评。2.2问题二分析已知数据是各个样本点位置的重金属的含量,要想得出重金属污染的主要原因,首先要通过数据说明该地遭到污染。其次需要对各元素进行集中分析,发现数据之间的关联性或相关性,从而发掘出重金属元素同时出现的规律和模式。因此,我们对各元素的含量进行关联度分析,得出它们之间的相关系数矩阵,再根据各元素之间关联度的大小通过查阅资料分析得出该城区重金属污染的原因。2.3问题三分析题目要求我们通过重金属的传播特征来建立模型,我们用MATLAB穷举的方法把样本中每一个位置带入,根据污染传播特征搜寻与其相距一定范围的样本点,分析其是否符合应满足的扩散特征。为了更好的确定污染源,我们要分析各个元素变化趋同的元素,并通过主成分分析法把8种污染元素分成两类。之后得到两类元素各自的污染源位置。2.4问题四分析问题四我们将在本论文第六部分中进行讨论。三、模型假设1、假设该城市属于内陆城市,不考虑地表径流对重金属传播的影响2、假设该城市土壤为中性,不考虑酸碱性土壤重金属传播的影响3、不考虑重金属的降解4、假设该地区土壤各向同性5、假设不同元素的扩散范围相同四、定义与符号说明𝒑𝒊土壤中污染物的环境质量指数𝒄𝒊污染元素i的实测污染值𝒄𝒐污染元素的评价标准𝒛𝒊𝒋标准化之后的变量𝒙𝒊𝒋标准化之前的变量𝒙𝒊各变量的平均值𝒔𝒊各变量的标准偏差𝐫两元素之间的相关系数𝒅𝒊𝒋第i号样本与第j号样本的距离五、模型建立与求解5.1问题一的模型建立与求解5.1.1模型的建立分析附件1中取样点坐标值,所在功能区域编号及附件2中取样点重金属元素的浓度,用MATLAB绘制出元素的二维分布图,后用griddata算法引入取样点的海拔高度最终形成各重金属元素的空间分布图。绘制完图后我们发现用该插值方法得出的结果误差很大。因此将在第六部分考虑利用克里金插值法进行优化。地域海拔高度用白色等高线表示,等高线越密集,坡度越大,图中颜色深浅代表元素浓度的高低,黄色表明浓度越高,蓝色表明浓度越低,分布图如下:图1元素As空间分布图图2元素Cd空间分布图图3元素Cr空间分布图图4元素Cu空间分布图图5元素Hg空间分布图图6元素Ni空间分布图图7元素Pb空间分布图图8元素Zn空间分布图由附件1中取样点坐标与功能区的对应根据临近点插值方法用MATLAB绘制的城市功能区分布图如下:图9功能区分布图五类功能区分别用五种不同的颜色表示。由上图可以看出,山区主要分布于城区的东部,工业区主要分布于城区的西部,交通区主要在城区的中部,绿地区和生活区分布则比较零散。5.1.2模型的求解在土壤环境质量评价中,根据评价的目的、对象、区域环境条件、污染源和污染状况确定评价项目,选择的参数过少或者过多,都不能反映土壤的综合污染特性。在该问题的背景下我们以附录三中提供的背景值为依据来评价环境质量。常用的评价方法有单因子指数法和内梅罗指数法。[1]模型一:我们采用单因子污染指数法对每种元素在各区域的污染程度进行分析。单因子指数法的一般模式为:𝑝𝑖=𝑐𝑖𝑐0式中,𝑝𝑖指样本土壤中污染元素的污染指数,𝑐𝑖指样本土壤中污染元素的实测污染值,𝑐0指样本土壤中污染元素的标准限值。取本题附件三中背景值中的元素均值,通过MATLAB编程计算单因子污染指数得如下表:生活区工业区山区交通区公园绿地区总As1.741792932.014274691.123358591.585567631.739920638.20491447Cd2.230472033.023931621.171689982.769342252.1580219811.3534579Cr2.226400291.722876341.256764421.872706871.40761298.48636083Cu3.742665299.661805561.31191464.713252092.2872510821.7168886Hg2.6583051918.35300791.1701731612.76635823.2854775538.233322Ni1.491241691.610704611.256405521.432284671.24306627.03370268Pb2.229237543.00131721.179222872.049490421.9583410110.417609Zn3.434907774.027934781.06223543.519635582.2353954514.280109总19.755022743.41585279.5317645330.708637716.3150868119.726365表1-1由上表数据分析可知,横向来看,Hg的污染程度最高,主要分布于工业区和交通区;Cu污染程度其次,大多分布在工业区;其次是Zn,分布在工业区,生活区和交通区;Cd,Pb,As和Cr,Ni的污染程度差不多,分布也比较均匀。纵向来看,工业区的重金属含量最多,其次是交通区,生活区和公园绿地区居中,山区中重金属的含量最少。再根据单因子污染指数标准对照表:单因子指数法认为,有一项污染物超标即认为该土壤样品超标。由此对照表与表1-1得出各区污染水平。其中生活区中度污染,工业区重度污染,山区轻微污染,交通区重度污染,绿地区重度污染。得出的污染水平,符合我们日常生活中的常识,因此我们认为该污染物评价模型比较有效。模型二:为了综合考虑所有污染项目,兼顾污染最严重的因子,我们采用内梅罗综合污染指数法评价,其一般模式为:√(𝑐𝑖𝑐0⁄)𝑚𝑎𝑥+(𝑐𝑖𝑐0⁄)𝑎𝑣2式中,(𝑐𝑖𝑐0⁄)𝑚𝑎𝑥为样本土壤污染物中污染指数最大值,(𝑐𝑖𝑐0⁄)𝑎𝑣为样本土壤污染物中污染指数平均值,其他步骤同模型一相同。我们用MATLAB计算出了该城区的内梅罗污染指数如下表:表1-2可以得出两点:1、工业区和交通区受金属污染程度最严重2、山区是五个功能区中环境质量最好的区域内梅罗指数生活区3.17059698工业区13.5330157山区1.25314046交通区9.42641489公园绿地区2.73436075再根据内梅罗污染指数标准对照表:综合得出:生活区属于重度污染,工业区属于重度污染,山区属于轻度污染,交通区属于重度污染,公园绿地区属于中度污染。5.2问题二的模型建立与求解5.2.1数据预处理在进行关联度分析和运用Kolmogorov-Smimov检验正态分布时,由于附件2中给出的不同重金属浓度的单位不同(𝜇𝑔𝑔⁄和𝑛𝑔𝑔⁄),如果直接用原始数据进行分析,结果会因为数据之间的量纲不同而失去可比性,因此,我们要对初始数据进行标准化处理。因此在对附件2中的数据进行标准化时可以对变量的标准差标准化:𝑧𝑖𝑗=(𝑥𝑖𝑗−𝑎𝑖)𝑠𝑖⁄其中,𝑧𝑖𝑗为标准化之后的变量𝑥𝑖𝑗为标准化之前的变量𝑎𝑖为各变量的平均值𝑠𝑖为各变量的标准差经过标准差标准化之后,数据都变成没有单位的纯数量,各变量将有约一半观察值数值小于0,另一半观察值数值大于0,变量的平均值为0,标准差为1。从而消除了量纲影响和变量之间变异的影响。5.2.2模型的建立与求解由附件3元素背景值中元素的平均值,标准偏差和范围各数据之间的关系,我们发现,在背景状态下每种污染元素的分布服从正态分布N(𝜇,𝜎2)。其中μ为各元素均值,σ为元素标准差,而后面的范围正好为μ±2σ,根据3σ原则,有95%以上的元素落在该区域内,由此启发我们通过比较附件二中的样本数据与附件三中数据的变异系数,以及通过分析附件二中数据是否符合背景状态下的正态分布来确定该地区是否收到人为影响,导致元素分布不符合背景。模型一:计算变异系数和Kolmogorov-Smimov正态检验,由此确定该地区各元素的变异系数很大超过100%,也不符合正态分布。变异系数计算公式为:𝑠𝑖𝑎𝑖×100%𝑎𝑖