云南财经大学实验报告系(院):统计与数学学院专业:经济学创新人才培养基地班级:经基14-1学号:201405000154姓名:罗振威实验时间:2016年5月指导教师:陈龙伟云南财经大学教务处制城市表层土壤重金属污染分析摘要本文主要是由采样数据对该城市八种重金属元素污染的程度进行分析。首先我们对采样数据进行预处理,用EXCEL对数据进行处理,然后用MATLAB等软件对所给的数值进行空间作图。针对问题一我们对八种重金属含量分成若干段段分别来表示不同的浓度,再利用Matlab软件根据取样点的坐标,做出各种重金属元素的空间分布图,并用不同的颜色表示重金属元素的浓度各功能区污染程度针对问题二,对各功能区的污染物含量进行分析,分析推测该城市可能存在规模较大或者数量较多的Hg,Cu,Zn,Pb严重超标的工厂。为进一步揭示表层土壤重金属污染来源,我们对三个污染相对严重的功能区的超标较严重的重金属元素Hg,Cu,Zn,Pb进行相关性分析,运用MATLAB软件计算出各相关系数,揭示出不同功能区内土壤表层重金属污染的不同来源,分析可得,交通区污染主要来源于汽车尾气排排放,工业区污染主要来源于工厂的超标排放。第三问为找出传播特征和确定污染源,我们主要是利用MATLAB软件做出8种污染物各自在该城区的矢量图,然后通过直观的观察和线性的拟合来判断污染物的传播特征和污染源的大体位置。最后说明该模型的缺点以及需要改进的地方。关键词:MATLAB软件;主成分分析法;内梅罗综合污染指数;矢量图;一、问题重述随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。按照功能划分,城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,分别记为1类区、2类区、……、5类区,不同的区域环境受人类活动影响的程度不同。现对某城市城区土壤地质环境进行调查。为此,将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(0~10厘米深度)进行取样、编号,并用GPS记录采样点的位置。应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。另一方面,按照2公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。附件1列出了采样点的位置、海拔高度及其所属功能区等信息,附件2列出了8种主要重金属元素在采样点处的浓度,附件3列出了8种主要重金属元素的背景值。现要求你们通过数学建模来完成以下任务:(1)给出8种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。(2)通过数据分析,说明重金属污染的主要原因。(3)分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。(4)分析你所建立模型的优缺点,为更好地研究城市地质环境的演变模式,还应收集什么信息?有了这些信息,如何建立模型解决问题?二、问题分析随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。对于重金属在环境中的影响更为明显,因此研究城市表层土壤重金属污染是迫在眉下的事。(一)对问题1的分析:对于问题1,经过对数据和题目的分析,直接使用MATLAB使用二次插值法可以画出8种主要重金属元素在该城区的空间分布图。对于第二小问,我们首先根据所给的数据将已区分好的各个区域归在一起,求出各种重金属元素在该区域的平均值,建立综合污染指数评价法模型;分析各种重金属元素在各个区域的污染指数来分析该城区内不同区域重金属的污染程度。(二)对问题2的分析:问题2要求通过数据分析来说明重金属污染的主要原因。首先可以对重金属和海拔进行相关性分析,得出相关矩阵和相关度,再结合问题一求出的结论分析出重金属可能的主要来源和重金属污染的主要原因。(三)对问题3的分析:问题3要求通过分析重金属污染物的传播特征,找出污染源的位置。首先通过对数据的处理得到污染源的可能位置,然后经过建立模型,应用MATLAB进行拟合,从而更好的找到污染源的位置,得到比较满意的结果(四)对问题四的分析:首先对我们建立的模型进行优缺点分析,然后通过查询资料了解影响城市地质环境演变的其他一些因素,从而选择模型解决问题。三、问题假设1、假设题目中所给数据可靠无误;2、假设问题一中各区平均的污染程度可以看作该区的污染程度;3、假设问题二中只考虑题目中所给的8中重金属,不考虑其它重金属;4、假设重金属传播特征不受风向等因素影响;5、短期内重金属元素的物理、化学变化及迁移对周围环境影响不大;6、不考虑元素间的相互作用的影响;7、不考虑采集填埋土和堆积时间不长的新成土,采集城市老成土。四、符号说明符号含义说明X横轴长度(m)Y纵轴长度(m)Z高度(m)*生活区^工业区o山区s交通区+公园绿地区注:在此没有设定的符号在下文中会具体说明。五、模型的建立与求解5.1问题一的求解5.1.1用MATLAB软件对所给数据进行插值拟合得出调查区的地形图和8种主要重金属元素在该城区的空间分布图1-1,再用MATLAB软件对所给数据进行分析得出功能区散点图1-2:图1-1:城区地形图图1-2功能区分布图图1-3As在该城区的空间分布图图1-4Cd在该城区的空间分布图图1-5Cr在该城区的空间分布图图1-6Cu在该城区的空间分布图图1-7Hg在该城区的空间分布图图1-8Ni在该城区的空间分布图图1-9Pb在该城区的空间分布图图1-10Zn在该城区的空间分布图说明:图1-1的Z轴为海拔高度,X、Y轴为地理坐标值(单位:m)。图1-2的X、Y轴为地理坐标值(单位:m)。图1-3到图1-10的Z轴为重金属元素的浓度(单位:μg/g),X、Y轴为地理坐标值(单位:m)。5.1.2模型建立土壤环境质量单项污染指数主要用来评价某一污染物的污染程度,指数小污染轻,指数大污染则重。但区域内土壤环境质量作为一个整体和外区域进行比较时除用单项污染指数外,还常用综合污染指数。综合污染指数可以综合判断某土壤多种污染物的联合污染效应。目前土壤环境质量评价方法有很多,各有优点和缺点。本文根据我国《土壤监测技术规范》(HJ/T166-2004)中推荐的内梅罗综合污染指数法进行评价。在计算某个区域某种重金属单项污染指数分指数的基础上,再计算该区域多种重金属的综合污染指数。单项污染指数和综合污染指数的计算公式如下:𝑃𝑖𝑗=𝐶𝑗𝑆𝑗(1)𝑃𝑁=√(𝑃𝑗,𝑎𝑣𝑒2+𝑃𝑗,𝑚𝑎𝑥2)/2(2)当𝑃𝑖,𝑗≤1时表示土壤未受该因子污染,当𝑃𝑖,𝑗1时,表示土壤受该因子污染。内梅罗综合污染指数反映了各污染物对土壤的作用,同时突出了高浓度污染物对土壤环境质量的影响。根据HJ/T166-2004,内梅罗综合污染指数的分级标准(见表1-1),及以背景值作为评价标准(见表1-2),得出各个区域的污染等级。表1-1内梅罗综合污染指数的分级标准等级内梅罗污染指数污染等级1𝑃𝑁≤0.7清洁(安全)20.7𝑃𝑁≤1.0尚清洁(警戒线)31.0𝑃𝑁≤2.0轻度污染42.0𝑃𝑁≤3.0中度污染5𝑃𝑁3.0重污染表1-28种主要金属元素的背景值元素平均值标准差范围As(μg/g)3.60.91.8~5.4Cd(ng/g)1303070~190Cr(μg/g)31913~49Cu(μg/g)13.23.66.0~20.4Hg(ng/g)35819~51Ni(μg/g)12.33.84.7~19.9Pb(μg/g)31619~43Zn(μg/g)691441~975.1.3模型求解本文以背景值作为评价标准进行求解,EXCEL对文中所给数据进行分类,把数据分入1类区、2类区、3类区、4类区、5类区。然后得出各个区里面主要重金属含量的平均值,用EXCEL做出了各区域各重金属平均值的二维折线图,可看作各区中主要重金属含量值。如下表:表1-3各区重金属含量的平均值区域As(μg/g)Cd(ng/g)Cr(μg/g)Cu(μg/g)Hg(ng/g)Ni(μg/g)Pb(μg/g)Zn(μg/g)16.27289.9669.0249.493.0418.3469.11237.0127.25393.1153.41127.54642.3619.8193.04277.9334.04152.3238.9617.3240.9615.4536.5673.2945.71360.0158.0562.21446.8217.6263.53242.8556.26280.5443.6430.19114.9915.2960.71154.24然后根据公式(1)、(2)结合MATLAB软件算得各区重金属单项污染指数和综合污染指数,如下表:表1-4各区重金属单项污染指数和综合污染指数区域单项污染指数综合污染指数AsCdCrCuHgNiPbZn11.74172.23052.22653.74242.65831.49112.22943.43493.170422.01393.02391.72299.662118.35311.61063.00134.02813.533131.12221.17171.25681.31211.17031.25611.17941.06221.253241.58612.76931.87264.712912.76631.43252.04943.51969.426451.73892.1581.40772.28713.28541.24311.95842.23542.7343再由内梅罗综合污染指数的分级标准得出各区的综合污染等级,如下表:表1-5各区综合污染等级区域污染等级生活区5重污染工业区5重污染山区3轻度污染交通区5重污染公园绿地区4中度污染从表中可以看出,该城区内生活区、工业区、主干道路区属于重污染区,公园绿地区属于中等污染区,山区属于轻度污染区。5.2问题二的求解5.2.1模型的建立采用主成分分析法对重金属污染的原因进行分析:利用已给定的数据,使用主成分分析法分析每类区域中不同化学元素对该地区的主要影响和次要影响,并对八种元素在该地区土壤的污染程度的影响进行排序。假设进行主成分分析的指标变量有𝓂个,将各指标值𝑎𝑖𝑗转换成标准化指标𝑎𝑖𝑗̅̅̅̅。其中:𝑎𝑖𝑗̅̅̅̅=𝑎𝑖𝑗−𝜇𝑖𝑗𝑠𝑗(𝑖=1,2…,𝑛;𝑗=1,2…,𝑚)相应的,称𝑥𝑖̅=𝑥𝑖−𝜇𝑖𝑠𝑖为标准化指标变量。相关系数矩阵:𝑅1=(𝑟𝑖𝑗)𝑚×𝑛,组成的元素为:𝑟𝑖𝑗=∑𝑎𝑘𝑖∙̃𝑎𝑘𝑗̃𝑛𝑘=1𝑛−1式中𝑟𝑖𝑖=1,𝑟𝑖𝑗=𝑟𝑗𝑖,𝑟𝑖𝑗是第𝒾个指标与第𝒿个指标的相关系数。下面计算相关系数矩阵ℛ的特征值𝜆1≥𝜆2≥⋯≥𝜆𝑚≥0,以及对应的特征向量𝜇1,𝜇2,…,𝜇𝑚,其中,𝜇𝑗=(𝜇1𝑗,𝜇2𝑗,…𝜇𝑚𝑗)𝑇,由特征向量组成𝓂个新的指标向量:{𝑦1=𝜇11𝑥1̃+𝜇21𝑥2̃+⋯+𝜇𝑚1𝑥𝑚̃𝑦2=𝜇12𝑥1̃+𝜇22𝑥2̃+⋯+𝜇𝑚2𝑥𝑚̃…………𝑦𝑚=𝜇1𝑚𝑥1̃+𝜇2𝑚𝑥2̃+⋯+𝜇𝑚𝑚𝑥𝑚̃式中𝑦1是第1主成分,𝑦2是第2主成分,…,𝑦𝑚是第𝓂主成分。下面计算特征值𝜆𝑗(𝑗=1,2…,𝑚)的信息贡献率和累积贡献率。主成分𝑦𝑗的信息贡献率为:𝑏𝑗=𝜆𝑗∑𝜆𝑘𝑚𝑘=1𝑗=(1,2,…𝑚)主成分𝑦1,𝑦2,…𝑦𝑝的累积贡献率为:𝛼𝑝=∑𝜆𝑘𝑝𝑘=1∑𝜆𝑘𝑚𝑘=1当𝛼𝑝接近于1时,则选择前𝓅个指标量𝑦1,𝑦2,…𝑦𝑝作为𝓅个主成分,代替原来𝓂个指标变量,从而可对𝓅个主成分进行综合分析。下面计算综合得分:综合得分:Z=∑𝑏𝑗𝑦𝑗𝑝𝑗=1其中𝑏𝑗