长沙空气质量统计分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1HUNANUNIVERSITY统计学论文论文题目长沙PM2.5情况以及影响因素探究学生易鑫学号201318210224专业班级金融工程1301学院名称金融与统计学院2目录摘要........................................................................................................................................3一、PM2.5定义以及长沙地区PM2.5的计算及评价方法..........................................4二、影响长沙PM2.5的因素简述....................................................................................5三、影响长沙PM2.5的因素相关分析与显著性检验..................................................5(1)五项指标与PM2.5间的相关分析....................................................................6(2)PM2.5与其他五项指标相关性的显著性检验...............................................9(3)PM2.5与其他指标的偏相关系数分析...........................................................10四、结论.............................................................................................................................10参考文献..............................................................................................................................113摘要身边总是有非长沙本地的同学和朋友,特别是来自沿海地区的同学抱怨长沙的空气质量,说长沙这个Pm2.5天天爆表的地方会污染他们的肺。因此本人想用统计学的方法,求证下面两个问题:1、长沙的空气真的就如所说的那样“不堪呼吸”吗?2、影响长沙空气PM2.5指数的又有哪些因素呢?之后形成本篇论文的结论。关键词:长沙PM2.5指数,相关分析,显著性分析,偏相关分析4一、PM2.5定义以及长沙地区PM2.5的计算及评价方法首先我们先来解读一下PM2.5的定义,PM2.5就是指空气中的细颗粒物,又称细粒、细颗粒,主要因为其在环境空气中空气动力学当量直径小于等于2.5微米而得名。它能较长时间悬浮于空气中,其在空气中含量浓度越高,就代表空气污染越严重。虽然PM2.5只是地球大气成分中含量很少的组分,但它对空气质量和能见度等有重要的影响。那么长沙的PM2.5的数据又是如何统计出来的呢?目前来看,长沙PM2.5共有十个点,分别是:经开区、马坡岭、天心区、伍家岭、沙坪、湖师大、高开、火车新站、雨花区、湖南中医院十个监测点,那么,可以发现,10个监测点的地理位置分布,是具有一定代表性的环境。包括情节对照点,即空气质量好,远离污染源的地方,也包括人流量大,靠近闹市区的地方。各监测点分布情况为:芙蓉区2个,开福区及岳麓区2个,高开区、经开区、天心区和雨花区各1个。每个PM2.5自动监测仪器,每个小时可完成一次PM2.5的测量,先把每一个点24小时内PM2.5的浓度相加除以24就得出每个点的日均浓度,然后把这十个点的日均浓度相加除以10,就得出了长沙市区PM2.5的日均浓度,这就是环保局网站上这个PM2.5数值的由来。以近期某日(2015/5/15)为例,长沙十个观测点的数据分别如下由该图可以看出沙坪监测点的PM2.5日均浓度值最高,天心区、火车站次之,而伍家岭的浓度最低。我认为主要的原因有以下几点:首先看到湖师大及雨花区环保局监测点,它们地处大学校园附近,校园内绿地面积大,环境较好,空气质量较好,周围车流量比较少;其次说说火车新站监测点,地处闹市,属居民聚集区,周边的解放东路与朝阳路车流量比较多,同时靠近火车站,客运流量大。且处于工厂密集区,属于市区人口稠密区域和主干道区,空气质量较差;同样,天心区、开福区、芙蓉区处市中心,高楼林立,易导致PM2.5的累积现象。不得不提的是,沙坪区虽远离市区,但由于长沙全年基本盛行南方和东南风,沙坪处于北边,该处风速受主城区中高楼林立的影响,速度较慢,不利于PM2.5的扩散。那么,我们如何根据PM2.5指数评定某一个地方的空气质量呢。实际上,我们对PM2.5指数有做分级评定,分别如下优0~35良35~75轻度污染75~115151.74伍家岭267.30高开区368.59湖南中医药大学471.26雨花区环保局574.22经开区环保局675.93湖南师范大学776.41马坡岭881.52火车新站984.56天心区环保局1090.78沙坪5中度污染115~150重度污染150~250严重污染大于250及以上当然这在统计学上就是一个的定序尺度的分析,能够帮助我们更好地解读数据,同时空气质量指标也会作为一个统计数据计入我的论文。二、影响长沙PM2.5的因素简述首先,我们有必要了解一下有关PM2.5形成原理。在PM2.5形成中有两大主要来源,分别是自然源和人为源,其中,自然源包括土壤扬尘、海盐、植物花粉、孢子、细菌等。自然界中的灾害事件,如火山爆发向大气中排放了大量的火山灰,森林大火或裸露的煤原大火及尘暴事件。人为源指因人类活动而产生的PM2.5,包括固定源和流动源。固定源包括各种燃料燃烧源,如发电、冶金、石油、化学、纺织印染等各种工业过程、供热、烹调过程中燃煤与燃气或燃油排放的烟尘。流动源主要是各类交通工具在运行过程中使用燃料时向大气中排放的尾气。PM2.5可以由硫和氮的氧化物转化而成。而这些气体污染物往往是人类对化石燃料(煤、石油等)和垃圾的燃烧造成的。在发展中国家,煤炭燃烧是家庭取暖和能源供应的主要方式。没有先进废气处理装置的柴油汽车也是颗粒物的来源。燃烧柴油的卡车,排放物中的杂质导致颗粒物较多。长沙从2013年开始施行AQI评价指标,因此我的数据也是从2013年开始,其中包括六个监测数据指标(SO2、NO2、PM10、PM2.5、O3和CO等)。因为PM2.5有一部分就来自于各种硫化物氮化物和不完全燃烧的颗粒,因此我选择能从AQI数据中看得到的NO,SO2,PM10(可吸入颗粒物,比PM2.5大一点),CO,O3。对五组指标分别与PM2.5数据两两进行定量的相关性分析。同时,还应考虑各指标对PM2.5的综合影响,即测算复相关系数,又考虑到在对某一指标与PM2.5的相关性分析时,仍有可能受到其它指标的影响,即指标之间不是相互独立的,因此,需进一步测算偏相关系数。从长沙空气质量指数AQI网站()上,我们能够得到从2013年10月28日到2015年六月的空气质量报告,约580个单日数据,说大不大说小不小,由于数据缺乏,同样统计指数又及其受季节因素影响。在进行一系列的数据试验后,决定采用2014年全年数据进行相关度等的分析。为了让统计分析继续下去,我们还是认为数据均服从正态分布吧。三、影响长沙PM2.5的因素相关分析与显著性检验首先,我们输入2014年全年数据,对单个数据进行分析,由于四季是一个轮回的过程,所以先不考虑季节影响,对各个指标求均值,可以得到如下报告:ReportPM2.5PM10CoNo2So26Mean74.0088.881.10268339.6223.03One-SampleTestTestValue=0tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpperPM2.529.921368.00074.00369.1478.87从2014年全年来看,PM2.5指数均值为74,且通过单样本T得到有95%把握认为均值为74。检验根据以上的评级方法,可以说从均值而言,长沙的空气质量总体而言是良好的,那么我们可以据此我们认为长沙的空气并不是天天都是污浊的,更不是“不堪呼吸”的。(1)五项指标与PM2.5间的相关分析首先假设在分析两指标的相关性时,不会受到其它指标的影响,并绘制散点图,以判断两个变量有无相关趋势,以及趋势呈何种相关,再定量测定其相关系数。那么我们先做有关散点图的工作,将PM2.5作为纵轴指标,各个因素作为横轴指标作直观的数据判断。图1:PM2.5与PM10数据散点图图2:PM2.5与CO数据散点图7可以看出,除O3,PM2.5与PM10、CO、SO2、NO2的散点分布大致呈左下-右上形态,同时,由于各变量值为连续型分布,故采用相关分析法对各组变量进行定量的相关性分析。相关系数说明两个变量线性关系的密切程度和相关方向,以符号r表示样本的相关系数,运用数理统计教给我们的理论,计算方法为:r=∑(𝑥−𝑥̅)(𝑦−𝑦̅)√∑(𝑥−𝑥̅)√∑(𝑦−𝑦̅),记为𝑙𝑥𝑦√𝑙𝑥𝑥𝑙𝑦𝑦对此相关系数的统计检验使用t统计量:t=𝑟√𝑛−2√1−𝑟2。其计算方法可理解为两组向量夹角的余弦值。设X=(𝑥1,𝑥2,𝑥3,…,𝑥𝑛)𝑇,Y=(𝑦1,𝑦2,𝑦3,…,𝑦𝑛)𝑇从几何上粗略地讲,将两个向量平移至相同起点,则向量间的夹角大小可图3:PM2.5与SO2数据散点图图4:PM2.5与O3数据散点图图5:PM2.5与NO2数据散点图8以反映两者的相关性,具体而言,可用两向量夹角的正弦进行衡量,即有:ρxy=x,y|x||y|=∑xiyini=1√∑xi2ni=1√∑yi2nj=1。相关系数r没有单位,其值为-1=r=1,r为正表示正相关,r为负表示负相关。其定义相关程度等级如下:相关系数的值相关程度等级|r|=0完全不相关0|r|0.3微弱相关0.3=|r|0.5低度相关0.5=|r|0.8显著相关0.8=|r|1高度相关|r|=1完全相关将2014全年的数据进行彼此相关度检测,结果如下:CorrelationsPM2.5PM10SO2NO2O3COPM2.5PearsonCorrelation1.642**.575**.534**.006.706**Sig.(2-tailed).000.000.000.916.000N365365365365365365PM10PearsonCorrelation.642**1.558**.542**.284**.348**Sig.(2-tailed).000.000.000.000.000N365365365365365365SO2PearsonCorrelation.575**.558**1.845**-.147**.549**Sig.(2-tailed).000.000.000.005.000N365365365365365365NO2PearsonCorrelation.534**.542**.845**1-.275**.563**Sig.(2-tailed).000.000.000.000.000N365365365365365365O3PearsonCorrelation.006.284**-.147**-.275**1-.335**Sig.(2-tailed).916.000.005.000.000N365365365365365365COPearsonCorrelation.7

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功