水资源短缺的综合分析和预测吴清柏钱咪咪庞新摘要水是人类社会发展的支柱没有水.随着社会的不断发展,人们对水资源的需求量不断增长,因此水资源紧缺程度不断增大,现如今已成为影响社会发展的主要制约因素之一.所以对水资源的分析与预测已经成为不可避免的热门话题.本文从以北京市为例,分析各个行业对水资源短缺的影响趋势,建立数学模型具体分析与判断.对于问题一采用灰色关联分析判断影响水资源短缺的主要影响因素,再用熵权值的方法来来确定权重系数验证.得到各个有效数值进行比较,然后判断在众多因素中的重要因素.对于问题二采用模糊概率理论进行分析,对水资源短缺风险发生的概率和缺水影响程度进行综合分析.构造隶属函数,利用logistic回归模型模拟.而后建立水资源短缺风险模型.对于问题三采用多元线性模型,最小二乘的方法得到未来几年内北京水资源情况的相关数据进行判断与预测并提出相应的措施.关键词:熵值法SPSS软件模糊概率法多元线性回归最小二乘一、问题重述水资源,是指可供人类直接利用,能够不断更新的天然水体。主要包括陆地上的地表水和地下水。近年来,我国、特别是北方地区水资源短缺问题日趋严重,水资源成为焦点话题。以北京市为例,北京是世界上水资源严重缺乏的大都市之一,其人均水资源占有量不足300m3,为全国人均的1/8,世界人均的1/30,属重度缺水地区,附表中所列的数据给出了1979年至2000年北京市水资源短缺的状况。政府采取了一系列措施积极解决水资源短缺问题,如南水北调工程建设,建立污水处理厂,产业结构调整等。但是,气候变化和经济社会的不断发展,水资源短缺始终存在。北京各年的《统计年鉴》及市政统计资料提供了北京市水资源的相关信息(网上可获得)。利用这些资料和你自己可获得的其他资料,建立数学模型讨论以下问题:1、影响北京市水资源短缺的主要因素有哪些?2、对北京市水资源短缺的影响因素进行综合分析。3、对北京市未来几年的水资源短缺进行预测,并提出应对措施。二、问题分析问题一:为了寻找到影响北京水资源严重短缺的主要影响因素。在收集整理好各类数据后,我们可以通过求解其关联度来进一步确定影响事物的本质因素,使各种影响因素之间的“灰色”关系量化,同时我们规定缺水量=总用水量-水资源总量。问题二:水资源系统复杂,含有随机性和模糊性.采用logistic回归模型模拟和预测水资源短缺风险的概率基于模糊概率的资源短缺模型.进行判断.问题三:通过利用线性回归和最小二乘的方法,进行分析.而后进行数据线性拟合预测未来水资源短缺问题.三、基本假设1、假设在未来的两年中不会发生重大自然灾害,如洪水、地震等.2、假设水资源总量全部为北京市地表水地下水量没有外部供水影响.3、假设所查找的数据真实有效.4、假设影响水资源短缺的各因素之间是相互独立的.四、符号说明aW为缺水系统中最小缺水量mW缺水系统中最大缺水量SW为供水量nW为需水量f(x)为风险发生的概率密度函数R为水资源短缺风险E总方差五、模型的建立与求解问题一5.1.1在本题中,我们在提供的工业用水、农业用水、第三产业及其他用水几个影响因子基础上还增加了降水量,人口数量,污染处理能力,平均气温,工业污染,居民消费指数等九个影响因子。通过对1979年至2009年各个因素数据的分析,采用灰色关联分析对影响进行粗略的判断主要风险因子,再运用熵值法来确定权重系数的方法验证。由于熵值越小,表明指标值的变异程度越大,提供的信息量越多,在综合评价中所起的作用越大,其权重也越大,故我们最后可以通过各个因素的熵值大小,比较得出各个因子的权重大小,从而得到影响北京水资源短缺的主要风险因子。3.1.2灰色关联分析表1.1979-2000年北京市水资源短缺情况:年份总用水量(亿立方米)农业用水(亿立方米)工业用水(亿立方米)第三产业及生活等其它用水(亿立方米)水资源总量(亿方)降水量(毫米)平均气温(摄氏度)污水处理能力(万立方米/日)人口数量(万人)居民消费价格指数缺水量(亿立方米)197942.9224.1814.374.3738.23718.411.123897101.84.69198050.5431.8313.774.9426380.7112390410624.54198148.1131.612.214.324393.212.325919101.324.11198247.2228.8113.894.5236.6544.412.325935101.810.62198347.5631.611.244.7234.7489.91325950100.512.86198440.0521.8414.3764.01739.31488.811.925965102.20.74198531.7110.1217.24.393872111.525981117.6-6.29198636.5519.469.917.1827.03665.312.1261028106.89.52198730.959.6814.017.2638.66683.912.3261047108.6-7.71198842.4321.9914.046.439.18673.912.7261061120.43.25198944.6424.4213.776.4521.55442.213.2261075117.223.09199041.1221.7412.347.0435.86697.312.7301086105.45.26199142.0322.711.97.4342.29747.912.5301094111.9-0.26199246.4319.9415.5110.9822.44541.512.851102109.923.99199345.2220.3515.289.5919.67506.7135112011925.55199445.8720.9314.5710.3745.42813.213.7251125124.90.45199544.8819.3313.7811.7730.34572.513.3591251117.314.54199640.0118.9511.769.345.87700.912.7591259111.6-5.86199740.3218.1211.111.122.25430.913.1591240105.318.07199840.4317.3910.8412.237.7731.713.1591246102.42.73199941.7118.4510.5612.714.22266.913.1591257100.627.49200040.416.4910.5213.3916.86371.112.81291364103.523.54根据以上数据绘制曲线图如图一所示,由曲线可大致得出缺水量与各因子的影响大小,由图可知人口数量与降水量的曲线都与缺水量的曲线形状较接近,故具关联度。即可粗略得出人口数量与降水量为缺水量的主要因子。5.1.2熵值法确定权重系数在确定评价指标的权重时,往往多采用主观确定权重的方法,如AHP方法等。这样就会造成评价结果可能由于人的主观因素而形成偏差。在信息论中,熵值反映了信息无序化程度,其值越小,系统无序度越小,故可用信息熵评价所获系统信息的有序度及其效用,即由评价指标值构成的判断矩阵来确定指标权重,它能尽量消除各指标权重计算的人为干扰,使评价结果更符合实际。其计算步骤如下:(1)构建m个事物n个评价指标的判R=(ijx)nm(i=1,2,…,n;j=1,2,…,m)。(2)将判断矩阵归一化处理,得到归一化判断矩阵Bminmaxminijijxxbxx年份居民消价格指工污染平均气污水理能力人口量降水量第三产业及生活其它用水工业用水农业用水缺水量式中:maxx、minx分别为同指标下不同事物中最满意者或最不满意者(越小越满意或越大越满意)。(3)根据熵的定义,m个评价事物n个评价指标,可以确定评价指标的熵为:11(ln)lnmiijijjHffm1,2,,;1,2,,injm1ijijmijjbfb为使lnijf有意义,当ijf=0时,根据风险评价的实际意义,可以理解lnijf为一较大的数值,与ijf相乘趋于0,故可认为ijflnijf=0。但当ijf=1,ijflnijf也等于0,这显然与熵所反映的信息无序化程度相悖,不切合实际,故需对ijf加以修正,将其定义为:11(1)ijijmijjbfb(4)计算评价指标的熵权W1()inWw11iiniiHwnH,且满足11niiw5.1.3权重的求解及主要风险因子的确定我们通过3.1.2中涉及的熵值求权重的方法,运用MATLAB编程得到了各个因素的熵值,通过比较可以得到影响北京市水资源短缺的主要风险因子。熵值法的主要运算结果见下表:表二:各个风险因子归一化后的ijf年份农业用水第三产业及生活用水工业用水居民消费指标价格人口数量降水量污水处理能力平均气温工业污染19790.36370.25350.4110.24040.17210.19910.14360.37180.306819800.39350.25260.360.193280.18290.25680.14760.31980.296419810.33130.260.29430.15260.20220.2390.19310.30380.28519820.27550.26190.3310.22720.2190.25640.22880.28040.280919830.26560.26190.30210.22040.23740.29770.23480.26790.266719840.25580.27130.26730.24080.26040.31910.25550.26380.272319850.24270.31810.24410.25090.28210.27880.25730.21790.195619860.22960.4210.22870.25770.30850.22740.26730.25580.165619870.21640.46780.20550.28480.340.31930.27720.18590.157919880.19680.50510.20550.30520.34420.39820.28720.20590.1534表二:各个风险因子的熵以及熵权农业用水第三产业及生活用水工业用水居民消费指标价格人口数量降水量污水处理能力平均气温工业污染H0.13890.14980.14120.15730.15940.15920.15560.14130.1249W0.11220.11080.11190.10980.10960.10960.11010.11190.1141由上表可知:农业用水、第三产业及生活用水,工业用水、居民消费指标价格,人口数量、降水量、污水处理能力、平均气温、工业污染的熵权值分别为:0.1122、0.1108、0.1119、0.1098、0.1096、0.1096、0.1101、0.1119、0.1141。由于熵值越小影响越大,其权重也越大的原则,我们可以很清楚的知道:在影响北京水资源短缺的众多因素中,北京市人口总数以及北京市降雨量对其影响程度较大。问题二就风险的含义来说,应包括以下两个方面:第一,指事故发生的可能性,或事故发生的不确定性;第二,只事故本身。因此对风险的度量有两个方法:一是以风险率度量,即系统实施的可能性;而是衡量风险破坏深度、历时等的指标,即系统失事的结果。但风险R不仅是风险事件发生的概率P的函数,而且是风险发生事件所产生的后果的函数。这一点很容易理解,一个事故发生风险的概率可能很高,但产生的后果损失很小的风险事件其风险不一定很