基于小波神经网络耦合模型的流域年均产沙量预测(1云南师范大学旅游与地理科学学院,云南昆明,650092;2云南财经大学,云南昆明,650211;3国立新加坡大学地理系,新加坡119260)摘要:本文引入小波神经网络耦合模型对流域年均产沙量进行了定量研究。由于流域的地质、地貌、土壤在一定时间尺度内具有相对稳定的特性,选出年降雨量、年均气温、年径流量、大雨降雨量、暴雨降雨量、蒸发量、日照时数和汛期降雨量等八个要素作为模型的气候水文输入因子,而以耕地面积、林地面积、水库库容、公路修建、水土保持面积、裸地面积、年采矿量及年末总人口等八个要素作为模型的人类活动输入因子,对流域年均产沙量进行了定量建模预测。建模结果表明小波神经网络耦合模型不仅拟合精度高,而且预测效果好,从而为流域产沙的定量研究提供了新的途径。关键词:流域;年均产沙量;小波神经网络耦合模型;盘龙河流域中图分类号:文献标识码:文章编号:WaveletNetworkModelforYearlyAverageSedimentYieldofRiverBasin.(1TheCollegeofTourismandGeographySciences,YunnanNormalUniversity,Kunming650093China;2YunnanUniversityofFinanceandEconomics,Kunming650221China;3DepartmentofGeography,NationalUniversityofSingapore119260,Singapore)Abstract:TheWaveletNetworkmodelwasappliedtopredicttheyearlyaveragesedimentyieldinariverbasin.Duetothelandform,geological,soilconditionsarerelativestabilityduringperiodoftime,thisresearchselectsthewaterdischarge,rainfall,temperature,heavyrain,rainstorm,amountofevaporation,sunshinehoursandthefloodseasonrainfallasthemainclimate-hydrologicalfactorofthemodel,andselectstheplantationarea,woodlandarea,reservoirstoragecapacity,roadconstruction,waterandsoilconservationarea,barelandarea,yearlyminingamoutandtotalpopulationasthemainhumanactivityfactorofthemodeltoestablishtheyearlyaveragesedimentyieldmodelbasedonwaveletnetworkforprediction.Theresultshowsthatthewaveletnetworkmodelnotonlypossessehighaccuracyoffitnessbutalsoattainshighprecisepredictionaswell.Keywords:basin;yearlyaveragesedimentyield;waveletnetworkmodel;Panlongbasin1相关研究概述流域产沙量是水利工程规划设计的重要参数,也是流域土壤侵蚀的重要指标。关于流域产沙量的研究是当今自然地理学研究的重要课题,已有不少国内外学者对此进行了探索,其中的流域水文模型则是重要的研究方向。流域水文模型是由描述流域泥沙产输、降雨过程、径流形成等各个函数关系构成的一种物理结构或概念性结构,它满足流域物质和能量平衡的原理。自20世纪60年代以来,随着计算机的出现和发展,及模拟技术的不断深入,流域水文模型也得到快速发收稿日期:基金项目:云南省自然科学基金“气候变化对龙川江流域水资源的影响、脆弱性和适应性研究”;国家重点基础研究发展计划‘973’项目(编号:2003CB415105)资助作者简介:男,云南昆明人,博士,主要从事水文学与气候学方面的研究.展,大致经历了概念性模型和分布式物理模型两个阶段[1]。20世纪60~70年代流域水文模型的主要发展是概念性模型,这类模型的基本思想是将流域水文过程概化为一系列的数学计算元件,并组合成一个系统。较为有名的包括Stanford模型、Sacramento模型、Tank模型、Boughton模型以及国内的新安江模型[2]。1969年,Freeze和Harlan第一次提出了关于分布式物理模型的概念,这类模型的特点是模型的参数具有明确的物理意义,可以通过对连续方程和动力方程的求解而准确的描述流域水文的物理过程。其参数充分考虑空间变异性,具有较好的移植性,因此在模拟土地利用、植被变化等方面具有更强的优势[3]。如SHE模型(SystemHydrologicEuropean)是最早的分布式水文模型的代表,该模型共有18个参数,大部分具有物理意义,这些参数可由流域特征确定。SHE模型的物理基础和计算的灵活性使它适用于多种资料条件[4,5]。80年代以来,水文模型研究开始把土壤-植物-大气作为物理上的动态系统,并按能量、质量的传输过程来测定和分析三者之间的相互作用[6]。但是,分布式水文模型的使用也有局限性,为了模拟不同地理条件,必然需要大量的参数,涉及到大量的数据赋值方法,应用起来具有很大的局限性。近年迅速发展起来的小波分析具有良好的时频局部特性和变焦特性,而神经网络具有很好的自学习、自组织、自适应、鲁棒性和泛化能力。如何把两者的优势结合起来,并与已有的产沙量模型取长补短,一直是研究者关注的热点问题,本研究试图在这些方面作一些探索。2小波神经网络模型描述小波分析与神经网络通常有两种结合方式:一种是松散型结合方式,即小波神经网络组合模型(Waveletartificialnetworkmodel,WANN),这种模型将小波分析作为神经网络的前置预处理手段,为神经网络提供输入特征向量,然后再用传统的神经网络进行处理,本文不准备详细讨论这种模型。另一种是紧致型结合方式,即所谓的小波神经网络耦合模型(Waveletnetworkmodel,WN),小波与神经网络的紧致型结合,是目前小波分析与神经网络结合研究中最为广泛采用的一种结构形式。它是由ZhangQinghua等人于1992年正式提出的,其基本思想是用小波函数来代替常规神经网络的隐层函数,同时将相应的输入层到隐层的权值及隐层的阈值分别由小波基函数的尺度参数和平移参数来代替[7,8]。图1为三层小波神经网络耦合模型的基本结构,其中)(k为小波函数。小波函数可选Morlet小波或样条小波,还可以选紧支集正交小波,本文选用的分析小波是Morlet小波,其实部的数)1(.........输入层隐含层输出层1xnx1y2ymy2x)2()(k)1(k1my1nx图1小波神经网络耦合模型学表达式为:)2/exp()75.1cos()(2xxx。此外,模型的参数学习算法可以采用梯度下降法、最小二乘法、正交最小二乘法以及BP算法等[9],本文采用的学习算法是基于BP模型的学习算法。基于BP算法的小波神经网络耦合模型是一种有监督的误差逆向传播的多层神经网络,包含输入层(Inputlayer)、隐层(Hiddenlayer)和输出层(Outputlayer)三层。其中隐层的传递函数由Morlet小波函数代替传统的正切Sigmoid函数。若设zx为输入层的第z个输入样本,zy为输出层的第z个输出值,ijw为连接输入层节点i和隐含层节点j的权值,kjv为连接隐层节点k和输出层节点j的权值,),(ba为分析小波,ja和jb分别为第j隐层节点的伸缩和平移系数,M(z=1,2,…,M)为输入样本的模式个数,n为输入层节点个数,h为隐含层节点个数,m为输出层节点个数,为Sigmoid函数,则小波神经网络耦合模型可以表示为:]})([{)(00),(hjzmkijbakjztxwvty(1)设kZx为第p个输入模式,pzy为第p个模式层的第z个实际输出,pzd为第p个模式层的第z个期望输出,模型的误差函数为:MpnipzpzpzpzydydE11)]1ln()1(ln[(2)设定:mjzijixwnet0及)()(,iiiibaabnetnet,则可以计算出小波神经网络耦合模型的输出为:])([)(0,hjibakjznetvty(3)引入学习率(0,0.8)、动量系数(0,0.95)和迭代步数l后,网络的权值和阈值可按下列公式进行学习和调整:)]1()([)()1(lwlwwElwlwijijijijij(4))]1()([)()1(lvlvvElvlvkjkjkjkjkj)]1()([)()1(lalaaElalajjjjj)]1()([)()1(lblbbElblbjjjjj目前,就如何选择神经网络隐含层的节点数目在学术界一直找不到有效的方法,多数研究者都凭借“试错法”确定。本文根据的是Kolmogorov定理,即若输入层有n个节点,则隐含层的节点数目h为2n+1个。图2研究区地理位置及泰森多边形3实例应用3.1研究区自然地理概况研究区域盘龙河流域位于云南省文山壮族苗族自治州东南缘(图2)。东经103°35.4′~104°51.9′,北纬22°51.0′~23°51.3′,面积3128km2。盘龙河属于红河流域泸江水系,自西北向东南流注,在麻栗坡县船头(中越边界)出境越南。流域内海拔一般在1000~2800m之间,平均1969m,薄竹山海拔2991m为流域最高点,盘龙河出境处海拔107m为流域最低点,平均坡降6.02‰。流域内年均气温15.8~19.3℃,年均降雨量922~1329mm,年均日照1492~2290h,无霜期可达273~353天,主要属于亚热带季风气候。由于地处滇东南喀斯特山原,区内地貌类型主要是峰林、峰丛、溶蚀洼地等喀斯特地貌。3.2模型的输入因子选取模型因子的选取是构建模型最为重要的环节之一,影响产沙量变化的因素很多,不同流域的主要因素也有所不同。但都主要包括流域下垫面条件、气候、人类活动等3大方面。一般地说,由于地质地貌条件相对稳定,故产沙量变化主要取决于气候和人类活动影响[10,11]。关于流域产沙的预测研究,多数学者以径流为主要预测因子[12]。Fitgerald认为,在多元回归模型中,降水可作为一个潜在的预测因子。Lemke等曾以降水为预测因子之一研究流域产沙[13,14],彭清娥等选采伐面积、采伐量、降雨量和径流量作为预测因子[15]。彭荔红则选用降雨量、降雨历时、洪峰流量和流量[16]。本研究选取产沙量的影响因子基于以下考虑:①流域的地质、地貌、土壤在一定的时间尺度内具有相对稳定的特性;②径流是泥沙搬运的主要动力;③降雨是泥沙产生与输移的驱动力,强降雨(大雨、暴雨、大暴雨、特大暴雨)过程对地表土壤的击溅和搬运高于一般的降雨过程;④其它气候因子无论从短期还是长期都影响产沙,但主要以间接方式为主。如气温可以通过影响蒸发、径流、土壤理化性质等最终影响流域产沙;⑤人为扰动既可能减少产沙,如退耕还林和修筑水库,但也可以加大侵蚀产沙,如不合理土地耕种模式、公路建设、矿山开采等。基于以上的考虑,本研究选取年径流量、年降雨量、年均气温、日降雨量超过25mm(大雨)的累积次数及累积降雨量、日降雨量超过50mm(暴雨)的累积次数及累积降雨量、蒸发量、日照时数和汛期降雨量作为模型的气候水文输入因子,以年末耕地面积、林地面积、水库