基于回归分析预测法的年径流预测分析李璐瑶(安徽合肥工业大学土木与水利学院13级水利水电一班,学号2013217699)摘要:水是人类生活以及生产劳动必不可少的重要物质,也是整个生态系统的重要组成要素。水资源系统工程是对水资源复杂系统进行科学规划、最优设计和优化运行管理的一门新兴交叉综合性工程技术学科。为了实现水资源的可持续利用,促进人口、资源、环境和经济的协调持续发展,需要对水资源进行合理有效规划以及研究水资源规划方法。目前水资源系统分析方法有很多,比如模型化方法、预测方法、优化方法等,而回归分析预测法是预测方法中最基本的方法,同时也是统计学中应用最为广泛的一个分支,线性回归预测方法建模相对简单,在年径流预测分析中也得到了广泛应用。本论文旨在初步了解回归预测法及其如何在年径流预测中发挥作用并且探讨其局限性和不足。关键词:年径流预测回归分析水资源系统年径流是一个设计到水文,气象及下垫面等诸多因素的复杂过程,它因为确定性因素的作用变化十分复杂,对未来的描述也很困难。因此准确可靠的年径流预测对合理开发和优化利用水资源、进行区域水资源安全管理,以及更好的制定区域社会经济规划具有十分重要的指导意义。提高年径流预测精度,一直是国内外水文工作者研究的热点和难点。其中,年径流预测方法中使用最广泛的是统计预测法,常用的预测统计模型为回归模型,其因可操作性强而被广为采用。但由于年径流过程的自相依性不强,年径流及其影响因子之间存在不确定的非线性关系,只用单一的统计回归模型往往得不到令人满意的结果。1.回归分析预测法1.1回归预测的简介回归预测法,是研究变量与变量之间相互关系的一种数理统计方法。应用回归分析从一个或几个自变量的值去预测因变量的值。回归预测中的因变量和自变量在时间上的并进关系,即因变量的预测值要由并进的自变量的值旁推。这类方法不仅考虑了时间因素,而且考虑了变量之间的因果关系。具体方法有一元线性回归预测法、多元线性回归预测法、非线性回归预测法等。1.2回归分析的主要内容:从数据出发,确定因变量和自变量之间的关系;对关系式中的参数进行估计,并进行统计检验;筛选自变量,即从大量自变量中找出影响显著的,剔除不显著的;用求得的回归模型进行预测;对预测结果进行分析、评价。1.3回归分析模型及求解1.3.1一元线性回归预测一元线性回归预测是处理因变量y与自变量x之间线性关系的回归预测法,其数学模型为:其中a、b称为回归系数.首先根据x、y的现有统计数据,在直角坐标系中作散点图,观察y随x而变是否为近似的线性关系。若是,则求出式(7.4.1)中的a、b值,就可确定其数学模型,然后由x的未来变化去求相应的y值。a、b的确定方法(1)解联立方程组求解得到:直接用最小二乘法使拟合的数值与实际值的总方差为最小,即拟合程度最好,则得两者之差ei(7.4.1)yabxY=a+bxyxax0xbxayxxbnayiiiiii222(7.4.2)(7.4.3)iiiiiiinbnibanyyxxxxyx22(7.4.6)ˆiiiiiiabQiiyyyexabxye总方差根据极值原理,式(7.4.6)对a、b分别求偏导,并令其=0,得Sxx称之为xi的方差和(离差平方和)Sxy称之为xi与yi的协方差和(离差积之和)yxiixynnab利用、,可将、表达为2(7.4.4)(7.4.5)xyyxiiibxxxiiaybx222iiiiQiiaaabaaababxyyxyx000(7.4.7)iiQyabxanabyxiinabyxiibyxiiaybxn令,即所以27.4.7Qiibbabyx将式代入得()222iiiiiiiQybxxyibbybxbxbybxxyxxyxx2002(7.4.8)iiiixyxxxxyybxxixxyybxxiSS令其,即所以222222222()iiiixxSxxxxxxixnxxxixixxxxxinyxyxSyyySiiixyiiyy2同样,3.回归效果检验y=a+bx一定程度上反映了y与x之间的统计线性相关关系,该关系是否密切,决定了所采用线性预测模型多大程度上可信。这可以通过y与x的相关系数rxy的大小来确定。rxy的取值:|rxy|=1,样本点完全落在回归线上,y与x有完全的线性关系;0rxy1,y与x有一定的正线性相关关系,即y随着x的增加而成比例倍数增加;-1rxy0,y与x有一定的负线性相关关系,即y随着x的增加而成比例倍数减少;rxy=0,y与x之间不存在线性相关关系。取一定显著水平,查相关系数表,若|rxy|表中相应数字r临界值,表示x、y间存在线性相关,预测模型可用。r临界值是对不同的样本容量n,在两种置信度95%、99%下的相关系数的临界值,即r临界值与样本容量n、以及所要求的置信度1-)有关。1.3.2多元线性回归方法多元线性回归是简单线性回归的推广,研究的是一个变量与多个变量之间的依赖关系。多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变量的相关分析,从而建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。2.年径流预测分析在大量的社会、经济和工程问题中,对于因变量y(如,当前径流)的全面解释往往需要多个自变量(如,前期径流和降水)的共同作用。回归分析法是研究变量和变量之间依存关系的一种数学方法。水资源系统中径流要素受流域自然地理、气候及人类活动等诸多因素影响,其变化特性和规律十分复杂。表现出随机性、灰色性、非线性等复杂特征。径流预测,特别是中长期预测,是非常困难的,一直是国内外研究的热点和难点。由于资料缺乏,在年径流预测时通常选取前面相邻年份的径流量作为影响因子,故影响因子之间必然存在一定的相关性。3.一元线性回归预测方法在径流预测方面的作用下面以实例来说明如何通过回归分析预测法进行年径流预测。下表给出了1954-1965年径流与年降雨水文资料,现以表中资料建立回归预测模型进行分析计算(1)解联立方程组b=1.047783a=-586.016(2)直接用最小二乘法Sxx=934948.9Syy=1136317Sxy=979623.3Rxy=0.950420rxy1,年径流y与年雨量x有良好的的正线性相关关系,即年径流y随着年雨量x的增加而成比例倍数增加降雨量和径流量的回归关系:Y=1.0478X-586.02(3)当样本容量为12,置信度为95%时,查相关系数临界值表得,r临界值=0.5760年份年雨量X年径流YXYX^2Y^2Y0Y-Y0(Y-Y0)^21954201413622743068405619618550441524.2492-162.249226324.8029195512117288816081466521529984682.865845.13422037.096011956172813692365632298598418741611224.5784144.421620857.59855195711576958041151338649483025626.284668.71544721.806197195812577209050401580049518400731.0646-11.0646122.4253732195910295345494861058841285156492.166241.83381750.0668221960130677810160681705636605284782.4068-4.406819.41988624196110293373467731058841113569492.1662-155.166224076.549621962131680910646441731856654481792.884816.1152259.6996711963135692912597241838736863041834.796894.20328874.242891964126679610077361602756633616740.494855.50523080.827227196510523834029161106704146689516.2656-133.265617759.72014求和15721944013346810215307698562450109884.2553平均值1310.083333786.66666671112234.1671794230.75713537.5|rxy|r临界值,故年雨量x、年径流y间存在线性相关,预测模型可用,其余检验均略去。当预测降雨量为1000mm时,径流量预测值的点估计:径流量Y=1.0478*1000-586.02=461.78mm4.回归预测的模型评价上述年径流回归预测模型虽经计算可用,但按选择基于最小二乘估计法的线性回归模型时对自变量有着基本要求:在模型中应包含所有对因变量有重要解释意义的因素,并且在用于反映这些因素的自变量之间不存在多重相关性。若不满足要求,存在的危害有:(1)在自变量完全相关的情况下,最小二乘的回归系数无法估计;(2)如果自变量之间存在着不完全的共线现象,则回归系数是可以估计的,但是,回归系数的估计方差会随着自变量之间的相关程度的不断增强而迅速扩大;(3)在高度相关条件下,回归系数的估计值对样本数据的微小变化将变得非常敏感,回归系数估计值的稳定性将变得很差;(4)当存在严重的多重相关性的影响时,会给回归系数的统计检验造成一定的困难;(5)在自变量高度相关条件下,对用最小二乘法得到的回归模型,其回归系数物理含义的解释将变得十分困难,甚至还会出现回归系数的符号与实际概念完全相反的现象;(6)因为回归模型的建立是基于样本的,多重相关性也是指抽样的数据。如果把所建立的回归模型用于预测,而多重相关性问题在预测期间仍然存在,则共线性问题对预测结果并不会产生特别严重的影响。但是,如果样本数据中存在的多重相关问题在预测期间发生了变化,或者在预测期间共线性的问题不再存在,那么,所得的预测结果就完全不确定了。5.结论及建议水资源规划是全面落实国家或地区实施可持续发展战略的要求,适应经济社会发展和水资源的时空动态变化,着力缓解水资源短缺、水环境恶化等水问题的一项重要工作。它是根据国家或地区的社会、经济、资源和环境总体发展规划,以区域水文特征及水资源状况为基础来进行的。水资源规划目的是根据经济社会可持续发展和环境保护对水资源的要求,提出水资源合理开发、优化配置、高效利用、有效保护和综合治理的总体布局及实施方案,促进我国人口、资源、环境和经济的协调发展,以水资源的可持续利用支持经济社会的可持续发展。使用回归分析预测法对年径流进行预测分析相对经典成熟,容易理解且运用广泛,但仍存在着些许不足,通过实例我们发现正确应用回归分析预测时应注意:①用定性分析判断现象之间的依存关系;②避免回归预测的任意外推;③应用合适的数据资料。为了得到如意的预测结果,要求在预测工作中不能机械,要会灵活使用,要注意了解会影响预测结果的偶然情况,以便对预测结果进行适当修正,这样才能使预测结果更接近实际,也才能使预测能更好地为经济建设服务。近些年的“年径流预测的最小二乘支持向量机-马尔可夫链组合模型”、“基于近邻估计的年径流预测动态联系数回归模型”等都是在回归分析预测的基础上对年径流进行预测,人类对通过回归分析预测法对年径流预测分析掌握的越来越熟练,深入分析并具有创新精神,努力实现从传统水利向现代水利、可持续发展水利的转变。参考文献【1】蒋尚明金菊良