2019/12/291第六章水文统计研究对象:频率计算,相关分析研究内容:频率计算:随机变量及其概率分布水文频率曲线水文频率计算适线法相关分析:两变量直线相关2019/12/292研究目的研究河川径流的统计变化规律,预估径流未来的变化趋势,以满足水利工程规划、设计、施工和运行管理的需要。第六章水文统计2019/12/293第一节概述内容提要:水文现象的两重性概率论与数理统计(水文统计)水文统计的任务学习要求:了解水文现象的基本特点掌握水文统计的任务2019/12/294一水文现象的特性水文现象是一种自然现象,它具有必然性的一面,也具有偶然性的一面。1、必然现象是指事物在发展、变化中必然会出现的现象;水文学中称水文现象的这种必然性为确定性。2、偶然现象是指事物在发展、变化中可能出现也可能不出现的现象,偶然现象也称随机现象;偶然现象短期观测结果不稳定,甚至杂乱无章,无一定规律,但经过长期观测后可呈现出一定的规律性。一般将从随机现象长期观测资料中统计出来的规律称为统计规律。将从水文随机现象长期观测资料中统计出来的规律称为水文统计规律。2019/12/295二水文统计定义及其研究对象定义利用概率论与数理统计的理论和方法,研究和分析水文随机现象的统计变化规律的科学称为水文统计。研究对象水文统计主要研究对象为各种水文特征值,如年洪峰流量、年径流量、各种雨量、泥沙、水位等。工程水文计算中运用数理统计方法来解决一些实际工程问题。例如,在某流域上设计一个水库,为了保障水库的防洪安全,就必须了解水库运营期间可能发生的最大洪水。水库运营期一般在100年以上,要预测这么长时间内可能发生的最大洪水,又由于影响洪水大小的因素众多,难以基于必然现象的规律,应用成因方法对径流做出这样长期的时序定量预报,因而只能基于统计规律,运用数理统计方法对径流做出概率预估,估计出在水库运营期内可能出现的洪水(概率意义上预测),作为水库防洪安全设计的重要依据。2019/12/296三水文统计的任务任务利用概率论与数理统计的理论和方法,研究和分析水文随机现象的统计变化特性,并以此为基础对水文现象未来可能的长期变化作出概率意义下的定量预估,为工程的规划、设计、施工以及运营管理提供水文依据。2019/12/297具体方法和内容根据已有的资料(样本),进行频率计算,推求指定频率的水文特征值;研究水文现象之间的统计关系,应用这种关系延长、插补水文特征值和作水文预报;根据误差理论,估计水文计算中的随机误差范围。四水文统计所解决的主要问题2019/12/298第二节随机变量及其分布参数内容提要概率中基本概念、随机变量的概率分布与统计参数学习要求:1.了解概率中的基本概念;2.掌握水文随机变量的概率分布与统计参数2019/12/299一、概率中的几个基本概念随机试验:在概率论中,对随机现象的观测叫做随机试验。事件:随机试验的结果分类:必然事件:在一定的条件组合下,必然会发生的事件;(降雨-产流-水位上升)不可能事件:在一定的条件组合下,一定不可能发生的事件;(洪水-断流)随机事件:在一定的条件组合下,可能发生也可能不发生的事件。(洪峰流量)随机试验及事件2019/12/2910一、概率中的几个基本概念在同等可能的条件下,随机事件在试验的结果中可能出现也可能不出现,但其出现或不出现的可能性大小则不相同,例如,年降雨量出现在均值附近的可能性要比出现极大值或极小值的可能性要大得多。为了比较随机事件出现的可能性大小,引入概率的概念。概率:随机事件在随机试验中出现的可能结果数与随机试验中所有可能出现的结果数的比值,反映了随机事件出现的可能性。P(A)=k/n显然,必然事件的概率等于1,不可能事件概率等于0,随机事件概率介于0与1之间。频率:指在具体的重复试验中,随机事件A出现的次数m与试验总次数n的比值。W(A)=m/n概率及频率2019/12/2911一、概率中的几个基本概念概率与频率的区别与联系区别:概率为理论值,频率为经验值联系:当n趋于无穷大时,频率稳定并趋于概率,水文上用频率代替概率。对于水文现象,所有可能的取值无法获取,只能采用有限的多年实测水文资料组成样本系列,推求频率作为概率的近似值。)()(limAPAWn2019/12/29122019/12/29132019/12/29142019/12/29152019/12/2916随机变量:随试验结果不同而发生变化的变量。通俗地讲,指在随机试验中测量到的数量。水文统计研究的是水文随机变量。对于水文现象而言,指某种水文特征值,如某地区流域出口的年径流量和洪峰流量等。通常随机变量用大写字母X表示,它的种种可能取值用相应的小写字母x表示。若取n个,则X=x1,X=x2,……,X=xn。一般将x1,x2,……,xn称为系列。而可能取值出现的概率用P表示。离散型随机变量:若随机变量仅能取得一个有限区间内的某些间断的离散数值,则称为离散型随机变量。例如,掷一颗骰子出现的点数。连续性随机变量:若某随机变量可取得一个有限或无限区间内的任何数值,则称此随机变量为连续型随机变量。水文变量大多数属于连续型随机变量,如年降水量、洪峰流量等可取0和极限值之间的任何数值。一、概率中的几个基本概念随机变量2019/12/2917总体:随机变量所有可能取值的全体,分有限总体和无限总体。成因相同、相互独立的同一水文变量的集合。有限总体:检验某厂生产的1万个产品的质量,不必全部检验,而抽取一种一部分检验就可以了。样本:从总体中随机抽取出的一组观测值。样本容量:样本中所含随机变量的项数。水文现象属无限总体,因为其个体沿时程变化的数量应包括过去、现在和将来的所有情况。不可能完全找到总体,只能将已观测到的水文资料作为总体的一个随机样本,如果样本容量足够大的话,利用数理统计方法分析得到的随机样本的统计规律性才能比较准确的反映总体的近似情况,区域年径流量的总体属于无限总体,其总体是自古至今乃至将来极其长远岁月的每一年的径流总量。水文中概率分析的目的就是要由样本的统计规律来估计总体的规律。一、概率中的几个基本概念总体、样本、样本容量2019/12/2918定义:某一随机变量的取值在长时期内平均多少年出现一次,又称多少年一遇,T,年重现期与频率的关系:根据研究对象不同,重现期T与频率P(%)之间分别存在如下两种关系:研究洪水:设计频率P50%,T=1/P;研究枯水:设计频率P50%,T=1/(1-P)。必须指出的是,由于水文现象一般无固定周期性,所谓百年一遇洪水是指大于或等于该频率的洪水在长时期内平均100年发生一次,而不能理解为恰好每隔100年遇上一次。对于具体的100年来说,超过或等于这样的洪水可能有几次,也可能一次也不会出现。长江98大洪水以及99大洪水就是实例。一、概率中的几个基本概念重现期2019/12/29192019/12/29202019/12/29212019/12/29222019/12/2923随机变量可以取所有可能值中的任何一个值,但是取某一可能值的机会是不同的,有的机会大,有的机会小。一般将随机变量的取值与取值概率之间存在的相互对应关系称为概率分布。二随机变量的概率分布2019/12/2924二随机变量的概率分布(1)离散型随机变量的概率分布离散型随机变量的概率分布一般用分布列表示概率满足下列两个条件:①pn≥0②∑pn=1Xx1x2……xi……P(X=xi)p1p2……pi……2019/12/2925(2)连续型随机变量的概率分布对连续性随机变量而言,由于其可能取值为无限,而取个别值的概率趋于零,因而无法研究个别值的概率,只能研究某个区间的概率:X≥x,X≤x或aXb一般研究随机变量X的取值大于或等于某一个取值x的概率,即研究X≥x的概率,表示为P(X≥x);P(Xx)=1-P(X≥x)P(x+△xX≥x)=P(X≥x)-P(X≥x+△x)水文统计中通常研究X≥x的概率及其分布。二随机变量的概率分布2019/12/2926(2)连续型随机变量的概率分布随机变量概率分布函数:随机变量X的取值大于或等于某数值x的概率即P(X≥x)为x的函数,水文上称P(X≥x)为随机变量X的概率分布函数,即为F(x),它代表X的取值大于等于某一取值x的概率。随机变量概率分布函数值F(x)与变量x之间的变化关系曲线称为随机变量的累积频率曲线,水文上简称频率曲线。随机变量概率密度函数f(x):指随机变量概率分布函数导数的负值,或简称密度函数。密度函数的几何曲线称密度曲线。二随机变量的概率分布2019/12/2927二随机变量的概率分布概率分布函数与概率密度函数的关系dxxdFxFxfdxxfxFxXPx)()()()()()(对于连续性随机变量而言,密度函数和分布函数从不同的角度完善的描述了随机变量的概率分布规律,因此密度函数和分布函数构成了随机变量的基本特征。2019/12/2928从统计学的观点来看,任何一个随机变量系列的统计规律都可以用密度曲线或分布曲线完整的刻画,但对于水文随机变量总体未知,无法求出F(x)和f(x)的明确解析函数表达式。对一些具体问题而言,有时不一定需要用完整的形式说明随机变量,而只要知道能够说明随机变量主要特性的某些特征数值就可以了。例如,某地年降水量是一个随机变量,各年不同,有一定概率分布曲线。若只要了解该地年降水量的概括情况,其多年平均年降水量就是反映该地年降水量多寡的一个重要的数量指标。统计参数:用于反映随机变量的统计规律或分布规律的某些特征数字。统计参数分为总体统计参数和样本统计参数两类。水文现象的总体通常是无限的,它是指自古迄今以至未来长远岁月所有的水文系列。显然,水文随机变量的总体是不知道的,这就需要在总体不知道的情况下,靠有限的样本观测资料去估计总体统计参数或总体的分布规律。常用统计参数类型:主要有均值、均方差、变差系数、偏态系数此处只介绍样本统计参数。三随机变量的统计参数2019/12/29291均值含义:反映随机变量系列平均水平的高低。计算公式设某水文变量的观测系列(样本)为x1,x2,……,xn,则其均值计算公式为:niinxnnxxxx12112019/12/29302均方差σ含义:反映随机变量系列在均值两侧的绝对离散程度。用于样本系列的均方差计算公式:12nxxiAxBxBA<2019/12/29312均方差σ均方差对密度曲线的影响均方差越大,系列越离散;反之,则越集中。σ2>σ1σ1σ22019/12/29323变差系数Cv含义:反映随机变量系列在均值两侧的相对离散程度,对水文现象来讲,反映了水文变量多年的变化情况。南方河流水文变量的Cv一般比北方的小,原因为南方雨量充沛,年际变化小。计算公式:xCvBAvvCC>BxAxBA<BAXX<2019/12/29332019/12/29343变差系数CvCv值对密度曲线的影响变差系数越大,系列越离散;反之,则越集中2019/12/29354偏态系数CS含义:反映随机变量系列在均值两侧分布不对称程度。计算公式:3133)(nxxCsniiBxAxBAssCC<2019/12/29364偏态系数CSCs值对密度曲线的影响Cs=0——对称分布;随机变量大于均值与小于均值出现机会相等Cs0——正偏分布;随机变量大于均值比小于均值出现的机会小Cs0——负偏分布;随机变量大于均值比小于均值出现的机会大2019/12/2937第三节水文频率曲线线型水利工程的规划设计,常常需要知道大于或等于某一水文特征值的频率是多少,也就是要提供一定频率的水文数值,这就需要绘制频率曲线。水文频率曲线类型(1)经验频率曲线由实测资料(样本)所绘制的频率曲线称为经验频率曲线(2)理论频率曲线能用数学方程式表示、符合经验点据分布规律的的频率曲线称为理论频率曲线。2019/12/2938201