工程水文学(EngineeringHydrology)主讲:张峰手机:13856993385邮箱:zf_hhu@163.com安徽水电学院水文与水资源专业教研室二Ο一五年二月一日工程水文学(EngineeringHydrology)二Ο一五年二月一日第6章水文统计一、概述(1)水文现象水文现象是一种自然现象,它具有必然性的一面,也具有偶然性的一面。必然现象是指在一定条件下事物在发展、变化中必然会出现的现象。偶然现象是指在一定条件下事物在发展、变化中有可能出现也可能不出现的现象,或称随机现象。(2)水文统计的任务统计学的任务就是要从偶然现象中揭露事物的规律。这种规律需要从大量的随机现象中统计出来,称为统计规律。研究随机现象统计规律的学科称为概率论,而由随机现象的一部分试验资料区研究总体现象的数字特征和规律的学科称为数理统计学。水文统计的任务就是研究和分析水文随机现象的统计变化特性,并以此为基础对水文现象未来可能的长期变化做出在概率意义上的定量预估,以满足工程规划、设计、施工以及运营期间的需要。河流湖泊必然现象融雪融雪偶然现象二、概率的基本概念1、事件在概率论中,对随机现象的观测或观察叫做随机试验,随机试验的结果称为事件。事件分为以下三种:(1)必然事件。在每次试验中一定会出现的事件。(2)不可能事件。在任何一次试验中都不会出现的事件。(3)随机事件。在一次随机试验中,可能出现也可能不出现的事件。随机事件常用A,B,C,…表示,简称为事件。2、概率一定条件下,随机事件在试验中可能出现也可能不出现,但不同随机事件其出现的可能性大小可能不相同。为了了解随机事件出现的可能性大小,必须要有一个数量标准,这个数量标准就是随机事件的概率。计算公式如下:上式只适用于古典型随机试验,即试验的所有可能结果都是等可能的,且试验可能结果的总数是有限的。nkAP)(二、概率的基本概念3、频率设随机事件A在重复n次试验中出现了m次,则称P(A)为事件A在n次试验中出现的频率。对于水文现象,可以将频率作为概率的近似值。4、概率加法定理和乘法定理对于A和B两个事件,若A与B不能同时发生,则称A与B为互斥事件。如果两个事件彼此互斥,则两个事件之和出现的概率等于这两个事件的概率之和,即对于任意两个事件A和B,则有若A、B是随机试验S的两个事件,在事件A发生的前提下,事件B发生的概率称为事件B在条件A下事件的条件概率,记作P(B|A)。由此推证,两事件积的概率等于其中一事件的概率乘以另一事件在已知前一事件发生条件下的条件概率,即)()()(BPAPBAPnmAP)()(-)()()(ABPBPAPBAP二、概率的基本概念如果两个事件是相互独立的,即任一事件的发生不影响另一事件发生的概率。那么两个独立事件共同出现的概率P(AB)等于这些事件各自出现概率的乘积,即0)(),()()(0)(),()()(BPBAPBPABPAPABPAPABP)()()(BPAPABP三、随机变量及其概率分布1、随机变量随机变量是指在随机试验中测量到的数量。水文现象中的随机变量一般是指某种水文特征值,如年径流、洪峰流量等。随机变量分为两大类:离散型随机变量和连续型随机变量。(1)离散型随机变量,是指随机变量仅能取得有限个数值或可列的有限个数值。(2)连续型随机变量,是指随机变量可以取得一个有限连续区间或无限连续区间的任何数值。)()(xXPxF三、随机变量及其概率分布2、随机变量的概率分布随机变量的概率分布是指随机变量的取值与其概率之间的对应关系。对于离散型随机变量,其概率分布一般以分布列表示,即Xx1x2…xm…P(X=xm)p1p2…pm…其中,pm为随机变量X取值xm(m=1,2,…)的概率。它满足下列两个条件:(1)pm≥0(m=1,2,…)(2)对于连续型随机变量,无法研究个别值的概率,只能研究某个区间的概率。水文学习惯研究事件X≥x的概率及其分布。事件X≥x的概率P(X≥x)随着随机变量取值x而变化,所以P(X≥x)是x的函数,这个函数称为随机变量X的分布函数,记为F(x),即11mmpdxxdFxFxf)()()()()(xXPxF三、随机变量及其概率分布F(x)代表随机变量X大于或等于某一取值x的概率。该分布函数用几何图形表示出来,如下图所示,在数学上称此为随机变量的概率分布曲线,在水文上通常称为随机变量的累积频率曲线,简称频率曲线。上式中,f(x)为分布函数导数的负值,刻划了密度的性质,叫做概率密度函数,或简称密度函数。密度函数f(x)的几何曲线称为密度曲线。实际上,分布函数和密度函数是微分与积分的关系,即xdxxfxXPxF)()()(【实例】P136三、随机变量及其概率分布2、随机变量的统计参数随机变量的统计参数是指能说明随机变量的统计规律的某些数字特征的量值。统计参数有总体统计参数与样本统计参数。所谓总体是某随机变量所有取值的全体,样本则是从总体中任意抽取的一个部分,样本中所包括的项数则称为样本容量。在水文计算中,常用的样本统计参数有:(1)均值设某水文变量的观测系列(样本)为x1,x2,…,xn,则其均值为均值表示系列的平均情况,可以说明这一系列总水平的高低。niinxnnxxxx1211三、随机变量及其概率分布(2)均方差(标准差)均方差反映随机变量系列在均值两侧绝对离散的程度。计算公式如下:nxxnii12)(均方差对密度曲线的影响:均方差愈大,系列愈离散;反之,愈集中。三、随机变量及其概率分布(3)变差系数(离差系数、离势系数)数理统计中,用均方差与均值之比作为衡量系列相对离散程度的一个参数,它是一个无因次的数,用小数表示,其计算公式为称模比系数,其中,)1(12xxKnKxCiiniiv均方差对密度曲线的影响:变差系数愈大,系列愈离散;反之,愈集中。三、随机变量及其概率分布(4)偏态系数在水文统计中,主要采用偏态系数作为衡量系列不对称程度(偏态)的参数,它也是一个无因次的量,其计算公式为313313313)1()()(vniiniiniisnCKnxxnxxC【注意】对于总体统计参数,通常用EX或E(X)表示均值(或称数学期望),而离势系数及偏态系数仍用Cv和Cs表示。三、随机变量及其概率分布(5)原点矩随机变量X对原点离差的r次幂的数学期望E(X’),称为随机变量X的r阶原点矩,以符号mr表示,即)(11XEmniirirrPxXEm1)(niiPXEm1001)(对离散型随机变量,r阶原点矩为-)()(dxxfxXEmrrr),,2,1,0(),(nrXEmrr对连续型随机变量,r阶原点矩为当r=0时,,即零阶原点矩就是随机变量所有可能取值的概率之和,其值等于1。当r=1时,,即一阶原点矩就是数学期望,也就是算术平均值。三、随机变量及其概率分布(6)中心矩随机变量X对分布中心E(X)离差的r次幂的数学期望E{[X-E(X)]r},称为随机变量X的r阶中心矩,以符号μr表示,即niirirrpXExXEXE1)]([)]([对离散型随机变量,r阶中心矩为-)()]([)]([dxxfXEXXEXErrrrrXEXE)]([对连续型随机变量,r阶中心矩为显然,当r=0时,μ0=1;当r=1时,μ1=0;当r=2时,μ2=δ2;当r=3时,Cs=μ3/δ3。四、水文频率计算1、分布线型水文频率计算的两个基本内容包括分布线型和参数估计。连续型随机变量的分布是以概率密度曲线和分布曲线来表示的,我国水文计算中常用的有正态分布、皮尔逊Ⅲ型分布及对数正态分布等。(1)正态分布正态分布的密度函数及密度曲线的特点如下:)(21)(222)(xexfax正态分布的密度曲线有以下三个特点:1)单峰;2)关于均值a对称,即Cs=0。3)曲线两端趋于无限,并以x轴为渐近线。正态分布在水文上的应用——频率格纸的横坐标横坐标:两端稀疏,中间密集四、水文频率计算(2)皮尔逊Ⅲ型分布(P-Ⅲ型分布)P-Ⅲ型曲线是一条一端有限一端无限的不对称单峰正偏曲线,如下图所示,数学上称为伽马分布,其概率密度函数为)21(24)()()(02)(100svsvsxCCEXCEXCCexxf式中,Γ(α)为α的伽马函数;α、β、α0的为P-Ⅲ型分布的形状、尺度和位置参数,α0、β0,且三个参数与总体的三个参数Ex、Cv、Cs具有如上关系。四、水文频率计算(2)皮尔逊Ⅲ型分布(P-Ⅲ型分布)水文计算中,一般需求出指定频率p所对应的随机变量xp,这要通过对密度曲线进行积分,求出等于或大于xp的累积频率p值,即vEXCEXxpxxpdxexxxPP)(100)()()(dEXCdxCEXxvvp)1(令dCfPpsp),()(则有简化后得到公式已知P,求xp?直接利用上式求解比较困难,引入中间变量φ,φ是标准化变量,称为离均系数,φ的均值为0,标准差为1。已知P和Cs,查附录1得到φp,计算xp。【应用举例】已知某地多年平均降雨量1000mm,Cv=0.5、Cs=1.0。若降雨量分布符合P-Ⅲ型,试求频率P=1%的年降雨量为多少?解:由Cs=1.0,P=1%,查附录1得φp=3.02龙门水文站年最大洪峰流量理论频率曲线【应用举例】已知P、Cv、Cs、均值,求xp?利用P-Ⅲ型分布,查表计算,绘制理论频率曲线如下四、水文频率计算2、参数估计用有限的样本观测资料去估计总体分布线型中的参数,称为参数估计。参数估计的方法主要有:矩法、概率权重矩法、线性矩法、权函数法及适线法。(1)矩法估计矩法是用样本矩估计总体矩,并通过矩和参数之间的关系,来估计频率曲线参数的一种方法。矩法估算样本参数的无偏估计量公式如下:3133132)3()1()1()2)(1(vniivniisCnKnCKnnnC称模比系数,其中,1-)1(12xxKnKxsCiiniivniixnx11niixxns12)(11随机变量所取数值的全体称为总体,从总体中任意抽取的一部分称为样本,样本中所包括的项数称为样本容量。水文变量的总体是指自古迄今以至未来的水文系列,现有的水文观测的系列可以当作总体的一个样本。用一个样本的统计参数来估计总体的统计参数是存在误差的,称之为抽样误差。这种误差是由于从总体中随机抽取的样本与总体有差异而引起的。样本抽样误差的均方值称为均方误,是衡量抽样误差的大小的常用指标。皮尔逊Ⅲ型分布参数矩法估计的均方误公式如下:)165231(6243212431242222SSCsSVSvvCvsXCCnCCCcnCcnn由表中可见,当n=100时,CS的误差在40~126%之间。水文资料一般都很短(n<100),按矩法公式算得的CS值,抽样误差太大。四、水文频率计算(2)适线法根据估计的频率分布曲线和样本经验点据分布配合最佳来优选参数的方法叫做适线法(亦叫配线法),包括传统目估适线法、计算机优化适线法。1)经验频率曲线水文计算中习惯把由实测资料(样本)所绘制的频率曲线称为经验频率曲线,而把由数学方程式所表示,符合经验点据分布规律的频率曲线称为理论频率曲线。四、水文频率计算1)(nmxXPm2)经验频率经验频率是指将实测水文变量资料按递减次序排列,并以自然数顺序编序号,然后依次利用一定的公式(如期望公式)计算系列中各项的频率,即称为经验频率。我国水利水电工程设计洪水规范中规定采用的经验频率计算公式采用期望公式,公式如下【应用举例】已知某水文站24年最大洪峰流量实测资料,绘制其经验频率曲线,并求10年一遇的设计洪水。某站24年的最大洪峰流量经验频率曲线解:由第(3)栏最大洪峰流量及对应的第(4