1第3章水文统计的基本原理与方法3.1概述3.2概率与频率的基本概念3.3随机变量及其概率分布3.4统计参数3.5水文频率曲线线型3.6抽样误差3.7水文频率计算适线法3.8相关分析2水文现象的统计规律水文现象是一种自然现象,它具有必然性的一面,也具有偶然性的一面。偶然现象也称随机现象;偶然现象仍然是有规律的,一般称为统计规律。水文统计及其任务数学中研究随机现象统计规律的学科称为概率论,而由随机现象的一部分试验资料去研究总体现象的数字特征和规律的学科称为数理统计学。概率论与数理统计学应用到水文分析与计算上则称为水文统计。水文统计的任务就是研究和分析水文随机现象的统计变化特性。并以此为基础对水文现象未来可能的长期变化作出在概率意义下的定量预估,以满足工程规划、设计、施工以及运营期间的需要。3.1概述3一、概率的基本概念与定理(1)事件:是指随机试验的结果。事件有两种属性:数量性质:直接测量的量或计算的量,如年降雨量,年径流量...属性性质:直接观测到的现象,如天气的雨天和晴天,钱币的正面和背面...3.2概率与频率的基本概念4A.必然事件B.不可能事件C.随机事件事件可以分为三种类型:(2)概率为了比较某随机事件出现(或不出现)的可能性大小,必然赋予一种量化的(以数量表示)指标,这个数量指标就是事件的概率。()5nmAP)(式中,P(A):一定条件下随机事件A的概率;n:试验中所有可能的出现的结果数;m:出现随机事件A的结果数。简单的随机事件的概率定义用下式表示:随机试验是指所有试验的可能结果都是等可能的,而且试验的可能结果的总数是有限的。但水文事件不一定符合这种性质。6对于不是古典概型事件,只能通过多次重复试验来估计事件的概率。设事件A在n次随机试验中出现了m次,则称:nmAW)((3)频率为事件A在n次试验中出现的频率。注意:n不是所有可能的结果总数,仅是随机试验的次数。7二、频率和概率的区别和联系区别:概率是抽象数.是个理论值;频率是具体数,是个经验值。联系:频率随实验次数的增多而逐渐稳定.并趋近于概率。实验者掷硬币次数正面出现的次数正面出现的频率蒲丰(Buffon)404020480.5069皮尔逊(K.Pearson)1200060190.5016皮尔逊(K.Pearson)24000120140.5005频率越接近概率0.5表6-1掷币实验出现正面的频率8两事件和的概率:两个互斥事件A、B出现的概率P(A+B)=P(A)+P(B)条件概率P(B|A):在事件A发生的条件下发生事件B的概率。两事件积的概率:两事件同时出现的概率:P(AB)=P(A)×P(B|A)P(AB)=P(B)×P(A|B)P(A)≠0,P(B)≠0若A、B相互独立。即事件的发生互不影响,则P(B|A)=P(B),P(AB)=P(A)P(B)三、概率加法定理和乘法定理9用以表示随机试验结果的一个数量(事先是未知的),由于它事先不能确定,是随机的,称为随机变量。水文现象中的随机变量,一般指某个水文特征值(如年径流量、年降雨量、洪峰流量等)。3.3随机变量及其概率分布10总体在统计数学中,把某种随机变量所取数值的全体,称为总体。如年径流量的总体数是无穷的。(1)统计学中几个概念:样本从总体中不带主观成分任意抽取的一部分,称为样本。样本所包含的项数,称为样本容量。如实测的水文资料是有限的,是一样本。11它是指随机试验结果的一个数量。在水文学中,常用大写字母表示,记作X,而随机变量的可能取的值记作x,即:X=x1,X=x2,X=xn一般称之为随机系列或随机数列。(2)随机变量的表示12离散型随机变量随机变量仅取得区间内某些间断的离散值,则称为离散型随机变量。如洪峰次数,只能取0,1,2…,不能取相邻两数值之间的任何值。(3)随机变量的分类连续型随机变量随机变量可以取得一个有限区间内的任何数值,则称为连续型随机变量。如某河流断面的流量可以取0~极限值之间的任何实数值。13对于离散型随机变量:随机变量的取某一可能值的机会有的大有的小,即随机变量取值都有一定的概率与之相对应,可表示为:(4)随机变量的概率分布nn2211PxXPPxXPPxXP)()()(上式中P1,P2,…Pn表示随机变量X取值x1,x2,…xn所对应的概率。14x1x2x3x4……xn一般将这种对应关系称作随机变量的概率分布规律,简称为分布律。可以用以下的分布图形表示:XP离散型随机变量概率分布图15由于它的所有可能取值有无限个,而取个别值的概率为零,故无法研究个别值的概率。水文学上习惯研究随机变量的取值等于或大于某个值的概率,表示为:它是x的函数,称作随机变量X的分布函数,记作F(x),即F(x)=P(Xx)表示随机变量X大于或等于值x的概率,其几何曲线称作随机变量的概率分布曲线(水文学上通常称累计频率曲线,简称频率曲线)。)(xXP对于连续型随机变量:16由图中可知,X=900,相应的P(Xx)=0.15,说明大于900mm降雨的可能性为15%;同理,大于500mm降雨的可能性为60%00.20.40.60.81.0)xX(P)x(F500900年降雨量(mm)某站年雨量概率分布曲线P(Xx)17P(Xx)=P(Xx+x)+P(x+xXx)P(x+xXx)=P(Xx)-P(Xx+x)=F(x)-F(x+x)(1)由概率的加法定理:则,降雨量落在900和500mm的可能性为:60%-15%=45%xx+xPXP(Xx)P(Xx+x)随机变量X落在(x,x+x)的概率可用下式表示:18平均概率密度:随机变量落在区间(x,x+x)的概率与该区间长度的比值称作随机变量落在区间(x,x+x)平均概率。xxxFxF)()((5)概率密度函数:19称f(x)为概率密度函数,简称密度函数。而密度函数的几何曲线称作密度曲线。)()()()()()(xfxFxxFxxFlimxxxFxFlim0x0xΔΔΔΔΔΔ当x0,取极限得:20f(x)f(xi)F(x)xi密度曲线分布曲线dxxfxFx)()(xxdx21通过密度函数f(x)可求出随机变量X落在(x~x+dx)区间即dx上的概率=f(x)dx,称之为概率元素,即为图中的阴影面积;通过密度函数f(x)可求出随机变量X概率分布函数F(x),其与密度函数f(x)有如下的数学关系:dxxfxXPxFx)()()(22F(x)分布函数,反映随机变量X超过某个值x的概率。这两个函数能完整地描述随机变量的分布规律。f(x)密度函数,反映随机变量X落入dx区间的平均概率;可见,随机变量的二个函数:233.4随机变量统计参数能说明随机变量统计规律的某些特征数值,称为统计参数,或特征参数,有时为分布参数。位置特征参数均值(平均数)众值(众数)中值(中位数)离散程度特征参数均方差变差系数Cv对称程度特征参数偏态系数Cs24(1)平均数/数学期望x离散型随机变量的平均数是以概率为权重的加权平均值。若各随机变量很少重复出现,可不考虑出现次数的影响,可用算数平均法求平均值一、反映位置特征参数对于离散型随机变量:25dxxfxxEba)()(式中,a、b分别为随机变量X取值的上下限。数学期望或平均数代表整个随机变量的总水平的高低,它为分布的中心。对于连续的随机变量:26表示概率密度分布峰点所对应的数。对于离散型随机变量:M0(x)是使概率P(=xi)等于最大时所相应的xi值。M0(x)=xiPi-1PiPi+1Px离散型随机变量的众数(2)众数,记为M0(x)27M0(x)是概率密度函数f(x)等于最大时所对应的xi值M0(x)f(x)x连续的随机变量的众数对于连续型随机变量:28把概率密度分布分为二个相等部分的数。对于离散型的随机变量:将所有变量的可能取值按大小次序排列,位置居中的数字。(3)中位数,记为Me(x)29对于连续的随机变量中位数满足:21dxxfdxxfbxMxMaee)()()()(式中,a,b分别为随机变量X取值的上下限Me(x)xf(x)1/21/2ab30该参数用以反映随机变量分布离散程度(相对于随机变量分布中心即平均值的差距)的指标,通常有以下几种:二、反映离散特征参数值愈大,分布愈分散;值愈小,分布愈集中。(1)标准差(均方差)(Standarddeviation)1221f(x)x标准差对密度函数的影响31例1:两系列:甲---5,10,15;乙---1,10,19。比较其离散程度10乙甲xx0.43)1015()1010(105222)-(甲35.73)1019()1010(101222)-(乙表明:乙系列的离散程度大于甲系列均值相同时,均方差可以反映其离散程度;但均值不同时,却无法比较-----因此,引入离差系数(变差系数)32(2)变差系数(离差系数,离势系数〕xxECV)(CV1CV2CV2CV1f(x)x变差系数对密度函数的影响CV值愈大,分布愈分散;CV值愈小,分布愈集中。对于均值不同的二个系列,用均方差来比较其离散程度就不合适,则要采用均方差和均值的比来表示:33表明:甲系列的离散程度大于乙系列08.410甲甲x08.41000乙乙x005.010000.550.0100.5乙乙乙甲甲甲xcxcvv例2:比较两系列的离散程度:甲---5,10,15;乙---995,1000,1005。34f(x)x偏态系数对密度函数的影响Cs=0Cs0Cs0若不对称:CS0,称为正偏;CS0,称为负偏。三、反映对称特征的参数:偏态系数(偏差系数)33)(xXECsiiViiSkxxnCknxxC,)1()(3333vscc)4~2(一般有经验关系:35当Cs0,密度曲线峰顶在均值的左边,为左偏或正偏,概率分布曲线为向下凹曲线。当Cs0,密度曲线峰顶在均值的右边,为右偏或负偏,概率分布曲线为向上凸曲线。当Cs=0,密度曲线峰顶在均值处,为对称分布或正态分布,概率分布曲线为一直线。36水文现象大多属于正偏,Cs0(PIII曲线)。当其他参数不变时,Cs值越大,则概率曲线的凹度越大,即两端都在正态直线以上,中间部分向下。373.5水文频率曲线线型水文频率曲线是指水文分析计算中使用的分布曲线。可分为:经验频率曲线:习惯上把由实测资料(样本)绘制的频率曲线称为经验频率曲线,理论频率曲线:而把由数学方程式所表示的频率曲线称为理论频率曲线。水文中常用的理论概率频率曲线正态分布极值分布型皮尔逊Ⅲ型分布型38xexfxx222)(21)(式中,:平均数;:标准差。x许多随机变量如水文测量误差、抽样误差等一般服从正态分布。一、正态分布随机变量x的密度函数为39f(x)a.单峰,只有一个众数;b.以均值为轴对称,Cs=0;c.曲线二端趋于±∞,并以x轴为渐近线;d.1)(dxxf正态分布曲线的特点:xxx正态分布的均值和标准差确定后,分布就唯一确定了。x40概率密度函数表达式:)(100)()()(axeaxxf二、皮尔逊Ⅲ型分布式中,()~的伽玛函数,,,a0:三个参数,它们与三个统计参数有一定的关系,其表达式为:dxexx01)(Γsvc,c,x)21(2402svsvsccxaccxc可见,当以上三个参数确定后,P-III型密度函数亦完全确定。41f(x)皮尔逊Ⅲ型概率密度曲线a0M0(x)Me(x)xPPxdxxfP)(xP-III型曲线的特点:一端有限另一端无限的不对称单峰正偏曲线42PxaxPdxeaxxXPP)(100)()()(在水文计算中,一般要求出指定
本文标题:水文学-第三章
链接地址:https://www.777doc.com/doc-5296112 .html