保持幽默感要能处乱不惊第四章水文统计基础知识本章重点:1、理解随机变量及概率分布的概念,掌握常用概率分布曲线;2、理解总体、样本与抽样误差的概念及统计参数的估计;3、掌握现行频率计算的方法——适线法,理解频率计算中几个特殊问题的处理;4、掌握二元相关分析法。本章学习思路:工程设计标准设计洪水频率(洪水重现期)设计洪水水位设计洪水流量表5.1~5.3工程设计标准频率曲线(P-Ⅲ型曲线)频率曲线经验频率曲线理论频率曲线曲线选用(P-Ⅲ曲线)统计参数(x,Cv,Cs)(P37~40)适线方法求矩适线法三点适线法公式4-18~公式4-20QKQCQPvP)1(问题启发•1、如何由工程设计标准(设计洪水频率或重现期)推求设计洪水流量(设计洪水水位)?•2、设计洪水频率和重现期之间是什么关系?•3、理论频率曲线的形式是什么样的?•4、如何求理论频率曲线的三个参数?•5、求矩适线法中,如何选取水文资料?经验频率曲线理论频率曲线QKQCQPvP)1(重现期99.9999.999.899.59998959080706050403020105210.50.20.10.050.011000010002001005020105251020100001000200100500100200300400500600700800频率(%)Cv=2CsCv=2.5CsCv=3CsCv=3.5CsCv=4Cs采样点CS=2CVCS=2.5CVCS=3CVCS=3.5CVCS=4CV水文特征值的选取:年最大值法潮白河流域下会站流量(m3/s)0204060801001201401601801973年1975年1978年1981年1983年1986年1989年1992年1994年流量(m3/s)水文现象的特性一、随机性水文现象是自然现象的一种,在其发生和演变过程中,包含着必然性的一面,也包含着偶然性的一面。必然现象是在一定条件下,必然出现或不出现的现象。偶然现象是在一定条件下,可能出现也可能不出现的现象,也称随机现象。二、确定性规律1、周期性:年周期,多年周期。2、地区性:气候及下垫面相似地区的水文现象规律相似。3、相关性:水文现象之间存在一定的因果关系。第一节随机变量及其概率分布一、随机变量随机变量系列:x1,x2,…,xn随机变量离散随机变量连续随机变量水文统计法就是将流量、水位、降雨量等实测水文资料作为随机变量,通过统计分析和计算,推求水文现象(随机事件)客观规律性的方法。1、随机变量:随机试验取值随机的变量,分为离散型、连续型随机变量。2、概率P:随机变量出现某取值的可能性。3、频率P:随机变量某取值在试验中出现的比率。nmP(A)掷币试验出现正面的频率表试验者掷币次数出现正面次数频率蒲丰404020400.5080皮尔逊1200060180.5016皮尔逊24000120140.5006在试验次数足够大的情况下,事件的频率和概率是十分接近的。二、随机变量的概率分布概率分布例4-1X(日)012345678910P(%)2468101315171384100例4-21)计算频率密度及累积频率年降水量组距Dx(=200mm)发生在组距中的次数Dm区间频率Dp=Dm/n(%)频率密度Dp/Dx(%)累积次数m累积频率P=m/n(%)2300~210111.60.00811.62100~190123.20.01634.81900~170134.80.02469.6………………700~50111.60.00862100合计6210005001000150020002500020406080100120累积频率年降水量00.020.040.060.080.10.120.140.162300210019001700150013001100900700年降水量频率密度2)绘制频率直方图3)绘制累积频率曲线频率直方图累积频率曲线f(x)F(x)概率密度曲线概率分布曲线分布曲线与密度曲线的关系PF(x)=∫f(x)dx(分布曲线)f(x)(密度曲线)xxPP(%)xxp∞dxxfxFxxPPxPP)()()(1)(dxxf三、随机变量的分布参数x水文计算中常用的统计参数有均值、变差系数和偏态系数。一个随机变量系列的频率密度曲线和频率分布曲线的形状和方程,都可以用几个数值特征值来反映,这些数值特征值称为统计参数(特征参数,分布参数)。vCsC1).均值均值反映了系列在数值上的大小(系列总体水平的高低),可以作为系列之间数值大小(水平高低)的比较标准。系列中各个变量与均值的比值,称为模比系数(或变率),以K表示。对任一变量x,则有:2).中值中值的大小能反映系列中间项和密度曲线的位置。xniinxnnxxxx1211xxKiix1.位置特征参数3).众值众值的大小能反映系列中最大几率项和密度曲线的位置。4).均值、中值、众值的位置关系xa)xxxox0yyb)xxx0xc)xxxxya)正偏态;b)正态;c)负偏态密度曲线图水文现象为不对称分布,年洪峰流量频率分布多为正偏。2、均方差和变差系数均方差和变差系数都是反映随机变量系列对其均值离散程度的参数。系列中各随机变量对其均值的差称为离差,用表示,。方差是离差的平方和,可以用来表示系列总的离散程度。均方差表达各随机变量对其均值的平均离散程度。对于总体对于样本vCixxiDxxiiDDniiniixx1212)(nxxnii12)(1)(12nxxnii比值表示相对离散程度,称为变差系数或离差系数,用表示。在水文计算中,利用样本资料推算总体的变差系数可采用下式:或1)1()1(1212nnKnKxCniiniivxvC212)1()(xnxxxCniiv较小时,表示系列的离散程度较小,即变量间的变化幅度较小,频率分布比较集中;反之,较大时,系列的离散程度较大,频率分布比较分散。vCvC3、偏态系数偏态系数是反映随机变量系列中各随机变量对其均值对称性的参数。对于总体对于样本sC3313)(vniisCxnxxC3313)3()(vniisCxnxxC频率曲线的三个参数,其中均值()一般直接采用矩法计算值;变差系数(Cv)可先用矩法估算,并根据适线拟合最优的准则进行调整;偏态系数(Cs)一般不进行计算,而直接采用倍比,我国绝大多数河流可采用Cs=(2~3)Cv。x,其频率分布对称于均值,为正态分布;,为正偏态,系列中大于均值的变量比小于均值的变量出现的机会少,其均值对应的频率小于50%;,为负偏态,表明系列中大于均值的变量比小于均值的变量出现的机会多,其均值对应的频率大于50%。0sC0sCCS30x2x3x1yCS20CS1=0xsC0sC值变化情况统计参数与密度曲线及频率曲线的关系1.统计参数、、与密度曲线形状的关系cv3>cv2>cv10ya)x1x2x2>x1cv1=0x0ycs3b)xcv3x0cv2ycs2c)xcs3>cs2>cs1cs1=0xxvCsC1)均值反映密度曲线的位置变化2)变差系数反映密度曲线的高矮情况3)偏态系数反映曲线的偏斜程度xvCsCx对频率曲线的影响2.统计参数、、与频率曲线形状的关系xvCsCvC对频率曲线的影响sC对频率曲线的影响、、与频率曲线的关系1)均值反映频率曲线的位置高度2)变差系数反映频率曲线的陡坦程度3)偏态系数反映频率曲线的曲率大小vCCS1=0CS3CS2CS17599959075502010510.1a)P(%)xx3x1x2x3x2x1501015200.195909950205110750.1P(%)b)c)xCV3CV1=0CV2CV3CV2CV1CS3CS2x999095P(%)xvCsCxsC四、几种常用的概率分布曲线2.皮尔逊Ⅲ型曲线(K.Pearson,英国生物学家))()(100)()()(axeaxxfyP-Ⅲ型曲线的方程式的密度函数为:为函数1.正态分布曲线的三个参数、、经过换算也可以用系列的三个统计参数、和来表示,其关系式为0axvCsC24sCxCCsv2)21(0svCCxaxvCsC因此,若已知三个统计参数、和,则P-Ⅲ型曲线及其方程式就可以确定,也就是确定了密度曲线及密度函数。P-Ⅲ型曲线的应用将P-Ⅲ型曲线的方程式进行一定的积分演算,就可以得到频率曲线纵坐标值的计算公式,即频率曲线的方程式(分布函数)为:式中,——频率为P的随机变量;——离均系数,,这是频率P和偏差系数Cs的函数,为了便于实际应用,制成离均系数值表,可供查阅。——模比系数,,可根据拟定的比值制成模比系数值表。PxxKxCxPvP)1(Px),(1sPvPvPCPfxxxCxxCKPK1vPPCxxKvsCC/PK对于年最大流量系列,公式(4-18)可写成式中,——频率为P的洪峰流量(m3/s);例4-3QKQCQPvP)1(PQ解题思路QKQCQPvP)1(),(sCPf1、把历年的年最大流量资料按大小递减次序排列,然后进行计算;2、计算、、;vCsCQPQ3、计算。Cs=n*Cv五、重现期在水文计算中,等于和大于某一数值的水文要素特征值(流量、水位等)出现的次数与总次数的比值,为该特征值的累积频率(P)。重现期是指在很长时期内,平均若干年遇到一次大于或等于(或小于或等于)某值的洪水(或枯水),以年为单位。重现期T与累积频率P的关系为:当P≤50%时,对洪水而言当P≥50%时,对枯水而言PT1PT11重现期99.9999.999.899.59998959080706050403020105210.50.20.10.050.011000010002001005020105251020100001000200100500100200300400500600700800频率(%)Cv=2CsCv=2.5CsCv=3CsCv=3.5CsCv=4Cs采样点宜昌水文站各种频率的设计洪水流量洪水频率重现期洪水流量(m3/s)5%20年一遇723002%50年一遇790001%100年一遇837000.1%1000年一遇988000.01%10000年一遇113000第二节统计参数的估计一、总体与样本总体,总体的容量样本,样本容量二、统计参数的估计累积频率曲线的三个统计参数:均值变差系数偏态系数1.矩法简介1)原点矩(均值为一阶原点矩)2)中心矩(方差为二阶中心矩)2.矩法估计样本系列统计参数1)样本的均值估算xniixnx112)样本的变差系数估算`vCniiniivKnxxnC1212`1111xxKii3)样本的偏态系数估算`sC313`1vniisnCKC3.样本参数的无偏估计值niivvKnCnnC12`1111313`23121vniissCnKCnnnC三、抽样误差统计参数的均方误公式:4222216523162432124312ssCsvsvvCsxCCnCCCCnCCnnsv尊重弱者保持高度的自信心第三节水文频率计算求矩适线法一、概述累积频率曲线累积频率曲线的绘制方法:求矩适线法三点法读点补矩法1.求矩适线法绘制累积频率曲线的基本要点2.经验累积频率计算公式二、绘制累积频率曲线的求矩适线法点绘点据——计算统计参数——选线——绘制曲线%1001nmP3.用适线法绘制累积频率曲线的具体步骤1)绘制经验累积频率曲线2)矩法求样本统计参数3)选定线型4)适线例某工程拟建断面水文站有35年实测流量资料,试求最大流量的累积频率曲线及相应于设计标准P=1%和校核标准P=0.1%的最大流量值。1)计算