2020/5/121基本原理与方法第三章水文统计2020/5/122•了解其它有关水文统计的知识。•掌握经验累积频率曲线绘制;•PⅢ形理论频率曲线;•直线相关分析;•统计参数计算;重点2020/5/123§3—1水文统计的意义及基本概念本节自学:1、水文统计为何要采用数理统计法2、自然界中的现象可分为哪三种类型,举例说明3、统计规律性、连续性随机变量、离散性随机变量、总体、样本、随机样本、样本容量、有限总体。2020/5/1244、数理统计法对水文资料的要求是什么检查资料的可靠性检查资料的代表性检查资料的一致性检查资料的随机性检查资料的独立性简介2020/5/125§3—2概率与频率P(A)=mn一、概念1、概率0≤P(A)≤1——随机事件在客观上出现的可能性大小的数值,也称机率。P(A)——随机事件A的出现机率;m——事件A在客观上出现的结果总数;n——一切可能出现的结果总数(总体容量)。2020/5/126事先概率总体是有限的,其随机变量的机率可事先算出事后概率经验概率总体是无限的,其随机变量的机率无法事先算出水文统计是事后机率,因为水文特征值是无限总体2020/5/1272、频率——在若干次重验复实验中,某事件出现的次数与实验总次数之比。W(A)=mnW(A)——随机事件A的频率。m——随机事件A的频数。n——总的实验次数。频率是随机实验时的实测值2020/5/1283、频率与概率的关系频率是实测值概率是理论值当试验次数越多,频率与概率的值越接近2020/5/129二、概率运算定理1、概率相加定理:p(A1+A2+……+An)=P(A1)+P(A2)+……+P(An)2、概率相乘定理:p(A1*A2*……*An)=P(A1)*P(A2)*……*P(An)2020/5/1210三、随机变量的概率分布随机变量与其概率的一一对应关系,称随机变量的概率分布。1、随机变量的概率分布2、频率及有关概念将水文观测资料由大到小排列,按等区间分成若干组,各组出现的次数与总次数之比,即为频率。(1)频率——表示每组所在区间的变量值出现的可能程度2020/5/1211(2)频率密度(A)频率~变量;(B)频率密度~变量;——频率在区间内的平均值即:xp(3)直方图——(4)频率密度曲线——当△x→0时,直方图近乎曲线,此曲线即频率密度曲线。2020/5/1212pxx频率密度曲线(A)密度函数:dxdpxpxp==lim)(xp2020/5/1213(B)密度曲线形状见图3.2多呈铃形(正态)分布,中间值频率较大,两头较小。由曲线形状可以知道:密度曲线呈中间大,两头小的。而大多数的水文现象具有此规律性。故密度曲线和密度函数可用来描述连续型随机变量的统计规律。2020/5/1214四、累积频率与重现期1、累积频率——等量或超量值的累积频数与总观测次数之比。是机率相加定理的应用nmxxpi=)(公式2020/5/1215p(x≥xi)——累积频率m——累积频数n——总观测次观测年限越长,则样本容量越大,其预见性越可靠。其中:2020/5/1216xp观测年限越长,则样本容量越大,其预见性越可靠。累积频率曲线频率分布曲线2020/5/12172、重现期——等于或大于某随机变量xi的值,平均多少年(或多少次)可能遇见一次,简称多少年(或多少次)一遇。重现期较累积频率更易懂、具体2020/5/1218T=1p(p≤50%)T=11-p(p≥50%)其中:T——重现期p——累积频率对于洪水频率对于枯水频率2020/5/1219p=95%时,表示20年一遇的枯水p=5%时,表示20年一遇的洪水例•而重现期是指长期内平均若干年可能出现一次,而不是固定周期。注意•频率是指多年平均出现的机会2020/5/1220•同等级建筑物的设计频率值相同,但因实际的水文现象不尽相同,故设计值也存在着差异。•设计频率标准由工程的重要性及建筑物的等级确定;五、设计频率标准(简介)2020/5/12211、频率设计标准——是根据工程的重要性及建筑物的等级来制定的允许破坏率和安全率——建筑物正常运转遭到破坏的可能性——在年内都能保证安全的机率破坏率保证率它与安全率是两个不同的概念2020/5/12222、保证率的计算PM=(1-p)n在n年内都能保证安全的机率n——保证安全的年数P——破坏率n越小,保证率越大,即要求保证的年数越小,可以达到的保证率越大。2020/5/1223§3—3经验累积频率曲线一、经验累积频率曲线——将某水文变量按由大到小的顺序排列,计算大于等于某变量的累积频数,并计算其累积频率。以累积频率作为横坐标,相应的变量作为纵坐标,并将其对应值点绘在坐标中,且目估一条光滑的曲线,此曲线即经验累积频率曲线。经验累积频率曲线2020/5/1224二、经验累积频率公式%100=nmp1、古典公式:其中:m——随机变量序号n——随机变量总数适用于系列比较长,即n很大时,否则p不合理,故水文计算中一般不采用此种公式。2020/5/1225注意:m是按由大到小排列的变量序号。如:m=10,n=10,则p=100%,显然与事实相背,因为样本中的,最小值不一定是总体中的最小值,故此式不尽合理。2020/5/12262、数学期望公式(维泊尔公式):3、中值公式(切哥达也夫):%1=nmp符号的意义同上。常用此公式%1004.03.0=nmp2020/5/12274、海森公式:%1005.0=nmp以上几个公式各有特点,从形式上难以确定哪个更符合实际,因为不管哪个公式都存在一定的抽样误差,且愈靠近两端,误差愈大,故只有增大样本容量,才能使计算结果更接近实际。实践证明,维泊尔公式的结果偏于安全,且公式形式简单,工程水文中常用此式。2020/5/12282020/5/1229三、经验累积频率曲线的绘制和应用•选定经验累积频率公式•据公式计算系列中变量的经验频率•以频率为横坐标,随机变量为纵坐标,将各计算值点绘在坐标纸上•将各点用一条光滑的曲线相连,即为经验累积频率曲线。步骤2020/5/1230四、经验累积频率曲线的外延由于在实际工程中,往往需要将实测的频率曲线向两端延长,以满足于设计频率标准。但若在普通坐标纸上点绘曲线,由于曲线两端曲率变化较大,如果只凭目测使其延长,则误差太大,故可采用以下的方法:2020/5/12311、应用机率格纸绘制经验累积频率曲线一般采用海森机率格纸(1)可以使密度曲线为正态分布的分布曲线,在海森机率格纸上呈现一条直线;(2)由于实测水文资料系列,其密度曲线很少呈现严格的正态分布,故此分布曲线也并非一条完全的直线,外延仍有一定的误差。特点2020/5/12322、利用数学方程式(即理论累积频率曲线)对水文资料的频率密度曲线选配一条合适的数学模型,利用数学的方法推求累积频率曲线方程式安全与经济是一对矛盾体,解决问题的办法就是由国家统筹考虑给出的设计频率。2020/5/1233§3-4随机变量的统计参数统计参数某些随机事件虽然有共同的统计规律,但不同的系列中,其取值也不同,故描述频率分布的密度曲线和分布曲线也具有不同的形状。为了选配合适的密度曲线数学模型,就必须选好合适的统计参数。——在数理统计法中,为描述不同系列的频率分布和曲线形状,所采用的能反映其特征的几个具体数据。2020/5/1234水文统计常用的几个统计参数:1、均值x与系列中所有变量有关,反映系列变量平均水平的参数,是系列量的代表。2、计算:一、均值加权平均法算数平均法2020/5/1235如:有一实测系列:x1,x2,x3,……,xn,相应的频数是:f1,f2,f3,……,fn。则有:nnnffffxfxfxx=212211(1)加权平均法2020/5/1236(2)算数平均法:当各变量占有同等比重(即出现的次数相同)时。可写为:均值的大小能反映系列分布中心和密度曲线的位置=nixnx112020/5/1237二、均方差、变差系数(离散系数)1、均值的数学特性:=0)(iixx2、均方差s描述系列各变量的离散程度。可用以比较系列的均值相同时,其离散程度的大小。2020/5/1238(1)公式:nxxsi=2)(1)(2=nxxsi水文资料应是样本,故一般应用此式。总体样本n——总数2020/5/1239如:有两系列甲:10,50,90s=40x=50乙:49,50,51x=50s=1(2)注:只用均值无法表示系列的离散程度,由s可以知道甲系列比乙系列的离散程度大。故若比较系列的离散程度应考虑均值和均方差2020/5/1240当均值都相同时,均方差越大,则离散程度越大。当均方差相同时,均值越大,则离散程度越小。此时可用以下的变差系数判别2020/5/1241表示系列的相对离散程度3、变差系数Cv均方差与均值的比可用来比较均值不同,均方差相同的两个系列的离散程度。2020/5/1242(1)公式nxxxxsciv2)(1==1)(1==nxxxxsciv总体样本若引入模比系数则公式为:3—16式xxkii=2020/5/1243(2)例:乙系列:995,1000,1005甲系列:5,10,15=10,s甲=5,Cv甲=0.5x甲=1000,s乙=5,Cv乙=0.005X乙注:当甲、乙系列的s相同,但可比较Cv,Cv小则离散程度小。不相同时,x即:当均方差相同时,均值越小,离散程度越大2020/5/1244(3)影响Cv的因素1流域形状狭长形流域的Cv>枝状形流域的Cv大流域的<小流域的径流均匀、波动小的<波动激烈的2020/5/12452河网的布置下游<上游同一流域,各支流洪水汇合后的干流段Cv<汇合前;3实测系列时段的长短同一水文现象,时段长的Cv<时段短的Cv2020/5/1246三、偏态系数(偏差系数)1、偏态系数Cs衡量一个系列在均值两侧对称程度的参数。(1)公式:33)(nsxxcis=33)(31sxxncis=总体样本2020/5/1247(2)Cs对曲线的影响Cs0Cs=0Cs0正偏态分布正态分布负偏态分布2020/5/1248§3—5理论累积频率曲线理论累积频率曲线——用数学方程式建立起的频率曲线方程理论累积频率曲线并非是由理论导出的公式,只是这种数学方程式的特点与水文统计规律能较好的符合,故此式只是可用以分析水文样本系列的数学工具,不能说明水文现象的本质。用数学公式可以达到延长经验频率曲线的目的。而频率曲线的形状与三个参数有关,故要选配合适的理论曲线,就须先设定好三个参数。2020/5/1249一、皮尔逊Ⅲ型曲线1、方程:若将坐标原点定在众值处,可写成:)1(0dxdaeaxyy=)()()(100G=axeaxybaaab3—26式3—25式2020/5/1250其中:Γ(α)——函数;a0——曲线左端起点到系列零点的距离;α、β——曲线的参数。d——均值到众值的距离(偏差半径);y0——众值处的纵坐标;a——曲线左端起点到众值的距离;e——自然对数的底。众值——系列中出现次数最多的变量。2020/5/12512、曲线方程中各参数的计算见式3—273、皮尔逊Ⅲ型曲线的应用皮尔逊Ⅲ型曲线积分,可以得到理论累积频率曲线的随机变量值公式。2020/5/1252φp—离均系数(查附录3)kp—模比系数(查附录4)是p、cs的函数(1)公式:xkxpp=pvpck=1其中:(2)举例:设某水文站平均Q=1000m3/s,cv=0.5,cS=1.5,求此理论频率曲线及设计洪峰流量Q1%。2020/5/12531皮尔逊Ⅲ型曲线只是一种数学模型,具体应用时应联系具体的水文现象作分析;(2)问题:2为了寻求一条与经验频率符合的较好的理论频率曲线的参数,需多次调整参数:x、cv为此,可采用试算的方法。2020/5/12544、统计参数对皮—Ⅲ型曲线的影响皮—Ⅲ型曲线是密度曲线Cv次之,最小。X用三个统计参数建立起的数学模型去推论总体的情况,Cs带来的误差最大,2020/5