水文统计的基本知识

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第四章水文统计的基本知识§4—1概述§4—2概率的基本概念与定理§4—3随机变量及其概率分布§4—4频率计算§4—5相关分析§4—1概述一、水文现象的必然性和偶然性1、必然性水循环降水径流一般可以通过成因分析,建立数学物理方程,并利用它来求解。例如:用水量平衡方程确定径流量。2、偶然性如:河流某断面每年汛期出现的最大洪峰流量或年径流量在数量上,有的年份大,有的年份小,事先无法确定。二、概率预估§4—2概率的基本概念与定理一、事件事件:指随机试验的结果。它可以是数量性质的,如年雨量的数值等;也可以是属性性质的,如天气的阴、晴等。事件的分类1、必然事件:如果在试验前就可断定某一事件在试验结果中必然发生,则该事件为必然事件。如:洪水来水位2、不可能事件:如果在试验前就可断定某一事件在试验结果中不会发生,则该事件称不可能事件。如:洪水来水位事件的分类3、随机事件:某种事件在试验结果中可以发生也可以不发生,这种事件称随机事件。如:某河渠断面处下一年出现的最大洪峰流量值。二、概率为比较随机事件出现(或不出现)的可能性大小,而赋予的一种数量指标。计算公式:式中:P(A)———定条件下出现随机事件A的概率;n——在试验中所有可能结果总数;m——有利于A事件的可能结果数。nmAP)(因为0≤m≤n,所以0≤P(A)≤1当m=n,P(A)=1,则事件A为必然事件;当m=0,P(A)=0则事件A为不可能事件;当0mn,0P(A)1则A为随机事件。只适用于所谓“古典概型事件”。水文事件不属于古典概型事件。nmAP)(三、频率事件A在n次试验中出现的频率当事件次数n不大时,频率不稳定,n充分大后,频率失去随机性,以微小的摆动接近常数0.5。nmAW)(频率与概率的区别和联系概率表达事件客观上出现与可能性大小,是个理论值,对于简单事件,事先可以确定;频率是通过若干次试验后才能求得的经验值,事先不能确定。当试验次数愈大,频率愈接近概率。因此当试验次数足够多时,可以用事件发生的频率来代替事件的概率。四、概率的加法定理和乘法定理互斥事件(互不相容事件):两个不可能同时发生的事件。独立事件:两个事件的发生互不影响。1、概率加法定理两个互斥事件和的概率等于这两个事件的概率的和。即:P(A+B)=P(A)+P(B)式中,P(A+B)——事件A与B之和的概率。非互斥事件:P(A+B)=P(A)+P(B)-P(AB)2、概率乘法定理对于两个独立事件,该两项事件同时发生的概率等于这两个事件概率的乘积,即:P(AB)=P(A)·P(B)不独立事件:P(AB)=P(A)P(B/A)P(AB)=P(B)P(A/B)式中,P(B/A)——事件B在事件A已发生情况下的概率,简称为B的条件概率。实例某地区位于甲、乙二河的汇合点,当任一河流泛滥时,该地区就会被淹没。设在某个时期内,甲河泛滥的概率P(A)=0.1;乙河泛滥的概率P(B)=0.2;又知当甲河泛滥时,乙河泛滥的概率P(B/A)=0.3。求这个时期内该地区被淹没的概率。又当乙河泛滥时,甲河泛滥的概率是多少?解:因A、B事件相容且不独立,故该地区被淹没的概率为:实例15.02.03.01.0BPABPAPBAPABPAPBAPBP所以由于P(A+B)=P(A)+P(B)-P(AB)=P(A)+P(B)-P(A)P(B/A)=0.1+0.2-0.1×0.3=0.27本节小结一、事件的分类二、概率、频率及二者的区别和联系三、概率的加法定理和乘法定理§4—3随机变量及其概率分布一、随机变量1、定义:随试验结果而发生变化的量。总体:某种随机变量所取数值的全体。样本:从总体中不带主观成分任意抽取的一部分。样本容量:样本所包含的项数。水文现象中的随机变量,一般是指某种水文特征值,如某站的年降水量等。它们的总体通常是无限的,而样本则是指有限期间的实测水文数列。2、随机变量的分类(1)离散型:随机变量只能取得区间内某些间断的离散数值。例如,掷一颗骰子。(2)连续型:随机变量可以取得一个有限区间内的任何数值。水文资料中的数据大都如此。例如,某河流量,可以在零与极限流量间变化,因而流量可以等于零至极限流量间的任何实数值。二、随机变量的概率分布随机变量取得各个可能值的机会不同,其取值与概率有一定的对应关系。如:P(X=x1)=P1、……P(X=xn)=Pn一般将这种对应关系称为随机变量的概率分布规律,简称分布律。分布律的概念只有离散型随机变量才有。连续型随机变量只能以区间概率来分析其概率分布规律。除此,通常还研究随机变量X的取值均大于x的概率,将其表示为P(Xx),它与P(Xx)可以相互转换。实例北京站具有104年实测年降水量资料,现按下列步骤进行统计分析。序号年降水量出现次数(年)频率(%)组内平均(组距频率密度△X=200mm)△P/△X组内累积组内△P累积(10-4/mm)频率P(1)(2)(3)(4)(5)(6)(7)11500~1300.1110.950.950.47521300~1100.1120.951.90.47531100~900.1131512.514.46.254900~700.1213620.234.610.15700~500.1397537.572.118.756500~300.1251002496.1127300~100.141043.91001.958合计104100计算步骤(1)将年降水量分组,并统计各组出现次数和累积次数。拟定分组距离△X=200mm,列于表中。累积次数表示年雨量大于或等于该组下限值x的出现次数。(2)计算各组出现的频率、累积频率及组内平均频率密度。计算步骤(3)绘图。以各组平均频率密度为横坐标,以年雨量X为纵坐标,按组绘成直方图。这种频率密度随随机变量取值x变化的图形,称为频率密度图。如果资料年数无限增多,组距无限缩小,频率密度直方图就会变成光滑的连续曲线,称为随机变量的概率密度曲线。计算步骤以累积频率P为横坐标,以年降水量X为纵坐标,绘制阶梯形实折线。这种表示大于或等于x的累积频率随随机变量取值x变化的图形,称为频率分布图。同样,如资料年数无限增多,组距无限缩小,实折线就会变成S形的光滑连续曲线,交称之为随机变量的概率分布曲线。概率密度曲线和概率分布曲线示意图概率密度函数概率密度曲线的函数式用f(x)表示,并称为概率密度函数,简称密度函数。整个曲线与X轴所包围的面积表示概率为1。f(x)dx概率分布函数概率分布曲线的函数式用F(X)表示,称为概率分布函数,简称分布函数。F(X)表示随机变量取值大于某一指定x值的概率。分布函数F(X)是密度函数f(x)的积分函数。xdxxfxXPxF)()()(F(xi)在水文计算中,一般不绘制水文变量的概率密度曲线,而绘制概率分布曲线。水文上习惯称概率分布曲线为频率曲线,称概率密度曲线为频率密度曲线或简称为密度曲线。三、随机变量的统计参数统计参数:能用来说明随机变量统计规律特性的某些特征数字,称为统计参数。1、算术平均数xniinxnnxxxxx13211均值对密度曲线和频率曲线的影响f(x)三、随机变量的统计参数2、均方差σ与变差系数CV对于均值相等的不同系列,它们的离散程度可用均方差σ来衡量。1)(12nxxnii对于均值不同的系列,它们的离散程度可用变差系数CV来衡量。ki为模比系数。1)1(1)(11212nknxxxxCvniinii=xxKii变差系数CV对密度曲线和频率曲线的影响f(x)实例。离散程度比乙地区的小这说明甲地区的年雨量来衡量,即:而必须用相对值,来说明离散程度的大小所以不能用,但由于尽管解:的大小。试比较两系列离散程度。,乙地区的年雨量系列,,甲地区的年雨量系列,乙乙乙甲甲甲乙甲乙甲乙乙甲甲4.08000233.01200360,320800;3601200xCxCCxxmmmmxmmmmxvvv三、随机变量的统计参数3、偏态系数CSCS是衡量随机变量分布在均值两边是否对称以及不对称(偏态)程度的参数,是无因次数。313313)3()1()3()(CvnKnxxCsniinii当随机变量在均值两边分布对称时,CS=0,称正态分布;若分布不对称,当正离差的立方占优势时,CS0,为正偏分布;当负离差的立方占优势时,CS0,称负偏分布。偏态系数CS对密度曲线的影响水文现象大都属正偏分布,即CS0。通常密度曲线的峰偏左,且CS愈大愈偏左。偏态系数CS对频率曲线的影响反映在频率曲线上,CS0时,曲线向上凹,且CS愈大,凹势愈显著,即上段愈陡,而下段愈平缓。四、抽样误差抽样误差:由随机抽样而引起的误差。均方误计算公式:nxCvCsCsCvnCvcv24321222)165231(642CsCsnCs四、抽样误差样本统计参数的抽样误差随样本均方差σ、离差系数CV及偏态系数CS的增大而增大。但随样本容量n的增大而减小。结论:样本系列愈长,抽样误差愈小,样本对总体的代表性愈好。矩法按下式估算统计参数的方法一般称为矩法。niinxnnxxxxx13211313313)3()1()3()(CvnKnxxCsniinii1)1(1)(11212nknxxxxCvniinii=本节小结一、基本概念1、总体2、样本3、样本容量二、随机变量分类及其概率分布三、概率密度曲线和概率分布曲线四、概率密度函数和概率分布函数五、随机变量的统计参数(计算公式、各自对密度曲线和频率曲线的影响)六、矩法§4—4频率计算频率计算是用来分析研究某种随机变量出现不同数值可能性的数学工具。水文计算中,常常要知道大于某一水文特征值的频率是多少,换句话说,也就是要提供相应于一定频率的水文数据。这就要进行频率计算,要根据水文变量的样本系列来确定频率分布曲线。§4—4频率计算一、经验频率曲线(一)经验频率的计算公式经验频率:是指根据实测样本资料所求得的大于或等于某一水文变量的概率。计算公式:式中:P——大于或等于某一变量值x的经验频率;m——x由大到小排列的序号;n——观测资料的总次数,即样本容量。%100nmp经验频率的修正公式公式有不合理之处。例如当m=n时,p=100%,这种情况不可能。修正公式:%1001nmp%100nmp(二)经验频率曲线的绘制及其在应用中的问题1、绘制经验频率曲线(1)将实测的样本系列按由大到小排列;(2)用式计算出各项x的经验频率;(3)以水文变量X为纵坐标,以经验频率P为横坐标,在概率格纸上点绘各相应坐标点(pi,xi);(4)徒手目估通过点群中心连成一条光滑曲线,即得水文变量X的经验频率曲线。%1001nmp2、经验频率曲线的应用根据设计要求的频率P,查出工程设计所需的水文数据xP。即:PxP。(三)频率与重现期的关系重现期:是指某一随机事件在很长时期内平均多少年出现一次(多少年一遇)的意思,也即平均的重现间隔期。频率P与重现期T的关系:1、当研究洪水或暴雨问题时,重现期指在很长时期N年内,出现大于某水文变量XP事件的平均重现间隔期。PNPNT1(三)频率与重现期的关系例如:当P=1%时,代入下式得T=100年,称为百年一遇洪水。2、当研究枯水问题时,重现期是指在很长时期(N年)内,出现小于某水文变量XP事件的平均重现间隔期。PNPNT1PPNNT11)1(二、理论频率曲线理论频率曲线:是指用数学方程式表示的频率曲线。根据经验,与水文资料配合较好的线型是皮尔逊Ⅲ型曲线。皮Ⅲ型频率密度曲线是一条一端有限、一端无限的不对称单峰正偏曲线。皮Ⅲ型频率密度曲线示意图皮Ⅲ型频率密度曲线的密度函数)21(;2;4—,,—)()()()(020)(100svsvaxCCxaCCxCaea

1 / 92
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功