气象统计方法第一章气象资料及其表示方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

气象统计方法主讲:温娜南京信息工程大学大气科学学院2015年3月本课件主要参考南信大李丽平老师课件要求:1、掌握气象上常用的一些统计方法,运用这些方法进行资料分析,在此基础上作一些简单的气候预测等2、了解其它方法在业务和科研中的应用,对后期学习起引导作用气象统计方法:利用统计方法对气象资料样本进行分析来估计和推测总体的规律性,为气象预报提供依据。•课时安排–总学时:48学时(1-16周)–讲授为主,课堂练习•考核方式–平时成绩(出勤、课堂作业)–期末考试参考书目:1、李湘阁等《气象统计方法》,2、黄嘉佑著《气象统计分析与预报方法》,气象出版社,2004.33、施能著《气象统计预报》,气象出版社,2009.114、吴洪宝等著《气候变率诊断和预测方法》,气象出版社,2010.65、魏凤英著《现代气候统计诊断与预测技术》,气象出版社,2009.9教学内容第一章气象资料及其表示方法第二章气候稳定性检验第三章选择最大信息的预报因子第四章一元线性回归分析第五章多元线性回归分析第六章气候趋势分析第七章主分量分析第八章聚类分析第一章气象资料及其表示方法1.气象要素大气温度、压力、空气湿度、风向和风速、降水、云、雾、雷暴、辐射、能见度等还有土壤、陆面植被、海洋等监测要素一、气象资料(研究对象)2.气象监测全球监测系统ARGO计划气象监测意义:1.记录天气、气候的实际情况2.了解气候的基本状况3.分析研究气候变化规律4.气候预测(第一张天气图的诞生)拉萨站(29N,91E)气温观测数据江苏省(116-122E,30-36N)月平均气温数据(1958-2007)江苏省(116-122E,30-36N)月平均气温数据(1958-2007)气象中单个或多个要素可看成为统计学中单个或多个变量。二、气象资料的表示第一节单个要素的气象资料1、数据的表示:某要素x有n次观测值,其向量表达形式为或者n样本容量时间序列概念数据是随时间变化的序列,习惯称为时间序列。例如:取某要素月平均值的n年资料几何意义:(1)n维空间中的一个点(2)一维空间(单坐标)中的n个点举例:1.某站点1958至2007年的气温2.某站点1960至2010年一月份的气温3.某站点某时段冬季/夏季降水2、数据资料的统计特征要素样本中资料分布的特点---用一些统计量表征。1)平均值含义:平均值是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。平均值概念在气象上的应用:气象上的月平均气温、年平均气温及某要素多年平均值就是这种统计量。例如:某地气候状态(对于逐月资料,一般分别求各月多年的平均值,所以会有12个月平均值场;逐日资料也是类似)。气象研究中,不同时间分辨率气象资料的使用(逐日资料、月资料、年资料等)举例:江苏气候?江苏省1958-2007年月平均气温江苏省各月气温平均值(气候态)江苏省1958-2007年冬季月平均气温2)距平•含义:反映数据偏离平均值的状况,也是通常所说的异常。•距平序列:单要素样本中每个样本资料点的距平值组成的序列称为距平序列,也可以记为距平向量。气象上的应用:中心化的概念:把资料处理为距平的方法叫中心化。气象上常用距平值代替原样本中的资料值作为研究对象。中心化的必要性:因为气象要素的年变化周期影响很大,各月的平均值不一样,为了使之能在同一水平下比较,常使用距平值(比如之前的举例)。特性:距平值的平均值为0,使用方便;直接作为预报值,比较直观(偏高/偏低)。举例:某地气温的变化情况?(气温偏高、偏低是相对于它的平均值而言)江苏省冬季气温的异常(1958-2007)如何正确计算异常场?不可取江苏省气温异常(1958-2007)3)方差和均方差(标准差)对气象要素x,资料长度n,其表达式:含义:是均方差(标准差),描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),是方差。方差向量表示形式:气象上的应用:1)如果12月份气温标准差比1月份大,反映了12月份气温随时间变化幅度比1月大。2)对于同一个月(例如12月),如果南京气温的标准差比拉萨小,表明拉萨冬季气温的变化幅度比较大。(内陆日变化较沿海大,这个日变化大小的比较使用的是标准差的比较)江苏省各月气温标准差3)均方差小的要素预报比大的困难还是容易?原因?4)变量减去某常数后均方差相同。5)标准差与变量值同量纲,一般用标准差表示变量取值变化的大小。数据的标准化对气象要素x,资料长度n,其表达式:特征:1)标准化变量的平均值为0。2)标准化变量的方差为1。12,,tztxxxxtnS,为何要进行标准化?各要素单位不同、平均值和标准差也不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量。江苏省气温异常及其标准化降水距平百分率距平/平均值*100%1)计算降水距平,即观测值减去平均值2)1步骤所得结果除以该平均值,乘以100%,即为降水距平百分比注意:当观测值序列时间比较长,超过30年,可以选择1980-2009的平均值,作为步骤1中的平均值4)变率和变差系数1)意义:说明变量值变化的大小。2)变率绝对变率:距平绝对值的平均。相对变率:绝对变率与平均值之比11naiiVxxnarVVx3)变差系数标准差与平均值之比(%)表示变量的相对变化,2111nxpiiSVxxxxn(-)注意:绝对变率和标准差的数量级与变量平均值的量级有关。有些同类型变量,彼此之间平均值差别大,若要比较它们的变化性用绝对变率和标准差不恰当,应当利用相对变率或变差系数。5)频率分布累积频率概念的引入:平均值和均方差相同,但取值很大区别,区别其特征,就需要引入新的统计量------累积频率。累积频率:变量小于某上限的次数与总次数之比。(样本特征—直方图)•总体(母体):统计分析对象的全体。•样本:总体中的一部分。三、总体和样本理解与应用:总体的特征是客观存在的样本的特征随样本而变,与其有关的变量均称为随机变量,如平均值、均方差等选取有代表性的样本很重要样本量n=30,根据数理统计中的大数定理推断得到。气象上的总体指无限总体,一组气象资料就是无限总体的样本。总体与样本关系的相对性。大数定律•大数定律又称大数法则、大数率。在一个随机事件中,随着试验次数的增加,事件发生的频率趋于一个稳定值;同时,在对物理量的测量实践中,大量测定值的算术平均也具有稳定性。在数理统计中,根据贝努利定理\辛钦定理:当n很大时,算术平均值接近数学期望;频率以概率收敛于事件的概率。1)分布函数无限总体的累积频率称为概率密度函数,其最常见的形式是正态分布和分别是总体平均值(期望)和标准差,可以用样本平均值和均方差去估计。,xdxxfxPxF)()()()(xf222)(21)(xexf正态分布曲线标准化变量的平均值为0、方差为1。特点:1)标准化正态分布随机变量的绝对值大于2.58(1.96)的概率仅为0.01(0.05)2)不同要素变量作图3)标准化变量值的取值范围(+/-3之间),大于3的概率仅为0.0027世界气象组织(WMO)旱涝年确定标准:距平达到或者大于2倍均方差,出现概率不到5%年份。江苏省月平均气温标准化数据P(|T|=2)=0.0483;P(|T|=3)=0.005江苏省冬季气温数据分布图2)正态分布的统计检验•大多数气候诊断方法和预测模型是在气候变量呈正态分布假定前提下进行的,所以对气候变量是否呈正态分布形态的检验是十分必要的。正态分布检验不仅可以判断原始变量是否遵从正态分布,还可以检验那些原本不遵从正态分布,但经过数学变换后的变量是否已成为正态分布形式。(1)概念峰度系数与偏度系数是用来衡量随机变量概率密度分布曲线形状的数字特征,描述了气候变量的分布特征。偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。峰度系数:表征曲线分布形态顶峰的凸平度(即渐进于横轴的陡度)。(2)标准偏度系数和峰度系数的计算公式为:其中,和s分别为样本均值和标准差。xg2=g1=偏度系数:峰度系数:标准偏度系数的意义测量数据分布的不对称性情况,刻画以平均值为中心的偏向情况,g10,表示负偏,即均值在峰值的左边;g10,表示正偏,即均值在峰值的右边;g1=0,表示对称分布标准峰度系数的意义测量分布图像坡度的缓急程度g20,表明图形坡度平缓g2=0,表明图形坡度刚好g20,表明图形坡度偏陡若g1=0,g2=0时,表明研究变量为理想的正态分布变量(3)显著性检验(4)资料的正态化1、正态化的必要性各类统计预报模型和统计检验方法(F\t\u\检验)要求资料是符合正态分布。年\月平均气温\气压\多雨地区的月降水量符合!日降水和少雨地区月降水通常偏态。旬\候降水不一定!22、资料正态化处理方法1.立方根或四次方根;2.双曲正切转换(纠正课本公式)--旬降水;3.化为有序数后的正态化转换(标准化和正态化)。江苏省全年月降水数据分布图*也可以理解为同一要素多个格点(站点)的资料,下面慢慢体会。第二节多要素的气象资料一、数据矩阵多个气象要素的样本如何表示?---矩阵。设有m个气象要素,每个要素有n次观测值,则数据矩阵为:(2.1)11121212221212()mmnmmnnnmxxxxxxxxxXxxx第t个样本的资料向量为nt,,2,1(2.2)123()tttmtxxxxtx两个方面来研究问题()“R型分析”:研究不同要素或变量(如同一要素不同格点之间)的关系。(列)“Q型分析”:研究样本之间的关系(行)。二、数据的两种空间表示(几何意义)1、n维空间中的m个点(列)m个变量(格点、站点)确定了n维空间中的m个点;用来研究变量(或者不同格点、站点)之间的关系。------相关关系,如两个变量之间的相关系数2、m维空间中的n个点(行)--空间点聚图一个样本对应m维空间中的一个点;分析样本之间的关系时用到,如寻找相似个例。三、均值向量m个变量的样本平均值组成的向量。m维空间中的n个点的重心(各部分受到的重力作用集中于一点,这一点就是重心)。12()mxxxxntitixn11xmi,,2,1(2.3)多年平均1月气温(1971~2010年)多年平均7月气温(1971~2010年)多年平均1月降水量(1971~2010年)多年平均7月降水量(1971~2010年)四、距平向量1112121222d1d2dm12()dddmdddmddndndnmxxxxxxxxxXxxx(1,2,,1,2,)dijijjxxxinjm,其表达式为:五、协方差和协方差矩阵1.协方差衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系),另外一个统计量叫相关系数(以后讲解)。表达式:)()(11jjtntiitijxxxxnsjintjtitxxxxn11mji,2,1,(2.4)距平的内积协方差气象意义的进一步理解:1)反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。两变量关系越密切,其协方差的绝对值越大,如理解(气温为例):前冬气温负距平(冷)、后冬正距平(暖)---协方差负值----反相关前冬气温正距平(暖)、后冬正距平(暖)----协方差正值----正相关2)变量自身的协方差就是方差。距平的乘积X1与x2的距平符号相同率高,有相同的变化趋势,x2与x3的距平符号相反率高,有相反的变化趋势;两组变量均有良好的相关关系。问题:协方差带单位,不同要素之间不好比较,以后学习相关系数可解决这个问题。-30-20-1001020304050051015系列1系列2系列32.协方差矩阵m阶对称矩阵,对角线元素是第i个变量的方差,撇号代表距平。)(ijsSmji,2,1,(2.6)1TddnXXppnnnppppppnppp

1 / 125
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功