ICS13.060.99CCSM746团体标准T/ACEF123-2023河湖水环境数据同化技术指南Technicalguideformultisourcedataassimilationofriverandlakewaterenvironment2023-12-20发布2024-01-01实施中华环保联合会发布T/ACEF123-2023I目次前言................................................................................................................................................II1范围...............................................................................................................................................12规范性引用文件..........................................................................................................................13术语和定义..................................................................................................................................14数据同化算法..............................................................................................................................35数据同化类型..............................................................................................................................36数据同化技术流程......................................................................................................................4附录A(资料性)数据同化算法.............................................................................................8T/ACEF123-2023II前言本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。本文件为首次发布。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中华环保联合会提出并归口。本文件主编单位:中国水利水电科学研究院、北京爱特拉斯信息科技有限公司。本文件参编单位:长江水利委员会水文局、江西省水务水科学检测研发有限公司、成都致用物联网技术有限公司、云南农业大学、西安理工大学、中华环保联合会水环境治理专业委员会。本文件主要起草人:杜彦良、刘晓波、张士杰、郭梦京、吴佳鹏、王世岩、徐德龙、钱宝、高占平、许莉、许高平、温洁、包宇飞、刘畅、王亮、韩祯、赵仕霖、刘伟、马旭、黄智华、曹鹏飞、李晓慧、江涛、王建雄、张玉超、罗春辉、刘愿军、李伟。T/ACEF123-20231河湖水环境数据同化技术指南1范围本文件规定了河湖数据同化算法选择、同化类型、同化流程和数据同化效果评估等技术内容。本文件适用于河湖水环境监测数据处理,边界及初始数据驱动的水环境数值模型驱动、河湖水环境预警、预报,为提高数值模型的预测精度。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB8566计算机软件开发规范SL219水环境监测规范HJ630环境监测质量管理技术导则HJ212污染物在线监控(监测)系统数据传输标准HJ355水污染源在线监测系统(CODCr、NH3-N等)运行技术规范3术语和定义下列术语和定义适用于本文件。3.1监测及数据采集Monitoringanddatacollection基于监测站网、物联网等,进行多源、全天候数据数据采集,实现数据实时、安全的传输和存储,进行高效的数据处理,提供多种场景的数据搜索,及延展的云处理等功能。3.2数据融合DatafusionT/ACEF123-20232在河湖水环境监测中,将空间、时间上频次及密度不一致的人工监测、自动传感监测、卫星遥感等多途径来源的水环境数据和信息加以联合、相关及组合的处理过程。3.3数据同化Dataassimilation在考虑数据时空分布以及观测场、初始场或背景场误差的基础上,在数值模型的动态运行过程中融合新的观测数据的方法。它是在过程模型的动态框架内,通过数据同化算法不断融合时空上离散分布的不同来源和不同分辨率的直接或间接观测信息来自动调整模型轨迹,以改善动态模型状态的估计精度,提高模型预测能力。3.4数值模型Numericalmodel根据物质守恒、生化反应、物质转化等原理及过程,用数学语言和方法描述河湖物质在水体中发生的物理、化学、生物、化学和生态学诸方面的变化,包括在水体中发生的混合和输运、在时间和空间上的迁移转化、以及各因素相互作用关系的数学方程及求解。3.5初始条件Initialcondition初始条件是描述整个模型初始状态的数学表达,模型驱动后初始条件被新状态所替代,但初始条件需要接近模型计算的真实状态,确保模型的平稳驱动。3.6边界条件Boundarycondition边界条件是指模型在求解区域边界上的变量随时间和地点的变化规律,模型边界条件可以为给定数值边界、梯度边界、函数边界、自由边界等。3.7模型参数Modelparameter数值模型运行计算需要输入边界条件、初始条件、模型计算参数等,进行方程求解,受观测条件描述过程公式等的限制,这几类数据的输入均可产生不确定性,导致模型计算结果的偏差。3.8不确定性输入Uncertaintyinput数值模型运行计算需要输入边界条件、初始条件、模型计算参数等,进行方程求解,受观测条件描述过程公式等的限制,这几类数据的输入均可产生不确定性,导致模型计算结果的偏差。3.9T/ACEF123-20233误差分析(ErrorAnalysis)误差分析是对模型预测结果可能存在的错误或不确定性的种类和数量的研究,分析模型结果与观测场的产生的偏移程度,以量化模型计算精度和数据同化效果。4数据同化算法数据同化算法可划分为以下类型:——最优插值法(Optimalinterpolation,OI)——粒子滤波算法(ParticleFilter,PF)——卡尔曼滤波算法(KalmanFilter,KF)——集合卡尔曼滤波算法(EnsembleKalmanFilter,EnKF)——变分算法(VariationalAlgorithm,VAR)——层次贝叶斯方法(HierarchicalBayesianMethod,HBM)——鲁棒滤波方法(HFilter,HF)按数据同化算法与模型之间的关联机制,可将数据同化算法可分为顺序数据同化算法和连续数据同化算法两大类。根据水环境数值模型求解的变量的时空特性,以及观测数据类型确定采用不同的同化算法。采用连续数据同化算法,根据观测数据时间确定同化的时间T,利用该同化时间的所有观测数据和模型状态变量值进行最优估计,通过迭代而不断调整模型初始场,最终将模型轨迹拟合到在同化时间上获取的所有观测场上,该类算法有三维变分、四维变分算法、集合卡尔曼滤波算法等。采用顺序数据同化算法又称滤波算法,包括预测和更新两个过程。预测过程根据j时刻状态变量的值初始化模型,不断向前计算,直到有新的观测值输入,预测j+1时刻模型的状态变量值;更新过程则是对当前j+1时刻的观测值和模型状态预测值进行加权,得到当前时刻状态最优估计值。根据当前j+1时刻的状态值对模型重新初始化,重复上述预测和更新两个步骤,直到完成所有观测数据时刻的状态预测和更新,常见的算法有集合卡尔曼滤波和粒子滤波算法等。5数据同化类型模型运算时,由于不确定性的输入,同化类型可分以下为三种类型T/ACEF123-20234——初始场的同化:当模型计算值与实测值产生偏差,采用实测值对计算场进行同化,带入下随后的计算中,纠正模型计算的整体误差。对初始场进行同化时,应选择三维变分和四维变分算法、层次贝叶斯算法等相应同化算法。——边界条件的同化:为克服边界输入的不确定性,确定需要同化的输入边界条件,可以是单一边界,或是多边界,采用同化技术对边界条件序列同化,使得计算结果逼近观测值,提高计算精度。对边界条件进行同化时,选择集合卡尔曼滤波和粒子滤波算法等相应算法。——模型参数的同化:水环境模型通常计算参数众多,多参数带来参数的不确定性,对相关敏感性参数进行同化,该方法体现参数在不同时间段上的变化。对参数进行同化也需选择适当的同化算法,通常有集合卡尔曼滤波和粒子滤波算法等相应算法。通过数值模型输入的不确定特征,选择某种同化类型并实施。6数据同化技术流程6.1数据收集整理首先,根据所建立的水环境数学模型,收集整理需要驱动模型计算的数据过程或空间分布场,包括地形数据、气象数据、水文数据、水质指标的常规监测数据、自动监测站数据、卫星遥感解译等数据等,尽量减小模型输入的不确定性。其次,收集模型计算区域中状态变量的观测数据,用于数据同化。应对于不同来源和类别的数据,按照空间和时间的分布密度、间隔时段等差异特点进行归类整理。6.2数据融合尽可能采用自动化监测设备等自动数据采集的数据,从数据的一致性上做好数据的统一校核和整理分析,通过融合算法,如贝叶斯算法、最小二乘算法等,去除异常及故障数据,消除冗余,结合人工监测降低传感器系统偏差,保证数据准确性。通过数据融合将多源数据进行科学、合理的综合处理,提高状态监测精度和数据诊断智能化程度,真实反映水环境状态及演变。6.3数值模型构建根据取得资料和数据,及研究或预测需求,确定模型预测的状态变量,了解变量之间的相互影响与变化规律,选择可描述变量之间关系,反映现象的基本特征的过程模型,基本框T/ACEF123-20235架由水动力模型耦合水温模型、水质模型等构成,设定研究时间段,和研究区域,状态变量的初始场,变量之间相互作用或影响的参数德国,以及输入驱动模型的边界过程等,开始模型的计算。模型参数值确定可采用经验公式、室内实验或数学方法等,参数代入模型后能较好地变量之间的反应作用关系及过程,模型计算结果能较好重现研究区域水环境变化,基本符合观测数据。6.4数据同化数值模型可预测多个变量的变化,包括水动力变量(水位、流量、流速等)、水温、水质指标的状态变量等。首先,确定模型输出的需要同化的预测变量,变量可以是一个也可是多个,同化变量需要在模型预测时间段内,有相应的观测值。在模型计算的时间轴上,判断是否有需要同化的模型求解变量的观测值,当该时段存在观测值时,调用同化算法进行同化计算,更新变量,或相应的模型参数、输入条件等,该时刻的同化结束后,采用更新后的数据继续计算,模型行进中,进行观测值判断,确定是否启动同化计算,直到模型计算结束。通过同化技术可实现单一变量的同化,也可对多变量进行同时同化。在具体的流程见图6-1。图6-1.数据同化流程7.数据同化效果评估T/ACEF123-20236河湖水环境数据