基于业务模型的油气勘探开发数据标准体系设计肖波1,2,文必龙3,邵庆3(1.成都理工大学能源学院,四川成都610059;2.中国石油化工股份有限公司信息系统管理部,北京100005;3.东北石油大学计算机与信息技术学院,黑龙江大庆163318)摘要:石油工业信息标准中,数据技术标准占很大的比例,但大量的数据技术标准之间缺少协调一致的机制。采用综合标准化方法,提出由业务层和系统层标准构成的石油数据标准体系架构。在业务层,以业务模型为核心集成业务层的数据标准;在系统层,按数据的生命周期,设计数据的采集、传输、存储、管理、服务和应用等系列标准。采用模型驱动的思想,实现业务层与系统层之间标准的衔接,并用元模型对系统层不同数据标准进行统一描述、统一管理,形成一个可高度集成的石油数据技术标准体系。关键词:综合标准体;业务模型;数据标准;模型驱动;元模型中图法分类号:TP311文献标识码:A0引言在石油工业信息标准中,数据标准占绝大多数。以石油行业标准为例,当前石油信息行业标准共发布37项标准,其中数据类标准为29项。随着数字油田、智能油田建设的深入,系统规划或设计油气勘探开发数据标准体系成为石油工业信息标准化方法研究的重点。王瑞林[1]提出以业务流、数据流为主线索,进行调研和分析的石油天然气勘探开发数据标准体系研究方法,梳理源头数据和代码体系,设计数据元和元数据、分类与编码、源点信息采集、业务模型、图形格式、数据交换标准等标准分类。赵丰年等[2]结合石油勘探开发数据采集、管理与服务,从技术和管理方面及数据元、元数据和管理标准3个维度建立石油勘探开发数据标准模型。王辉等[3]提出FOL数据标准体系,从数据标准内容的扩展性方面,按照固定(Fixed)、开放(Open)和本地化(Local)3个层级进行油田数据标准体系设计,有效解决数据标准的适用性问题。Energistics从数据操作角度提出数据模型、数据存取、数据交换、数据服务等系列石油数据标准[4].为了描述数据标准,Zcollection定义资源集合组织、检索开发框架,该框架有良好的框架结构和可扩展性,能够很好地描述集合、对象,以及它们之间关系的元数据[5-6]。这些研究虽然从各自的角度提出定义和管理数据标准化框架,但过于单一,难以形成系统化的、严谨的体系架构。综合标准化方法具有综合性、成套性、整体协调性等特点[7-8],对系统化地设计数据标准体系具有参考价值。笔者在总结中国石化数据标准制订过程的技术和经验基础上,采用综合标准化方法的思想,提出基于业务模型的数据标准体系,设计数据标准综合体和油气勘探开发数据标准框架;提出油气勘探开发的业务模型,将数据标准的各个内容集成到业务模型的各个单元;给出面向数据集成的模型驱动架构,实现业务层与系统层之间标准的衔接。1基于综合标准化的数据标准架构油田信息系统建设是一个复杂的系统工程,石油数据标准体系应该与油田信息系统架构保持一致,标准之间达到高度协调,因此,石油数据标准体系应该有一套成熟的方法。在传统的标准化中,特别是在政府直接管理标准化时,由于受上下机构的影响,存在“多而散”收稿日期:2014-05-23;编辑:任志平;刘丽丽基金项目:国家科技重大专项(2011ZX05023-005-012)作者简介:肖波(1963-),男,博士,高级工程师,主要从事油田企业信息技术方面的研究。的特点,要求必须采用新的方法——综合标准化。综合标准化是为了达到确定的目标,运用系统分析方法,建立标准综合体,并贯彻实施的标准化活动[7-8]。它建立标准综合体的目的是为了实现总体优化的目标。标准综合体的构建可以采用两种方式:一种按系统组成结构,如产品构成、数据体系结构;另一种是系统的活动流程,如生产流程、数据流程。按照油气勘探开发数据体系结构建立的勘探开发数据标准综合体见图1,在业务层按专业划分数据标准,在系统层按不同层级的数据库进行划分数据标准。从数据生命周期角度建立勘探开发数据标准综合体(见图2),在业务层按数据表现形式定义数据标准,在系统层按数据在系统内部存在方式定义数据标准。综合图1和图2的标准综合体,得到勘探开发数据标准框架(见图3)。图1基于数据体系结构的数据标准综合体Fig.1Thedatastandard-complexbasedondataarchitecture图2基于数据生命周期的数据标准综合体Fig.2Thedatastandard-complexbasedondatalifecycle两个标准综合体将数据标准分为业务层和系统层。数据采集和应用是联接业务层和系统层的两个关键接口。数据标准综合体的结构存在问题:(1)业务层面的各数据标准的关联;(2)业务层与系统层之间的标准的衔接;(3)系统层的各数据标准之间的集成。这些问题是实现勘探开发数据标准之间相互协调、集成为一个有机整体的关键。因此,提出油气勘探开发业务模型和数据集成的模型驱动架构,其中业务模型用来集成业务层的数据标准;模型驱动架构用来集成业务层与系统层,并对系统层数据标准进行集成化管理。业务层资料管理规程分析指标体系用户数据视图数据图形标准数据报表体系采集传输/交换存储管理服务数据采集规程数据交换标准数据模型标准数据管理标准数据服务标准系统层元数据标准数据生命周期(过程)管理数据提交数据分析与处理数据查询业务层源头数据库中心数据库项目数据库物化探数据模型标准系统层井筒工程综合研究油气生产地面工程分析化验业务模型标准图3勘探开发数据标准框架Fig.3Thedatastandardframeworkforpetroleumexplorationandproduction2油气勘探开发业务模型业务模型(BusinessModel)是一种通过定义组成活动及活动之间逻辑关系描述企业经营生产过程的模型。油气勘探开发业务建模是将石油勘探开发生命周期中涉及的业务抽象为一个完整的业务功能结构,在系统地、本质地、概括地抽象勘探开发功能结构的同时,还要建立每一个业务功能相关的数据、知识、软件等的关联关系[9]。业务分析与建模过程从形式上可分为4个阶段:一是业务领域划分;二是分业务领域建模;三是业务模型集成;四是业务模型标准化。业务模型采用“业务域—业务分类—业务活动”三层结构(见图4)。由图4可以看出,将油气勘探开发所有业务划分为多个业务域,每个业务域建立多级业务分类,每个分类中定义一个或多项最基本的业务活动。图4油气勘探开发业务模型的体系构架Fig.4Thearchitectureofbusinessmodelforpetroleumexplorationandproduction业务域(BusinessDomain)是对企业中的一些主要业务活动领域的抽象,而不是现有机构部门的照搬。对油田业务域的划分可以根据某一主题进行。业务领域的划分原则:(1)根据专业划分业务领域;(2)根据油气田勘探、开发生命周期划分业务领域;(3)根据油气田勘探、开发管理阶段划分管理业务域。业务领域的划分参照三种原则,尽量符合油气田勘探、开发管理的约定俗成的管理习惯,做到不同业务域间的业务不重复,并保证能覆盖所有油气勘探开发业务模型物化探井筒工程综合研究油气生产地面工程分析化验油气藏工程勘探地质研究开发方案设计开发地质研究规划与部署油藏工程方案设计地面工程方案设计采油工程方案设计经济评价方案设计油层保护方案设计针对性油层保护技术研究油层保护室内评价实验研究油层伤害因素分析油层保护投资概算业务域业务分类业务活动产生和使用的数据产生和使用的知识用到的软件参与的的人员使用的工具和材料业务单元业务模型标准资料管理规程分析指标体系用户数据视图数据图形标准数据报表体系数据采集规程数据交换标准数据模型标准数据管理标准数据服务标准元数据标准油气勘探开发数据标准业务层标准系统层标准的勘探、开发业务。因此,将油气勘探开发业务领域划分为“物化探”、“井筒工程”、“分析化验”、“综合研究”、“油气生产”、“地面工程”等六大业务领域。业务是由一系列业务活动组成的,对业务活动的描述按照“6W”模式进行[9],即活动是由谁(Who)发起的、在什么时间(When)发起的、在哪里(Where)发起的、为什么(Why)要发起这个活动、在这个活动中都涉及到哪些(Which)对象、这些对象的特性是什么(What)。采用业务单元定义参与业务活动的基本元素及元素之间的关系。一个业务单元包括八类元素:1个业务活动、该活动作用的1个业务对象、实施该活动的组织机构、1组结果对象(输出)、1组参与对象(输入)、业务规则、相关对象的特性和对象之间的关系(见图5)。业务单元中,“特性”定义业务活动需要的数据、业务活动相关的知识,是数据规划梳理的重点;“参与对象”包括各种人员、软件、数据、设施、材料和方法等;“作用对象”包括区块、油藏、井、层位、油田和企业等;“结果对象”可以是油井等油田实物对象,也可以是文档、方法和研究成果等技术性对象。图5业务单元的结构Fig.5Thestructureofbusinessunit基于“6W”的业务模型的建模通过在统一的业务域分类架构下,对单一业务活动的业务单元进行描述,没有进行专门的业务流程梳理;由于业务单位中描述业务活动参与对象与结果对象,即定义活动的输入与输出,以这些对象为中介,很容易自动形成业务流、数据流和知识流等流程。业务活动与数据之间的关系可以用“CUR”矩阵描述。矩阵中,行对应业务活动,列对应数据元。如果业务活动中创建某一项数据,则行列对应的值标识为“C”(Create);如果业务活动对数据进行更新,则标识为“U”(Update);如果业务活动引用某一项数据,则标识为“R”(Read)。对“CUR”矩阵,可以检查某一数据是否有惟一的创建源头,保证数据源头的惟一性。根据CUR关系,可以自动形成数据流。除了数据外,业务活动还可与知识、软件等关联;通过这些关联,形成以业务模型为基础的企业标准化的数据管理、知识管理和软件服务等信息技术标准化体系。这里的业务模型是一种逻辑模型,与现实中的油气勘探开发业务并不是一一对应的。一个实际的油气勘探开发业务通常由一个或多个业务活动组成,因此,可以将业务模型看作是一个标准化的业务活动组件库。在将实际工作中的业务与业务模型中的多个业务活动对应起来时,所需要的数据、报表、成果、软件和方法可自动推理出来,快速实现数据服务、知识推送和应用激活等业务支持。3面向数据集成的模型驱动架构活动作用对象参与对象活动执行者结果对象业务规则关联特性所谓模型驱动是指为实现系统的目标,将系统分为若干个层级,在每一个层级上通过模型描述该层级上的实体,建立不同层级上模型之间的映射关系。根据模型间的映射关系,人工或计算机可以完成从源模型到目标模型的变换,从而达到系统运行的目标[10]。在数据的生命周期中,每一个环节都可以用相应的模型进行描述,如数据采集模板、数据存储模型、数据交换模型等,解决不同模型之间的变换,实现数据的流转,从而解决勘探开发业务中的问题。为了实现不同模型之间的转换,MOF定义4层元数据体系结构,分别用M0~M3表示:M0为信息层,M1为模型层,M2为元模型层,M3为元元模型层[11-12]。按照模型驱动理论,设计面向油气勘探开发数据集成的模型体系(见图6)。图6油气勘探开发数据集成的模型体系Fig.6Themodelarchitectureofdataintegrationforpetroleumexplorationandproduction由图6可以看出,M0指存储在各类数据库中的具体数据,包括结构化数据和非结构化数据。M1指各种模型。除数据采集规程、数据管理规程和资料管理规程等规范人的操作行为的标准外,其他的数据标准可以采用模型进行定义。业务模型中,与业务单元关联的每一种模型都可表达为对数据的需求,表达成用户数据视图。在用户数据视图和逻辑数据模型之间可建立映射关系,不同结构的物理数据模型之间也可建立映射关系,映射关系即模型映射字典。用投影描述逻辑数据模型与物理数据模型之间的转换,各种模型转换构成从业务到