POSC数据模型与我国石油工业数据标准化袁满yuanman@263.net(黑龙江省大庆市大庆石油学院计算机学院)1前言随着计算机的普及,尤其是随着计算机网络技术的发展,为石油工业的现代化管理提供了基础保证平台。这一基础平台为石油工业发展的信息化、管理的现代化提供了优越的环境,而信息化的前题是数据的标准化,只有实现了数据的标准化,才能实现石油工业中各企业间信息的共享,才能使管理现代化。只有对石油工业数据标准化,才能够实现数据交换的标准化。在世界上,石油工业数据的标准化,不只是我国一直在从事这方面的研究,国外一些著名的大公司与相关的组织也一直在从事这方面的研究。1990年,美国的BPExploration、ChevronCorporation、ElfAquitaine、MobileCopoartion及TexacoInc等五大石油公司联合发起并成立了POSC组织,该组织是目前最具权威的一个石油数据标准化组织。它定义的数据模型从1.0、2.0、2.1、2.2一直发展到今天的到3.0规范,在这个规范的发展中,使这个通用模型日渐成熟。整个模型的定义反映了石油勘探与开发中各种业务关系及技术关系。经过总结与精炼,我们给出了POSC数据模型核心精湛理念:“对象-活动-关联-特性”思想。无论是模型的建模理念,还是模型本身的组织思想对于我国石油数据标准化具有深远的理论与应用上的指意义。本文对POSC数据模型精湛理念进行了详细的剖析与论述,旨在使这种思想对于我国石油数据标准化能起到一定的指导作用。26W模型、对象及特性2.16W模型对象的概念是一个广义的概念,它可能包括具体对象,也可能包括抽象对象。对象是由活动产生的,例如一口井,它是通过钻井活动产生的一个对象。所以在这里我们提出与传统观念相反的概念,即认为数据是以活动为中心的,而不是以对象为中心的,对象间的作用产生了活动,而活动又产生了新的对象与特性。同样,特性的作用,通过研究认为:数据有两个主要的的作用,一个是用来描述对象本身的静态特性,即描述对象不变属性的那些特性,如一口井的编号、位置等信息,这部分特性以对象为中心;而另一部分是用来描述对象与活动相互作用而产生的过程特性,即对象的动态特性。以活动为中心,在活动中既产生了特性,又有可能产生一些新的对象。在电信领域有人提出了描述业务活动的5W模型,这一模型具有通用性,基于这一模型,我们提出将油田整个活动的生命周期中涉及的业务抽象为一个“6W”模型,即某个活动是由谁(Who)发起的、在什么时间(When)发起的、在哪里(Wherer)发起的、为什么(Why)要发起这个活动、在这个活动中都涉及到了哪些(Which)对象、这些对象的特性是什么(What)。通过这个“6W”过程的提问,可以将某一业务活动中涉及的相关信息完全抽取出来,见图1。实际上,在我们日常的生产与管理过程中,每天都在有目的地从事着各种有规规律的,甚至是重复的活动。这些活动既包括生产活动,又包括管理活动,而每一种具体的活动都有其描述的特性。我们认为对象是为活动服务,活动的过程不是目的,最终是通过这些活动来达到某种目的。所以活动本身象一个胶水,它暂时将一些相关对象粘合在一起,由这些对象的联合作用完成一个活动。2.2对象、活动、特性及关联关系在一个活动的生命周期中,一个活动可能会涉及到若干个对象,同时该活动也可能会产生一些新的对象;通常情况下,一个大的活动可能要由若干个子活动组成;特性是W活动的发起者以及涉及到的相关人或组织活动发起、持续及结束时间活动发起的位置也可能包括活动作用的地点活动发起的目的(活动的标识)活动中所涉及的对象,包括新产生的对象活动过程中产生的特性记录图 1在一个活动生命周期中涉及的6W模型对对象、活动、对象与对象间的临时关系、对象与活动间的临时关系及活动与活动间临时关系的描述。一个活动中涉及的特性包括:描述对象本身的静态特性一、对象与对象临时关系特性一、对象与活动临时关系特性以及活动与活动临时关系特性一。它们间的关系见图2。一个大的活动可能要分成几个子活动才能完成,而每个子活动与大活动具有相似性。每一个子活动可能又有几个子子活动组成,每个子子活动又会产生新的对象或特性。图3表示了一个活动通常是由n个子活动组成的,每一个子活动中可能会涉及一组对象,这些对象间相互作用可能会又产生一些新的对象。图3中的圆表示该子活动所涉及的对象,这些对象可能是原来就存在的,也可能是由该子活动产生的。从图3中还可以看出,一个活动通常是按照活动的进度表来进行的,每一个子活动进行时必须遵循该子活动的模板,随着时间的向前推移,这n个子活动在逐渐进行,直到每一个子活动完成了,这一大活动才被完成。对象、活动、特性及关联关系在数据建模中占有很重要的地位,下面我们对它们进行一一讨论。tSub_Activity1OOOOSub_ActivityiOOOOSub_ActivitynOOOO图 3一个活动通常是由若干个子活动组成的PropertyActivityObject活动涉及到对象活动可能会产生对象由特性来描述活动由活动产生特性由特性来描述对象在活动的作用下,对象产生的特性活动包含子活动图 2 对象、活动及特性间的关系活动间建立临时关系对象间建立临时关系对象与活动间建立临时关系3对象的分类定义3.1高层分类POSC将对象分成了两大类,一类是与技术有关的技术对象,另一类是与业务有关的业务对象,见图4。在油田勘探、开采等活动中涉及的对象相当繁多,其中的业务对象关系既包括了拓扑对象,又包括了文档规范对象;而拓扑对象又细化为可定位的对象与空间对象,这里的空间对象主要包括点、线、面、体等。可定位的对象既包括了由地震解释所获得的地质特征对象,同时又包括了对井筒中地质特征的解释对象,地球特征又包括若干个用来描述地球特征的对象。3.1材料对象的分类图5给出了POSC数据模型中关于材料的分类。这一材料对象模型包括了油田中所Object_of_InterestTechnical_ObjectBusiness_ObjectToplogical_ObjectDocument_SpecificationLocatable_ObjectSpatial_ObjectInterpreted_FeatureFacilityEarth_FeatureMaterial图4对象分类涉及到的各种材料对象。从图5可以看出,材料对象包括了生产中使用的设备、岩石材料及各种流体材料,同时将文档也归结到材料对象模型中去了。3.3通用设施对象分类从图4中还可以看出,在油田的整个生命周期中广泛使用的设施(Facility)属于可定位对象。该对象又是由若干个对象组成的,其中占有很大比例的对象是通用设施对象(General_Facility),它包括的对象见图6。这些设施主要是指地面上的一些设备,并不包括井筒中的一些设施。图5材料对象的分类在通用设施对象的分类中包含了油田生命周期中涉及到的各种地面设施。3.4井筒中设备对象的分类无论是生产井还是注入井或者是其它类型的井,为生产或测试的目的,在井筒中安装了许多的设备,如在机采井中安装了抽油杆、抽油泵、各种阀等。这些井下设备对象的分类见图7所示。图6通用设施对象分类3.5描述对象的属性通过上面的讨论可知,对象之所以存在千差万别,是因为不同类别的对象具有不同的属性,所以POSC的数据模型对每一个对象均定义了描述其特性的属性。例如同是属于材料(Material)对象中的岩石样本的岩芯(Core)与岩石薄片(Rock_Thin_Section),它们除了从它的父类岩石样本中继承了通用属性之外,还各自定义了它们相区分的属图7井筒中设施对象分类性,如Core定义了wellbore属性,以表明它是取自于哪一口井;而Rock_Thin_Section对象定义了sample_thickness属性,以反映该岩石薄片的厚度。不同的类型的属性描述对象不同方面的信息,如拓扑属性能够描述该对象与其它对象间的拓扑关系。在POSC数据模型中,从不同的角度定义对象的属性,以实现从不同的方面描述对象的目的。3.6关于对象分类的总结为描述石油勘探与开发中的各种活动,POSC定义了丰富的对象。在上文中,我们通过对对象分类的讨论可知,在POSC中,对各种类型的对象采用科学的方法进行了细致的分类。可以清清楚地看出在POSC数据建模中涉及的基本原子对象就是这样各种类别的对象。而POSC对这些对象进行了明确的定义,并对描述各种类别对象的属性进行了定义。所以在一个具体的活动中,实际参与的是一些对象的集合,这些对象既包括了技术对象,又包括了各种业务对象,是这些对象相互作用的结果才完成了某一活动。4活动的分类定义4.1活动的分类POSC在2.2版本中,对活动进行了分门别类的定义,即活动(Activity)定义了若干种子类实体,而到了3.0版本只定义了一个实体Activity。为了反映不同的活动类别,在Activity实体中通过属性kind来标识该活动属于哪一种类型。POSC将油田生命周期中的活动从大类上定义为:井筒活动、电缆地层测试活动、瞬时压力测试活动、油藏摸拟活动、定向勘测分析活动、泥浆分析活动、矿物表征活动、流体分析活动、地学解释活动、材料处理活动、生产活动、样本采集活动等。4.2描述活动的特性通过上面的讨论可知,活动也是由特性表征,为此我们将描述活动的特性总结在表1中。表1描述Activity的显示属性属性名称类型含义IdentifierStringElement活动标识DescriptionStringElement对活动的描述instance_create_dateTimestampElement实例创建时间instance_creatorStringElement活动的发起者last_updatedTimestampElement活动的最后更新时间last_updated_byStringElement活动的更新者SourceStringElement该活动数据的提供方activity_contextIntanceElement描述活动的环境信息Containg_activityInstanceElement所包含的子活动CostMoneyElement活动所花的费用start_timeTimestampElement活动开始的时间DurationQuantityElement活动持续的时间end_timeTimestampElement活动结束时间KindInstanceElement活动的类型ref_existence_kindInstanceElement活动正在进行或计划中ref_transient_periodInstanceElement活动的周期naming_systemInstanceElement活动命名所遵循的规则的定义机构除此之外,它定义了一些反映与该活动有关的一些逆属性,逆属性通常是该活动涉及的一些其它对象实例,通过逆属性的形式,POSC的数据模型将活动中涉及的一些相关对象捆绑在一起。例如,这里的属性involved_object属性是activity的一个逆属性,它是一个集合的类型,其中集合中的元素是若干对象实例,由该属性定义该活动中涉及的各种对象。5关联关系活动中会涉及若干个对象,这些对象之间或者是对象与活动之间等都有可能建立临时关系,例如在完井活动中一个完井段与某一井筒建立的临时关系以及在作业活动中主方与承包方间的临时关系或者是某一设备与另一个设备间的临时联结关系等。在POSC数据模型中,以活动为中心将相关的对象组织在一起,这些对象之间可能会建立临时关系,也可能建立永久关系。这些不同对象间的相互作用便导致了相应的活动。POSC中的关联关系由Association与Transient_Association来描述。6特性模型在POSC数据模型中,特性数据模型与对象、活动等捆绑在一起,用来描述对象的静态与动态特性。在POSC的Epicentre3.0版本中定义了395个特性实体,例如仅密度一项就定义了几