1浅析联邦数据库系统陈霞(2007213144)(华中师范大学物理科学与技术学院武汉430079)摘要本文简单介绍多数据库环境下异体结构的联邦数据库的基本概念,使用方法和相关的一些应用实例。关键词联邦数据库特征应用实例一.前言在当今信息社会中,信息处理方式正由集中式向分布式过渡,由于计算机和通信技术的迅速发展,人们获取信息时不仅从单一数据源获取,更多的时候需要从相互独立运行的大型数据库中获取信息。然而,在不同企业、机构,不同的组织和部门使用不同数据库管理系统来存储和搜索其重要数据,这几乎是不可避免的。有时只有将这些系统中的信息组合起来,人们才会认识到这些系统所包含数据的整体价值。通过建立联邦数据库,可以使客户机能够访问和集成数据,能够专门计算各种关系型和非关系型数据源。本文主要简单介绍联邦数据库的特征和基本概念,以及未来趋势,列出一些应用例子并对进行简单分析。二.联邦数据库的特征和分类(一)联邦数据库的特征Hammer和Mcleod(1979)及Heimligner和Mcleod(1985)先后提出了联邦数据库的基本概念,将各自独立的数据库集成为一个相互协作的系统,使之在用户看来就像一个数据库系统。所谓联邦数据库系统(FDBS)是一个彼此协作却又相互独立的单元数据库(CDBS)的集合,它将单元数据库系统按不同程度进行集成,对该系统整体提供控制和协同操作的软件叫做联邦数据库管理系统(FDBMS),一个单元数据库可以加入若干个联邦系统,每个单元数据库系统的DBMS可以是集中式的,也可以是分布式的,或者是另外一个FDBMS.联邦数据库最重要的特征就是:一个单元数据库系统在继续本地操作的同时可以参加联邦系统的活动。单元DBS的集成可以由联邦系统的用户来管理,也可以由联邦系统的管理员和单元DBS的管理员来共同管理,整体系统集成的程度取决于联邦系统用户的要求,加入联邦系统并共享联邦系统数据库的单元DBS管理员的要求[1]。包含多种数据库的FDBS,其特征还体现在分布,异构性,自治,透明性这四个方面。⑴分布数据可按多种方式分布在不同的数据库中,这些数据库可通过通信系统相互连接。⑵异构性联邦数据库系统的异构性主要由两个方面导致的一个是数据库管理系统的不同还一个是数据的语义不同数据库管理系统导致的异构主要是数据模型和数据表达的不同语义异构则难以识别主要是当存在对内容解释或对相同或相关数据的使用等存在不一致时便产生语义异构[2]。⑶自治性2按照参考文献[3]中的介绍Veijalainen和Popescu-Zeletin给出了3种自治类型:设计自治、通讯自治和执行自治。①设计自治设计自治是指成员数据库有能力选择自己任一方面的设计,包括:a)所管理的数据(theuniverseofdiscourse,即论域)b)数据的表现形式与命名(数据模型,查询语言等);c)数据的语义解释;d)约束和串行化条件;e)并发控制算法;f)文件和记录结构;g)成员数据库间数据的关联和共享。②通讯自治通讯自治是指成员数据库管理系统可以决定是否和其它成员数据库管理系统通讯,通讯自治的成员数据库系统可以决定何时以及如何对来自其它成员数据库管理系统的请求进行回应。③执行自治执行自治是指成员数据库管理系统可以不受外来操作的影响,来执行本地操作(由成员数据库管理系统的本地用户提交的命令或事务)以及决定执行外来操作(由其它成员数据库管理系统或联邦数据库管理系统提交的操作)的顺序。所以,联邦数据库管理系统不能对一个执行自治的成员数据库管理系统强加命令执行的顺序。执行自治意味着一个成员数据库管理系统可以忽略任何不满足本地约束关系的操作以及因参与联邦数据库系统但逻辑上不受影响的本地操作。此外,成员数据库系统不需要将外部操作的执行顺序以及相对于本地操作的外部操作顺序通知给联邦数据库系统。在操作上,成员数据库管理系统的执行自治就是以本地操作同样的方式来对待外部操作。⑷透明性联邦数据库系统是透明的,它对用户掩盖了成员DBS的差异、特质和实现,使一组成员数据库系统对用户而言像是一个系统。(二)联邦数据库的分类基于成员数据库系统的自治性多数据库系统可分成两类非联邦数据库系统和联邦数据库系统。分类如下[4]:3三.联邦数据库系统的操作IBM联邦数据库的体系结构如下:应用程序可以使用任何受支持的接口(包括ODBC、JDBC或Web服务客户机)与联邦服务器交互。联邦服务器通过称为包装器的软件模块与数据源进行通信。四.联邦数据库的应用实例Versatil是国内东南大学研制的一个基于CORBA的分布式异构数据源集成系统原型。它使用对象集成模型(OIM)作为数据集成的公共模型,提出了一种基于对象代数的查询语言OSQL,同时引入模板和动态字典的概念统一描述各种异构数据源的模式,不通过扫描数据库,而是利用局部动态字典的模板操作构造集成系统全局动态字典,为查询的分解和优化奠定了基础[5]。4IBM2003年5月发布的DB2InformationIntegrator是联邦数据库走向应用的佼佼者,它依托IBM雄厚的技术实力和前期投入,使客户可以从多种分散的数据源和内容源中归纳出一种共用的数据模型,并像对待一个信息源那样对它们进行访问和处理,主要以读访问方式使用。DB2InformationIntegrator具有联邦、搜索、高速缓存、转换和复制数据的功能。作为一种联邦数据服务器,它能够提供对DB2UniversalDatabase(包括DB2Informix产品)以及Microsoft、Oracle、Sybase和Teradata数据库的即时访问。此外,它还可以访问WebSphereMQ消息、XML文档、网络服务、MicrosoftExcel、平面文件、ODBC或OLEDB源以及生命科学领域所独有的各种格式文件中的半结构化数据。其中,DB2InformationIntegrator8.1版可以通过联邦数据服务器对多种分散的数据进行访问和处理,最适合主数据源是使用其它XML、网络或内容源扩充的关系数据的项目使用。另外,在国内外存在着多种联邦数据库系统,如Myriad系统,加拿大国土信息系统(Albertal系统),关系型多数据库系统IS-G1obal,通用联邦数据库系统等。这些联邦数据库系统在联邦类型、模式集成方法、公共联邦操纵语言、数据操纵功能、可视化界面、系统结构、效率、成员数据库类型、查询处理与优比、安全性与存取控制、联邦事务管理和实用性等方面各有不同。参考文献:[1]张兵,张荣肖,潘玉平,联邦数据库系统,《计算机系统应用》1995,NO.1[2]程骄杰,联邦数据库系统的原理和实现研究,上海交通大学2004年硕士学位论文,[3]JariVeijalainen,RaduPopescu-Zeletin,MultidatabaseSystemsinISO/OSIEnvironment.IFIPTC5WG5.4.ConferenceStandardsandEconomicDevelopmentinInformationTechnology14-16April1986,Athens:inN.E.MalagardisandT.J.Williams(eds.)StandardsinInformationTechnologyandIndustrialControl,North-Holland,Netherlands,1988,pp.83-97.[4]程骄杰,联邦数据库系统的原理和实现研究,上海交通大学2004年硕士学位论文p.[5]周娜娜,基于联邦数据库的信息集成,重庆大学2006年硕士论文