异构数据库的集成技术

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

异构数据库集成技术在高校学生信息管理系统中的应用引言随着校园的信息化建设的飞速发展,异构数据库集成技术起着越来越重要的作用。由于部门业务和功能归属不同,各应用系统开发时采用了不同的软硬件环境.数据的这种按部门或功能进行组织和管理,把很多信息都分开化啦!正好,异构数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。不同的数据库所存储的形式也各不相同,比如,教学管理数据库主要就是用于储存管理应用处理层所需的数据资料。不同教育机构建立的各自的应用控制系统中也建设了各自的数据库,但由于缺乏统一协调,各数据库系统在建立时都是从各自的需求出发,没有统一的数据库,这就使得各数据库之间无法互连!互通,信息资源无法融合共享论文对异构数据库集成展开研究,建立教学管理综合数据库系统,以适应不同平台!不同部门数据库之间的数据共享。要怎么才能实现网络环境下的信息共享?就要求必须联合各个异构数据库即集成多个数据库系统,实现不同数据库之间的数据信息资源合并和共享,显然,每个数据库系统在加入异构数据库集成系统之前本身就已存在,拥有自己的DBMS。异构数据库系统是指异构的多数据库系统,即组成它的成员数据库具有的硬件、系统软件(例如操作系统)或通信支持不同,或者成员数据库具有不同的DBMS或具有不同的数据语义DBMS的不同表现在表达(结构和限制)和语义两方面。网络上存在着大量异构的数据库,它们的异构性表现在多个方面,如数据的类型不同,数据的表示不同,管理数据的软件不同,以及系统运行的环境不同。随着企业合作和政务电子化的发展,许多信息系统需要访问这些异构数据库中的数据。因此,需要一种新的系统框架来解决多个异构数据库的信息集成,其前提是必须对用户透明,并保持本地数据库的自治性。1异构数据库集成技术1.1联邦数据库技术联邦数据库系统(FederatedDatabases)祸合较松一些没有单一的全局策略,每个局部数据库维护一个本地输入输出策略,输出策略指明了本地系统提供的全局共享数据,输入策略指明了允许输入本地系统的来自远程节点的数据局部输入输出策略构成了全局策略的一部分这种系统只集成局部系统中的部分数据,因而使得局部系统有较好的自治性联邦数据库是最简单的一种异构数据库集成方式:各个数据源是相互独立的.但通过数据源之间的数据交换格式进行一一映射.这种映射可以让数据源DB1使用数据源DB2理解的术语来访问DB2数据源也就是说.不同的数据源之间使用数据转换接口网关或调用接口来实现数据互访.这样一个数据源就可以访问任何其他数据源的信息。同时,如果有l1个异构数据源需要互连,那么我们就要去构造n(n—l1个映射程序来支持这n个异构数据源之间的互相访问。图1.1利用联邦数据库系统建立的校园管理系统1.2数据仓库技术传统的数据库技术与现在的数据库是有一定的区别的,传统的数据库是以单一的数据资源,即数据库为中心,进行事务处理、决策分析等各种不同数据处理工作,我们把它主要划分为两大类:第一类是操作型处理;第二类是分析型处理。操作型处理还有另外一种叫法,它又叫事务处理,对数据库联机的日常操作其实就是事务处理,通常是对一个或一组纪录的查询和修改,主要为企业的特定应用服务的,对数据的安全性和完整性有一定的注意力。数据仓库是决策支持系统机制和联机分析应用数据源的结构化数据环境。数据仓库的结构体系由三部分组成:综合信息集成服务平台,集成后的数据仓库,数据集成机制。数据仓库中,密集的数据更新处理性能和系统的可靠性是所有联机事务处理必须强调的,却并不强调数据查询的方便与快捷。联机分析和事务处理对系统的要求不同,即使是同一个数据库,它们在理论上都难以做到两全。数据仓库研究和解决从数据库中获取信息的问题。数据仓库异构数据源的谋略是由几个异构数据源的数据副本构成.按照一定的要求,进行预处理、转换,以符合数据仓库的模式,并存储到数据仓库中。让读者在使用时就感觉像在使用普通的数据库一般。只要把数据存储在数据仓库.使用者使用查询时就和以前在单一数据库中的查询大同小异,感觉仍然在原来单一的查询中使用。图1.2.1数据仓库系统结构多种数据资源的集成(Excel数据和文本文件)除了访问传统的RDBMS外,还可以从其他地方获取数据,比如从用户所持有的Excel数据和文本文件中。可以在同一个报表上,制成从数据仓库得到的销售实绩数据和Excel的预算数据等,这样可提高数据的利用率。数据仓库是面对整个企业的数据应用,而构筑数据中心是针对各个部门的信息应用。数据中心的数据是按部门从数据仓库中抽取,并进行加工处理。数据中心构筑工具,就是提供从数据仓库自动进行数据的抽出、变换功能,具有ETL功能,可以大幅提高运行效率。数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其它数据库的。建立数据仓库并不是要取代数据库,它是为了使信息更加完善和全面,主要应用于支持高层决策分析,而上面所提到的事务处理数据库在企业的信息环境中的任务是对日常的操作。数据仓库是数据库技术的一种新的应用,数据仓库还是用关系数据库管理系统来管理其中的数据。数据仓库的优点是可以很方便的进行联机分析和数据挖掘.它的缺点是数据存储太重复、不能及时使它得到更新。数据仓库中的数据分为四个级别:早期细节级、当前细节级、轻度综合级、高度综合级。把源数据综合后,首先进入的是早期前细节级,再进入当前细节,然后根据所需进后进一步的综合后,最后进入轻度综合级乃至高度综合级。数据仓库的特点包括稳定性、时变性,面向主题和集成性、这四大方面。1)稳定性大量的经集成、加工过的综合性历史数据被保存在数据仓库中,数据仓库的数据是供企业决策分析之用的,所涉及的数据操作主要是查询,一般情况下并不轻易进行修改操作,即数据仓库的用户进行分析处理时不进行数据更新操作2)时变性数据仓库由于时间的改变而改变,,所有数据仓库中的数据都永远不变,而是随时间不断变化的数据仓库中的数据不可更新是针对应用来说的,由于数据仓库中包含大量的综合数据,而这些综合数据中很多与时间有关,故随着时间的变化,这些数据也要不断进行更新、综合。传统的关系数据库系统一般处理格式化的数据,它比较适合这一方面,并能够很好的达到商业商务处理的需求,它在商业领域取得了巨大的成功。3)面向主题数据仓库面向主题的特点与传统数据库面向应用进行数据组织的特点相对应,数据仓库中的数据是面向主题进行组织的,而数据库是面向事务处理应用进行数据组织的。在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的各项数据及数据间的联系,就是面向主题的数据组织方式。主题是指一个分析领域,是在一个较高层次上对数据进行组织、归类的标准。从而使得面向主题的数据组织可以独立于数据的处理逻辑,方便了在多种环境上开发新的分析型应用。同时,这种独立性也是建设企业全局数据库所要求的,故面向主题不仅适用于分析型数据环境的数据组织形式,也适用于建设企业级数据库的数据组织方式。当然,根据其时间、访问频率等可把同一主题的数据存放在不同的设备上,以使数据仓库的整体性能得到优化。4)集成化特性数据仓库的数据有来自于分散的操作型数据,在原有分散的数据库中由于数据仓库的每一主题所对应的源数据可能有重复或不一致的地方,加上从原有数据库中是不能直接得到综合数据的。因此数据在进入数据仓库之前必须要经过加工与集成,统一和综合形成集成化的数据。数据不论来源于什么地方,在进入数据仓库之前,要做的事就是必须经过加工与集成,统一与综合,这样才使其进人数据仓库之后都具有统一的数据属性和编码结构等,这就是数据仓库中的一致性。另一方面,数据仓库还有其他一些特点.比如说,数据仓库不会允许用户去更新数据。因为,即使用户更新了数据仓库中的数据也不能反应到原来的数据源中,从而会使数据源和数据仓库中数据不一致。在数据仓库中进行数据构建有以下三种方式:(1)数据仓库及时更新异构数据源的数据变化。(2)数据仓库隔相同的时间从原数据源中重新构建数据。也就是呈周期性的。(3)数据仓库周期性的采用增量更新的模式更新原数据源中的数据。1.3中间件技术1)中间件的概念中间件通常是软件层,由一个API定义的,不兼容的操作系统或文件结构它负责处理,调节客户机/服务器或服务器与服务器之间的通信,位于基于客户/服务器的操作系统之上,管理计算机资源和网络通信。并且和下层的通信服务互相是没有联系的,而是一种独立的系统软件或服务程序。中间件是一类连接软件组件和应用的计算机软件,以便于运行在一台或多台机器上的多个软件通过网络进行交互,也是基于分布式处理的软件,网络通信功能是它的最突出的特点。由中间件技术提供的互操作性,推动了分布式体系架构的演进,该架构的作用是支持分布式应用程序并使其得到简化。并且,分布式应用软件借助这种软件在不同技术之间共享资源。需要注意的是中间件是一类软件,而非一种软件。中间件不仅可以实现互联,还可以用于应用之间的互操作。2)中间件的作用通过管理计算资源和网络通信,为各类分布式应用软件共享资源提供支撑是中间件的核心作用,主要也是为各种应用程序抽象出通用的公共部分,以降低应用开发的复杂程度。中间件是位于基于客户/服务器的操作系统之上、应用系统之下,起到了承上启下作用,系统软件的复杂性,都需要靠中间件来操作、调和。中间件为处于自己上层的应用软件提供运行与开发的环境,使复杂的应用软件可以更能得到有效地开发。中间件具有如下特点:满足大量应用的需要,只要把中间件升级,并保持中间件对外的接口定义不变,几乎不需修改任何应用软件,这样也就减少企业在应用软件开发时的经费。图1.3中间件系统服务(3)中间件的发展趋势传统的中间件产品种类繁杂,虽然在支持相对封闭、静态、稳定、易控的企业网络环境中的企业计算和信息资源共享方面取得了巨大成功,但在新时期以开放、动态、多变的互联网(Internet)为代表的网络技术冲击下,还是显露出了它的固有局限性用户往往需要采用多种不同的中间件产品,而中间件平台的特点是各产品模块既能够做为单独的中间件产品使用,又能够提供完整的软件平台支撑功能,具备优异的灵活性、可扩展性和可管理性。现在人们的需求越来越复杂化、多变化,单单用一种商品做成标准去推广已经行不通啦。首先就是优化企业流程,如果不优化流程,不改变企业传统模式和管理方法,不吸收一些有效并且吸引的管理模式,肯定是不会成功的。就对中间件来说,是一种基础软件,处于操作系统与应用软件的之间,现在很多方面已经得到了一定的优化,如今中间件在市场中占相当重要的地位,经过迅猛发展,也有了至关重要的软件分类,已经成为网络应用系统开发、集成、部署、运行和管理必不可少的工具。由于中间件技术涉及网络应用的各个层面,涵盖从基础通讯、数据访问到应用集成等众多的环节,因此,中间件技术呈现出多样化的发展特点。与操作系统、数据库管理系统并列为基础软件体系的三大支柱。那么中间件的价值到底体现在哪些方面呢?首先,中间件技术正在呈现出业务化、服务化、一体化、虚拟化等诸多新的重要发展趋势。因为由一个厂商去统一众多产品之间的差异是不可能的,而单独由计算机用户在自己的应用软件中去弥补其中的大片空档,由于技术深度和技术广度的要求,必然也是勉为其难。于是,中间件应运而生。中间件试图通过屏蔽各种复杂的技术细节使技术问题简单化。在中间件产生以前,应用软件直接使用操作系统、网络协议和数据库等开发,这些都是计算机最底层的东西,越底层越复杂,开发者面临的问题也就越复杂,如操作系统的多样性,繁杂的网络程序设计、管理,复杂多变的网络环境,数据分散处理带来的不一致性问题、性能和效率、安全,等等。有人提出能不能将应用软件所要面临的共性问题进行提炼、抽象,在操作系统之上再形成一个可复用的部分,供成千上万的应用软件重复使用。这一技术思想最终构成了中间件这类的软件。其次,是中间件的普通商品化趋势。伴随技术的成熟和竞争格局的变化,中间件产品已经变得高贵不贵。特别是在高端商用中间件市场,价格回归到了合理的水平.然后,集成化的统一中间

1 / 34
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功