北京市***局项目(数据仓库)数据仓库比较项目编号:北控伟仕,2004Page1of10数数据据仓仓库库比比较较OOrraacclleevvssDDBB221文档简介............................................................................................................................................21.1文档目的....................................................................................................................................21.2文档范围....................................................................................................................................21.3缩写约定....................................................................................................................................21.4参考文档和文献........................................................................................................................21.5文档概述....................................................................................................................................32相关的产品比较.................................................................................................错误!未定义书签。2.1数据仓库....................................................................................................................................42.2ETL工具....................................................................................................................................42.3OLAP..........................................................................................................................................42.4展示工具....................................................................................................................................53开发过程............................................................................................................................................53.1ORACLE的开发过程..................................................................................................................53.2DB2的开发过程........................................................................................................................74应用性................................................................................................................................................8北京市***局项目(数据仓库)数据仓库比较项目编号:北控伟仕,2004Page2of101文档简介1.1文档目的此文档,用来介绍Oracle的数据仓库产品与IBM公司数据仓库产品的比较文档。通过本文,使开发团队及最终使用者对两个数据仓库有初步的认识,为数据仓库及相关产品的选择提供依据。1.2文档范围所以文中没有具体实施的细节,适用读者:开发人员项目经理开发经理最终用户1.3缩写约定缩写描述IDSInternetDeveloperSuiteOWBOracleWarehouseBuilder1.4参考文档和文献编号文档名称版本日期1DB2vsOracle(BI)2DataWarehouseCenterApplicationIntegrationGuide8.23北京市***局项目(数据仓库)数据仓库比较项目编号:北控伟仕,2004Page3of101.5文档概述本文档主要是从各各角度对ORACLE的数据仓库和IBM的数据仓库的分析,下面就两方面的产品做一下简单的概述:IBMIBM公司提供了一套基于可视数据仓库的商业智能(BI)解决方案,包括:Warehousemanager、Essbase/DB2OLAPServer5.0、IBMDB2UDB,以及来自第三方的前端数据展现工具(如BO)和数据挖掘工具(如SAS)。其中,Warehousemanager是一个功能很强的集成环境,既可用于数据仓库建模和元数据管理,又可用于数据抽取、转换、装载和调度。Essbase/DB2OLAPServer支持“维”的定义和数据装载。Essbase/DB2OLAPServer不是ROLAP(RelationalOLAP)服务器,而是一个(ROLAP和MOLAP)混合的HOLAP服务器,在Essbase完成数据装载后,数据存放在系统指定的DB2UDB数据库中。严格说来,IBM自己并没有提供完整的数据仓库解决方案,该公司采取的是合作伙伴战略。也就是说IBM公司在展现和多维分析上留有接口,所有第3方的公司可以利用这个接口来连接到IBM的系统中提取想要的数据.例如,它的前端数据展现工具可以是BusinessObjects的BO、Lotus的Approach、Cognos的Impromptu或IBM的QueryManagementFacility;多维分析工具支持ArborSoftware的Essbase和IBM(与Arbor联合开发)的DB2OLAP服务器;统计分析工具采用SAS系统。OracleOracle数据仓库解决方案主要包括OWB和OracleDiscoverer两个部分。然而Express是和Oracle8i配合使用的OLAPServer。从Oracle9i开始(包括10g),Oracle把OLAPServer整合进了数据库,作为了数据库的一个选件,OracleExpressServer是一个MOLAP(多维OLAP)服务器,它利用多维模型,存储和管理多维数据库或多维高速缓存,同时也能够访问多种关系数据库;OWB(Warehousebuilder)可以完成数据仓库建模和元数据管理,又可用于数据抽取、转换、装载和调度以及多维模型的建立;OracleDiscoverer属于查询工具是专门为最终用户设计的,分为最终用户版和管理员版。Discoverer是Oracle的OLAP展示工具,无需编程。北京市***局项目(数据仓库)数据仓库比较项目编号:北控伟仕,2004Page4of101.6数据仓库ORACLE采用Cluster体系结构,多个节点共享硬盘,存在磁盘I/O瓶颈,可伸缩性较差,少见超过4个节点的实例。ORACLE基本上没有真正TB级的数据仓库,客户往往被要求将其海量数据分解到多个数据库中。IBM采用MPP体系结构,每个节点独享各自的硬盘空间,各个节点间通过高速网络交换数据。可伸缩性强,最多可以扩充到1000个节点。国内有32节点的实例,国外有512节点的实例。每个数据库中单个表的大小可以达到512GB*1000=500TB。在全球范围有许多TB级的数据仓库。1.7ETL工具ORACLE的ETL工具使用的是OracleWarehouseBuilder(OWB),此工具中做维过程就是构建星形结构的过程,在作mapping,执行的过程则是数据抽取的过程,全都用OraclewarehouseBuilder来实现。OWB全部开发过程通过图形界面完成,对于简单的数据转换实现简单,开发速度快。但是对于复杂的转换过程,由于整个转换过程全部都是由工具完成,用户不能干涉,导致在转换中一些复杂查询速度缓慢,而且没有可能优化。IBMWarehouseManager是IBM数据仓库解决方案的重要组成部分,它主要由以下几部分功能组成:数据访问,数据转换,数据分布,数据存储,靠描述性数据查找和理解数据,显示、分析和发掘数据,数据转换过程的自动化及其管理。它缩短了复杂的海量数据与有洞察力的商务决策之间的差距。IBM的WarehouseManager可获取的数据源可以是DB2家族中的任一数据库,也可以是Oracle、Sybase、Informix、SQLServer数据库和IMS、VSAM文件系统;存放数据仓库的数据库可以是DB2UDBforWindowsNT、OS/2、AIX/600、HP-UX、SunSolaris、SCO、SINIX和DB2/400、DB2forOS/390;WarehouseManager的管理平台为WindowsNT和OS/2;而且以上适用的平台仍在不断地扩展。1.8OLAPDB2OLAPServer北京市***局项目(数据仓库)数据仓库比较项目编号:北控伟仕,2004Page5of10在线分析处理(OLAP)在IBM的商务智能中扮演着重要角色,IBM为此提供一个分析工具--DB2OLAPServer,深入最终用户的业务,对桌面上的数据进行实时操作。DB2OLAPServer是一套独特的商务工具,能够快速地分布传统监视和报告范围之外的应用程序数据。IBMDB2OLAPServer是一种功能强大的工具,结合了业界领先的ArborEssbaseOLAP功能以及DB2的可靠性、可管理性和访问能力。ArborEssbase是OLAP市场领先的厂商。同其它OLAP相比,有更多的前端工具和应用程序利用了EssbaseAPI,使其成为事实上的业界标准。同大多数基于SQL的应用程序结合时,DB2OLAPServer和WarehouseManager将为端用户提供更多的前端工具和业务智能应用程序选择余地。如今,用户可以享受到多种OLAP应用程序的优势,如通过Arbor的OLAP引擎集成预算功能,充分利用机构在相关技术上的投资,管理基本设施和DB2数据。通过集成IBM的WarehouseManager和DB2O