银行业务数据仓库解决方案IBM(中国)2005年09月IBM商业智能解决方案IBMDB2DWE软件功能说明与特点-2-第1章银行业务与数据仓库现状.......................................................................................3第2章DB2数据仓库解决方案............................................................................................32.1数据仓库海量关系型数据库DB2ESE与数据分区模块DPF............................52.1.1高扩展性.................................................................................................................52.1.2高性能.....................................................................................................................62.1.3高可靠性.................................................................................................................62.1.4易管理性.................................................................................................................62.2DB2调度复杂即席查询的查询管理器DB2QueryPatroller..............................112.3DB2多维分析工具DB2CubeViews....................................................................112.4WebsphereInformationIntegrator..........................................................................162.4.1联邦数据服务器(FederatedDataServer).......................................................172.4.2针对异构关系型数据库的复制服务器(ReplicationServer).........................182.5数据仓库管理工具DB2WarehouseManager.......................................................182.6数据挖掘DB2IntelligentMiner............................................................................192.6.1DB2IntelligentMinerScoring..............................................................................212.6.2DB2IntelligentMinerModeling...........................................................................222.6.3DB2IntelligentMinerVisualization.....................................................................222.7前端展示应用开发平台DB2Alphablox...............................................................24第3章根据规模灵活配置.................................................................................................26IBM商业智能解决方案IBMDB2DWE软件功能说明与特点-3-第1章银行业务与数据仓库现状现有的新兴商业银行业务系统及中间业务系统中,存在以下难题:缺乏有针对性的分析模型分析工具功能有限、效率不高客户流动性加大,业务复杂性加剧,随机分析需求增多在构建银行业务数据仓库系统时,需要面对如下挑战:整合新兴商业银行各个业务系统数据,提供针对银行的分析数据模型;提供针对业务数据仓库的分析指标体系;系统要具有海量关系型数据库引擎,在技术上有效的支持海量数据的存储;系统要具有强大的数据分析引擎,提供强大的数据分析能力。第2章DB2数据仓库解决方案IBM软件方案建议采用成熟的、具有性能价格比优势的、功能完善的DB2DataWarehouseEnterpriseEdition(DWEE)数据仓库企业版来建立银行的业务数据仓库基础平台,其总体结构规划如下:IBM商业智能解决方案IBMDB2DWE软件功能说明与特点-4-MQTStarSchemaOLAPMetadataOLAPMetadataDB2CubeViewsDB2CubeViewsDB2UDBESE+DPFDB2UDBESE+DPFDB2QueryPatrollerDB2QueryPatrollerSQLSQLSQLSQLSQLSQLSQLSQLSQLSQLSQLSQLSQLSQLSQLSQLSQLSQLJanFebMarR1R2R3CITICEBBGDB100200180400200450555356234100180200510350275325298235CustomerIDTimeRegionIDProfit001JanR01100001JanR02200001JanR03180001FebR01400001FebR02200001FebR03450001MarR01555001MarR02356001MarR03234002JanR01235002JanR02298...............CustomerIDName001GDB002EBB003CITICRIDNameR01GuangZhouR02BeiJingR03ShangHaiROLAPMOLAP10020018040020045055535623423528927534534532546676346325350520456237362DataFileIndexFileFactTableDimensionTable001001001JanFebMarCustomerIDTimePointerFront-endBIToolsBIBIApplicationsApplicationsIBMOfficeConnectEnterpriseWebEditionDB2IntelligentMinerModelingDB2IntelligentMinerVisualizationDB2IntelligentMinerScoringPMMLDB2DataPartitioningFeatureORACLEInformixSybaseSQLServerTEXTXMLDB2WarehouseManagerStandardEditionDB2WarehouseManagerStandardEditionDB2InformationIntegratorStandardEditionDB2InformationIntegratorStandardEditionOLAPMetadataBridgeAlplaBloxIBM企业数据仓库平台DB2DataWarehouseEnterpriseEdition(DB2数据仓库企业版)是一个强大的商业智能平台,他扩展了IBMDB2UDB用于构建数据仓库和分析应用的商业智能特性。包括联邦数据访问,数据分区,在线分析处理,数据挖掘,ETL,工作负载管理等功能。整合了IBMDB2UDB的商业智能特性,是面向客户和合作伙伴,构建企业随需应变架构,实施实时商业智能的新一代商业智能解决方案。主要产品包括如下:产品:功能模块1.数据仓库存储的海量关系型数据库DB2UDBESEDB2UDBESE企业版,数据仓库引擎2.数据分区模块DB2UDBDPFDB2UDBDPF模块,提供分区支持,支持多机并行3.调度复杂即席查询的查询管理器QueryPatroller基于成本的查询负载管理工具,提高数据仓库吞吐量4.多维分析工具DB2CubeViews1.OLAP元数据交换工具IBM商业智能解决方案IBMDB2DWE软件功能说明与特点-5-2.模型级物化查询表生成器,加速OLAP多维分析5.实时数据仓库及信息集成器IBMWebsphereINFORMATIONINTEGRATOR1.关系数据库联接RelationConnect2.非关系数据库联接LifeSencieConnect6.ETL工具B2WarehouseManager1.用于数据抽取、清洗、加工和装载的的ETL工具DB2WarehouseManagerTransformer;2用于分布数据仓库ETL过程的数据仓库代理Agent。3.数据仓库的开发、监控以及MetaData管理工具DB2WarehouseCenter;4数据仓库信息目录InformationCatalog;5.报表生成工具QMF7.DB2IntelligentMinerScoring数据挖掘评分工具在数据仓库中直接实现(实时)评分8.DB2IntelligentMinerModeler数据挖掘建模工具,从数据仓库中发现规律(模型)9.DB2IntelligentMinerVisualization数据挖掘模型图示化工具10.IBMOfficeConnectAnalytical/EnterpriseWebEditionExcel多维分析插件,在Excel中实现查询、报表、多维分析11.DB2Alphablox提供开发分析应用的平台,构建客户自己的分析应用2.1数据仓库海量关系型数据库DB2ESE与数据分区模块DPF2.1.1高扩展性在单UNIX主机CPU扩展方面,TPC-C(OLTP)和TPC-H(Ad-HocQuery),显示了DB2在扩展性方面的能力。在SMP环境中,经SUN在64CPUE1000上的测量,可达到90%的扩展性(详细信息参见)。在集群技术方面,采用ShareNothing的MPP体系结构,每个节点独享各自的硬盘空间,各个节点间通过网络交换数据。可伸缩性强,最多可以扩充到1000个节点。国外有512节点的实例。每个数据库中单个表的大小可以达到512GB*1000=500TB。在全球范围有许多TB级的数据仓库。美国电信公司SprintPCS的实时数据仓库由55个DB2节点服务器组成,每个节点4CPU,运行50TB实时数据仓库。IBM商业智能解决方案IBMDB2DWE软件功能说明与特点-6-2.1.2高性能DB2的基于成本优化技术已经有27年历史,积累了大量独有专利技术。针对任意的查询,DB2独特的查询重写功能将所有SQL语句改写成为语义上完全相同,但是可以使用优化器所有优化功能的语句,优化器再自动选择最优的查询路径完成查询。此功能特别适用于以图形化界面生成的数据仓库应用。针对O