Oracle数据库10g的OLAP选项:唯一用于商业智能的关系–多维数据库Oracle白皮书2004年6月OracleOLAP10g:唯一用于商业智能的关系–多维数据库执行概要............................................................................................................3引言.....................................................................................................................3目前的商业智能市场.....................................................................................3商业智能应用程序的类型...................................................................3传统分析服务器.....................................................................................4Oracle关系–多维数据库.........................................................................5集成RDBMS-MDDS的优势............................................................6简化的管理..............................................................................................6高可用性...................................................................................................6提高的安全性..........................................................................................7数据等待时间最短................................................................................7开放访问...................................................................................................7OracleOLAP10g概述..............................................................................7开放接口...................................................................................................8集成数据库过程.....................................................................................8集成的RDBMS-MDDS数据存储..........................................................8多维数据模型..........................................................................................9OLAPDML............................................................................................10假设分析.................................................................................................13查询API.................................................................................................14OracleOLAP10g:用于商务智能的唯一RDBMS-MDSS第2页执行概要大多数企业中,商业智能应用程序的部署是沿着技术线路划分的。不太复杂的报表和即席查询工具的部署通常使用的是数据仓库和基于SQL的报表工具,而较复杂的分析和计划应用程序的部署则是使用其他特殊的数据库和工具。从传统角度看,对不同类的应用程序使用不同的技术是有理由的。关系数据仓库易于扩展,可支持非常大的数据集。单独的分析数据库提供了关系数据库所没有的分析功能。数据仓库和分析数据库间的这种划分带来了高昂的代价。维护单独的分析数据库需要在硬件、软件和数据库管理员方面付出额外的开销。将数据复制分析数据库的过程也使数据对分析员和决策人员的可用被大大推迟。随着数据集规模的增加,这些问题也变得更加尖锐。需要更多的时间将数据复制到分析数据库中。通常,单独的分析数据库难以应付非常大的数据库。这些问题转化成了与更及时、更有效的分析所相关的机会成本。Oracle数据库10g通过提供支持分析的Oracle数据库消除了这些障碍。集成在Oracle数据库10g中的OLAP选项提供了特殊分析数据库的分析功能,消除了管理一个单独数据库系统的需要。引言唯一用于商业智能的关系–多维数据库意味着什么?这不是简单地在关系数据库上包装和安装传统的分析服务器。这也不是两个不同数据库服务器间的协作或相互依赖。这是在同一数据库实例中组合关系数据类型和多维数据类型。最终在Oracle数据库的核心中引进一个全功能的多维引擎。从Oracle9i数据库Release2以来,Oracle数据库的OLAP选项是目前唯一可用的关系–多维数据库。多维技术和关系技术共存在同一平台上。多维数据是Oracle数据库中最好的数据类型。还没有其他的供应商做出这一声明。目前的商业智能市场在进一步讨论OracleOLAP10g前,有必要检阅一下分析服务器的市场。本部分讨论四种类型的商业智能应用程序和当前用于支撑这些应用程序的架构。商业智能应用程序的类型企业需要各种不同的商业智能应用程序以满足不同的用户群。这些应用程序通常可分为四类:OracleOLAP10g:用于商务智能的唯一RDBMS-MDSS第3页标准报表即席查询和报表分析报表计划应用程序OracleOLAP10g满足各种类型应用程序的要求。标准报表报表应用程序通常提供静态或参数化的报表。受众通常很广,例如,一个企业中所有的销售经理。具有最低分析要求的报表应用程序通常是基于关系数据库的,并使用SQL作为查询语言。即席查询和报表即席查询和报表应用程序通过各种数据选择和导航技术的使用为用户提供了高层次的交互。即席查询和报表应用程序通常是基于关系数据库的,使用SQL支持“一维”查询,例如“我的前10个客户是谁”。对大多数的用户群,例如销售人员来说,这种程度的分析功能已经足够。分析报表分析报表应用程序也支持数据的即席查询,但它们也回答更复杂的问题。虽然下面的查询看起来有些复杂,但这是营销分析员常问的问题:与一年前的同期相比,销售总额的百分比变化是多少?对最前面的10个客户中每个客户的前10种产品进行分析,以本年度对每个客户的销售总额与去年同期的总额的百分比变化为基准。该查询是多维的。查询中的计算是在多个方向上进行的。同期前和本年度至今日的计算是在时间维上。排列则是在客户和产品维上。产品排列嵌套在客户排列中。产品和客户排列中嵌入了一个计算后的尺度。传统上,大多数的即席分析应用程序使用了独立的分析数据库来支持所要求的复杂多维查询。计划应用程序计划应用程序可使用户预知结果。它们允许用户提出如下的问题:本公司本季度的利润将是多少?价格变动将如何影响单位产品销售额和净利润?货币波动对净利有什么影响?计划应用程序非常不同于查询和报表应用程序,因为它们使用模型、预测、特殊集合和分配方法等分析工具生成新的数据。计划应用程序的常见例子包括企业预算和财务分析,以及需求计划系统。通常这些应用程序使用了独立的分析数据库。传统分析服务器在过去,分析应用程序的开发者必须做一个本质决定:应用程序应采用关系数据库访问数据仓库中的数据,还是使用特殊的分析数据库?平衡是非常重要的。关系数据库提供了成本效益最高的数据管理方法,对各种应用程序提供了OracleOLAP10g:用于商务智能的唯一RDBMS-MDSS第4页最开放的访问。被管理的数据集中在一个中心位置。不需要将数据复制到其他特殊的数据库。由于所有的数据都保存在数据仓库中并能使用SQL查询,基于SQL的应用程序都可以访问数据。不幸地是,SQL的分析功能非常有限,而且性能比不上特殊的分析数据库。特殊的分析数据库提供了完整的分析功能集,并为复杂的查询提供了更好的性能,但分析数据库的维护需要巨大的开销。分析数据库要求数据复制和独立的管理设施。数据复制是个高代价的过程,将造成数据可用性的重大延迟。独立的管理过程同样是昂贵的,因为它需要单独的数据建模、ETL过程、安全步骤和灾难恢复计划。因此,开发者倾向于使用SQL编写仅具有有限分析要求的应用程序,并对有更多分析要求的应用程序使用分析数据库。企业需要承担管理独立数据库系统和复制数据的费用。关系OLAP(ROLAP)技术为一些使用SQL的分析计算提供了支持,但由于分析能力和性能的限制,这些技术只是取得了有限的成功。下面的图片显示了一个用于支持各种分析应用程序典型数据库架构。这个典型环境中,数据由源系统(例如总帐或销售定单系统)访问,经数据集成引擎处理后被装载到关系数据库的一个数据仓库中。即席查询和报表应用程序可直接查询数据仓库并提供对数据的及时访问。但是,基于特殊分析数据库的分析应用程序用户需要等上数小时乃至数天,等待数据被复制到分析数据库中。从DBA的角度看:有三个技术要掌握(数据集成工具、关系数据库和分析数据库)有三个元数据库要管理有三个管理过程有两个数据存储(仓库和多维)无论是在管理系统方面,还是由于无法访问最新数据而导致的低效这一机会成本方面,管理这三个过程的代价都是非常高昂的。ORACLE关系–多维数据库Oracle数据库10g通过提供集成的关系–多维数据库挑战对分析数据库的传统认识。OracleRDBMS-MDDS消除了可管理性和分析能力及性能之间的矛盾。Oracle数据库10g简化了过程,降低了维护数据的费用,同时能够支持复杂的分析查询并提供出色的性能。Oracle数据库10g扩展OracleOLAP10g:用于商务智能的唯一RDBMS-MDSS第5页了SQL的分析能力并以关系数据库集成组件的形式提供OracleOLAP10g,从而实现了这一目标。DataWarehousingETLOLAPDataMiningOracle10g此外,OracleOLAP10g是集成数据仓库和商业平台的一部分,该商业平台将ETL、OLAP和数据挖掘功能集成进了Oracle数据库。结果就是一个更易于管理和成本效率更高的平台,它全面支持分析应用程序并提供对更新信息的及时访问。集成RDBMS-MDDS的优势与分离、独立的多维数据库相比,完全集成的RDBMS-MDDS具有很多优势。这些组件包括:简化的管理高可用性提高的安全性数据等待时间最短开放访问简化的管理OracleR