边-数据仓库和数据挖掘导读2

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

实例•我们现在的身份是FoodMartCorporation的数据库管理员。FoodMart是一家大型的连锁店,在美国、墨西哥和加拿大有销售业务。通过下面建立的三个多维数据集示例,即Marketing(市场营销)、HR(人力资源)和ExpenseBudget(开支预算),您将建立访问数据所需的各种连接,定义多维数据集,以最为有效的方式分析数据。1、建立系统数据源连接•数据源包含访问一个对象源数据所需的信息。•为什么?•在开始使用AnalysisManager之前,必须首先在ODBC数据源管理器中设置和源数据的连接。•如何设置系统数据源名称(DSN)•Microsoft®WindowsNT®4.0用户:单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“数据源(ODBC)”。Windows®2000用户:单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“管理工具”,再双击“数据源(ODBC)”。•在“系统DSN”选项卡上单击“添加”按钮。•选择“MicrosoftAccess驱动程序(*.mdb)”,然后单击“完成”按钮。•在“数据源名”框中,输入“教程”,然后在“数据库”下,单击“选择”。•在“选择数据库”对话框中,浏览到“C:\ProgramFiles\MicrosoftAnalysisServices\Samples”,然后单击“FoodMart2000.mdb”。单击“确定”按钮。•在“ODBCMicrosoftAccess安装”对话框中单击“确定”按钮。•在“ODBC数据源管理器”对话框中单击“确定”按钮。2、启动AnalysisManager•AnalysisManager是一个在Microsoft®管理控制台(MMC)上运行的管理单元程序。•可以使用AnalysisManager管理OLAP和数据挖掘对象及数据。•如何启动AnalysisManager•单击“开始”按钮,依次指向“程序”、“MicrosoftSQLServer”和“AnalysisServices”,然后单击“AnalysisManager”。3、建立数据库和数据源•现在即可以开始使用AnalysisManager!•为什么?•在设计多维数据集前,需要建立一个数据库结构。数据库是指在其中存放多维数据集、角色、数据源、共享维度和挖掘模型的一种结构。然后需要和早期在ODBC数据源管理器中建立的数据源连接。•如何建立数据库结构•在AnalysisManager树视图中展开“AnalysisServers”。•单击服务器名称,即可建立与AnalysisServers的连接。•右击服务器名称,然后单击“新建数据库”命令。•在“数据库”对话框中的“数据库名称”框中,输入“教程”,然后单击“确定”按钮。•在AnalysisManager树窗格中展开服务器,然后展开刚才创建的“教程”数据库。•新的“教程”数据库包含下列项目:–数据源–多维数据集–共享维度–挖掘模型–数据库角色•然后,建立到“教程”数据源中的示例数据的连接。•在AnalysisManager中建立一个数据源,将数据库连接到在ODBC数据源管理器中建立的系统数据源名称(DSN)上。在建立多维数据集的过程中,所有的数据都将来自这个源。如何建立数据源•在AnalysisManager树窗格中,右击“教程”数据库下的“数据源”文件夹,然后单击“新数据源”命令。•在“数据链接属性”对话框中,单击“提供者”选项卡,然后单击“MicrosoftOLEDBProviderforODBCDrivers”。•单击“连接”选项卡,然后从“使用数据源名称”列表中单击“教程”。•单击“测试连接”以确保一切工作正常。在“Microsoft数据链接”对话框中应出现一条消息,说明连接成功。在消息框中单击“确定”按钮。••单击“确定”按钮关闭“数据链接属性”对话框。4、建立多维数据集•多维数据集是数据的一种多维结构。多维数据集由维度和度量值的集合进行定义。•为什么?•以多维方式建立数据模型可简化联机业务分析,提高查询性能。通过创建数据多维数据集,AnalysisManager可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。•管理关系数据以进行多维使用的最常用的方式是星型架构。星型架构由一个事实数据表和链接到该事实数据表的多个维度表组成。•市场部想要按产品和顾客分析1998年进行的所有销售业务数据。使用存储在公司数据仓库中的数据,您就能建立多维数据结构(多维数据集),以便在市场分析人员查询数据库时获取快速的响应。您将在本节建立一个多维数据集,用于进行销售分析。•如何打开多维数据集向导•在AnalysisManager树窗格中,“教程”数据库下,右击“多维数据集”文件夹,单击“新建多维数据集”菜单,然后单击“向导”命令。如何向多维数据集添加度量值•度量值是要进行分析的数据库中的量化值。常用的度量值为销售、成本和预算数据。度量值根据多维数据集不同的维度类别进行分析。•在多维数据集向导的“欢迎”步骤,单击“下一步”按钮。•在“从数据源中选择事实数据表”步骤,展开“教程”数据源,然后单击“sales_fact_1998”。•单击“浏览数据”按钮可以查看“sales_fact_1998”表中的数据。数据浏览完毕后,关闭“浏览数据”窗口,然后单击“下一步”按钮。•若要定义多维数据集的度量值,在“事实数据表数据列”下,双击“store_sales”。对“store_cost”和“unit_sales”列重复此步骤,然后单击“下一步”按钮。如何建立时间维度•在向导的“选择多维数据集的维度”步骤,单击“新建维度”命令。此操作将调用维度向导。•在“欢迎”步骤,单击“下一步”按钮。•在“选择维度的创建方式”步骤,选择“星型架构:单个维度表”选项,然后单击“下一步”按钮。•在“选择维度表”步骤,单击“time_by_day”。查看完“time_by_day”表后,单击“下一步”按钮。•在“选择维度类型”步骤,选择“时间维度”选项,然后单击“下一步”按钮。•接下来,将定义维度的级别。在“创建时间维度级别”步骤,单击“选择时间级别”,单击“年、季度、月”,然后单击“下一步”按钮。•在“选择高级选项”步骤,单击“下一步”按钮。•在向导的最后一步,输入“Time”作为新维度的名称。•单击“完成”返回到多维数据集向导。•在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Time”维度。如何建立产品维度•再次单击“新建维度”命令。在“欢迎进入维度向导”步骤,单击“下一步”按钮。•在“选择创建维度的方式”步骤,选择“雪花架构:多个相关维度表”选项,然后单击“下一步”按钮。•在“选择维度表”步骤,双击“Product”和“product_class”将它们添加到“选定的表”。单击“下一步”按钮。•在维度向导的“创建和编辑联接”步骤,显示在上一步选定的两个表以及它们之间的联接。单击“下一步”按钮。•若要定义维度的级别,在“可用的列”下,按顺序双击“product_category”、“product_subcategory”和“brand_name”。双击每列后,其名称显示在“维度级别”下。在选择了所有三列后,单击“下一步”按钮。•在“指定成员键列”步骤,单击“下一步”按钮。•在“选择高级选项”步骤,单击“下一步”按钮。•在向导的最后一步,在“维度名称”框中,输入“Product”,并保持“与其它多维数据集共享此维度”复选框为选中状态。单击“完成”按钮。•现在应能在“多维数据集维度”列表中看到“Product”维度。如何建立客户维度•单击“新建维度”命令。•在“欢迎”步骤,单击“下一步”按钮。•在“选择创建维度的方式”步骤,选择“星型架构:单个维度表”选项,然后单击“下一步”按钮。•在“选择维度表”步骤,单击“Customer”,然后单击“下一步”按钮。•在“选择维度类型”步骤,单击“下一步”按钮。•若要定义维度的级别,在“可用列”下,按顺序双击“Country”、“State_Province”、“City”和“lname”列。双击每一列后,其名称将显示在“维度级别”下方。选择完所有四个列之后,单击“下一步”按钮。•在“指定成员键列”步骤,单击“下一步”按钮。•在“选择高级选项”步骤,单击“下一步”按钮。•在向导的最后一步,在“维度名称”框中,输入“Customer”。保持“与其它多维数据集共享此维度”复选框的选中状态。单击“完成”按钮。•在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Customer”维度。如何生成商店维度•单击“新建维度”命令。•在“欢迎”步骤,单击“下一步”按钮。•在“选择创建维度的方式”步骤,选择“星型架构:单个维度表”选项,然后单击“下一步”按钮。•在“选择维度表”步骤,单击“Store”,然后单击“下一步”按钮。•若要定义维度的级别,在“可用列”下,按顺序双击“store_country”、“store_state”、“store_city”和“store_name”列。双击每一列之后,其名称将显示在“维度级别”框下。选择了所有四个列之后,单击“下一步”按钮。•在向导的最后一步,在“维度名称”框中,输入“Store”,并保持“与其它多维数据集共享此维度”复选框的选中状态。单击“完成”按钮。•在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Store”维度。如何完成多维数据集的生成•在多维数据集向导中,单击“下一步”按钮。•在“事实数据表行数”消息给出提示时,单击“是”按钮。••在多维数据集向导的最后一步,将多维数据集命名为“Sales”,然后单击“完成”按钮。•向导将关闭并随之启动多维数据集编辑器,其中包含刚刚创建的多维数据集。单击蓝色或黄色的标题栏,对表进行排列,使其符合下图所示的样子。5、设计存储和处理多维数据集•可以设计多维数据集中的数据和聚合的存储选项。在使用或浏览多维数据集中的数据之前,必须先进行处理。••为什么?•可以从三种存储模式中选择:多维OLAP(MOLAP)、关系OLAP(ROLAP)或混合OLAP(HOLAP)。•聚合为预先计算好的汇总数据,利用这些数据可以极大地提高查询的效率和响应时间。•在处理多维数据集时,将计算为多维数据集所设计的聚合,并为多维数据集装载已计算的聚合和数据。•方案:•设计好Sales多维数据集的结构之后,需要选择要使用的存储模式并指定要存储的预先计算好的值的数量。完成此项操作之后,需要用数据填充多维数据集。本节中将选择MOLAP作为存储模式,创建Sales多维数据集的聚合设计,然后处理该多维数据集。处理Sales多维数据集时将从ODBC源中装载数据并按照聚合设计中的定义计算汇总值。如何使用存储设计向导设计存储•在AnalysisManager树窗格中,在“教程”数据库下展开“多维数据集”文件夹,右击“Sales”多维数据集,然后单击“编辑”命令。•在“欢迎”步骤中单击“下一步”按钮。•选择“MOLAP”作为数据存储类型,然后单击“下一步”按钮。•在“设置聚合选项”下单击“性能提升达到”。在此框中输入“40”作为指定百分比。此操作指示AnalysisServices将性能提升到40%,而不管需要多大的磁盘空间。管理员可以用此优化能力平衡查询性能需求和存储聚合数据所需磁盘空间大小。•单击“启动”按钮。•在AnalysisServices设计聚合时,您可以查看向导右边的“性能与大小”图。从中可以看出增加性能提升对使用额外磁盘空间的需求。完成设计聚合的进程之后,单击“下一步”按钮。•在“您希望做什么?”下选择“立即处理”,然后单击“完成”按钮。注意:处理聚合可能会花费一些时间。•在处理时可以在出现的窗口中查看多维数据集。处理完成之后将出现一则信息,确认处理已成功完成。•单击“关闭”按钮返回AnalysisManager树窗格。6、浏览多维数据集数据•可以开始浏览Sales多维数据集中的数据了!••为什么?•使用多维数据

1 / 44
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功