数据仓库实验二

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据仓库与数据挖掘设计并构造AdventureWorks数据仓库实例2015-2016学年第1学期学院:电子工程学院学号:姓名:2016年1月数据仓库与数据挖掘实验二设计并构造AdventureWorks数据仓库实例1.实验目的在SQLServer平台上,利用AdventureWorks数据库作为商业智能解决方案的数据源,设计并构造数据仓库,建立OLAP和数据挖掘模型,并以输出报表的形式满足决策支持的查询需求。2.实验环境及工具实验环境:win7系统实验工具:MicrosoftSQLServer2012SQLServerManagementStudioSQLServerDataTools3.实验内容3.1需求分析AdventureWorks数据库中有很多实体关系表,涉及到自行车制造企业的人力资源、产品管理、市场销售和采购、供应商管理及生产管理多个方面。而作为自行车的决策者,最关心的就是销售业绩的问题。而这里经过思考,主要是对这几个主题完成以下三个目标:(1)分析不同类别的产品通过网上销售在不同时间段内销售的业绩;(2)生成分析结果的报表;(3)分析影响客户所有车的数量的因素。3.2确定主题与边界对于该类自行车商品的公司管理层,需要关注和分析的主题主要是四个:供应商、产品、库存、和客户。其中商品主题的内容包括记录超市商品的采购情况、数据仓库与数据挖掘商品的销售情况和商品的存储情况;客户主题包括的内容可能有客户购买商品的情况;仓库主题包括仓库中商品的存储情况和仓库的管理情况等,简单的主题关系图如图3-1所示。图3-1主题关系图分析销售业绩主要基于三个维度:产品、客户和时间。事实数据为销售记录。3.2.1产品维度对于产品,起关键作用的是产品名称和分类。所以对产品实体,应该具备表3-1中的属性。产品的各个属性存在dbo.DimProduct表中。属性含义类型约束ProductKey确定唯一产品的主键intNotnullEnglishProductName产品英文名nvarchar(50)NotnullColor产品颜色nvarchar(15)Notnull表3-1产品维度属性表数据仓库与数据挖掘3.2.2客户维度客户维度则主要关心姓名、年龄、性别、受教育程度、子女个数、是否拥有房产、拥有汽车数量、所在地区等信息,如表格3-2中所示。客户的各个属性存在dbo.DimCustomer和dbo.DimGeography等表中,表之间通过主键或外键连接。属性含义类型约束CustomerKey表示唯一客户的主键intNotnullCustomerAlternateKey客户全称nvarchar(15)NotnullGeographyKey客户地理位置,外键int表3-2客户维度属性表3.2.3时间维度对于时间维度,相关的是年、月、日、季度、半年等,与时间相关的信息存放在dbo.DimDate表中。数据仓库与数据挖掘图3-2时间维度图3.2.4事实数据对于事实数据,只关心订单产品价格、折扣、数量和总价等情况,它的所有属性如表格3-4中所示。其中,单位产品价格及折扣、订单总数和订单总价等信息在dbo.FactInternetSales表中,如下图所示。数据仓库与数据挖掘图3-3事实数据图3.3逻辑模型创建3.3.1添加数据源(1)运行AdventureWorksSQLServer2005示例数据库.msi文件,生成AdventureWorks_Data.mdf和AdventureWorks_Log.ldf文件。在MicrosoftSQLServerManagementStudio工具中,右键点击对象资源管理器中的数据库节点,选择“附加”选择AdventureWorks_Data.mdf,可看到AdventureWorks中的表格及其内容,如图3-2所示。数据仓库与数据挖掘图3-4.AdventureWorks导入数据库同样的方法,附加了AdventureWorksSQLServer2012示例数据库AdventureWorksDW2012。在后续操作中使用AdventureWorksDW2012。图3-5.AdventureWorksDW2012导入数据库数据仓库与数据挖掘(2)在SQLServerDataTools工具中,创建一个AnalysisServices商业智能项目AnalysisServicesTutorial,为它创建新的数据源,选择步骤(1)中的数据库。生成AdventureWorks对应的数据源,如图3-6所示。新建完成后数据源下出现AdventureWorksDW2012。图3-6.添加数据源3.3.2添加数据源视图右击添加数据源视图,选择AdventureWorksDW2012数据源,选择需要添加的表格,这里我关心的只有产品、客户的信息,所以选择DimProduct、DimCustomer、DimDate、FactInternetSales及相关的表格,并以此将表名中的Dim去掉。添加好后的数据源视图如图3-7所示。图3-7.数据源视图数据仓库与数据挖掘3.3.3添加维度维度的添加方式都是右击维度,使用现有表来新建。(1)添加时间维度,选择相应的属性。图3-8.时间维度(2)添加产品维度,选择相应的属性。图3-9.产品维度数据仓库与数据挖掘(3)添加客户维度,选择相应的属性图3-10.客户维度3.3.4添加多维数据集根据上面添加生成的维度,生成多维数据集。右键点击多维数据集,选择新建,使用现有表建立,度量值选为InternetSales,维度选择上一步生成的即可。数据仓库与数据挖掘图3-11.度量值与维度图3-12.多维数据集数据仓库与数据挖掘3.4部署AnalysisServices项目新建多维数据集成功之后,进行部署。第一次部署失败,提示错误28000。如图3-13所示。图3-13.部署失败解决方法:在SQLServerManagementStudio中新建一个账户,并映射到AdventureWorksDW2012、权限设置为db_datareader。然后在DataTools中双击数据源下的AdventureWorksDW2012,把模拟信息改成使用服务账户。最后重新点击部署,部署成功。数据仓库与数据挖掘图3-14.部署成功3.5决策树建立上述完成后可以可以在工具栏的窗口中查看信息。如图3-15所示,为维度用法。图3-15.浏览维度用法数据仓库与数据挖掘右击挖掘结构,建立相应的挖掘结构模型,通过决策树等直观查看挖掘结果。图3-16.决策树结果示例4.实验总结通过本次实验,熟悉了SQLServer2012的使用以及AnalysisServices项目的创建和部署,加深了数据仓库中数据源、维度、多维数据集等概念的理解,并且练习运用这些组成部分构建和部署数据仓库,通过建立决策树对数据进行挖掘。对本课程的学习内容,也有了更为深入的理解。实验过程持续较长时间,也遇到一些问题。通过上网查询资料以及跟大家讨论,难题一一迎刃而解。报告中若有不完善之处,还请老师多多包涵。最后,非常感谢王老师通过建立QQ群的方式进行信息传达、问题讨论。即时通讯的一切优点在教学和实践中都有所体现,这样的平台让学生受益良多。再次感谢!

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功