数据仓库与ETL的实现过程设计数据仓库Cube多维数据集数据仓库源系统客户端设计数据仓库导入数据仓库建设Cubes查询数据134查询工具报表分析数据挖掘2数据仓库的星型结构Employee_DimEmployeeKeyEmployeeID...EmployeeKeyTime_DimTimeKeyTheDate...TimeKeyProduct_DimProductKeyProductIDProduceNameProductBrandProductCategory...ProductKeyCustomer_DimCustomerKeyCustomerID...CustomerKeyShipper_DimShipperKeyShipperID...ShipperKeySales_FactTimeKeyEmployeeKeyProductKeyCustomerKeyShipperKeyUnitsPrice...TimeKeyCustomerKeyShipperKeyProductKeyEmployeeKey多个外键事实维度键维度与事实一个数据仓库包括了–多个中央事实表FactTable多个维度外键和多个可以分析的指标–多个维度表DimensionTables可以分析的角度ETL过程数据从数据源向目标数据仓库抽取(Extract)、转换(Transform)、装载(Load)的过程ETL过程•构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。•抽取:将数据从各种原始的业务系统中读取出来。•转换:按照预先设计好的规则将抽取得数据进行转换、清洗,以及处理一些冗余、歧义的数据,使本来异构的数据格式能统一起来。•装载:将转换完的数据导入到数据仓库中。ETL举例FNameLNameUnitPriceQtyBarrAdam.552ChaiSean1.13…EmpKeyName1Barr.Adam2Chai.Sean…NameUnitPriceQtyBarr.Adam.552Chai.Sean1.13…NameTotalSalesBarr.Adam1.1Chai.Sean3.3…EmpKeyTotalSales11.123.3…导入合并计算查找案例背景保健品销售部门,各分部门将销售情况记录在各自的表中,记录方式也是不一样的要求计算出各种产品各个员工07年的销售情况店面网售PosDWSQLsheet1sheet2sheet3Pos部门销售情况EmployeeNameGroupNameTimeProductNameProductStyleProductClassQuantityInformationSourceSaleAddressDimProductProductKeyProductNameProductStyleProductClass店面销售情况EmployeeNameGroupNameTimeProductNameProductStyleProductClassQuantityCustomerEvaluationCustomerSources网售销售情况EmployeeNameGroupNameTimeProductNameProductStyleProductClassQuantityProductNameProductStyleProductClassProductNameProductClassProductStyleProductNameProductClassProductClassProductNameProductStyleProductStyleDimEmpEmployKeyEmployeeNameGroupNameDeptNameGroupeNameEmployeeNameGroupeNameGroupNameEmployeeNameEmployeeNameGroupeNameEmployeeName维度表的抽取源表源表源表维度表店面销售情况EmployeeNameGroupNameTimeProductNameProductStyleProductClassQuantityDimProductProductKeyProductNameProductStyleProductClassFactSalesProductKeyProductNameProductStyleProductClassProductNameProductClassProductStyleProductNameProductClassProductStyleProductKeyProductKey事实表的抽取源表维度表事实表DEMO