商务智能应用实例10.1数据仓库的数据加载与钻取10.2商务智能中的数据挖掘模型设计10.3SQLServer中的数据挖掘工具10.4商务智能客户端界面的设计第10章商务智能应用实例通过本章学习,可以了解:如何使用SQL2005对超市销售数据仓库进行数据加载;如何建立数据挖掘应用模型;如何使用SQL2005的数据挖掘工具;如何将多维数据集与数据挖掘结果通过终端展示工具展示给商务智能用户;10.1数据仓库的数据加载与钻取10.1.1数据仓库的数据加载1.建立复制2.创建发布和定义项目3.创建请求订阅向导4.禁用发布或分布向导10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.2超市数据仓库系统的数据加载10.1.3多维数据集的更新⑴运行“SQLServerBusinessIntelligenceDevelopmentStudio”,然后新建一个IntegerationService项目。⑵在该项目中,右键单击SSIS包,然后选择“新建SSIS包”命令10.1.3多维数据集的更新10.1.3多维数据集的更新10.1.3多维数据集的更新10.1.3多维数据集的更新10.1.4数据仓库的钻取访问1.数据钻取的进入10.1.4数据仓库的钻取访问2.数据钻取选项的确定10.1.4数据仓库的钻取访问3.钻取数据列的选择10.1.4数据仓库的钻取访问4.钻取数据的选择10.1.4数据仓库的钻取访问5.钻取结果显示10.1.5数据仓库的多维表达式MDX应用10.1.5数据仓库的多维表达式MDX应用在查询输入框中输入需要的查询语句,如:Select{[Measures].[商品销售额],[Measures].[商品成本],[Measures].[商品销售量],[Measures].[商品销售利润]}oncolumns{[Customdim].[客户所在城市].children}onrowsfrom[超市系统]where([Storagedim].[开业年份].[2003])10.1.5数据仓库的多维表达式MDX应用10.1.5数据仓库的多维表达式MDX应用MDX的多维查询语句一般的形式为:SELECT[,…]FROMWERE10.2商务智能中的数据挖掘模型设计10.2.1数据挖掘对象的分析数据挖掘项目组成员超市营销策略评价主要通过门市、商品、营销策略、日期和客户五个维度。要分析的则是商品的销售量、销售额、商品的成本和商品销售的利润等度量信息。商品销售量增长率=(实施促销策略后商品销售量/实施促销策略前商品销售量-1)×100%商品销售额增长率=(实施促销策略后商品销售额/实施促销策略前商品销售额)×100%商品利润增长率=(实施促销策略后商品利润/实施促销策略前商品利润)×100%商品促销策略门市影响率=不同门市相同促销策略商品利润增长率之比商品促销策略时间影响率=不同时间相同促销策略商品利润增长率之比等各种新的变量。10.2.2数据挖掘模型与相关数据的准备1.挖掘模型的确定在过去的若干年中的业务趋势是什么?在业务的不同分类中有哪些最活跃的因素?不同的元素之间是否存在相关性?最感兴趣的分类存在哪些地方?不同的分类有哪些层次?客户分成“接收促销”、“不接收促销”两个分类。将客户分成三个不同的聚类,它们的特征分别有哪些?销售额前10个商品聚类是什么?它们彼此之间有哪些不同之处?有时为了解决一些较大的业务问题,可能还需要对业务问题进行分解,将业务问题分解成多个较小的问题。如果这些问题能够使用分类、估计、关联分组、聚类、细分或预测等挖掘方法来解决。那么这一较大的问题也就可以用数据挖掘方法解决。10.2.2数据挖掘模型与相关数据的准备将客户流失问题分解成这样一些问题:①那些已经或正在流失的客户具有哪些特征?②能否建立一个预测正在流失客户的模型,预测客户流失行为的发生?③能否建立一个模型,进一步预测那些将要流失的客户会在什么时候流失?④能否建立一个模型解释这些流失客户为什么流失?对这些分解以后的问题就可以使用不同的数据挖掘方法来解决。10.2.2数据挖掘模型与相关数据的准备①可以使用聚类方法将流失的客户分成不同的组,这就能够很好地说明那些流失客户的特征。对问题②,则可以将所有客户划分到“流失”和“不流失”两个客户类中,这就可以预测那些可能流失的客户。同时,这种分类也可以用来解释问题④。而对于问题③则可以变换一下角度来考虑,即开发一个预测模型,预测客户会在“近期”、“中期”、“远期”流失,这样就可以将所有客户分成“近期”、“中期”、“远期”三个流失类。10.2.2数据挖掘模型与相关数据的准备确定挖掘模型的分析目标或挖掘成功的度量值度量值的确定步骤:收集企业的关键战略领域报表、识别企业信息量化的度量指标、对这些度量指标进行编码、识别数据挖掘解决业务问题的度量指标、对度量指标设定基线。例如,在超市数据挖掘中经常进行度量的指标有:购买商品的客户百分比、对促销策略响应的客户数、客户购买商品的平均量、某一时间段购买商品的总量或总金额、商品销售的利润率。在确定了度量值以后,还要确定这些度量值的当前值,以便在数据挖掘以后,采取相应对策后的比较。2.挖掘数据的准备建立数据挖掘库:选择业务数据、转换业务数据、验证业务数据。为数据挖掘工作准备训练数据集与数据验证集:确定数据质量、准备适当的数据、为目标变量确定初值、确定数据挖掘变量的格式。10.2.3数据挖掘模型的应用注意多目标变量之间的相互关系确定多目标变量最终的分析顺序剔除那些对目标变量具有强相关性的变量挖掘模型的维护和完善将所获得挖掘结果存储进多维数据集