客户关系管理第7章CRM系统中的商业智能技术数据仓库技术数据挖掘理解三种技术的的应用商业智能技术的概念与应用联机分析处理商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术数据仓库数据仓库(datawarehouse)是一个面向主题的(subjectoriented)、集成的(integrated)、非易失的(non-volatile)、随时间变化的(timevariant)数据集合,用于支持管理决策面向主题集成性非易失性时变性商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术数据粒度粒度级别综合程度数据量数据细节(详细度)高高小低低低大高数据分割垂直分割水平分割图解分割商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术特性数据库数据仓库数据当前数据历史数据面向业务操作数据分析存储读写操作多为只读使用频率高较低数据访问量少多要求的响应时间较短可以很长关注数据输入信息输出数据库与数据仓库的区别商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术企业外部数据数据仓库存储数据元数据业务操作型系统数据清洗/转换数据提取提取仓库数据挖掘系统/数据展现系统数据集市数据集市数据集市数据集市数据仓库的体系结构图商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术操作数据存储ODS是用于支持企业日常的、全局应用的数据集合。ODS解决的是“日常”性问题,因而具有引入数据是可变的、数据是当前或近期的两个特点。应用联机事物处理OLTP联机分析处理OLAP商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术联机分析处理OLAP是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。相关逻辑概念变量维维的层次维成员事实多维数据立方体商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术OLAP的分析动作数据切片数据切块数据钻取数据聚集数据旋转商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术20073季20071季20061季20063季20074季20072季20064季20062季a1a2北京上海东京大阪钻取聚集a2a120062007中国日本20062007北京上海东京大阪a1a220062007A1200230A2456478A3100120A1A2A320062004561002007230478120数据钻取与聚集数据旋转商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术冰箱销售第1季度,冰箱在什么地区销售情况最好?第1季度,哪个省份的冰箱销量处于领先地位?第1季度,哪个城市的冰箱销售数量最高?产品地点时间电视冰箱空调华东东北西北2006.42007.12007.22007.3冰箱运用数据切片来分析商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术冰箱44899西北79954华东36040东北25309浙江29344江苏17866吉林18174辽宁西北东北华东冰箱24632陕西20267甘肃25301山东运用数据钻取来分析商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术07年1季07年1季07年1季电视冰箱空调数量数量数量西北陕西西安145691354411308咸阳11027110888112甘肃兰州7205111699846天水283290986355华东山东济南87701210910699青岛87811319210657浙江杭州145711402519326宁波128301128417196江苏南京226751662419665苏州183081272017983东北吉林长春900394136847四平820184534364辽宁沈阳1675196315745大连1212685436356商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术用户信息实用者知识挖掘者客户数据仓库的功能动态、整合的客户数据管理和查询功能基于数据库的客户关系结构和忠诚客户识别功能基于WEB数据仓库的信息共享功能基于数据库支持的客户购买行为参考功能基于数据库支持的客户流失警示功能商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术客户数据仓库的体系结构数据挖掘对分析的结果进行评估客户信息客户活动清洗、转换外部数据联机分析处理数据仓库数据准备客户数据集市商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术客户数据仓库的设计分析建立企业模型概念模型设计逻辑模型设计物理模型设计数据仓库的生成确定系统边界及主题域技术准备工作确定数据的存储结构确定数据存放位置确定存储分配商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术客户数据仓库的建设数据信息的搜集和集成确保数据的质量按规则更新数据,保持对已有客户的看法数据仓库统一共享,以发挥最大效益分析定性分析方法定量分析方法商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术数据挖掘数据挖掘(datamining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在有用的信息。它是通过分析数据发现数据内部的信息和知识过程。数据挖掘定义首先强调了数据挖掘的基础是大量数据,所以数据挖掘应该具有高效处理大量数据的能力。这也是目前数据挖掘技术的一个难题,一些算法在小数据集上效果很好,但数据量增加到一定程度,算法的实现代价过大、效率太低,甚至无法实现。商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术数据来源事务数据库高级数据库数据仓库关系数据库数据挖掘算法孤立点分析关联分析分类分析聚类分析序列模式分析商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术ID购买商品1{K,A,D,B}2{D,A,C,E,B}3{C,A,B,E}4{B,A,D}规则置信度A∧BD75%A∧DB100%B∧DA100%AB∧D75%BA∧D75%DA∧B100%关联分析商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库{F}25%项集支持度{A}100%{B}100%{C}50%{D}75%{E}50%根据最小支持度60%得到频繁项集L1连接产生候选集项集支持度{A}100%{B}100%{D}75%项集{A,B}{A,D}{B,D}计算支持度项集支持度{A,B}100%{A,D}100%{B,D}75%全部满足最小支持度连接产生新的候选集项集{A,B,D}支持度75%客户关系管理第7章CRM系统中的商业智能技术序列模式分析C=先购买了商品X的组数先购买了商品X再购买商品Y的组数S=总组数先购买了商品X再购买商品Y的组数置信度支持度客户号日期商品号数量甲3/4/07A14B34/4/07C11乙5/6/07C2B3D138/6/07B10D12I1I2CSAB10.5BC0.50.5A,BC0.50.5BB0.50.5BD0.50.5BB,D0.50.5B,C,DB,D0.50.5时间分类表序列规则客户关系管理第7章CRM系统中的商业智能技术AllCreditRiskGood:3Bad:4Debt=LowCreditRiskGood:3Bad:1Debt=HighCreditRiskGood:0Bad:3EmploymentType=Self-employedCreditRiskGood:0Bad:1EmploymentType=salariedCreditRiskGood:3Bad:0ID债务情况收入情况工作类型信用风险1HighHighSelf-employedBad2HighHighSalariedBad3HighLowSalariedBad4LowLowSalariedGood5LowLowSelf-employedBad6LowHighSelf-employedGood7LowHighSalariedGood分类分析决策树商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术聚类分析相异度距离0d(2,1)0d(3,1)d(3,2)0d(n,1)d(n,2)……0xi1xj12+xi2xj22+…+xipxjp2(a)(b)(c)K-平均算法的过程商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库假设有k个群组Si,i=1,2,...,k。μi是群组Si内所有元素xj的重心,或叫中心点。客户关系管理第7章CRM系统中的商业智能技术DM与OLAP数据挖掘能自动地发现隐藏在大量数据中的隐含模式,它与其他分析型工具最大的不同在于它的分析过程是自动的。数据挖掘的用户不必提出确切的问题,而只需挖掘工具去挖掘隐藏的模式并预测未来的趋势,这样更有利于发现未知的事实。与数据挖掘相比,OLAP更多地依靠用户输入问题和假设,但用户先入为主的局限性可能会限制问题和假设的范围,从而影响最终的结论。因此,作为验证型分析工具,OLAP更需要对用户需求有全面而深入的了解。商业智能DM的应用客户智能基本概念基本概念数据挖掘DW的应用OLAP的应用OLAP基本概念DM与OLAPDM的算法数据仓库客户关系管理第7章CRM系统中的商业智能技术数据挖掘的基本步骤模型实施建立数据挖掘库分析数据建立模型模型评估与验证确定分析和预测目标修改模型商业智能DM的应用客户智能基本概念基本概念数据挖掘