通信行业智能决策支持系统通信行业智能决策支持系统神舟通用助力通信业科学化管理数据挖掘通信数据挖掘产生背景产生背景客观需求在经营管理上向国外企业看齐信息技术的飞速发展,导致电子信息数据爆炸般膨胀。能否有效利用现有信息和数据,在很大程度上决定了企业能否抓住商机并夺得市场。如何更有效地发挥现有数据的价值,使数据库、数据仓库以及ERP、CRM中所积累的数据信息内部的规律展现在数据拥有者面前;如何提高信息的利用率,快速准确地分析出潜藏、有用的信息,做出高明的决策;如何通过透析历史经营情况归纳成的经验和失败的教训,用数据来预测未来的发展趋势,快速准确地把握风云变幻的市场脉搏;——数据挖掘的出现为这一切提供了一个契机。技术条件概述概述数据挖掘(DataMining),就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。“简单地说,数据挖掘用于发现您数据中[隐藏]的模式和关系,以便帮助您做出更好的业务决策。”本质上讲,数据挖掘其实是一类深层次的数据分析方法。知识架构知识架构数据挖掘技术数据挖掘技术归纳性技术通过对现有数据的深入分析,归纳总结出事物间的内部规律和关系,以指导对事物的认知和管理。常见的技术有关联规则挖掘、聚类分析、相关性分析、序列模式等。预测性技术通过对历史数据进行深入分析,总结、模拟出事物发展的一般规律(或称模式),从而有效指导对事物发展势态的预测。常见技术有分类预测和回归预测(包含时间序列预测)。关联规则,最初是为了解决购物篮分析问题而提出的,其目的是发现超市交易数据中不同产品同时被购买的规律。这些规律刻画了客户的购买行为模式,可以用来指导商家科学地安排进货、库存以及货架摆放设计等。啤酒和尿布:业务专家可以发现诸如“买牛奶的客户一般会同时买黄油”等显而易见的规律,但是利用数据挖掘您可能会发现“啤酒和尿布经常被同时购买”这些鲜为人知,但非常有用的规律。适用范围:除了用于零售行业,它也可以被广泛应用到电子商务、通信等其它行业中,用以发现客户消费的关联行为,从而指导决策人员制定交叉销售策略,提升客户价值或进行客户挽留。关联分析客户ID交易时间产品数量10000012005-3-2面包210000012005-3-2水果110000012005-3-2牙刷110000012005-3-2牙膏110000012005-3-2书210000022005-3-2牛奶110000022005-3-2面包110000022005-3-2水果110000022005-3-2水杯110000032005-3-2牛奶110000032005-3-2面包310000032005-3-2水果110000032005-3-2饮料110000032005-3-2衣服210000032005-3-2烤鸭110000032005-3-2洗面奶110000032005-3-2洗发水110000032005-3-2牙膏310000032005-3-2牙刷3……………………1。牛奶,水果=〉面包(置信度=70%,支持度=6.8%)2。面包=〉牛奶(置信度=80%,支持度=17.3%)3。面包=〉牛奶(置信度=80%,支持度=10.3%)4。牙膏=〉牙刷(置信度=80%,支持度=1.3%)思想:按照“物以类聚”的思想,利用数据挖掘的方法,将事物聚集成组内差异尽可能小、组间差异尽可能大的几个小组。用途:将客户或监管对象自动聚集成具有明显不同特征的群体,从而使决策人员和业务人员能够尽可能做到精细化营销和科学化管理。将通信客户自动聚成“短信一族”、“商务型”和“时尚一族”3个具有不同特征的群体聚类分析对于经验丰富的业务专家来说,他们经常会发现某些数值型影响因素与关注的数值型目标之间存在相关性,但是又没法客观地量化其相关程度。这些专家的一些定性的经验很难固化成知识,快速传授给新人。由于人脑信息容量的制约,专家对知识的积累是有限度的和有选择的。利用相关分析,并借助计算机,可以对所有可能与目标相关的因素快速进行综合分析,帮助分析人员或决策人员将这种相关性快速量化,并形成易于学习和继承的结论,从而指导决策。定性感知量化结论相关分析相关分析对于经验丰富的业务专家来说,他们经常会发现某些因素对关注的目标有一定的影响,但是各因素对目标的影响程度(或称重要性)又各不相同,但是又没法客观地量化这种“重要性”。在建立关于目标的预测模型时,我们需要筛选出一部分对目标影响最大的因素进行分析(因子太多,引入的干扰因素就越多,会降低模型对新数据预测的准确率;同时,建模需要花费的时间也较多)。属性重要性分析方法,帮助分析人员或决策人员将这种“重要性”关系快速量化,并为预测模型的建立提供因子筛选标准。属性重要性分析“客户流失”属性重要性打分目的:从历史数据中,自动推导出对事物发展规律基于给定数据的推广性描述,构造一个分类函数或分类模型(分类器),该模型能把满足一定特征的数据归为特定的类别。作用:(1)判别分析:利用分类模型总结的分类规则,对给定特征的新数据进行判定,将其划归到特定的类别,称之为“判别分析”。(2)分类预测:与判别分析不同,分类预测的分析目标是事物在未来的发展状况,判定其在未来某时刻将呈现的状态。分类下图为一个病情诊断的例子,利用建立的决策树模型,以确定何种情况(K、Na、蛋白质等含量)下该吃什么药。和分类预测类似,回归分析也是从历史数据中自动推导出对事物发展规律基于给定数据的推广性描述;不同的是回归分析的目标是数值型指标,构造的模型是一个回归函数;用于判定给定特征的数据的目标应该达到的数值,而非状态。回归分析时间序列,就是将某一指标值在不同时间上的不同数值,按照时间先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,不可能完全准确地利用历史值来预测将来,但是前后时刻的数值具有一定的相关性。时间序列挖掘,通过对历史数据进行分析,揭示其内在规律(如波动的周期性、振幅,趋势的种类等),以从动态的角度刻划某一现象同其他现象之间的内在关系,从而掌握和控制未来行为,进而完成预测未来行为等决策性工作。时间序列分析用途用途如何对现有客户进行分类才最合理?每类客户应该制订怎样的营销或管理策略?对于稳定客户,如何对其进行交叉销售,提升其价值?哪些客户有流失倾向?应该如何挽留他(她)们?客户的信用度如何?如何防范欺诈行为?客户对价格的敏感度如何,价格变动对其有多大影响?如何发现潜在的设备故障和事故?未来的电力负荷会怎样,电力系统是否稳定?如何优化组织的资源分配?如何发现新药?工业生产中各种因素对产品质量的影响程度如何?产品生产过程中,各种影响因素应该调到什么水平才能保证产品质量,或生产出最优的产品。……数据挖掘可以帮助你解决如下难题:数据挖掘流程数据挖掘流程CRISP-DM,为Cross-IndustryStandardProcessforDataMining(交叉工业的标准数据挖掘流程)的缩写,是一套成熟的数据挖掘流程国际标准,被众多主流数据挖掘厂商所遵循。作为一种方法论,它将一个数据挖掘工程分成商业理解、资料理解、数据准备、模型建立、模型评估、模型部署6个步骤,并展示了各步骤之间的关系。DW业务理解应用部署模型评估模型建立数据准备数据理解应用现状应用现状数据挖掘从一开始就是面向应用的。目前,在很多领域数据挖掘都做出了巨大的贡献,尤其是在通信、银行、保险、证券、政府、零售(如超级市场)、交通、制造业、电子商务、医疗等诸多领域。数据挖掘能够解决的典型商业问题有:客户细分、客户流失预警、信用评估、交叉销售、风险预警等。行业应用行业解决方案通信行业银行业保险业证券行业政府行业……客户流失分析客户细分客户信用评估交叉销售营销效果预测价格敏感度分析客户综合价值评估数据挖掘通信数据挖掘背景背景我国加入WTO以后,国外资本大量涌入国内电信市场,国际化的市场环境要求国内的电信运营企业在经营管理上能够迅速赶上国外的先进水平,以迎接电信运营业的国际化竞争。随着国内电信行业改革和重组的不断深化,国内电信业务的市场环境将渐趋合理,竞争将日益加剧。经过重组后的中国电信市场有中国电信、中国网通、中国移动、中国联通、中国铁通和中国卫星通信6家电信运营企业。各企业在业务上互相交叉渗透,相互竞争,面临着前所未有的挑战。市场压力加大、客户对质量的要求提高、竞争成本增加、ARPU和收益下降、利润点转移,企业已经很难再像以前一样通过规模效应来维持竞争优势。各个运营商的网络质量逐渐趋同,营业范围的放开和一致性,要求电信企业建立一套以数据整理、数据挖掘、信息传递为基础的商业智能系统(即运营分析与决策支持系统),以提高自己的竞争能力,增强竞争优势,支持企业市场战略。分析主题分析主题通信行业分析主题客户流失预警分析模型旨在帮助客服、营销人员预测客户流失的倾向。具体来说,我们根据客户的人口统计、行为趋势、呼叫历史、付费情况等等信息以及一些由此衍生出的数据,来预测客户流失可能性的高低。该可能性可以帮助客服和营销人员在进行客户维系和挽留时更有针对性和前瞻性,从而减少挽留成本并提高维系效率。客户流失预警分析客户流失预警分析决策树展示流失预警分析模型决策树展示流失预警分析模型模型预测客户流失可能性模型预测客户流失可能性客户流失原因分群分析客户流失原因分群分析用户意见雷达图01020304050欠费提示资费问题信用额度网络质量缴费困难查询困难垃圾短信群一群二群三群四基于过去的流失历史,根据据客户的人口统计、行为趋势、呼叫历史、付费情况等信息,构建客户分群模型。对于每个群,找出可能的流失原因以及挽留对策。基于当前每个具体的客户数据,计算出将来最有可能流失的的原因,实施针对性的挽留措施。分群结果附:数据挖掘在附:数据挖掘在BIBI建设中的地位建设中的地位02040608010002468复杂度排序商业价值OLAP数据挖掘报表统计分析查询分析普通统计35咨询热线:+86-10-53500358神舟通用数据挖掘领域顶尖公司神舟通用数据挖掘领域顶尖公司