数据挖掘技术在客户关系管理中的应用[摘要]市场的激烈竞争导致了面向市场营销和客户服务的数据仓库的建设以及数据挖掘技术的应用,本文在介绍了数据挖掘技术的基础上,重点阐述了数据挖掘平台的建立,以及基于这个平台展开数据挖掘的过程和数据挖掘的主题分析。[关键词]数据挖掘技术;客户关系管理;数据仓库;数据挖掘主题一、引言随着计算机技术、网络技术、通讯技术的发展以及各行各业业务操作流程的自动化,企业内产生了以几十或上百GB计的大量业务数据,这些数据和由此产生的信息是企业的财富,它如实地记录着企业运作的本质状况。但是面对如此海量的数据,迫使人们不断寻找新的工具,来对企业的运营规律进行探索,为商业决策提供有价值的知识,使企业获得利润。能满足企业这一迫切需求的强有力的工具就是数据挖掘。二、数据挖掘技术概述数据挖掘是一种知识发现的过程,它主要基于统计学、人工智能、机器学习等技术,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,并对未来情况进行预测,以辅助决策者评估风险,做出正确的决策。数据到知识的演化过程,如图1。对于企业而言,数据挖掘有助于发现业务的趋势,揭示已知的事实,预测未知的结果。从这个意义上讲,知识是力量,数据挖掘是财富。在实际应用中,数据挖掘主要采用以下几种方法进行模式的发现。相关分析和回归分析。相关分析主要分析变量之间联系的密切程度,而回归分析主要基于观测数据建立变量之间适当的依赖关系,相关分析是回归分析的基础。时间序列分析。与相关分析类似,目的也是为了挖掘出数据之间的联系,但时间序列分析更加侧重于数据在时间先后上的因果关系。分类分析。分类分析首先为每一个观测赋予一个标记,然后检查这些被标记的观测,描述出这些观测的特征。这种描述可以是一个数学公式或者模型,利用它可以分类新的观测。常用的几种典型的分类模型有线性回归模型、决策树模型、基于规则模型和神经网络模型等。聚类分析。与分类分析不同,聚类分析的输入是一组未标定的记录,目的是根据一定的规则,合理地划分记录集合。聚类分析和分类分析是一组互逆的过程,因此在很多分类分析中适用的算法也同样适用于聚类分析。三、数据挖掘在CRM中的应用在客户关系管理中,数据挖掘的前提是必须建立企业级的客户信息数据仓库,能够把不同联机事务处理系统的客户数据聚集在一起,提供一个正确、完整和单一的客户数据环境。1.数据仓库的建立数据仓库作为数据挖掘的基础,不同于传统的联机事务处理系统,它具有面向主题的、集成的、不可更新以及随时间变化的特性,各个联机事务处理系统作为数据仓库的原始数据源,以文件方式提供客户基本资料、客户清单、客户账单、客户联系历史记录等数据,数据仓库通过ETL过程处理这些接口文件,并且按不同的主题域组织、存储和管理这些客户数据,通过数据仓库接口,对数据仓库中的客户数据进行联机分析和数据挖掘。数据仓库的体系结构主要由数据源、企业级数据仓库和决策支持3个部分组成。数据挖掘的主题定义在建立完成企业级的客户信息数据仓库之后,可以基于这个数据仓库平台进行数据挖掘工作,应用到以客户为中心的企业决策分析和管理的各个不同领域和阶段,在客户关系管理中,它可以应用在以下几个方面。客户群体分类分析。近年来,一对一营销正在被众多的企业所青睐。一对一营销是指了解每一个客户,并同其建立起持久的关系。数据挖掘可以把大量的客户分成不同的类,在每一个类里的客户具有相似的属性,而不同类里的客户的属性也不同。通过数据挖掘可以了解不同客户的爱好,提供有针对性的产品和服务,来提高不同类客户对企业和产品的满意度。客户行为分析。利用分类分析法和聚类分析法对客户通话行为进行分析,从而得出客户在消费习惯、生活方式、社会联系等方面的特征。对客户行为分析的根本目的是为了按不同特征划分客户群,针对不同客户群的特征,企业可以进行不同的市场营销活动和客户服务,在客户群划分中典型的应用就是针对某一客户群的消费特征进行某种业务的营销。客户的获得与保持。企业的增长和发展壮大需要不断维持老的客户,不断获得新的客户,新的客户包括以前没有听说过本企业产品的人,以前不需要本企业产品的人,以及以前是本企业竞争对手的客户。不论企业希望得到的是哪类客户,数据挖掘都能帮助企业识别出这些潜在的客户群,并提高市场活动的响应率,使企业做到心中有数,有的放矢。优惠策略仿真预测。优惠是市场营销中十分重要的一部分,优惠策略不恰当,常常会得到适得其反的市场效果,优惠策略仿真预测就是通过已建立的客户行为模型仿真客户对优惠策略的反应,从而预测优惠策略实施的效果。通过对优惠策略的仿真,可以预测优惠策略的成功与否,从而进行相应的调整和优化。客户信用分析。客户忠诚度分析主要通过对客户消费金额和账务支付的分析,建立客户价值模型,从而获得客户价值。客户是企业价值之所在,通过对客户忠诚度分析,有针对性地对高价值客户进行优质服务,对有离开倾向的客户及时进行挽留活动,对提高企业市场占有率,降低营销成本是十分有用的。反欺诈分析。目前,企业面临的一个最严重的问题是欠费问题,其中很大一部分是欺诈消费,因此反欺诈消费已经成为企业发展的关键。通过对客户数据的多维分析、聚类分析和孤立点分析可以建立客户欺诈消费模型,从而可以有效地对客户消费行为进行监控,对满足欺诈消费模型的消费行为进行告警。竞争对手分析。成熟的市场必然是一个竞争比较充分的市场,不同企业客户之间的互联互通是最基本的前提,因此通过对客户与竞争对手客户之间通话的行为分析,可以建立有关竞争对手经营和客户服务的模型,比如竞争对手客户发展模型,通过对这些模型的使用,可以制定有效的市场应对策略。交叉销售。现在企业和客户之间的关系是经常变动的,一旦一个人或者一个公司成为企业的客户,就要尽力使这种客户关系对企业趋于完善。一般来说可以通过这3种方法:a.最长时间地保持这种关系;b.最多次数地和客户交易;c.最大数量地保证每次交易的利润,因此就需要对已有的客户进行交叉销售。交叉销售是指企业向原有客户销售新的产品或服务的过程,交叉销售是建立在双赢原则的基础之上的,是对企业和客户都有好处的,客户因得到更多更好符合其需求的服务而获益,企业也因销售增长而获益,对原有客户销售的挖掘,在很多情况下与对潜在客户的挖掘是类似的,对于一些情况甚至可以当作是初次销售来对待,而交叉销售的好处在于,对于原有客户,企业可以比较容易地得到关于这个客户的比较丰富的信息,大量的数据对于数据挖掘的准确性来说是有很大帮助的,在大多数情况下所指的交叉销售是与初次销售不同的,在企业所掌握的客户信息,尤其是以前购买行为的信息中,可能正包含着这个客户决定下一个购买行为的关键因素甚至决定因素,这个时候数据挖掘的作用就会体现出来,它可以帮助企业寻找到这些影响其购买行为的因素。3.数据挖掘的过程在数据挖掘目标明确的前提下,可以基于已经建成的企业级客户信息数据仓库进行数据挖掘工作。数据挖掘遵循以下步骤:问题定义、数据准备、数据探索、建立模型、模型检验、模型应用以及投资回报分析。在问题定义之后,需要创建一个数据集市作为数据挖掘和分析的对象,一般抽取数据仓库中与问题相关的数据子集作为数据集市,在创建集市过程中可以使用随机抽样、等距抽样、分层抽样和分类抽样等抽样技术来减少数据集市的数据量,通过对数据的删选和对小概率事件的放大,使得数据集市中数据的特征和规律性更加显着。在数据探索过程中,通过多维分析和可视化展现探索数据的特征,通过对数据进行增删操作或者根据现有变量重新组合生成一些新的变量来更加有效地描述数据特征,其中,对数据统计特性的分析在数据探索过程中起着十分重要的作用。建立数学模型是数据挖掘工作的核心环节,目前比较常用的建模方法有神经元网络模型、决策树模型和回归模型。数据挖掘中具体使用哪一种方法,取决于数据集市的特征和需要实现的目标,在实际应用中,往往是对多种建模方法的比较和综合。在建模过程中,把数据分层为训练数据和校验数据,训练数据主要使用于建模过程中求解模型参数,而校验数据主要用于模型检验。因此模型检验阶段的主要工作是把检验数据代入已经建立的模型中,观察模型的响应,通过比较模型的响应和真实的数据,从而评估模型的准确程度,如果模型的准确性比较差,就需要重新进行数据探索、建立新的模型,直至新模型检验。因此,在实际应用中,数据探索、建立模型、模型检验是反复迭代的过程,如图2。数据挖掘的过程就是一个不断探索数据特征、建立和检验模型、发现客户消费行为特征的过程,企业只有把模型的结果应用到市场营销和客户服务过程中,才能真正发挥数据挖掘的作用。四、结语在信息时代,要充分利用企业的信息资源,从以产品为中心的管理模式转变为以客户为中心的管理模式上来,利用数据挖掘技术,分析客户的特征,探索企业和所对应市场的运营规律,不断提高企业的经济效益是企业发展的必由之路。主要参考文献[1]上海现代物流人材培训中心.企业资源计划(ERP)与SCM、CRM[M].北京:电子工业出版社,2002.朱明.数据挖掘[M].合肥:中国科学技术大学出版社,2002.毛国君,段立娟,王实,石云.数据挖掘原理与算法[M].北京:清华大学出版社,2005.