浅析朴素贝叶斯分类算法在客户关系管理中的简单应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

浅析朴素贝叶斯分类算法在客户关系管理中的简单应用摘要:朴素贝叶斯算法主要是运用了概率中的大事件概率作为数学背景,因此在商业领域的数据挖掘中,通过使用贝叶斯算法,可以从顾客的历史消费记录中对未来一段时间内,该类的顾客的消费中做出一个合理的估计,并针对该顾客的消费习惯,合理使用促销手段,从而使得在有效的降低企业成本的同时,获得最大的收益。关键词:朴素贝叶斯分类算法0.前言在国内商业上对数据挖掘的运用,更倾向于使用数学模型建立不同商品属性之间的相关联系,即通过顾客的历史消费记录,对不同种类的顾客的消费品做出一个大概的估计,并根据不同的消费品为未来一段时间内企业的促销提供支持,其目的是一方面降低企业的促销成本,另一方面是为了是使促销方式能直接的针对潜在客户,即实现“利润最大化”。从实践的角度上也证明了关联分组挖掘法在商业上的成功应用,但是在现在越来越多的商业问题中,关联分组法的使用不能在最大程度上满足企业的实际需求,因此,在结合相关的概率理论方法上,融入到实际的商业模型中,我们提出朴素贝叶斯分类算法在实际商业过程中的使用。1.数据挖掘在市场营销中的作用数据挖掘在市场营销中的应用,就是把数据挖掘理论和技术同实际的商业问题相结合,并应用到实际的企业问题中去,创建描述和预测模型,并通过一系列的方式和方法不断的优化该商业过程,从而形成有效的营销管理。在结合以往的研究的基础上,可以总结出数据挖掘主要是应用到以下几个方面:(1.1)寻找潜在的客户。在该方面,数据挖掘能在寻找客户方面起到多方面的作用,在此,我们可以认为具体的作用主要有:识别优等的潜在客户;为满足潜在客户要求制定不同的个性化的沟通渠道;针对不同的潜在客户群选择合适的信息,其中这些信息就包括了沟通信息,促销信息,反馈信息,服务信息等等。(1.2)对广告等宣传方式进行数据挖掘,从而制定适合企业自生的宣传方式。从历史和经验角度上,我们知道寻找潜在客户的一种方法是寻找与现有客户类似的人。该过程主要是同历史数据有着很大的关系,因此,在对历史数据进行挖掘前,我们首先就要建立“简档”,即能充分反应这类历史数据的数据文档,从而为能更进一步的数据挖掘提供支持。(1.3)通过数据挖掘不断的改善营销活动。在利用各种手段建立数据简档后,剩下的主要工作就是建立有效客户响应模型等数据模型,其目的是优化营销活动收益,为定向营销提供决策支持。(1.4)利用现在已有的客户了解潜在的未知的客户。很多成功的数据挖掘模型都得出一个共同的认识,即发现好的潜在的客户的一个最为有效的方法是察看目前最佳的客户来自那里。只有充分的了解已有客户以及和他们的特征的相关记录,才能最为准确的了解潜在客户,并为挖掘潜在客户提供帮助。从以上几点我们不难看出,数据挖掘在市场营销的作用不仅仅是减少客户的流失,降低企业的运作成本,更为重要的是能通过现有客户,以及他们的行为特征,挖掘出潜在的客户,给企业带来更大的利润。2.数据挖掘的前期工作总和前人的实践和研究,我们可以把数据挖掘可以分为三个阶段,第一阶段是数据收集,整理阶段,从各种数据表明,该阶段大概占到整个数据挖掘过程的60%的工作量,数据处理的好坏直接影响到后面两个阶段工作的进程,和挖掘的有效性。第二阶段,就是我们通常所提到的建模阶段。针对不同的行业,不同要求,可以建立客户响应模型,客户流失模型,客户保持模型,风险模型等等,而此阶段主要应用到了回归分析法,因子分析法,关联分析法等等高等数学方法。第三阶段的主要工作是对前期建立的模型,以及实施效果进行评估,反馈和修正。数据挖掘模型的实施一般不会立刻收到成效,更多的是有一个时间缓冲期,因此,对于数据挖掘模型的好坏,要通过未来一段时间,在实施了模型方法后收集到的记录上得以评价,按照质量管理的观点上来看,该过程是一个不断重复的,修正的过程,其目的是从一个粗的,概要营销逐渐向细的,精细营销转变。3.朴素贝叶斯分类算法简介贝叶斯分类算法主要是建立在统计学分类方法的基础上的,该方法在商业上主要用作预测属性成员关系的可能性。贝叶斯分类算法的核心思想就是我们经常说的贝叶斯定理,我们可以用下面的数学式子加以表示:(|)()(|)()PXHPHPHXPX其中(|)PHX为后验概率,或者是我们经常说的在X的条件下,取H的后验概率。在实际的商业领域中,我们可以用下面的示例描述为,假设数据元组可以分为sale和income两个属性来描述顾客购买行为,假设用H来表示顾客购买电脑,那么,我们用(|)PHX来表示该顾客在sale和income已定的条件下购买电脑的概率。()PH是我们通常说的先验概率,接着我们上面说的例子,这也就是说任意给定的顾客将购买计算机的概率,而在此时我们并不再去考虑这类顾客的年龄和收入特征。(|)PXH是指在购买了电脑H的条件下,顾客X的概率。在实际的商业数据挖掘过程中,我们通常采用一下步骤对商业数据进行深入的挖掘:(1)设现有训练集X,并且该训练集可用如下属性集加以表示,即12{,......}nXxxx。(2)设有属性iH,并且我们的目标是求出一个关于购买iH的最大概率,由贝叶斯定理,我们此时就可以求出在满足属性X的前提下,满足属性iH的大概率。在计算的过程中,我们要注意的是,因为我们现在运用的贝叶斯定理是有假设前提的,即训练集的各个属性12{,......}nxxx,是相对独立的,因此我们在前期的数据收集,整理的时候,就要特别注意这个问题,如果一些属性并不是相对独立,而是存在相对影响的,此时我们就不能用朴素贝叶斯分类对预测进行估计了,而是要用到贝叶斯网的相关概念。(3.1)朴素贝叶斯分类的示例研究数据挖掘的运用主要是在实际的过程中,因此,我们在结合朴素贝叶斯分类法的基础上,以下面实际的商业数据为基础,通过建立相关的数学模型,对实际的商业数据进行挖掘,找出隐藏在海量数据中的,对商业决策有价值的信息。表(3.1)是某商业银行在信用卡销售中所截取的一部分数据(表3.1)收入范围报纸促销邮寄促销保险促销其他信用卡性别年龄30—40KYESNOYESNOMALE4530—40KYESYESYESNOFEMALE4740—50KNOYESNONOFEMALE4330—40KYESNOYESYESMALE3850—60KNONOYESYESMALE4020—30KNOYESYESYESMALE4130—40KNOYESNOYESFEMALE5540—50KYESYESNOYESMALE4830—40KYESYESYESNOFEMALE2830—40KYESNOYESNOFEMALE4740—50KYESYESNOYESMALE4220—30KYESYESNOYESFEMALE2950—60KNOYESNOYESMALE5040—50KYESNOYESYESFEMALE4820—30KYESYESNOYESMALE32通过该数据,我们现在的目的是对SEX作为要预测值的输出属性。在进行预测分类之前,我们首先要对该表属性SEX的简单统计,统计结果如下表(3.2)所示。(表3.2)报纸促销邮寄促销保险促销其他信用卡SEXMaleFemaleMaleFemaleMaleFemaleMaleFemaleYES55554473NO32324314Ratio:yes/total5/85/75/85/74/84/77/83/7Ratio:no/total3/82/73/82/74/83/71/84/7我们现在要使用表(2.2)的相关数据,和贝叶斯分类器执行新的分类。我们现在考虑新的实例:{报纸促销=YES,邮寄促销=YES,保险促销=NO,其他信用卡=YES}我们现在的要求是预测的SEX是男性,还是女性。即现在我们要求出的是在报纸促销,邮寄促销,其他信用卡都是YES,保险促销是NO的情况下,是男性概率大还是女性的概率大。在此,我用E表示{报纸促销=YES,邮寄促销=YES,保险促销=NO,其他信用卡=YES}。首先我们假设SEX=MALE,那么根据贝叶斯分类,我们有以下式子成立:(|)()(|)()PEsexmalePsexmalePsexmaleEPE由表(2.2),我们首先要求的是在sex=male的条件下,()PE的概率,在之前,我们由朴素贝叶斯的假设可知,E中的属性是相互独立的,即此时()()()()()PEPYESPYESPNOP报纸促销邮寄促销保险促销其他信用卡=YES由此,我们可以分别对属性的概率进行计算,计算结果如下:(|)PYESsexmale报纸促销=5/8(|)PYESsexmale邮寄促销=5/8(|)PNOsexmale保险促销=4/8(|)Psexmale其他信用卡=YES=7/8及此,我们可以得出在sex=male的前提下,满足E的条件的概率是(|)PEsexmale=(5/8)(5/8)(4/8)(7/8)=0.170233而此时,()Psexmale的先验概率是0.533333。由此,我们可以得出计算结果:(|)PsexmaleE=(0.170233)(0.533333)/()PE=0.090790/()PE按照以上的计算思路,我们可以计算出对比式子的概率是:(|)PsexfemaleE=(0.093710)(0.466666)/()PE=0.043731/()PE对比两组数据,我们不难看出在满足条件E的情况下,sex为male的概率大于sex为female的概率。再次,我们可以预测,在对报纸,邮寄,信用卡的促销有所响应,以及不响应保险促销的前提下,男性的反应程度要大于女性的反应程度。(3.2)数据挖掘结论讨论经过上面的数据挖掘,我们得出的结论是不同的促销手段的对性别的影响是有所差异的,在男性没有其他信用卡的时,对报纸促销,邮寄促销的响应度是大于在相同条件下的女性的,因此我们在未来营销策划中,如果是要对使用以上几种促销方法时,更多的是倾向于男性,但是如果单单使用该类方法,即使男性的响应很强烈,但是并没有达到我们要去的目标,在通过其他数据库的分析过程中,我们对男性进行特别的分析,可以得出一些结论,男性在贷款,还款上的响应也是很强烈的,因此才进一步的促销过程中,我们要更多的利用这个挖掘发现,刺激男性在其他相关方面的消费。这样才能达到实际的商业目的。4.结束语商业企业为了构筑持久竞争力,实现企业盈利的最大化,已经逐渐从粗放式的广撒网式营销转变为精细营销,其目的是对不同价值的客户实施差别化服务,在有效的降低成本的同时,扩大从客户中获得的利润。以上实例是针对性的使用了朴素贝叶斯分类的算法对客户数据建模,并挖掘出具有实际意义的分类结果,为企业进一步的制定营销策略提供了一定的参考依据。参考文献:[1]蔡琼,唐佳妮.数据挖掘在银行客户细分中的应用[J].软件导刊,2009(3).[2]蔡春华.浅析数据挖掘在企业CRM中的应用[J].商业现代化[J].2009(1).[2]OliviaParrRud.DataMiningCookbook[M].机械工业出版社,2003.[3]MichaelJ.A.BerryGordonS.Linoff.DataMiningTechniques[M].机械工业出版,2006.[4]JiaweiHanMichelineKamber.DataMiningConceptsandTechiques[M].机械工业出版社,2008.

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功