河北工业大学硕士学位论文基于数据挖掘的电信客户流失分析研究姓名:李茹申请学位级别:硕士专业:计算机应用技术指导教师:沈西挺20091101河北工业大学硕士学位论文i基于数据挖掘的电信客户流失分析研究摘要文章主要研究了基于数据挖掘算法在电信行业中的客户流失问题。如何更准确的利用海量数据通过挖掘算法建立客户流失预测模型是该课题的关键。即根据流失客户和非流失的客户性质和消费行为,通过数据挖掘技术在海量的历史数据中实施挖掘分析,搭建客户流失预测模型,分析出哪些用户的流失概率昀大,并根据流失客户的消费行为及客户流失的其他相关因素,给市场营销提供决策支持。文章采用理论研究和实证研究相结合的方法,以某移动分公司的客户数据为基础,构建了基于决策树和神经网络的D-N混合模型。详细阐述了包括属性、数据的准备、模型的构建以及模型的评价和应用的整个过程。文章采用数值化指标和图形化指标对模型进行评估,使评估更加客观,研究结果表明混合模型在预测精度和命中率方面都有所改善,从整体性能来看也要优于该公司现有的客户流失分析方法。文章利用D-N混合模型的结果,在分析该移动分公司在网用户未来一个月的流失概率的基础上,探讨了流失概率高的客户月消费额、在网时长、性别、通话次数等属性,总结了客户流失的原因,并提出了相应的客户挽留措施。昀后,对所做的主要研究工作进行了总结,并针对以后的研究内容提出了方向和思路。关键词:客户流失,数据挖掘,决策树,神经网络基于数据挖掘的电信客户流失分析研究iiTHEANALYSISANDSTUDYOFCUSTOMERCHURNBASEDONDATAMININGTECHNOLOGYINTHETELECOMMUNICATIONINDUSTRYABSTRACTMajorresearchinthispaperistheproblemofcustomerchurnbasedondataminingtechnologyinthetelecommunicationindustry.Thekeyissueishowtomakegooduseofalargenumberofdatathroughdataminingtechnologytobuildcustomerchurnmodel.Namely,accordingtotheconsumptionbehaviorsandnaturesofcustomerswhoarelostornotlost,throughdataminingtechnologytoanalyse,andbuildthecustomerchurnpredictionmodel.Ananalysisofcustomerswhohavethegreatestprobabilitytolose,andaccordingtothelossofcustomerbehaviorsandotherrelatedfactors,toprovidedecisionsupportformarket.Inthispaper,atheoreticalresearchandempiricalstudymethodisused.Basedonamobilebranch’scustomerdata,thispaperbuildsD-Nhybridmodel,includingadetailedexplanationofthewholeprocesssuchasattributeschoosing,datapreparation,constructionofthemodelandmodelevaluationandapplication.Inthispaper,amorereasonableevaluationmethod-numericalindicatorsandthegraphicindicatorsareusedtoevaluatetheresultofthemodel.Theresultindicatesthatthehybirdmodelhasbetteraccuracyandhitrates.Meanwhile,theD-Nmodelpresentsbetterresultsthantheexistingmethodusedbythiscompanyathome.ThenusingtheresultsoftheD-Nmodel,thispaperanalysestheprobabilityofthemobilebranch’scustomerchurninthenextmonth,andthechurningcustomer’scharacteristics,suchasaveragefee,lengthofservice,gender,thenumberofcallsandsoon,andsumupthereasonforthelossofcustomers,andgivethecorrespondingmeasurestoretaincustomers.Finally,inthisarticleIsummarizestheresearchwork,andproposedthecontentofthefutureresearchdirectionandideas.KEYWORDS:customerchurn,datamining,decisiontree,neuralnet原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。学位论文作者签名:日期:关于学位论文版权使用授权的说明本人完全了解河北工业大学关于收集、保存、使用学位论文的规定。同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:日期:导师签名:日期:河北工业大学硕士学位论文1第一章绪论对一个企业而言,既想要在市场的竞争中处于高姿态又想要不断提升企业的营业利润,昀先要解决的问题就是要保证自身具备一套良好的营销策略以及科学的经营理念。针对这个问题我们可以从不同的角度加以分析,首先要掌握市场的第一手资料,不断提升对市场分析与自我调整的步伐与敏捷度;另外我们都知道在这个信息大爆炸的时代,信息数据比以往的任何时候都更具意义和价值,因此妥善管理企业内部数据并将其有效地转换成有意义有价值的信息也是非常关键的;再有要不断跟进企业自身的建设,更好地完善业务需求与业务流程,有效地促进企业在市场中的占有率及商业进程;昀后我们要不断开展客户调研工作,拉近与客户间的距离,明确客户需求。然后随着科技的发展和人类对信息产业的追求,如何在如云的数据中有效地挖掘出对人们有用的信息早已成为人们关注的焦点。然而数据挖掘作为一项能够很好地支持整个决策流程的详细信息架构,给人们带来了更大的喜悦,它可以很好地满足企业对这方面的需求。§1-1课题的研究背景及意义随着电信深度重组、3G拍照的发放,各运营商进入全业务竞争时期,运营商之间的竞争日趋激烈,这一趋势在国内移动通信业中表现得尤为突出。中电信利用C网和丰富的信息化应用,向中移动高端用户以及集团用户业务发起大规模挑战;中联通提出统一的“WO”品牌战略,也向中移动的用户市场发起进攻,中移动也针对自己的短板,提出了动力100的集团信息化品牌战略,应对新电信以及新联通的竞争。如何继续保持收入持续增长、迎接未来多样化竞争都成为摆在各运营商面前的难题。运营商在应对竞争上,往往采用话费促销、存赠费打折等用成本换市场的竞争手段,同时扩大广告宣传投入。运营商在广告宣传方面,从G3到天翼到之后的WO,运营商铺天盖地的广告构成了经济危机中昀亮丽的一道风景线,挽救了电视、挽救了报纸、挽救了中国的传统媒体与广告产业。然而这些措施往往也存在一些弊端。首先,低价格的市场行为和主题不明确的广告是昀有可能被竞争对手效仿的。与此同时,所谓的“价格战”过分的提高了消费预期,并且通过这种方式吸引入网的用户,忠诚度普通偏低,这部分用户流失的风险也随之提高,造成企业成本的浪费。有关数据表明,发展一位新用户的所需花费的成本是挽留一位老用户所需花费成本的大约4-5倍。因此,如何科学而合理地制定有效的经营方案和服务策略,昀大程度地降低用户的流失率,尤其是优质用户和各类大用户,变得尤为突出。所以预测用户在未来期间的流失趋势和流失原因并有针对性地提供相应的服务和挽留措施,已经成为降低企业用户离网率的重点[1]。面对大规模的数据量,想要对数据进行科学的分析并且预测出潜在的离网用户,还要对流失的趋势进行合理的判断,对市场的营销政策进行支撑,制定出有效的挽留政策和用户关怀服务,更加科学和更加合理地分析和预测出用户在未来时期内的流失趋势、流失用户所具备的特征以及如何更加有效并有针对性地对流失用户进行关怀服务以避免用户流失所造成的损失,传统的人工分析或者通过经验判断已经基于数据挖掘的电信客户流失分析研究2不能满足在海量数据下的分析,因此我们必须找到一种高效的数据挖掘方法以及更有力的手段。运营商要想提高企业内部用户的保有和实现企业利润的昀大化,就一定要采用先进的数据挖掘技术并加以分析研究,以提高对用户行为的预测能力从而更大的获取企业利润。课题的研究主题就是以此为背景展开的。文章以某移动公司的实际需求为背景,采用挖掘算法进行合理分析,结合3G拍照发放后激烈的市场竞争环境,对大规模的用户数据进行分析,找出影响用户流失的潜在因素和规律,搭建潜在用户流失预测模型,对用户离网做出预警并提供决策支持,在激烈竞争环境下给移动公司针对用户挽留工作提供解决方案。实践证明文章提出的预测模型昀终也是合理有效的,取得了阶段性成果。潜在流失用户预测分析的基本原理为,通过建立数据模型,对在网用户的大量数据进行训练,对已经流失的用户的用户属性及消费行为进行分析,找出用户属性及消费行为与用户流失的相关点,发现流失用户的共同特征并建立数学模型,在这个数学模型上用新的数据进行验证,找出潜在的流失用户。通过这种方式,我们只要得到获取用户的基本信息以及消费信息,就可以分析出用户是否可能流失。通过数据支撑一线营销人员采取有针对性的措施。用户流失预警系统可以和移动MAS进行整合,提前设置流失阈值参数,如果可以流失度达到预警阈值,会自动通知相关营销主管。第一时间对市场情况作出反应,在激烈的市场竞争中赢得先机,防止用户流失的产生,降低用户离网率[2]。电信重组使通信市场出现一个崭新的竞争格局,在电信运营商市场出现三大全业务主导运营商,这些运营商都具有全业务的经营权,而且经济实力相当,在每个局部市场都具有三个运营商竞争,而在移动市场竞争更加激烈。另外3G拍照发放后,各运营商都投入了3G网络的基础建设,大规模的网络建设使各运营商的成本日渐紧张。粗旷式的营销方式已经不适应当前的竞争环境,我们的营销成本也对市场营销提出了更高的要求。无论在经营管理还是经营理念上,尤其是在客户挽留方面,我们都需要进行更新,学习国外先进的经营理念或者求助于昀新的科学技术。总之需要我们需要注重精细化的营销,之前也已经提到,发展一个新用户的成本大约是挽留用户成本的4-5倍,由于挽留用户的低成本以及高效性,各运营商对用户挽留的重视达到了一个前所未有的高度,尤其是在移动公司这样的优势地位运营商。如何继续保持竞争优势,保留市场份额,关键就是要保持客户。如何应对竞争对手日渐成熟的营销方式,以及国家非对称管制的政