基于导向性动态聚类算法的电信客户细分研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

中国科学技术大学硕士学位论文基于导向性动态聚类算法的电信客户细分研究姓名:吴镝申请学位级别:硕士专业:管理科学与工程指导教师:吴春旭20090401基于导向性动态聚类算法的电信客户细分研究作者:吴镝学位授予单位:中国科学技术大学相似文献(10条)1.学位论文邹远强蚁群聚类算法及其在电信客户分群中的应用2007面对经济全球化和和全球经济信息化的发展趋势,提高信息技术在社会经济诸领域的应用水平是最终推动经济和社会的发展的必由之路。自八十年代以来,人工智能转入实际应用,并提出了一个新兴的、面向商业应用的研究课题――数据挖掘。数据挖掘技术在国外早己被应用于零售业的销售预测和分析、金融业的客户信用分析及客户欺诈分析、电信业的客户价值分析和销售预测等方面。面临日益激烈和复杂的竞争环境,国内企业也逐渐加快了信息化的步伐,在电信行业,各大电信运营商已经建立或正在建设以数据仓库技术为基础,以联机分析处理和数据挖掘工具为手段的企业经营分析系统,用以通过对业务运营系统日常积累的大量历史数据进行智能化分析,揭示企业运作和市场情况,从而帮助管理层做出正确明智的经营决策,进而提高企业的市场竞争力。论文对数据挖掘的基本方法之一聚类技术进行了较全面的比较研究,并利用改进的聚类算法来细分电信业客户,从而达到可识别具有相似特征的客户群,成为分析客户和形成市场策略的基础,真正做到在恰当的时间,通过恰当的渠道,为恰当的客户提供恰当的服务,以满足其需要和愿望。本文首先着重阐述了群体智能领域蚁群算法在聚类分析中的应用,分析了目前在此基础上有代表性的改进算法,并通过对比不同蚂蚁行为模型,验证了基于蚂蚁运动模型的一种自适应的蚁群聚类算法(AdaptiveAntClustering,简称AAC)在聚类速度和质量等方面性能优越。针对现有的绝大多数聚类算法在低维、少量数据上表现较好,但在处理高维数据时聚类质量下降的缺陷,为满足电信行业的数据量大、维度高的特点,受自适应蚁群聚类算法(AAC)研究工作的启发,采用蚂蚁运动模型,提出了一种组合并行多蚁群聚类算法,该算法融入了层次和密度聚类的思想,称为混合蚁群聚类算法(HybridAntClustering,简称HAC)。该算法采用的是将海量数据分区进行并行聚类,最终合并的设计思路。通过实验证明,该改进算法在一定程度上提高聚类速度和质量。本文最后将此混合聚类算法成功应用于电信业客户细分。通过对用户资料、通话行为、服务行为等相关的属性进行数据挖掘,分析了各用户群的通话行为特征与服务类型特征以及各用户群与收益之间的关系,实验结果证实了该聚类算法的有效性。2.期刊论文陈治平.胡宇舟.顾学道.CHENZhi-ping.HUYu-zhou.GUXue-dao聚类算法在电信客户细分中的应用研究-计算机应用2007,27(10)结合聚类算法的分析,提出了一种解决电信客户细分的应用模型,该模型在实际中得到了较好的应用并为电信服务产品的策划设计提供了依据.同时,通过引入指标区分度的定义,给出了一种聚类方法应用效果评估的方法.该方法结合电信的案例应用与K-Means、SOM、BIRCH等聚类方法结果的分析,得出K-Means方法在电信客户市场细分中的应用优越性.3.学位论文陶秋香基于数据挖掘的电信客户流失和保留研究2007随着电信企业不断重组和市场竞争的加剧,存量客户的流失已经成为各运营商关注的重点。企业必须通过利用各种手段抓住客户才能获得最终的核心竞争力。电信企业可以充分利用企业各运营商支撑系统中的客户数据,应用数据挖掘的工具获取对客户的洞察能力,从而更好地满足客户的需求防止客户的流失。本文将多种数据挖掘技术应用于电信企业,在对寻找流失重点客户和预测离网客户两个方面进行了较为深入的研究,给出了解决问题的模型和方法并在实践中得到评估和检验。本文主要共分为五部分,结构如下:第1章:分析电信市场的发展和电信营销中存在的问题,引入存量流失的概念和分析客户保留的重要性,提出客户保留的措施体系。第2章:对数据挖掘技术进行概述,简要介绍了数据挖掘技术的发展历程、研究内容和实施过程。第3章:在分析了客户细分的各类方法后,提出基于数据挖掘K—Means聚类算法的V—NV客户分群方法,并通过在电信企业的应用进行了验证。第4章:介绍了客户离网的预测模型方法,给出了详细的客户离网建模过程方法,并在电信企业的应用中进行验证。第5章:针对研究中存在的问题给出了进一步研究的考虑。4.学位论文叶蕾数据挖掘在电信客户细分领域的应用2004随着数据挖掘技术的迅速发展,数据挖掘已经应用到生活的方方面面.本文研究的主要内容是数据挖掘技术在电信客户细分领域的应用.本文首先介绍了数据挖掘的基本理论知识,如数据挖掘的定义,数据挖掘的任务等等.本文的重点在于如何对电信客户进行合理、有效的细分.为了解决这一问题,我们进行了详细的需求分析,通过需求分析我们确定了对电信客户数据进行挖掘所需要的数据集.通过对所需数据的预处理,最终得到我们所需数据汇总表.之后,为了选择合适的聚类分析算法实现对电信客户的分群,我们利用两种不同的算法K-means算法和模糊C均值聚类算法对电信客户进行了细分.并通过修改不同的K值和样本点的个数,对结果进行修正,从而得到了合理的聚类结果.通过对两种算法得到的结果的比较找到了解决电信客户细分这一实际问题的合理方案.利用聚类算法解决电信客户细分问题,有利于电信运营商一对一的面向不同的客户群体制定销售政策.总体说来,这一问题的研究和探索,有着重要的现实意义.5.期刊论文耿筱媛.张燕平.闫屹.GENGXiao-yuan.ZHANGYan-ping.YANYi改进的K-means算法在电信客户细分中的应用-计算机技术与发展2008,18(5)在K-means算法中,选择不同的初始聚类中心会产生不同的聚类结果且有不同的准确率,并且其迭代过程在时间上不是高效的.针对K-means算法的这两点不足做了一定程度上的改进,理论分析表明,改进后的算法具有较高的准确度和较低的时间复杂度.采用改进后K-means聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,通过与统计分析的对比,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持.6.学位论文陈园园基于密度的聚类算法研究及其在电信客户细分中的应用2008伴随着电信市场的迅速发展,电信客户逐渐呈现出细分化、多元化的特征,电信企业的竞争焦点和发展机遇将更多的集中到各细分市场中。运营商要保持市场的领先地位以及不断提升客户价值,必须主动进行客户细分。因此如何有效地利用数据挖掘方法对客户进行细分是目前数据挖掘应用的一个非常热门且具有重要应用价值的研究课题。论文对数据挖掘基本方法之一的聚类技术进行了较全面的比较研究,并利用改进的聚类算法来细分电信业客户,从而达到可识别具有相似特征的客户群,成为分析客户和形成市场策略的基础。本文主要研究工作与特色有:1)针对基于密度的聚类方法不能发现密度分布不均的数据样本的缺陷,提出了一种基于代表点和点密度的聚类算法(CBRD)。算法以代表点的平均密度作为类密度,代表点的k近邻为代表区域,根据类密度,将满足密度阈值的代表区域中的点选为代表点,再利用选出的代表点调整类密度,如此反复的寻找出所有代表点和代表区域。所有区域相连的代表点及其代表区域将构成一个聚类,不在任何一类中的点则被作为噪声数据。实验结果显示,该方法可以发现任意形状的密度分布不均的类。2)提出的CBRD算法虽然能够发现任意形状的聚类,但是在数据量大的时候需要较多的内存和I/O消耗,导致其在客户细分中不能取得好的应用。因此,在CBRD聚类算法思想的基础上,本文提出了一种基于数据交叠分区的高效密度聚类算法,算法继承了CBRD聚类算法可以发现任意形状的密度分布不均的类的优点,同时还具有较高的运行效率。3)将改进后的密度聚类算法应用于电信客户细分,可以使企业更好的掌握市场动态以及对潜在客户挖掘提供有力的技术支持。实验结果证实了该聚类算法的有效性。7.学位论文景士颖基于粗集的权重确定方法及其在电信客户数据挖掘中的应用2004聚类分析作为数据挖掘技术中一种应用广泛的重要分析方法,近年来相关领域的研究相当活跃.随着计算机技术的高速发展,知识与大量观察和实验数据的处理、归纳、分类相联系,波兰华沙理工大学Z.Pawlak教授等提出用粗集理论(RoughSet)研究不完整数据、不精确知识的表达、学习、归纳方法,为信息科学和认知科学提供了新的科学逻辑和研究方法.该文将聚类分析与粗集理论结合起来,针对提高聚类算法的有效性的需求,提出了一种将粗集理论应用于数据挖掘的新思路:利用粗集理论中决定属性重要性的思路来计算数据库中属性的权重,并将得到的权重用于聚类分析.该文的所做的研究工作和创新主要体现在以下几个方面:1.将粗集理论应用于聚类算法中权重的确定,提出了一种有所侧重的聚类权重确定方法,即RSW算法.它的优点在于不依赖于专家的打分,能够充分发掘和利用数据库中的隐含的知识,作为确定权重的依据.与统计方法确定权重相比其特色在于,它不是采取概率的方法来描述不确定性,而采用集合论的方法.利用粗集方法确定权重的方法的适用范围是聚类有较明确的目标,这个目标能够用决策属性明确的表达出来;条件属性与聚类的目的(决策属性)相关,并且对于聚类所起作用的大小有所差异.2.在RSW算法的基础上,与统计的方法相结合,提出了SRSW算法.与RSW算法相比,SRSW算法的特点在于它把粗集方法与统计方法结合起来,充分利用数据库中的统计信息.3.将RSW算法和SRSW算法应用于电信客户数据聚类分析的实践,验证了算法的有效性.8.期刊论文常晓磊.闫仁武.杨苏宁.CHANGXiao-lei.YANRen-wu.YANGSu-ning基于空问定位的聚类算法在电信业客户划分中的应用-科学技术与工程2008,8(1)随着电信市场竞争的不断加剧,电信企业传统的营销模式正在向主动、精确营销模式转变.因此,客户划分显得至关重要.采用数据挖掘中聚类的方法对电信业的客户进行划分,在比较了现有聚类算法计算复杂度普遍较高的的基础上,采用了一种基于空间定位的方法,将客户数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任意数据,通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程.为了适合电信业客户的特殊性质,改进对客户属性数据的处理过程.通过电信客户的数据实验结果表明,算法的时间复杂度降至O(N)级别.9.学位论文李悦猛挖掘电信客户的交往圈2006经过多年的市场运作,国内的电信运营商都积累了大量的客户和业务数据。随着市场竞争的愈演愈烈,各运营商纷纷进行经营分析系统的规划和实施工作,期望这些系统能够帮助企业找到自己最有效的客户,开发有竞争力的业务,提高经营效率。数据挖掘是深入把握客户,提升客户价值的有效工具。目前,对用户和业务数据的挖掘利用,还主要集中在用户自身的属性归纳上。在长期的业务观察和数据分析过程中,笔者发现,用户通话详单中蕴含着客户之间的社会关系,可以从用户之间的相互联系,以及相互联系的用户所构成的交往圈的角度,观察客户,开展客户关系营销。本文重点介绍了数据挖掘在用户聚类方面的相关思想和实现算法,总结了用户之间相互联系的特点和规律,从用户自身的属性、用户之间的联系属性、用户的交往圈属性三个方面探讨了影响用户消费行为的因素,并给出了量化评估这种行为的计算方法,最后总结给出了一个挖掘用户交往圈的算法。该算法借鉴Google的PageRank排序方法,对用户之间相互联系的密切程度进行评估;借鉴基于密度的聚类算法(DBSCAN,0PTICS)和基于层次的聚类算法(CHAMELEON,CURE),生成用户的交往圈,并将交往圈中的用户进一步分类为核心用户和从属用户。这样一来,我们就可以将有限的资源投入到核心用户中去,借助核心用户的交往圈,宣传电信业务,推广电信产品,提高客户服务水平,增强客户的满意度。10.学位论文王林基于数据挖掘的电信客户保留研究2005随着电信企业不断重组和市场

1 / 65
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功