北京邮电大学硕士学位论文自动化数据挖掘在电信业中的应用姓名:李凯申请学位级别:硕士专业:软件工程指导教师:潘维民20080415自动化数据挖掘在电信业中的应用作者:李凯学位授予单位:北京邮电大学相似文献(10条)1.学位论文朱茜基于数据挖掘的电信业客户价值评价模型研究2009随着移动运营商竞争的加剧和通信技术的发展,各运营商之间已从网络资源的竞争转向客户资源的竞争,如何识别并保留高价值客户,提升低价值客户的价值,已成为各个运营商的主要任务。但目前电信业客户价值评价模型过于注重客户的当前价值,而忽略了其潜在价值的重要性;且各类客户营销策略的制定只从价值的高低出发,没有考虑客户的消费行为特点。因此,构建能够全面、合理地衡量电信业客户价值的评价模型,结合各类客户的消费行为特点制定相应的营销策略,是移动运营商亟待解决的问题。br 针对这些问题,本文在客户价值理论分析的基础上,结合电信业的具体情况,首先分析了电信业客户价值构成,重点讨论了客户的潜在价值,给出了电信业客户价值的评价体系。该体系综合考虑了当前价值和潜在价值两个方面,进而利用层次分析法确定了评价体系中各指标的权重,从而提供了一种判别电信业客户价值的方法。br 在给出电信业客户价值评价体系的基础上,本文利用该体系对客户进行了分群,将客户分为价值客户、次价值客户、潜价值客户和低价值客户四类。然后本文借助数据挖掘工具,充分利用通信行业拥有其用户的众多特征数据和庞大的消费数据的特点,通过对某地市移动公司的客户消费特征和静态属性特征进行分析,建立了基于决策树的客户分类模型,挖掘出了上述四类客户的具体消费行为特点,并据此提出了相应的客户价值提升策略。2.期刊论文常晓磊.闫仁武.杨苏宁.CHANGXiao-lei.YANRen-wu.YANGSu-ning基于空问定位的聚类算法在电信业客户划分中的应用-科学技术与工程2008,8(1)随着电信市场竞争的不断加剧,电信企业传统的营销模式正在向主动、精确营销模式转变.因此,客户划分显得至关重要.采用数据挖掘中聚类的方法对电信业的客户进行划分,在比较了现有聚类算法计算复杂度普遍较高的的基础上,采用了一种基于空间定位的方法,将客户数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任意数据,通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程.为了适合电信业客户的特殊性质,改进对客户属性数据的处理过程.通过电信客户的数据实验结果表明,算法的时间复杂度降至O(N)级别.3.学位论文金巍移动电信业中数据挖掘的应用——吉林移动流失预测模型的实施2004在电信企业面向市场,面向国内外众多的竞争者,努力创造更高价值的同时,客户流失的不断增加、客户平均生命周期的不断缩短严重影响了电信企业的发展。那么,在激烈的市场竞争和不断变化的市场需求面前,如何最大程度的降低客户的流失率呢?可行的方法之一就是利用数据挖掘技术。在客户流失分析系统中,如何应用数据挖掘技术呢?主要方式是根据以前拥有的客户流失数据建立客户属性、服务属性和客户消费数据,建立与客户流失可能性关联的数学模型,找出客户属性、服务属性和客户消费数据与客户流失的最终状态的关系,并给出明确的数学公式。只要知道客户属性、服务属性和客户消费数据,我们就可以计算出客户流失的可能性。市场/销售部门可以根据得到的数学模型随时监控客户流失的可能性。如果客户流失的可能性过高,高于事先划定的一个限度,就可以通过多种促销手段提高客户的忠诚度,防止客户流失的发生,从而可以大大降低客户的流失率。基于严格数学计算的数据挖掘技术能够彻底改变以往电信企业在成功获得客户以后无法监控客户的流失,无法实现客户关怀的状况,把基于科学决策的客户关系管理全面引入到电信企业的市场/销售工作中来。通过吉林移动客户流失预测模型的实施工作,探讨了数据挖掘在客户流失模型中的实际应用,就数据挖掘如何在实际中更好地发挥作用作了深入的研究。文中重点描述了流失模型建立过程中原始数据提取、挖掘数据的预处理、模型建立、模型验证等阶段的具体内容,为数据挖掘在电信行业中实际应用做了很好的尝试。本次流失预测模型使用了SPSS公司的clmentine工具。数据仓库使用的是Oracle9i。通过clmentine实现了快速高效地数据分析、抽取、模型训练和模型应用。当然由于时间紧,经验不足等客观因素,本次流失预测模型还存在以下问题:数据不够完备,由于生产系统中业务开展的现状,有很多数据无法得到:模型中过分的强调一些趋势的指标,使挖掘结果的有效性和时效性不高,也就是说预测结果中的客户可能在作外呼和挽留时已经离网。如何进一步提高模型的准确性是下一步的重要工作,同时我们还要进一步探讨数据挖掘在移动电信业其它方面的应用,使数据挖掘在移动电信业的其它方面应用中也发挥重要作用。4.学位论文沈燕卿基于数据挖掘的电信业客户流失分析与应用2005当今,随着国内电信业的改革,各运营商在企业大客户、长途业务、IP业务、移动业务等领域展开了激烈的竞争。传统的以技术为驱动、以销售产品为目的的市场战略逐渐被以客户为中心、以满足客户需求为目的的市场战略所取代,客户资源成为了企业竞争的焦点。激烈的竞争必然导致客户处于不稳定状态,各运营商都面临严重的客户流失问题。大量而频繁的客户流失延长了企业利润回收的周期,给企业造成了巨大的损失。在这种形势下,如何防止客户流失、实施客户保持工作,已成为运营商关注的焦点之一。如何根据客户的特性和客户行为预测客户的流失,并结合竞争环境的变化制定有效的客户挽留和赢回策略并实现赢利,是电信运营企业正常运营的重要任务,也是电信客户研究咨询领域的一个重要课题。论文首先对客户价值作了初步的探讨,将客户价值分析引入客户流失预测和控制;同时,根据客户背景资料、消费/支付数据、行为资料及相关推导指标等历史数据,本文将RBF神经网络、最近邻聚类、时间序列等多种数据挖掘技术应用于客户流失研究,针对目前相关研究中存在的问题,给出了客户流失研究中涉及的主要问题的解决方案,包括客户描述、属性规约、流失原因分析以及流失预测与控制策略等,重点解决流失模型的建立问题,并利用基于梯度下降的误差纠正算法监督学习模型参数,提高模型训练和预测的精度及可靠性;最后利用训练后的模型对每个客户的流失可能性进行预测以及生成公司可能流失的客户列表。通过对实际案例的应用,作者对模型的有效性和可操作性进行了验证,取得了良好的效果,证明其具有相当的实际意义;同时,对电信企业的市场战略实施也具有现实的指导意义。5.学位论文肇恒宇基于数据挖掘的电信业客户流失预测分析2006客户频繁流失是电信行业发展中所面临的一个严重问题,随着国外电信运营商的涌入,这个问题必将进一步恶化。为减少或避免客户的流失所带来的高额利润损失,将介绍一种行之有效的解决方案:首先,利用数据挖掘技术建立客户流失预测模型,然后用此模型挖掘出哪些客户将来会流失,并分析出为什么他们要流失,最后,根据这些客户的通话特征和业务喜好采取针对性的措施加以挽留。本论文应用数据挖掘技术建立客户流失预测模型,并围绕建立此模型的四个步骤进行了分析:数据预处理、客户分群、建立模型、模型评估与优化。在数据预处理阶段,为了从大量的属性中找出决策规则,所以引入粗糙集知识,对测试属性进行约简,找出真正影响决策的属性,减小决策树的规模;为了使预测的模型更加准确,在建模之前采用聚类算法对客户进行分群。客户分群的目的就是为模型提供有共同特征的用户群体,使得模型可以建立在不同的群体上。为了减少在调整簇中心过程中所带来的计算复杂性,本文给出了一种改进的k-平均算法来得到具有相似特征的用户群体;在建立模型阶段,主要介绍了决策树算法中传统的ID3算法及其改进算法;在模型优化与评估阶段,介绍了10-折交叉验证和boosting技术。6.会议论文郭明.郑惠莉电信业构建数据挖掘系统的思考2004本文介绍了数据挖掘应用的一般过程,对国内电信业的数据挖掘应用现状进行了分析,探讨了现有电信企业构建数据挖掘系统的面临问题,对数据挖掘应用系统的实施提出一些建议和看法。7.学位论文彭清圳基于数据挖掘的电信精细化营销策略研究2008随着中国电信业改革不断深入,电信市场不断拆分,客户选择电信产品和运营商的余地越来越大,电信运营商之间对客户的争夺也越来越激烈。过去那种粗放地开发市场、粗放地开发客户资源、粗放地使用媒体广告的状况失去营销效果,使业务推广面临营销失灵的局面。另一方面,即将展开的全业务运营会导致更加激烈的市场竞争,3G时代的增值业务将占据更重要的地位,用户的个性化需求将更加明显,因此作为通信服务市场前端核心的市场营销工作应从过去“粗放型营销”转变为“精细化营销”。同时,电信行业是典型的数据密集行业,其业务数据中隐含着大量对企业有价值的信息,而数据挖掘技术经过多年的发展,研究的重心正在转向各个应用领域,基于数据挖掘技术的“精细化营销”可以帮助我们发现顾客需要、分析顾客行为、评估顾客价值,进而有针对性地制定营销策略,满足客户个性化的需求。本文在分析我国电信业发展及电信业营销现状,数据挖掘和精细化营销的相关知识的基础上,深入分析数据挖掘在客户细分、交叉销售以及客户流失预警的具体应用,同时看出基于数据挖掘的精细化营销是电信业提升核心竞争力一个极为重要的手段,它将在电信业的市场营销中发挥重要的作用。论文中的营销理论分析、数据挖掘方法、具体应用案例,相信对于市场营销人员、经营分析人员等有一定的启发借鉴作用。8.学位论文颜丹丹CART算法在电信业潜在客户识别中的应用研究2007如今的社会已经步入了一个高度信息化的时代,每天都会出现海量的信息,如何从这些海量的数据中提取有用的信息,并为我们创造价值,就成为了一个关键问题。数据挖掘建立在对数据研习的基础上,并从中提取有用的信息来辅助决策。近几年来,数据挖掘技术也受到了经济领域和数据库界的共同关注,是数据库和信息决策领域前沿的研究方向之一。数据挖掘研究应用的领域和方法众多,常用的挖掘技术有:统计学、机器学习、信息科学。现已经逐步覆盖人工智能、神经网络、模糊集理论、粗糙集理论等学科技术,并在金融、证券、电信等领域得到广泛应用。本论文在介绍此课题的研究背景、意义及国内外的发展现状后,会进一步阐述数据挖掘的基本理论,研究比较不同的数据挖掘分类算法,并在此基础上,重点分析属于机器学习范畴的决策树理论和基本的算法。由于决策树算法有多种,本文将重点研究CART算法,此算法是一种非参数的统计方法,主要用来进行分类研究,并且可以同时处理连续变量和分类变量,分析完此算法的整个过程及优势后,文章将对电信业中的潜在客户识别问题进行实证研究,在某电信公司某月的客户历史通话行为基础上,利用CART算法建立识别模型,并对模型结果进行分析,从而确定潜在客户的特征及其衡量变量,如果能对这些客户进行有针对性的营销工作,那么,无论是公司还是客户都会从中受益很多。9.期刊论文赵兴华.李杰.王云峰.ZHAOXing-hua.LIJie.WANGYun-feng数据挖掘在电信中的应用分析-科技情报开发与经济2007,17(12)介绍了数据挖掘产生的背景、数据挖掘流程和功能,分析了数据挖掘在电信业中的几种应用,包括客户流失分析、客户获取、交叉营销、客户细分、市场分析、欺诈行为分析及网络告警分析.10.学位论文杨利军数据挖掘在移动客户流失预测中的研究与应用2009中国电信业飞速发展,2008年电信重组之后形成了“三足鼎立”之势,各运营商之间的争夺客户战将愈加激励,如何预测出即将流失的客户以降低损失和如何提高预测的准确度,是很重要的事情。随着数据挖掘技术的发展,数据挖掘的重要性已经被越来越多的人认可,数据挖掘技术的应用研究也越来越广,其中对电信行业的客户流失分析就是一大热点。本文通过对中国联合通信公司某地市的客户通话数据进行分析整理,通过使用决策树,神经网络,贝叶斯三种数据挖掘算法建立客户流失预测模型,并且对三种模型进行了性能对比和评价。论文主要内容包括:1.介绍中国电信业的发展概况和数据挖掘技术的发展情况,分析了