数据挖掘技术及其在电信CRM中的应用研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据挖掘技术及其在电信CRM中的应用研究作者:水静学位授予单位:兰州大学参考文献(25条)1.康晓东基于数据仓库的数据挖掘技术20042.张银奎.宋俊数据挖掘原理20033.邵峰晶数据挖掘--原理与算法20034.闪四清数据挖掘--概念、模型、方法与算法20035.王丽珍一种基于信息熵的记录约简度量方法6.范明数据挖掘概念与技术20047.段云峰.吴唯宁.李剑威数据仓库及其在电信领域中的应用20038.贾琳.李明基于数据挖掘的电信客户流失模型的建立与实现[期刊论文]-计算机工程与应用2004(4)9.石永华电信业务流失模型的研究2003(08)10.朱世武.崔嵬.谢邦昌移动电话客户流失数据挖掘[期刊论文]-数理统计与管理2005(1)11.NCRTeradata12.SafavianSRASurveyofDecisionTreeClassifierTechnology1991(03)13.BerthodMIntelligentDataAnalysis:AnIntroduction200414.ChaudurriSAnOverviewofDataWarehousingandOLAPTechnology199715.ZPalwakRoughsets1982(05)16.DJHandStatisticsandDataMining1999(01)17.邱丕群数据挖掘中的决策树技术及其应用[期刊论文]-统计与信息论坛2002(2)18.唐华松.姚耀文数据挖掘中决策树算法的探讨[期刊论文]-计算机应用研究2001(8)19.ZPawlakRoughsets1982(05)20.史忠植高级人工智能199821.赵宏波电信企业客户关系管理200322.叶进.张向利.张润莲基于数据挖掘的移动客户流失分析系统[期刊论文]-计算机系统应用2005(2)23.水静移动支付及其安全策略200524.水静个性化的商务模式--移动商务浅谈200525.水静新商务模式下的物流研究2005(08)相似文献(10条)1.学位论文许存兴聚类分析在数据挖掘中的应用2004聚类分析是数据挖掘方法中的一个重要的方法.该文首先对数据挖掘进行了简要的描述;其次、着重对数据挖掘中的聚类分析法进行讨论;最后、以一个超市的商品销售为例,用数据挖掘中的聚类分析法进行了挖掘.因此,该文从研究数据挖掘的算法角度出发,从三个方面对数据挖掘进行了论述:一、数据挖掘的概述通过对数据挖掘的概念、方法、过程、特点、作用及其与统计学关系的描述,使我们对数据挖掘有一个整体的了解.二、聚类分析在数据挖掘中的应用在这部分首先介绍了统计学中的聚类分析基础知识,即距离与相似系数和聚类的特征与聚类间的距离.其次,介绍了具体的聚类分析方法,包括分层聚类法(最短距离法、最长距离法和中间距离法)、分割聚类算法(PAM算法、CLARA算法)、基于密度的方法、基于网格的方法和基于模型的方法.三、数据挖掘在超市中的应用在这部分以某一超市为例,以数据挖掘的过程为线索,对这个超市的销售数据用聚类分析法中的层次法进行了数据挖掘;其次,对数据挖掘的结果进行了描述;最后,分析了数据挖掘的结果.2.期刊论文王金成.张海晖数学方法在数据挖掘聚类中的应用研究-太原城市职业技术学院学报2009,(1)聚类是数据挖掘中的重要研究领域.实现数据挖掘中聚类,有很多种不同的方法,其中基于数学的方法在聚类中发挥着重要的作用.有关聚类的数学方法有:模糊聚类方法、灰色趋势关联聚类、基于区间值的聚类方法.本文分别从方法解决的问题、适用条件、优缺点及其改进方法角度对这几种方法进行了分析和对比,以此体现数学方法对数据挖掘的重要性.3.学位论文赵恒数据挖掘中聚类若干问题研究2005数据挖掘是为了满足人们对数据中所蕴涵的信息和知识的充分理解和有效应用而发展起来的一门新兴技术。数据库、人工智能和数理统计是知识发现和数据挖掘的三个强大的技术支柱。发展自统计学的聚类分析作为数据挖掘的一项主要功能和任务,成为数据挖掘中的一个重要的研究领域,至今已提出了大量的理论和方法,取得了丰硕的研究成果。尽管如此,聚类中还存在许多问题,尤其随着数据挖掘技术的广泛应用,数据挖掘所面对的数据对象日趋复杂,聚类研究也面临更多新的内容和挑战。这就要求对现有聚类技术进行改进,同时不断提出新的聚类理论和方法以适应新的应用。本文对聚类有效性问题,迭代优化聚类的初始化问题,分类属性数据聚类算法及高维数据聚类方法进行了较为深入的研究,主要内容如下:第一章简单介绍了数据挖掘技术和数据挖掘中的聚类分析的特点,详细论述了聚类有效性问题、迭代优化聚类的初始化、分类属性数据聚类方法以及高维数据聚类的研究现状,最后介绍了本文的主要研究工作成果及内容安排。第二章介绍了数据挖掘中的聚类分析,包括聚类分析的数据结构和数据类型,聚类准则的确定,聚类算法的分类,并详细论述了数据挖掘中用到的主要聚类算法,最后对聚类结果的评价方法进行了简要介绍。第三章主要研究聚类有效性函数。首先介绍了模糊聚类的划分系数与划分熵,研究了基于几何结构的聚类有效性函数,从聚类的“紧致度”和“分离度”角度出发,提出了一种新的基于几何结构的加性聚类有效性函数;研究了改进的HubertГ统计量,将其与聚类分离度相结合,提出了一种基于HubertГ统计量和分离度的聚类有效性函数。此外,研究了聚类算法的实验结果的评价,指出了现有聚类结果评价方法的不足,阐明了聚类精确度是反映聚类效率的观点,用Fowlkes&Mallows划分相似测度作为聚类精确度,来评价后续章节中聚类算法的实验结果。第四章研究了现有的迭代优化聚类的初始化方法:即采样法,距离优化法以及密度估计法,分析了它们的优缺点,提出一种新的基于距离的初始化方法,它不需要设定门限,不受数据集的顺序影响,而且对孤立点和噪声有较强的抑制,适用于较大规模数据的聚类初始化;分析了对初值不敏感的k-harmonicmeans算法,提出了模糊k-harmonicmeans算法,并导出了该算法在中心迭代统一框架下的描述。第五章研究了k-modes、k-prototypes和fuzzyk-modes聚类算法,通过仿真讨论了k-prototypes算法的性能;在新的差异度函数的基础上提出了一种新的模糊k-modes算法;考虑到数据的不同属性对聚类过程的不同贡献,对输入数据进行属性加权处理,利用进化策略对权值进行优化,提出了基于进化策略属性加权的模糊k-modes聚类算法;研究了近似k-median的求解算法,用数据的近似中值(approximatedmedian)来代替模式(modes)进行聚类,提出了分类属性数据的近似k-median聚类算法。第六章研究了适用于高维数据的相似性度量函数Hsim(),这个度量函数可以较好地克服Lk-范数等传统的距离函数在高维空间中的缺点,并能将分类型和数值型数据的距离计算整合到一个统一的框架中去。在此基础上,针对高维数据提出了一种基于Hsim()相似性函数的模糊k-medians聚类算法。最后对论文的工作进行总结并提出以后进一步的研究方向。4.期刊论文李秀芳.李志成.LIXiu-fang.LIZhi-cheng基于数据挖掘的聚类算法研究-计算技术与自动化2006,25(3)随着数据信息的积累,如何从这些海量信息中有效地提取所需要的知识成为当前数据挖掘的重要内容.聚类作为数据挖掘的重要工具,通过将数据划分成多个类,使得类内数据尽可能相似,而类间数据的相似度尽可能小,已成为研究热点.本文总结在数据挖掘中的聚类算法,针对聚类中所存在的问题进行归纳,并对未来的研究进行了展望.5.学位论文丁学钧数据挖掘技术中基于属性的聚类算法研究2002当今世界,数据每天都在迅猛增长.人们保存如此大量的数据,一是因为计算机技术的发展使之变得方便可行,二是因为这些数据有巨大的潜在作用.由此而产生的数据挖掘概念引起了广泛地重视,出现了许多与之相关的技术和产品.权威的Gartner调查组报告显示,数据挖掘将是今后几年全球范围内重点投资研究的十大新技术之一.该文从数据挖掘的概念入手,以数据结构的角度看待数据挖掘的研究对象,对数据挖掘的重要工具聚类做了深入的论述,把聚类分为基于数据元素的Q型聚类和基于属性的R型聚类.着重讨论目前各类文献涉及较少、而又有着重要应用意义的R型聚类,论述了相关的概念、技术和算法.最后介绍了一个实际应用系统——医生医疗质量评价系统.文章在全面阐述数据挖掘、聚类、基于属性的聚类及三者关系的基础上,着重讨论了以下几个方面:1.基于属性的聚类有力地支持了数据挖掘的一些重要性能的实现.2.在聚类分析中应用的有关模糊集理论理论基础.3.对基于属性的模糊聚类算法进行了比较详细的讨论.4.探讨该课题未来的工作方向和面临的挑战.概括而言,该文以数据挖掘工具中聚类分析的一般理论和技术为基石,结合目前实际应用,提出了一些新的观点及算法设计思路,并试图在理论和实践两方面作出论述.6.学位论文邢留伟K-Means算法在客户细分中的应用研究2007无论是金融行业,还是电信行业,日益激烈的竞争使企业认识到客户是他们真正的资产,主要工作也都是围绕保留现有客户和发展新客户展开,营销方式也从大众化营销转为通过差异化、一对一营销来实现客户满意和公司获利的双赢,而差异化、一对一营销的关键就是有效的客户细分。客户细分的关键问题就是找出客户的特征,通过一些统计分析方法可以将客户隐藏在数据中的特征挖掘出来,从而进行分类。传统意义上,客户细分往往根据客户的一维属性来进行,如金融行业根据客户资产多少,可以将客户分为高、中、低端客户,该细分方法最大的优点是简单,可以方便地根据营销资源预算,取舍营销活动中的目标群体,在实践中简便易行。但是,随着技术的进步与客户需求的日趋多样化,以及企业产品的不断创新,传统的客户细分方法显现出了明显的缺点,即使同是高端客户,客户对同一产品或服务的需求也存在着明显差别,客户对产品或服务的要求日趋理性和严格,这种传统的基于一维的客户细分在实践中的应用显得力不从心。需要一种新的细分方法,能够实现:客观反映客户分组内在的特性;综合反映客户多方面的特征;有利于营销人员更加深入细致地了解客户特征;便于实现对客户行为变化的动态跟踪。这就需要用几十个,甚至上百个变量从而对客户进行更为精确的描述,在此基础上对客户进行更为精确的细分,因而,用于解决多变量的、大数据量的客户细分的数据挖掘技术也就应运而生了。客户细分通常用聚类分析方法来实现,其中K-Means算法是实践中最为常用的数据挖掘算法之一,在处理大数据量方面有绝对优势,而且可以取得较好的效果。在客户细分中,围绕K-Means聚类,如何依据通用的数据挖掘方法论,有针对性地将K-Means应用于客户数据建模中,对这些问题的实证研究在国内尚个多见。因此,从数据挖掘建模的角度,对用K-Means算法对客户进行聚类的问题进行理论分析和实证研究,具有一定的现实意义。本文第一章主要阐述客户细分的研究背景,并说明研究的动机与目的以及本文研究的步骤。本文第二章对实现客户细分的相关技术理论进行了总结和回顾。利用数据挖掘方法进行客户细分一个关键的问题就是客户细分方法论,在参阅大量国内外理论研究和实践文献的基础上,归纳总结了客户细分方法论,作为后续研究的基础。客户细分通常用聚类分析方法来实现,在阐述了聚类分析相关概念如距离、数据矩阵、变量标准化等基础上,重点分析了K-Means聚类的优点和缺点。K-Means聚类是一种优化聚类算法,运算速度快,适宜处理大数据,但是聚类结果与变量的量纲、异常值的处理方式、变量的维度、观测的顺序以及K个初始凝聚点的选择等都有很大的关系,本章着重对影响K-Means聚类结果的因素尤其是初始凝聚点的选择方法进行了理论上的分析和总结,也对K-Means聚类在实际中应用状况进行了文献回顾和探讨。聚类结果对实际是否有意义,需要对结果从技术和业务两个方面进行评估,本章对聚类结果好坏的评价标准进行了探讨。K-Means算法对高维数据的聚类效果较差,本文引进用主成分分析方法对高

1 / 62
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功