基于模糊聚类的客户分类方法研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

基于模糊聚类的客户分类方法研究作者:李艺明学位授予单位:广东工业大学相似文献(10条)1.学位论文冯永基于计算智能的聚类技术及其应用研究2006智能是个体有目的的行为、合理的思维,以及有效的适应环境的综合能力。计算智能是多种智能的集合,它具有在不确定不精确环境中进行推理和学习的卓越能力,是建立智能系统和智能模型的有效分析和计算工具。聚类是分析数据并从中发现有用信息的一种有效手段。基于“物以类聚”的思想,它将数据对象分组成为若干个类或簇,使得在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象之间差别很大。通过聚类,人们能够识别密集和稀疏的区域,发现全局的分布模式以及数据属性之间有趣的相互关系。计算智能通过建立聚类分析模型和计算用于聚类分析。基于计算智能的聚类分析模型会继承生物系统的处理机制和特征,即对模型有自然的描述能力,并不需要建立精确的数学模型;对处理目标的特性有良好的适应能力;具有良好的自组织特征;处理结果的可视化效果好,便于理解学习;具有一定的智能特征,从而获得了一定智能行为的能力;生物系统的多变性和多样性,也带来了处理目标的多样性;生物系统是大自然的一种客观存在,便于观察和分析,因此具有良好的开放性。计算智能领域非常广泛,从方法上讲,目前计算智能主要包括模糊控制、神经网络、进化计算、群体智能、免疫算法、人工生命和DNA计算等。论文以自组织特征映射(SOM)神经网络和群体智能两种计算智能技术用于聚类分析作为研究主线,开展研究,提出了动态SOM(DSOM)聚类分析模型和自组织混合蚁群(SOMAC)聚类分析模型,对两种模型基于数据并行和消息传递模式进行并行化研究,提出了DSOM并行聚类算法和SOMAC并行聚类算法,最后将DSOM聚类分析模型及其并行化策略用于客户分类,将SOMAC聚类分析模型及其并行化策略用于入侵检测,并通过试验,验证了论文每部分研究工作的有效性和可行性。现将论文的主要研究内容概括如下:1)对论文的理论基础进行介绍和综述。主要包括计算智能技术、群体智能技术、聚类技术的介绍以及研究现状综述。2)基于神经网络的聚类分析模型研究。为了克服固定结构SOM网络进行聚类分析的困难,论文借鉴GSOM网络训练算法的思想,提出了DSOM网络聚类分析模型。DSOM可按需要方便地在任意合适位置生成新结点,所采用的节点生长函数也更加简单实用,使得聚类的执行效率明显提高;DSOM结合了小波聚类的思想,降低了因反复调整学习率和误差率所花费的时间,又自动去除了特征空间中的噪声数据,提高了聚类结果的精度;在DSOM的基础上,利用生长因子控制DSOM的网络生长结构,从而实现了层次化聚类。通过最后的试验结果及分析,DSOM网络在生长因子SF控制下,进行聚类分析时,需要的训练次数、训练时间以及产生的冗余节点都要少于GSOM网络,而发现有效聚类的能力以及聚类的精确性要优于GSOM网络,从而验证了DSOM网络在进行聚类分析时的有效性。3)基于群体智能的聚类分析模型研究。群体智能聚类模型存在两个主要问题,一是蚁群聚类算法的收敛速度慢;另外就是蚁群聚类算法在聚类过程中,有一些被称作孤立点的对象与其它对象均不相似,蚂蚁拾起它们后,很难尽快放下,这不仅影响算法的收敛速度,更影响了最终聚类结果的精确度。为了克服这些缺陷,论文提出了自组织混合蚁群(SOMAC)聚类分析模型。SOMAC简化了LF聚类模型中的概率转换函数,并增加了小波变换阶段,从而提高了蚁群聚类算法的收敛速度和聚类精确性。在SOMAC模型的基础上论文又提出了一种适合于高维聚类分析的框架,并对此框架进行推广,提出了更具普遍性的高维聚类通用框架。4)基于计算智能的聚类分析模型并行化研究。并行化是一种有效提高算法执行效率和算法可伸缩性的途径,特别是面对大规模数据分析等计算任务较重的应用。论文在DSOM和SOMAC两种聚类分析模型的基础上,结合基于DSOM的聚类分析模型和SOMAC聚类分析模型自身的特征,分别提出了DSOM和SOMAC聚类分析模型的并行化策略,进一步提高了两种聚类分析模型的执行效率和可伸缩性,以满足大规模数据分析应用的要求。5)DSOM聚类分析在客户分类中的应用。客户分类是企业了解客户的重要手段。它基于企业对客户价值的认知,将客户划分为不同的重要类别,并以此制定客户的差别化服务政策,通过政策的实施将客户分类的结果作用于企业实践。本论文用客户的RFM(近度、频度和值度)行为作为对客户忠诚度、客户规模以及客户信用的模拟衡量,提出了基于DSOM和RFM评价指标的客户分类算法,同时给出了客户簇的标识方法以及客户类型的确定方法。通过模拟运行结果及分析,证明DSOM聚类分析模型与RFM评价指标体系结合可以有效的进行CRM(客户关系管理)中的客户分类,分类效果良好。通过生长因子SF的控制,不但可以发现已经定义的客户分类,而且可以针对企业感兴趣的客户簇进行更为精细的客户分类,并且能够发现更多客户类型。6)SOMAC聚类分析模型在入侵检测中的应用。基于入侵检测系统的复杂自然系统设计原则和异常检测的思想,论文提出了基于SOMAC聚类分析模型的异常检测方法。通过试验,基于SOMAC的异常检测算法,在渐近学习模型下,可以有效的检测出各种类型的异常数据,同时获得了较低的误报率。虽然SOMAC聚类分析模型直接用于入侵数据集的异常检测可以减少建立检测分类器所需的时间,但是算法的检测精度相对较低、误报率较高,特别是稳定性不高。因此,为了获得精度更高的检测模型,论文又提出了SOMAC检测分类器,它在一定程度上克服聚类结果与先验知识之间的矛盾,并提高了分类器的分类准确度和推广性。试验结果表明基于SOMAC检测分类器的入侵检测的平均检测率、平均误报率都保持了较高的性能。2.期刊论文孟钊兰.邵洪选商业银行客户分类新体系探索-金融理论与实践2008(3)商业银行客户分类体系是其业务经营的重要内容.采用何种方法对客户进行分类一直是实践中讨论的问题.运用多元统计的因子-聚类分析方法,从风险要素和价值要素两个维度来重新设置银行信贷客户分类的方法,有利于探讨银行的信贷客户分类的新思路和有效途径.为银行信贷管理和风险控制提供科学的方法支持.3.学位论文陶双基于密度和网格的聚类分析在数据挖掘中的应用2005聚类(Clustering)是数据挖掘中的重要的研究课题之一。聚类分析是研究多要素事物分类问题的数量方法。其基本原理是根据样本的属性,用数学方法按照某些相似性或差异性指标,定量的确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。本课题所要研究的基于网格和密度的算法不同于k-means、k-medoids等比较经典的基于“距离”的算法。它采取一种新的思路,具有发现嵌入在高维数据子空间中聚类的能力、数据超过内存容量的扩展性、对聚类的说明是以最容易理解的DNF形式给出的,易于用户理解、对数据不作假设以符合某种典型分布及对数据的输入顺序无关。根据试验,基于网格和密度的算法可以更好的在高维数据集中自动发现包含有趣知识的子空间并在其中发现精确的聚类。这种基于密度和网格的聚类方法同其它的聚类方法一样,被广泛的应用于医学,通信,保险等许多领域,本课题将这种聚类方法应用到通信行业中电话公司的客户分类领域,用它来分析公司客户的信息,将客户进行聚类,从而将客户分为不同的客户群,根据其特点采取措施,更好的巩固老客户,发展新客户,从而期待进一步提高企业利润。同时本课题还在数据预处理和算法实现上对已有的实现方式进行了一些改动,从而简化了已有算法的实现过程,提高了算法的可理解性,以期待提高算法的可用性和运行效率。此外,本文还将该聚类算法的聚类效果和聚类特点与研究已经比较成熟的k-means聚类算法进行了比较,进一步突出基于网格和密度的聚类算法在对高维大数据量数据集进行聚类时在效率和可理解性上的优势。4.学位论文罗堃数据挖掘在CRM中的应用2006目前竞争日益激烈的电子商务经济模式下,企业的客户数据日益丰富,客户关系管理的观念也日益受到企业的重视。而分析型CRM是目前及今后一段时间CRM系统的主流方向。如何从丰富的客户数据中挖掘有价值的信息,为企业管理者提供有效的辅助决策,是企业真正关心的问题。其中,客户分类是分析型客户关系管理的重要功能之一。通过客户分类,区分客户的重要程度,并针对不同重要级别的客户制定专门的营销方案和客户关系管理策略,可以帮助企业降低营销成本,提高利润和企业竞争力。客户也可从企业制定的专门的营销方案和客户关系管理策略中获得适合的交易体验。数据挖掘是分析型CRM实现其“分析”功能的必要手段,也是实现客户分类的有效工具。为了体现数据挖掘有别于统计等方法的特点,本文选择具有代表特征的聚类分析方法,根据客户为企业带来的销售额、利润额和客户与企业的交易次数等指标,对客户数据进行聚类。通过对聚类结果的分析和评价,分析每组客户对于企业的重要程度,进而达到客户分类的目的。本文选择典型的基于划分的聚类方法——K-平均算法,通过算法思想描述、算法流程设计、算法执行界面和显示界面的设计等多个方面介绍K-平均算法在客户分析中的具体应用。其中,包括数据整理、变量转换、参数选择、结果分析等多个过程。本文使用VB.NET实现算法流程,并使用实现的应用程序对用户数据进行聚类。尝试多次不同聚类数目,比较多次聚类结果,并从中选择效果最佳、对企业应用最适合的聚类结果。得到可解释、可用的客户分类,为企业提供决策支持。在算法实施结束后,给出算法评价,讨论算法存在的孤立点、参数设置等问题,并给出相应的解决方案。最后,讨论在整个算法过程中可能影响结果的参数,以及各种参数对于聚类结果的影响程度。通过本文的探讨,提供了使用数据挖掘方法辅助客户关系管理的解决方案和具体实施方法。从客户关系管理理论和数据挖掘技术两个方面分别探讨,并提供了数据挖掘和客户关系管理相结合的简易方法。5.期刊论文孟钊兰.邵洪选商业银行客户分类新体系探索-金融发展研究2008(2)商业银行客户分类体系是其业务经营的重要内容.采用伺种方法对客户进行分类一直是实践中讨讨论的问题.运用多元统计的因子-聚类分析方法,从风险要素和价值要素两个维度来重新设置银行信贷客户分类的方法,有助于为银行的信贷客户分类提新思路,从而为银行信贷管理和风险控制提支持.6.学位论文李云峰聚类分析在证券CRM客户细分中的应用2005随着证券公司数量的增多以及受佣金定价放开等一系列政策的影响,证券经纪业务竞争日趋激烈,客户的流动性亦随之增加。为了挽留老客户吸引新客户,提高客户服务质量,为客户提供优质的个性化的服务成为各证券公司的共识。于是各证券公司纷纷建立了CRM(客户关系管理)系统来分析客户和服务客户。CRM系统中非常重要的一部分就是根据客户信息数据和历史交易数据对客户进行有效的分类,从而集中企业资源,制定有效的竞争策略,有针对性的制定个性化客户服务方案,来增强自己的竞争优势。目前,能够成功实现CRM应用的国内的证券商为数甚少,且大部分属于应用型CRM。利用数据挖掘技术对客户进行深度分析方面的应用不足。另外我国证券业的显著特点是几乎所有股民都是自己直接参与股票交易,这些特色是国外从来没有的,因此国外CRM在分析个人投资者交易行为方面可借鉴的经验不多。本课题将通过证券公司客户细分方面的应用,探索数据挖掘技术符合我国特点的在证券业CRM中的应用。本文通过对各种聚类方法的比较选定使用DBSCAN算法对证券客户进行细分,DBSCAN聚类过程的关键是选择合适的参数ε和MinPts,然而参数的选择是困难的,根据这一特点本文提出了改进算法,首先通过循环操作,形成(ε,MinPts)在一个范围内的多组聚类。然后根据条件对聚类结果进行初选和复选,最后用复选出的聚类合成最终的聚类结果并通过图形表示出来。在此基础上建立了一个基于此改进算法的证券客户细分系统,并给出了一个应用实例,取得了较好的应用效果。7.期刊论文郑星龙.刘静波.王玉.李伟群客户细分与卷烟市场需求-西部大开发(中旬刊)2009(11)合理的客户评价和分类是准确测算市场需求和提升客户满意度的

1 / 56
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功