数据挖掘在银行信用卡系统中的应用作者:甘可翔学位授予单位:中山大学参考文献(19条)1.附录4:参考文献2.MichaelJABerry.GordonSLinoffMasteringDataMining20023.情报官世界数据挖掘技术及其应用现状4.CorinneBaragoin.ChristinaMAndersenMiningYourOwnBusinessinBankingUsingDB2IntelligentMinerforData20015.JiaweiHan.MichelineKamberDataMiningConceptsandTechniques20016.OliviaParrRudDataMiningCookbook-ModelingDataforMarketing,Risk,andCustomerRelationshipManagement20037.杭桂海SAS统计分析使用大全20038.情报官世界数据挖掘技术理论9.何俊.温家明数据挖掘及其在银行业的应用[期刊论文]-华南金融电脑2002(6)10.冯萍.宣慧玉数据挖掘技术及其在营销中的应用[期刊论文]-北京工商大学学报(自然科学版)2001(1)11.宣慧玉数据挖掘--探寻客户消费行为模式2003(05)12.赵宏波.孟雅玲数据挖掘在电信客户关系管理中的应用[期刊论文]-电信技术2001(12)13.张阿兰.谢邦昌数据挖掘在信用卡公司的应用[期刊论文]-统计与信息论坛2002(6)14.谢帮昌信息技术在全球银行业的应用(六)2002(05)15.王玉珍数据挖掘的分析与探索2002(04)16.李睿.李明数据挖掘技术探讨200117.汤建超电子商务中的数据挖掘2003(06)18.姚成忠数据挖掘技术及其在信用卡行业中的应用19.王晓耘.卜心怡数据挖掘--探寻客户消费行为模式的利器2000(17)相似文献(10条)1.学位论文吴婷数据挖掘在信用卡欺诈识别上的应用研究2006近年来,随着经济的发展与世界各国金融市场的逐步开放,各国政府积极推动各种有关金融自由化与国际化的措施,导致国内外信用卡市场不断成长,以信用卡为媒介的交易行为不断激增,已有超过现金及票据交易的趋势,信用卡业务成为银行一个重要的业务收入来源。但是随着发卡量大幅度增长,经济规模扩大和市场的快速扩张,目前全球信用卡的欺诈交易正以惊人的速度增长,欺诈手法不断翻新,歹徒作案技巧日益精明,金融企业已逐渐无法有效察觉欺诈交易,带来的损失日益增加,特别是在中国社会信用体系还没有效建立和发挥作用的情况下。如何能有效、快速、准确地识别出信用卡欺诈交易已成为目前金融界普遍关心的问题。本文首先简单介绍了信用卡及其业务、风险管理的相关知识,并深入分析了信用卡欺诈风险的成因和识别防范策略,指出应该分两条线索分别加以探讨:一是仅基于交易资料的以交易为线索进行分析,二是基于客户基本资料与交易资料结合的以客户为线索进行分析。接着研究了数据挖掘的分类方法,着重介绍了支持向量机和决策树算法及这两种算法各自的优点,同时对学者们在信用卡欺诈识别研究上所作的贡献进行了文献综述。然后针对目前在分类研究中普遍存在的两个问题——样本分布的不对称性和单一分类器效能低下,提出利用k-meaIiS聚类解决样本的不对称分布,架构基于支持向量机和决策树的组合分类器,并用Adacost方法进行分类结果的融合。最后使用某商业银行的信用卡数据,在前面架构的欺诈识别模型基础上进行实证研究,并将此分析结果与在类别不对称的样本分布和使用单分类器模型情况下的分类结果比较,实证证明本文中所架构的模型适合于信用卡欺诈侦测研究。2.期刊论文杨森.郭建奎.朱扬勇.YangSen.GuoJiankui.ZhuYangyong基于事中反馈的信用卡欺诈检测与防控-计算机应用与软件2008,25(9)信用卡欺诈活动日益猖獗,如何增强欺诈检测能力来规避持卡客户、商家等的经济损失是电子商务发展中至关重要的问题.给出了一个基于事中反馈的信用卡欺诈检测解决方案,其将数据挖掘技术和反馈控制技术联合运用实现实时欺诈检测及防控,以增强欺诈检测能力来减少经济损失.3.学位论文潘俊信用卡欺诈检测分类算法研究2009世界经济的快速发展与各种金融自由化与国际化措施的推动,使得国内外信用卡市场不断成长,同时也伴随着信用卡欺诈交易以惊人的速度增长。如何能有效、快速、准确地识别出信用卡欺诈交易已成为目前金融界普遍关心的问题。由于信用卡欺诈数据的非均衡分布,使得经典的数据挖掘算法的分类性能不理想。本文在深入研究和分析信用卡欺诈数据特点的基础上,针对数据的非均衡分布特点,采用K均值聚类算法对多数类样本进行二叉分割,产生满足一定条件的叶子节点,然后将叶子节点与少数类样本结合生成新的子集,在保证无信息丢失与无噪声数据引入的前提下使其分布达到均衡。同时针对单一分类器的局限性,引入多分类器融合的思想,建立一个以C4.5为基分类器的Adaboost与Cost-sensitive结合的组合分类器模型。实验结果表明以上算法能够有效地改善非均衡分布的信用卡数据分类性能。由于信用卡欺诈数据类别非均衡分布的特点明显,少数类样本的存在使得整体精确度不能很准确地对分类结果进行评价。本文在对少数类样本的查全率和查准率进行分析的基础上,采用少数类F-Measure指标对结果进行评价。实验结果表明其能较好地符合信用卡分类的特性。4.会议论文刘芬.吴鹏基于数据挖掘的异常数据捕获分析2007在金融行业中,各种信用卡的使用已经逐渐融入到普通居民的日常生活中,并带来了许多方便。然而利用信用卡进行欺诈的行为时有发生,给储户带来了巨大的损失,同时也给整个金融业带来恶劣的影响。异常检测是解决信用卡欺诈的一个常用手段,它是数据挖掘中一个重要方面,用来发现小的模式(相对于聚类),即数据集中间显著不同于其他数据的对象。目前提出的异常检测的方法均是基于统计的方法(如数据挖掘)和基于硬件的方法(如防火墙),基于统计的方法均通过建立特征库然后通过模式匹配的方法来检测异常,但这样方式会遗漏不少的异常数据。本文采用了一种基于主成分分析法(PrincipalComponentAnalysis,PCA)的数据挖掘方法来捕获异常数据,以此来最大程度发现信用卡欺骗行为,通过实验证明此方法是有效的。5.学位论文杨玺基于支持向量机的信用卡欺诈检测研究2008信用卡作为一种全新的支付手段和信用工具,已经成为众多商业银行竞相推出的业务,经营信用卡业务有高收益的同时也伴随着高风险。随着我国加入WTO,电子商务高速发展,信用体系和信用支付环境的建立,越来越多的消费者选择使用信用卡进行支付。因此,确保消费者信用卡安全支付尤为重要,对比国际先进的信用卡业务的信用卡交易欺诈风险管理体系,我国商业银行的信用卡交易欺诈风险管理体系存在着很大差距。市场经济条件下,随着经济发展,信用卡欺诈行为也越来越多,主要表现为:冒用他人信用卡交易和恶意透支、伪造信用卡诈骗、使用作废信用卡诈骗。信用卡诈骗严重扰乱了正常的金融秩序,给银行和持卡人造成很大的损失,影响银行信用卡业务的健康发展。传统的交易欺诈检测方法主要基于贝叶斯算法、决策树算法和神经网络算法。这三类算法的实际学习结果往往取决于我们对于数据的理解程度和算法模型设置问题。而这两项问题的解决,往往依赖于应用者的先验知识和经验,造成了对使用者“技巧”的过分依赖。本文仔细分析了信用卡交易的特点,发现采用数据挖掘技术能够有效地发现其内部隐藏的、潜在的异常交易模式。支持向量机是数据挖掘的一个新的研究领域,它能够很好的解决上述算法存在的问题。本文应用支持向量机算法构造了一个基于支持向量机的欺诈交易检测模型来检测高风险交易行为。具体来讲做了如下工作:把信用卡的业务数据转换为数据挖掘所需要的数据格式,并进行数据清洗、离散化、缺失数据处理等;建立支持向量机检测模型;对比分析各个模型的检测结果。本文最后还建立了一个基于支持向量机的风险检测实验系统,对检测结果进行了评价,并提出了下一步的研究工作重点。6.学位论文刘艳红SVDD算法研究及在信用卡欺诈检测中的应用2010随着全球信用卡欺诈交易数量的惊人增长,信用卡欺诈手法的不断翻新,主要表现为:冒用他人信用卡交易和恶意透支、伪造信用卡诈骗、使用作废信用卡诈骗等,由此带来的损失也日益增加。如何能有效、快速、准确地识别出信用卡欺诈交易已成为目前金融界普遍关心的问题。数据挖掘技术的应用为信用卡欺诈提供了智能型的检测方法。已有方法主要是将数据挖掘中的分类方法如贝叶斯算法、决策树算法和神经网络算法应用于信用卡欺诈检测模型中。基于这三类算法的欺诈检测模型存在以下问题:因为是有监督的欺诈检测,所以检测不出新类型的欺诈;建立模型所需数据集都属于银行的保密资料,所用的代表欺诈信息的数据很难找到;因为合法交易往往比欺诈交易多的多,所以存在严重的类别不平衡问题,这种不平衡会导致误分类,以至于分类精度不高。针对以上存在的问题,本文提出将单值分类方法—支持向量数据描述算法(SupportVectorDataDescription,SVDD)应用到欺诈检测模型的建立中。单值分类方法属于无监督分类方法,只用一类数据建模,能够检测出新类型的欺诈,并且也不存在类别不平衡问题。研究高效的SVDD方法、如何将该方法应用到欺诈检测模型中是本文研究的两个关键点。本文的工作如下:(1)对支持向量数据描述分类方法进行分析,指出SVDD方法的优缺点,分析了将其应用于信用卡欺诈检测模型建立中的优势和不足。(2)提出一种k-means聚类与改进的SVDD算法结合的新的分类算法(KmD-SVDD)。基于分而治之并行计算的思想,先用k-means聚类将整个数据集划分为七个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部支持向量集训练,即得到最终的全局决策边界。讨论了聚类个数k对训练时间的影响,并给出了k的选择方法。在合成数据和实际数据集上的实验结果表明,所提算法具有高效率和高分类精度。(3)提出基于蚁群算法的KmD-SVDD参数寻优方法。实验表明,KmD-SVDD算法中正则化参数C和核参数σ的确定对其性能影响很大,为进一步提高分类精度,将蚁群算法应用于KmD-SVDD参数的寻优中。首先由专家经验来确定这两个参数的有效位,C和σ在蚁群系统中由节点值体现,激素物质遗留在蚂蚁所走过的每个节点上,用k-fold交叉验证平均分类错误率作为目标函数值来更新信息素的浓度,这样搜索出来的最终路径代表模型此时具有最好的建模精度。与直接采用交叉验证方法比较,证明了该方法能够进一步提高分类精度。(4)提出基于KmD-SVDD算法的两阶段信用卡欺诈检测模型。该模型利用整群有相似消费行为的持卡人来取代原先单一的持卡人,克服了采用单一持卡人时交易记录数据不足的缺陷。通过与其他模型比较,验证了该模型的有效性。关键词:数据挖掘,欺诈检测,单值分类,支持向量数据描述,k-means聚类,参数优化7.期刊论文杨风召.白慧.YangFengzhao.BaiHui异常检测技术及其在电子商务中的应用-情报杂志2005,24(12)异常检测是一个重要的数据挖掘活动,用来发现数据集中明显与其它数据不同的对象.将异常划分为有模式异常和无模式异常,研究了各种异常的检测算法和检测系统的基本架构,并讨论了异常检测在电子商务中的应用.8.学位论文庄玮基于数据挖掘的信用卡欺诈行为识别模型的研究2008随着经济和社会的发展,以及全球金融市场的不断开放,各国政府积极推动金融自由化与国际化的措施,而以信用卡作为媒介的交易行为不断激增。但是,伴随发卡量的大幅增长和交易量的不断提高,信用卡欺诈呈现快速增长的趋势,且欺诈手法不断翻新,使银行很难迅速有效的从大量交易记录中觉察出欺诈交易,由此带来了巨大的风险和损失。因此,迫切需要一个能对信用卡交易进行快速判断和准确识别的模型或系统来辅助银行的工作。本文针对我国银行信用卡交易中普遍存在的欺诈问题,依据数据挖掘技术,构建信用卡欺诈行为识别模型,为我国银行的信用卡风险管理提供技术支