四川师范大学硕士学位论文基于支持向量机的信用卡欺诈检测研究姓名:杨玺申请学位级别:硕士专业:计算机应用技术指导教师:李晓宁;郭涛20080410基于支持向量机的信用卡欺诈检测研究作者:杨玺学位授予单位:四川师范大学相似文献(10条)1.学位论文吴婷数据挖掘在信用卡欺诈识别上的应用研究2006近年来,随着经济的发展与世界各国金融市场的逐步开放,各国政府积极推动各种有关金融自由化与国际化的措施,导致国内外信用卡市场不断成长,以信用卡为媒介的交易行为不断激增,已有超过现金及票据交易的趋势,信用卡业务成为银行一个重要的业务收入来源。但是随着发卡量大幅度增长,经济规模扩大和市场的快速扩张,目前全球信用卡的欺诈交易正以惊人的速度增长,欺诈手法不断翻新,歹徒作案技巧日益精明,金融企业已逐渐无法有效察觉欺诈交易,带来的损失日益增加,特别是在中国社会信用体系还没有效建立和发挥作用的情况下。如何能有效、快速、准确地识别出信用卡欺诈交易已成为目前金融界普遍关心的问题。本文首先简单介绍了信用卡及其业务、风险管理的相关知识,并深入分析了信用卡欺诈风险的成因和识别防范策略,指出应该分两条线索分别加以探讨:一是仅基于交易资料的以交易为线索进行分析,二是基于客户基本资料与交易资料结合的以客户为线索进行分析。接着研究了数据挖掘的分类方法,着重介绍了支持向量机和决策树算法及这两种算法各自的优点,同时对学者们在信用卡欺诈识别研究上所作的贡献进行了文献综述。然后针对目前在分类研究中普遍存在的两个问题——样本分布的不对称性和单一分类器效能低下,提出利用k-meaIiS聚类解决样本的不对称分布,架构基于支持向量机和决策树的组合分类器,并用Adacost方法进行分类结果的融合。最后使用某商业银行的信用卡数据,在前面架构的欺诈识别模型基础上进行实证研究,并将此分析结果与在类别不对称的样本分布和使用单分类器模型情况下的分类结果比较,实证证明本文中所架构的模型适合于信用卡欺诈侦测研究。2.学位论文陈青山基于数据挖掘的个人信用评分模型研究2008随着中国经济的快速发展,中国的信用消费已逐步浮出水面,个人贷款的增长速度非常迅速。个人消费信贷已经成为我国拉动内需,促进经济增长的重要手段。在个人消费信贷的发展过程中面对的主要问题之一就是个人信用风险难以评估和控制,导致消费信贷业务风险过高,因此,对个人信用评分模型的研究具有重要的应用价值。信用卡是消费信贷中发展最快,且最富创新活力的重要的金融信用支付工具。本研究从信用卡风险度量角度研究个人信用评分模型。通过将现代的数据挖掘技术中的支持向量机(SVM)、遗传规划(GP)和遗传算法(GA)引入信用卡风险管理领域,建立了信用卡申请风险模型和后期行为管理的评分模型,然后将信用评分模型应用到实际的信用数据中,验证了模型的有效性。论文将遗传规划和支持向量机方法结合起来,建立两阶段申请风险评分模型(2SRSM)。第一阶段利用遗传规划获得规则,并根据具体问题,引入误判成本分析和多目标优化选择策略来改进遗传规划算法。第二阶段利用支持向量机处理规则无法覆盖的客户数据。实证分析表明该评分模型具有分类准确率高和可解释性强的优点。论文通过研究国内商业银行信用卡行为数据,针对我国信用卡业务发展尚处于起步阶段,数据样本少、冗余属性多的特点,建立了基于遗传算法的特征选择算法。通过特征选择算法选择关键属性,消除了冗余属性对模型的影响,再利用多类支持向量机建立动态调整客户等级的信用卡行为评分模型,以便对信用卡的后期管理提供决策依据。实证分析表明,该模型能够有效提取关键属性,提高了模型的分类准确率。论文引入了遗传规划和支持向量机两个较新的数据挖掘技术,拓展了信用评分模型的研究,为解决个人信用评分进行了有益的尝试。3.学位论文田江基于支持向量机的孤立点检测方法研究2009孤立点检测是数据挖掘领域的重要内容之一。孤立点检测可以发现不具备一般数据特性的数据,进而发现潜在的有用信息。孤立点检测可以应用到很多实际领域,如信用卡欺’诈检测、故障诊断、医学诊断、网络入侵检测和信息检索等。近年来很多国内外学者着力于结合支持向量机技术进行孤立点检测应用,其成果颇丰。然而随着研究的不断深入和应用范围的不断扩大,现存方法遇到了一些障碍,检测模型的泛化能力和稳定性能也存在诸多问题。由于上述原因,本文以基于支持向量机的孤立点检测为题进行研究,以期提供更加高效稳定的孤立点检测方法,主要研究内容如下:br 1、一类支持向量机及其改进算法进行孤立点检测问题研究。实际应用中训练集通常包含大量的有标签正常样本,但只包含少量或者根本不存在有标签孤立点样本,这种情况下一类支持向量机表现出优势,但是由于算法对坐标原点依赖性强、参数不易选择等原因造成孤立点检测的误报率较高。针对这些问题本文首先利用受试者工作特征分析技术作为性能评价标准,使用两种参数搜索方法对模型进行优化,进而获得最佳决策函数。其次,设计了“局部密度一类支持向量机”算法,为每个样本测量数据局部密度并加到对应的松弛变量上,在训练过程中包含这些信息将有助于获得更理想的决策函数。此外,提出了“孤立点一类支持向量机”算法,通过综合距离和概率输出两种标准在无标签训练集中探测可疑孤立点,然后在特征空间刻画与可疑孤立点保持最大间隔的分类超平面,并在此基础上提出了一种根据数据异常程度动态更新数据样本的方法,提供了稳定高效的检测性能。br 2、数据预处理技术改善孤立点检测中支持向量分类器性能问题研究。支持向量机进行分类操作的时候,决策超平面会受到数据库中孤立点干扰而发生偏移;其原因在于孤立点在训练过程中易于成为边界支持向量,从而对最后的决策函数做出较大贡献:另外数据维数过高也会降低分类效率和性能。为此本文提出使用数据预处理方法改善分类器性能,通过主成分分析处理训练数据,为远离聚簇中心孤立点设置较小的权值,这样孤立点对最终决策函数起到的作用将大大降低,从而缓解决策超平面被偏移的问题,提出的方法被成功地应用到蛋白质亚细胞定位预测领域。针对高维数据会影响分类器性能的问题,利用高斯过程潜变量模型来抽取特征,并且设计了阶梯跳跃式降维方法,为获得良好分类性能提供了保障。br 3、使用混合策略的孤立点检测研究。孤立点检测应用中数据存在不平衡的特点,两类样本数量比例失调,将支持向量机的分类超平面向预测大类正常样本的方向倾斜,进而能够将孤立点样本全部识别为正常样本。本文首先结合两种支持向量机算法提出了一个两阶段的孤立点检测方法;集成不同权值改进半监督的一类支持向量机对数据集进行重采样,执行过程中通过设定较低权值降低孤立点的信息量,除去部分正常样本从而平衡两类样本的比例:使用代价敏感支持向量机执行孤立点检测操作,以两种误分类代价线性和最小为目标,实现了代价敏感孤立点挖掘。其次结合集成学习方法改进支持向量分类器的性能,利用聚类算法分解正常样本与孤立点样本作为单个分类器的输入,综合不同分类模型的输出结果改善孤立点检测性能。对于大类正常样本,使用聚类算法分解成多个部分,并分别计算与小类样本之间的距离,通过综合打分系统排除最远和最近的聚类;对于小类孤立点样本,使用一类支持向量机进行训练,在对应的支持向量样本上进行过采样操作;两种数据重采样方法的目的均在于平衡样本集以获得更理想的分类超平面。本文提出的混合策略方法能够提高检测率,降低误报率,同时将误分类代价降到最低。4.学位论文郭恺人脸识别中基于核的方法的研究2006人脸是人们社会交流中所关注的焦点,在辨别身份和传递感情方面起着重要的作用。尽管人们能够毫不费力地识别出人脸及其表情变化,然而利用计算机对人脸图像进行自动识别却是一个相当困难的问题。另一方面,由于人脸识别技术在视频监控、访问控制、信用卡验证、多媒体数据库检索以及安全等领域有着广阔的发展前景,因此在过去的20多年里,人脸识别一直是模式识别和计算机视觉领域研究的热点。特征提取和分类器设计是人脸识别中两个关键性的问题,本论文针对这两方面的问题,尝试将近年来模式识别领域中的新方法一核方法应用于人脸识别问题研究中,取得了一些有意义的结果。本文的主要工作包括:1、提出了一种小指数点积核函数。我们讨论了基于距离和点积的两种核函数,以及为了达到更好的分类效果,核函数应能够具有:(1)在原始空间中相关性很强的样本映射到高维空间后,其相关性变弱;(2)原始空间中相关性很弱的样本映射到高维空间后其相关性不能减弱的太快,仍需要有微弱的相关性。在此基础上,提出了更好的满足这些性能的小指数点积核函数,并将应用到主分量分析中。在AR和ORL人脸库上的实验结果表明:相对于多项式核函数,应用小指数点积核函数的核主分量分析的人脸识别有较低的误识率,且对光照、姿态及面部表情变化有更好的鲁棒性。2、结合小指数点积KPCA方法,本文提出小指数点积KPCA+零空间的人脸识别方法。首先利用小指数点积核主分量分析(KPCA)提取人脸样本的非线性特征,提高对光照、姿态及面部表情变化的鲁棒性,然后构造训练样本的类内散布矩阵零空间,在此零空间内找到令类间离散度最大的投影方向,往此方向投影得到人脸样本的最优分类特征矢量。应用此方法在AR人脸库和ORL人脸库上实验结果表明:这种方法的识别率和对光照、姿态及面部表情变化的鲁棒性对比Fisher脸方法有显著提高。3、本文提出了一种快速的wm-支持向量机人脸分类方法。构造一个支持向量机,将训练的人脸样本分为男人和女人两类训练集,然后在两类训练样本集中再分别构造两个一对多策略的多类支持向量机;在识别时,首先判定人脸样本的男女性别,然后再进行人脸的分类。在AR人脸库上的实验结果表明,相对于标准的一对多策略的mSvM,应用树状分类策略的、wm-支持向量机不仅大大提高了模型的学习速度,而且在应用局部核函数时能够得到更好的识别准确率。5.期刊论文郭振亚.GUOZhen-ya支持向量机在信用卡信用评估的应用-电脑知识与技术2009,5(7)信用卡业务现在是银行很重要的资产业务,构建一个适用的个人信用评估模型十分重要.基于近年来在智能学习系统领域发展起来的新理论,引入小样本学习的通用学习算法--支持向量机(SVM),建立了个人信用评估模型,通过与神经网络模型的比较.证实了该方法用于信用卡个人信用评估的有效性及优越性.6.学位论文涂建平核机器理论及在人脸识别中的应用2006人脸识别早在20世纪60年代就引起了人们的研究兴趣.近几年,它在安全验证系统、信用卡验证、档案管理系统、人机交互系统等领域有着广泛的应用前景,已经成为计算机视觉和模式识别领域的一个研究热点.人脸识别中的一个关键问题就是设计有效的分类算法.核机器学习是现在比较流行的一种学习算法,主要有支持向量机(SVM)、核主成分分析(KPCA)、核Fisher判别分析(KFD).本文主要讨论目前比较流行的核学习算法,阐述它们之间的区别和联系.相比其它的学习算法,SVMs有较好的推广能力和解的稀疏性.因此,我们将核Fisher判别分析展成类似支持向量机的数学模型,使之也具有稀疏性.此外,我们还利用误差修正码(ECOC)改进了多分类SVM,降低了多分类SVM的求解难度.在人脸识别的仿真实验中,我们用改进的SVM算法与其它的核学习算法进行比较,实验结果表明这种算法具有较高的识别率和稳定性.本文总共分为五个部分:第一部分,介绍了核函数与其相关的特征空间.第二部分,介绍了核主成分分析的无监督学习.第三部分,分析并改进了基于Fisher判别分析的核学习机器.第四部分,简要介绍了支持向量机的理论,采用误差修正码改进了LS-SVM多分类算法.第五部分,通过人脸识别的仿真实验测试改进的SVM算法的有效性,并与其它的核学习算法进行比较.7.学位论文李建平消费者信用风险管理中的数据挖掘模型研究2004该文就消费者信用风险管理问题进行了研究,主要的内容和创新之处有:一、探讨了信用风险管理中的数据挖掘应用原理,构建了数据挖掘应用的过程,并对该过程涉及的具体内容进行了较为详细地研究.首先阐述了消费者信用风险管理的一般理论与方法,分析了信用风险管理中的主要方法