P2P网贷平台用户的信用分类研究所在单位:浙江工商大学队伍名称:why指导老师:倪禾队长:王晨宇队员1:胡滢泉队员2:颜义人联系人:王晨宇联系方式:18458226363邮箱:1120639535@qq.comP2P网贷平台用户的信用分类研究摘要P2P(peertopeer)网络借贷是一种新型金融模式,具有较高的信用风险。本文从偿还意愿、偿还能力和个人基本情况三方面构建信用指标体系,采用Hopfield神经网络模型对用户信用进行级别分类,对P2P平台的准入门槛进行了设置,为P2P平台的风险预警提供理论参考。此外,本文结合实地调研情况和模型结论对P2P平台的风险预警提出实质性建议,帮助其完善风险预警机制,降低P2P平台的信用风险。关关关键键键字字字:::P2P网网网络络络借借借贷贷贷;;;信信信用用用风风风险险险;;;Hopfield神神神经经经网网网络络络模模模型型型;;;风风风险险险预预预警警警ABSTRACTOnlineP2P(peer-to-peer)lendingisabrand-newfinancialmodelwithahighercfreditrisk.Thispaperstructuresacreditindexsystemfromthreeaspects,includingthedesiretoreimburse,theabilitytoreimburseandpersonalbasiccondition,usestheHopfieldneuralnetworksmodeltoclassifythelevelofthecreditofthelendersandsetstheadmittancedoorsillofP2Pplatforms,offeringthematheoreticalreferenceoftheriskwaring.Furthermore,thispaperconnectstheinvestigationandmodelconclusiontoprovidepracticalsuggestionsforP2PplatformsinordertoperfecttheriskwarningsystemandreducethecreditriskofP2Pplatforms.Keywords:OnlineP2Plending;Creditrisk;Hopfieldneuralnetworksmodel;Riskwarning一绪论自2006年以来,中国小额信贷联盟首次引入了普惠金融1概念。在创新性互联网金融阶段,与普惠金融相适应的网络金融平台如雨后春笋般不断涌现。其中,以P2P形式2的网络借贷平台最具代表性。截止2013年底,纳入中国P2P网贷指数统计的P2P网贷平台为356家,未纳入指数而作为观察统计的平台为70家,加上另外观察的97家平台,三者共计523家。而截止2015年12月底,短短两年内,该数据已经达到了三千多家3然而,在P2P网贷平台爆发式增长的背后也伴随着倒闭浪潮的袭来。2014一季度共有22家P2P平台倒闭,2013下半年以来则有75家P2P网贷平台出现问题或倒闭。此外,余存的P2P问题平台占比也很高,截至2015年底,P2P平台共有3858家,其中问题平台为1263家。仅2015年12月,全国P2P就新增问题平台106家,其中跑路占问题平台比例达到52.83%4。P2P平台的倒闭和问题平台的存在引发了巨大的信用危机,并且往往涉及巨额的款项,严重阻滞了普惠金融的发展。因此利用现有资源做好P2P平台的风险控制成了保障其顺利发挥作用的关键。许多P2P平台为了消除客户的后顾之忧选择了和担保公司以及保险公司合作,也有的自己设置了风险准备金以抵抗平台风险。但是这么做并没有能够分散信贷风险,未体现P2P这种全新的金融模式的价值,而仅仅是对风险进行了转移。要做到真正地控制风险,就要把控住风险的源头—做好征信与预警这两方面的工作。为此,本项目通过调研和数学建模的方法从大数据的视角出发,建立全新的合理删掉数据结构,并选用适宜的数学模型去检验数据结构的合理性,提升现有信用预警模型的准确性,从而从根本上解决P2P平台运营过程中的核心风险问题。此外,为便于在数据结构的基础上给P2P公司提供切实可行的建议,本小组实地调研了756金融网和信和财富两家在杭P2P公司。通过和风险管控人员的沟通访问,了解目前其公司在借款端的风险管控方案和操作流程,为理论数据结构和实践操作的结合打下基础。二文献综述由于P2P网贷属于新兴事物,在国内才刚刚处于起步的阶段,因此在我国相应地研究和文献相对来说比较少。很多学者将评价和预警银行用户的贷款模型套用到P2P网贷领域。然而二者的行为偏好和自身属性存在一定差异,因此这样类比是有缺陷的。我们需在前人的经验上重新拟定数据结构中的因素和与之对应的权重才能对结果正确地作出判断。鉴于这个思路,下面将先阐述对个人信用评价方法的研究现状。在国际上,个人信用评估的指标着重于品格、能力、资本三大信用要素,合称3C模型。后来WilliamPost(1910)和Edward·F·Gee(1943)在3C模型的基础上发展了5C原则5;在个人信用研究的统计方法上,DavidDurand(1941)最早将判别分析法运用到信用评级。随后Desai(1996)和Bardos(1998)等人也陆续运用该法建立个人信用评分模型6。Wiginton(1980)首次在信用评分模型中引入了Logistic回归方法,虽然这个方法在利用相同的数据结构的情况下与原来的线性回归法相比并没有什么新的突破,但是它在增加数据维数的时候显示出良好的性质。Makowski(1985)提出了分类树7的方法,这类方法在21世纪初得到了我国学界的青睐;在20世纪90年代,一1普惠金融:指能有效、全方位地为社会所有符合条件的阶层和群体提供相应服务的金融体系,旨在增强金融产品与服务的可获得性。2P2P形式:指借助互联网平台让投资方与融资方实现无缝对接从而避免繁杂的程序,降低投放成本。3数据来源:第一网贷。4数据来源:网贷之家55C原则:在3C模型的基础上又加入了抵押品和周期形势这两个因素。6Desai(1996)和Bardos(1998)等人提出的基于判别分析法的个人信用评分模型利用消费者零售信用申请表中的数据对信用风险进行了预测。7分类树的信用评级方法把消费者进行不断分类,尽量让每一类的申请者都具有相似的违约风险,并且与其他类别申请人的违约风险明显不同。2些非统计的方法也逐步发展起来,如:Odom(1990)提出神经网络方法,Vapnik(1995)提出了支持向量机(supportvectormachines)等,但这些方法并不成熟。国内对于个人信用评级的研究是从20世纪90年代后期开始的,在2000年后涌现大量研究,其中,支持向量机、神经网络与其他评估方式的组合是较为突出的研究方式,但由于数据结构和相关数据的缺失,这类方法并不能得到很好的实际运用。国内的个人信用评估指标8主要分为个人指标、经济指标、信用指标三大指标体系。岳改枝(2007)采用AHP法9将个人信用评级指标按照层次进行分析,后来陈燕燕(2007)也利用了该法结合我国的信用评分模式,对传统个人信用评估模型进行创新和改造;另一方面,李刚、许传华(2007),刘忻(2007)都提出并设计了基于神经网络的信用评估模型,它能够处理那些有噪声或不完全的数据,具有很强的容错能力。李虹(2007)将数据处理后建立支持向量机模型,并通过编程不断调整有关参数,之后吴冲、王萤。郭英见(2008)针对传统方法的不足,进一步对支持向量机模型进行了实证研究。而高莉(2009)将分类树和支持向量机这两中方法在个人信用评级领域有机结合,提出了一个提高了训练精度和测试精度的新模型。个人信用评价方法多被商业银行用于对贷款申请人的信用评价,P2P平台较少将其用于对借款人的信用评价。但国外对P2P网络借贷的信用风险研究表明,P2P平台借款者的个体特征差异不大,但信用风险差异明显。PopeandSydnor(2011)[1]认为,P2P网络借贷平台是由投资者个人而非借贷平台审核借款人的信用风险。因此,借款人可通过虚假陈述骗取借款,贷款风险更大。通过分析Prosper网站上的数据发现,P2P平台责任的缺失使网络借贷市场运行趋于无效,因而风险增大[2]。研究韩国最大P2P平台上的“从众行为”发现,“从众行为”导致网络借贷信用风险加大,即信息不对称现象非常严重,往往还会导致道德风险[3]。2013年被称为“中国互联网金融元年”,但国内学术界将大数据相关技术运用于P2P风险分析和管控是从2014年开始。彭露、李茜(2014)认为利用大数据技术解决P2P借贷双方信息不对称的问题,完善平台自身的风险保障措施,是实现P2P平台安全运作的当务之急。肖曼君(2015)采用排序选择模型,基于excelVBA数据挖掘技术截取多个P2P网站数据,对平台信用风险的影响因素进行实证分析,发现个人特征、信用变量、历史表现、借款信息分别对网络借贷信用风险存在正向影响。陶志刚(2015)以A网贷公司为例,运用全面风险管理理论,采用大数据手段提升风控水平,结合监管环境构建A公司的P2P借贷风险管理体系。林春雨(2015)通过整合海量数据采集、Spark分布式平台计算、机器学习建模等大数据技术,构建了一个能基于多维度风险评价指标的风险预警模型,实时、精准、全面监测网贷平台风险,从而有效降低平台集资诈骗、恶意跑路等恶意事件的发生频率,维护广大投资人的资金安全及社会稳定。王楚珺(2015)结合大数据技术,利用个人基本资料、社交网络情况、电子商务平台数据、资金情况等大数据来对借款者进行信用评估,从而有效降低P2P网贷平台的风险。刘楠、李欧阳(2015)指出,面对P2P网络贷款平台的异化,我们应该根据现实情况,进一步利用大数据完善我国的征信制度,确保P2P行业稳定有秩序地发展,服务小微企业。研究信用评级的目的往往是为了更好地进行风险预警,两者是密不可分的两个连续的环节。因此,常常可以利用同一种模型方法解决评级和预警的问题。虽然国内外研究个人信用评级的研究众多,但是却不能建立在很好地挖掘P2P网贷用户特征的基础上,这就让平台用户的信用评级和预警产生问题。8国内的个人信用评估指标主要分为个人指标、经济指标、信用指标三大指标体系。其中:个人指标主要反映在婚姻状况、学历、工作情况、居住情况、保险情况、健康状况和年龄等;经济指标可细分为年总收入、固定资产、资金进出、债务收入比例等;信用指标可细分为贷款历史、信用卡历史、商业信誉和银行关系等,并可以根据需要添加一些常用的其他指标,如信用卡记录等。9AHP法就是指分类树的方法,该法对客户分类变量的选择功能强且具有高分类准确率。3三信用指标体系的构建要准确的评估P2P平台借款人的信用风险,就必须对借款人的信用风险进行量化测度。基于系统性、科学性和真实性原则,本小组构建了合理的信用指标体系,由影响用户信用的因素和信用因素的级别两部分组成,综合测度P2P平台借款人的信用风险。信用指标体系结构图如下:图1:信用指标体系结构图3.1影响用户信用的因素在研究客户信用分类问题之前我们必须知道影响客户信用分类的影响因素。信用是受信方主观上的履约意愿和客观上的履约能力的统一,包括履约意愿与履约能力两部分,因此,凡是与履约能力和意愿相关的各种特征都成为了影响个人信用价值大小的因素。国际上通用的信用评估方法是“4C”分析法,重点涉及了个人品德、个人资产状况、个人偿债能力以及个人基本情况。结合历史数据,本文参照4C原则将变量主要分为三类。3.1.1还款意愿还款意愿是一种心理状态,它属于个人形象的有部分。当然,我们不能凭空臆断一个人的还款意愿,只能通过他的行为来衡量。例如对于偿还债务的习性,是否有恶意的透支,是否拖欠银行的账目等。由于个人的行为是具有惯性的,所以我们可以依据个人的信用历史记录来预测其未来的行为趋势。依据网贷平台数据的样本因素,可以将逾期还款