1大数据对传统资信评估的影响摘要:大数据资信评估,拓展了信用信息的内涵,丰富了信用信息的内容,依托机器学习,开展数据挖掘,提高了资信评估的决策质量。大数据资信评估降低了传统资信评估的数据门槛,弥补了传统资信评估市场的不足,市场空间巨大,最终会占据主导地位,但会加剧该市场的垄断性。大数据资信评估的迅速发展也带来了信息不对称理论与金融监管上的挑战。关键词:大数据、信用信息、征信、信用评级中图分类号:F830.3;F830.5文献标识码:A文章编号:TheImpactofBigDataonCreditEvaluationAbstract:Bigdatacreditevaluationexpandstheconnotationofcreditinformation,enrichesthecontentofcreditinformation.Relyingonthedevelopmentofmachinelearninganddatamining,bigdatacreditevaluationimproveddecisionquality.Bigdatacreditevaluationloweredthresholdfortraditionalcreditevaluationdata,andmadeupfortheshortcomingsoftraditionalcreditevaluationofthemarket.Bigdatacreditevaluationhasahugemarketspace,andwilleventuallydominates.Butbigdatacreditevaluationwillincreasesthemarketmonopoly.Therapiddevelopmentofbigdatacreditevaluationalsochallengesthetheoryofasymmetricinformationonfinancialregulation.Keywords:Bigdata;Creditinformation;Creditreference;Creditrating21830年,英国伦敦第一家现代征信机构的出现标志着资信评估行业的诞生。到20世纪初,资信评估行业逐渐形成了信用评级和征信两大相对独立的分支,前者主要服务于资本市场,如美国的标普、中国的大公国际等公司,后者主要服务于借贷市场,如美国的FICO公司、中国的中国人民银行征信中心等机构。从1830年到21世纪初,资信评估行业基本上可以划分为20世纪中期之前的前电子化资信评估和之后的电子化资信评估两个阶段。为便于对比分析,接下来本文将电子化资信评估定义为传统资信评估,将目前依托大数据的资信评估简称为大数据资信评估,如Zestfinance、Kreditech、Wecash闪银等公司均是采用大数据资信评估。资信评估对于揭示经济金融市场中的信用风险,提高资源配置和金融市场效率具有十分重要的意义。大数据是信息时代发展到数字化阶段的结果与体现,尽管对于大数据以及大数据时代的定义还存在一些争议,但是大数据对人类经济、社会、思想、文化等领域的影响与冲击则是有目共睹,并且这种影响日益深刻与广泛。大数据时代的一个突出特征就是信息量及增长速度的飞速提高,同时信息传输方式越来越便捷。而揭示信用风险的资信评估正是以信用信息为加工和分析的载体,当前大数据对传统资信评估尤其是在企业信用评级和个人信用评分方面产生了巨大的冲击。本文主要结合企业信用评级和个人信用评分探讨大数据对传统资信评估的影响,这对于推进中国评级市场和征信市场的跨越式发展,完善社会信用体系具有非常重要的理论与实践意义。一、拓展了传统资信评估的信用信息基础1、拓展了信用信息的内涵信用信息指反映或描述信用主体信用状况的相关数据和资料等,主要包括政府信用信息、企业信用信息和个人信用信息。在传统资信评估中,企业信用信息主要指资产负债信息、经营信息等,个人信用信息主要指银行记录以及负债等信息(见表1)。无论企业还是个人,财务信息都在传统资信评估中居于核心地位。而大数据资信评估中,信用主体的任何信息都是信用信息,如客户属性、网上交易记录、网上信用评价、网上交易习惯、社交网络信息以及财务信息等。信用信息的范围和类型没有边界,财务信息不再是最主要的部分,只是信用信息的一部分,甚至是很小的一部分。以Zestfinance为例,传统信用数据最多占30—40%。相反,许多传统资信评估排除在外的信息,反而成为重要的信用信息,如拼写习惯、设备终端品牌,填写问卷的时间、浏览网络的时段、输入差错频率、手机的3使用情况和位置数据等。信用信息内涵的无限制拓展全方位改变了传统资信评估的运行模式,这也是大数据资信评估不同于传统资信评估的最基本前提。表1FICO公司个人信用评分参考的主要因素及比重信息类别内容评分比重偿还历史1、各种信用账户的还款记录;2、公开记录及支票存款记录;3、逾期偿还的具体情况35%信用账户数30%使用信用的年限15%新开立的信用账户1、新开立的信用账户数;2、新开立的信用账户账龄;3、目前的信用申请数量;4、贷款方查询客户信用的时间长度;5、最近的信用状况10%正在使用的信用类型1、信用账户类型;2、每种类型的信用账户数10%资料来源:根据FICO公司网站信息等整理2、拓展了资信评估信用信息的内容(1)拓展了信用信息的来源。传统资信评估的信用信息来源主要是以银行为主的金融机构,如私营商业银行、上市商业银行、开发银行、信用合作社、财务公司、信用卡发卡公司、贷款公司等,另外也有部分公用事业单位。因此,其信用信息主要是金融交易记录信息,这一点在中国人民银行征信报告中体现的Y也非常明显。而大数据资信评估的信息来源比较广泛,除了通过征信机构获得传统资信评估信息以外,主要借助现代通信技术,从社交网络、电商网络、移动终端等获得各种信用信息,并且这些网络来源的信息量非常之大。(2)扩展了资信评估的参考变量。美国FICO信用评分指标不超过50个,一般包含15—20个变量,当前中国人民银行的个人信用报告仅包含20个左右的变量。而美国的ZestFinance公司进行信用评估时,采集贷款人1万多条信息,最后遴选出70000条指标变量。德国的Kreditech,采集15000多个数据点,中国的Wecash闪银软件,采集用户的6000个数据点。(3)增加了信用信息的数据类型。根据存储特征,可以将数据分为结构化数据、非结构化数据。结构化数据具有一定的逻辑结构和物理结构,一般存储在数据库中,大多存储在关系数据库中。结构化以外的数据即为非结构化数据,大4多以文本的形式存在,不能存储到数据库中,而非结构化数据中,有一部分又具有一定的逻辑结构和物理结构,如HTML、XML中的一些数据,即属于半结构化数据。传统信用信息对应的数据基本都是结构化数据,可以用二维表描述,而大数据时代的信用信息大多是非结构化数据,难以用传统的数据库储存,这就使得大数据资信评估的数据分析手段与传统资信评估区别较大。表2传统资信评估与大数据资信评估在信用信息上的比较传统资信评估大数据资信评估内涵以资产负债类信息为主一切信息都是信用信息来源私营商业银行、上市商业银行、开发银行、信用合作社、财务公司、信用卡发卡公司、贷款公司、零售商、公用事业单位等社交网络、电商网络、移动终端、征信机构数量数量很多ZestFinance10000多条信息数量有限Fico评分只有15—20条变量Wecash闪银6000个数据点Kreditech15000个数据点类型以结构化数据位主以非结构化数据为主资料来源:根据ZestFinance公司网站等资料整理。二、优化了资信评估的决策过程1、数据分析从逻辑回归到机器学习无论企业信用评级还是个人信用评分,传统资信评估的技术手段侧重于对抽样的计量回归分析,尤其是正态分布假设下的线性回归,因为传统信用数据多是横截面数据、时间序列数据和面板数据等结构化数据。而大数据资信评估所面对的信息量非常大,同时大多是非结构化数据,这就决定了其资信评估的技术手段侧重于机器学习,以全样本为对象进行如因素分析、判别分析、分群分析、决策树、类神经网络以及规则归纳等。而且大数据资信评估对计算机的运算能力要求和依赖程度非常高,如在ZestFinance公司,Hilbert模型中的70000多条变量,有75%的依靠计算机处理,只有25%依靠人工干预。另外,数据分析的目的也更加体现实用性、可操作性。传统资信评估的计量分析侧重于假设检验,包括参数检验,而大数据资信评估数据分析的目的以预测为主,包括具体数值的预测和场景预测。52、提高了资信评估的决策效率上述数据分析技术手段变革的结果之一,是资信评估的时间成本大大降低。以Wecash闪银为例,5000元人民币以内的微授信在借款人登陆和提交资料以后,10分钟内可以完成授信决策,借款人可以即刻提现;50万元以内大额授信需2一3个工作日。而zestfinance对借款人的上万条数据分析在5秒钟内全部完成。Kreditech从各种公开来源的信息判断借贷者欺诈、欠账与及时还款的可能性只需35秒,15分钟之内完成贷款发放。而在传统资信评估最顶尖的FICO评分中,完成抵押贷款的审批需要0.5至2个工作日,汽车贷款在1小时左右,小额消费信贷需要15分钟。其决策时间都会远远高于大数据资信评估。大数据资信评估的另一个优势就是申请人可以随时借助互联网终端进行申请信贷,不受时间与设备的限制,而传统资信评估需要一些现场操作,并主要局限在工作日和工作时段。表3大数据资信评估的决策时间授信决策时间提现时间申请时间Wecash闪银10分钟2小时—3个工作日随时zestfinance5秒钟15分钟随时Kreditech35秒钟15分钟随时AvantCredit3分钟即刻提现随时资料来源:根据上述公司网站等来源信息整理三、引起了资信评估行业的深刻变革1、突破了传统资信评估的数据门槛进入传统资信评估行业的数据门槛体现在两方面:一是数据库规模要足够的大。这是由信用信息的成本收益特征决定的。比如益佰利公司拥有全球4亿企业和1.3亿家庭及个人的信用信息,环联公司拥有2.2亿消费者的信用信息,邓白氏公司拥有全球2亿多企业的信用信息。二是数据分析模型的准确性要高,要能经受住市场的检验。传统资信评估不仅在横向上需要有足够大的数据库规模支撑开发资信评估模型,更需要在纵向上,数据库要有足够长的时间跨度以检验校正资信评估模型,以建立一个较高违约预测准确度并且比较稳定的资信评估模型。所以,尽管一些发展中国家建立公共征信机构,依托行政力量可以在较短的时间6内,建立庞大的信用数据库,但是很难在短时间内开发出能经受市场检验的资信评估模型。如果资信评估模型的准确度不高,则无法建立良好的市场声誉,没有良好的市场声誉,则资信评估机构也就没有市场。大数据资信评估分别借助网络平台、机器学习突破了上述两大限制。第一,借助网络平台,大规模获取客户信用信息,短时间内建立一个庞大的数据库规模。以Zestfinance为例,通过第三方组织、通过访问互联网系统,如个人社交账户等可以从多领域、多机构获取和整合个人信用信息,再加上客户提交的数据,大数据资信评估公司可以在非常短的时间内,建立一个非常完整的而且极其详细的个人信用资料库(见表4)。Zestfinance公司,从2012年至今至少积累了10亿条个人信用信息,速度非常快、规模非常大。第二,通过机器学习、数据挖掘建立了比较准确的信用评估模型,大大加快了市场声誉积累的时间过程。ZestFinance比传统评分方法的违约率下降了40%,中国的金电联行2007年成立,截至2014年第一季度,通过大数据资信评估,已累计为1000多家企业提供超过40亿元的信用融资,最高授信达6800万,截至目前未发生一笔不良贷款。正是由于其准确的违约预测,所以大数据资信评估公司市场发展非常迅速。表4Zestfinance的数据获取渠道第三方数据传统信贷数据、搬家次数、司法记录用户提交的数据电