模式九大数据征信案例:芝麻信用芝麻信用评分大数据征信◼大数据征信,是指利用大数据技术开展的征信,具体来说,是利用大数据技术对企业、事业单位等组织的信用信息和个人的信用信息进行采集、整理、保存、加工,并向信息使用者提供的活动征信业务和征信机构◼征信业务:对企业、事业单位等组织(以下统称企业)的信用信息和个人的信用信息进行采集、整理、保存、加工,并向信息使用者提供的活动◼个人征信业务◼企业征信业务◼征信机构:依法设立、主要经营征信业务的机构诚信、信用和征信◼信用不是从诚信产生的,信用作为特定的经济交易行为,是经济发展到一定阶段的产物,是为了实现高效交易而建立的一种正式制度,具有强制性和规范性◼信用未必依赖于诚信,经济活动的交易双方讲信用,可能只是因为契约强制,并不是出于诚信◼征信是为信用活动提供的信用信息服务征信的重要性◼征信业在促进信用经济发展和社会信用体系建设中发挥着重要的基础性作用◼征信服务既可为防范信用风险,保障交易安全创造条件,又可使具有良好信用记录的企业和个人得以较低的交易成本获得较多的交易机会,而缺乏良好信用记录的企业或个人则相反,从而促进形成“诚信受益,失信惩戒”的社会环境案例:央行个人征信系统不到4亿9.9亿截止2019年4月◼全国16岁以上人口约13亿,约6亿人在央行征信系统中只是一个身份证号码,还有约3亿人完全不在征信系统内,也就是说,有9亿人没有信用记录个人信用报告信用评分:信用报告的数据摘要《关于做好个人征信业务准备工作的通知》(2015年1月)要求八家机构做好个人征信业务的准备工作,准备时间为六个月案例:腾讯征信◼腾讯征信有限公司是腾讯旗下独立的互联网征信机构,专注于反欺诈、身份识别、信用评估服务◼腾讯征信的服务对象主要包括金融机构和普通用户◼对于金融机构,腾讯征信通过提供互联网征信服务,帮助金融机构降低违约率以降低风险,提高通过率以服务更多用户。目前,腾讯征信已经与商业银行、消费金融公司、小贷公司、个体网络借贷机构、保险公司、金融服务公司开展合作◼对于普通用户,腾讯征信通过帮助他们建立信用记录,使得他们获得更多的金融服务腾讯信用◼腾讯信用是腾讯征信的个人征信信用评级产品,基于腾讯社交大数据优势,全面覆盖腾讯生态圈8亿活跃用户,通过先进大数据分析技术,把征信对象的特征输入到消费、财富、安全、守约等四个信用指数中,每一指数代表征信对象的某一信用特征,然后根据上述四个信用指数,采用科学的方法和模型进行整理、加工,得出信用星级◼个人信用星级最低半星,最高七星,星级越高代表信用越好腾讯信用(续)反欺诈产品◼反欺诈产品是国内首个利用互联网数据鉴别欺诈客户的系统,帮助金融机构和企业识别用户身份,防范涉黑账户或有组织欺诈,发现恶意或者疑似欺诈客户,避免资金损失◼反欺诈产品主要服务对象包括商业银行、证券公司、保险公司、消费金融公司、个体网络借贷机构等◼反欺诈产品通过市场应用验证查得率和查全率是行业的数倍,优异的实用验证表明其高效性和可靠性人脸识别服务◼人脸识别技术由腾讯自主研发,并与公安部达成战略合作,依靠多年的数据积累建立了庞大的图形数据库,结合腾讯独创的图形技术算法,将数据库与人脸扫描图像、公民身份证信息进行交叉比对,人脸识别准确率行业领先◼目前,腾讯人脸识别服务已经进入实际应用阶段,根据实际互联网金融场景测试,自拍身份证对比可以达到万分之一错误率以下,通过率95%以上腾讯征信与浦发银行信用卡中心的合作◼腾讯征信与浦发银行信用卡中心开展合作,浦发信用卡中心将接入腾讯征信信用评分、反欺诈等征信产品◼在合作前期,浦发信用卡中心对腾讯征信产品进行了周密的数据验证,结果显示腾讯征信相关产品在高风险用户的侦测能力上对浦发原有的信用卡申请评分有显著提升,效果非常明显。腾讯征信的接入能有效提升浦发信用卡的风控能力,增加浦发信用卡在新用户发卡审批环节的效率和风控强度,同时增加了浦发在线上渠道发卡的信心案例:百行征信◼2018年3月19日成立的百行征信有限公司,是目前除中国人民银行征信中心,唯一拿到个人征信业务经营许可的机构◼百行征信由中国互联网金融协会牵头,与芝麻信用、腾讯征信、深圳前海征信、鹏元征信、中诚信征信、中智诚征信、考拉征信、北京华道征信等8家市场机构共同出资成立。其中,中国互联网金融协会持股36%,其余8家机构分别持股8%数据库建设◼百行征信与央行征信系统错位发展、功能互补,助力传统金融,推动互联网金融、消费金融、小微金融和普惠金融的创新发展◼截至2019年底,百行征信的征信系统收录个人信息主体1.4亿人,去重后6500万人,信贷账户1.75亿个,信贷记录18亿条;累计收录P2P借款人3800余万,基本实现了网络借贷人群全覆盖产品创新◼开业以来,百行征信启动个人信用报告、特别关注名单、信息核实核验三款产品的上线验证测试工作,继续研发测试三款反欺诈产品(反欺诈规则报告、反欺诈评分、反欺诈风险画像)及百行征信APP,不断丰富产品种类征信服务◼百行征信持续规范服务流程、提升服务质量、创新服务意识,积极探索建立一整套全方位、全周期、全客户类型的,服务于B(机构)、C(个人)、G(政府)、S(社会)端等各类客户的专业化、精细化、以客户需求为导向、注重信息安全和个人隐私保护的服务体系大数据征信与传统征信的比较传统征信互联网征信覆盖人群有金融机构信贷记录的人群包含缺乏信贷记录的人群数据来源金融机构和公共机构金融机构、公共机构、商业伙伴、用户自身等数据类型信贷数据信贷数据、网络数据、社交数据等数据格式结构化数据非结构化数据、结构化数据算法应用逻辑回归机器学习变量特征还款记录和贷款类别等还款记录和贷款类别、水电煤缴费记录、网络消费支付记录、理财偏好、行为偏好、人脉关联度等变量个数数十个成千上万案例:芝麻信用数据集市数据源数据清洗客户归档变量预筛选精细化研究[经验+衍生]特征工程研究逻辑回归梯度提升决策树随机森林神经网络创新方法分群调整技术创新技术增量学习技术平滑处理技术•处理增量信息•处理稀疏信息•高效更新评分•提高用户体验•准确性•稳定性•普适性...…多数据源多算法的研究与比较原始加工艺术+科学广谱数据先进算法丰富场景芝麻模型金融生活其它广泛的数据来源先进的数据处理和算法技术◼芝麻信用基于大数据模型,通过数据处理,把上述原始数据转换为可用格式的转换数据。然后,将转换数据合并到描绘征信对象的某一特征,包括基本信息、注册信息、兴趣偏好、支付和资金、人脉关系、黑名单信息、外部应用等◼芝麻信用依据上述数据,运用云计算及机器学习等技术,通过逻辑回归、决策树、随机森林等模型算法,对各维度数据进行综合处理和评估,客观呈现客户的信用状况丰富的应用场景•消费金融•网络借贷•信用卡发放•……金融•租物•住宿•出行•旅行•……•拼车•租房•婚恋•同城•……解决商户与人,人与人之间的信任问题B2CC2C生活降低违约率提升通过率信用+生活芝麻信用评分典型应用场景与效果出行住宿金融大数据征信业务大数据征信关注名单反欺诈身份核实信用评分大数据信用评分◼信用评分,是指征信机构利用信用评分模型对企业和个人信用信息进行量化分析,以分值形式表述◼大数据征信中的信用评分,是指利用大数据技术开展的信用评分◼如同信用评分,大数据信用评分也可以分为企业信用评分和个人信用评分案例:芝麻企业信用分案例:芝麻分案例:招联金融好期贷大数据信用评分的原理案例:芝麻分的原理◼芝麻分就是典型的大数据信用评分,在信息采集、整理、保存、加工等,遵循大数据信用评分的原理原始数据◼芝麻信用将成千上万种来源于各种渠道的原始数据输入系统◼数据包括阿里巴巴的电商数据、蚂蚁金服的互联网金融数据、公共机构及合作伙伴数据、用户上传数据等转换数据◼芝麻信用通过数据清洗、客户归档、原始加工,将上述原始数据转换为可用格式的数据,储存在数据集市元变量◼芝麻信用运用大数据模型,将转换数据合并到描绘征信对象某一特征的元变量,包括基本信息、注册信息、兴趣偏好、支付和资金、人脉关系、黑名单信息、外部应用等模块◼芝麻信用将元变量输入到不同的数据分析模型,得到五个不同的信用维度(模块)合成分数◼芝麻信用将五个信用维度赋予相应权重,形成最终的信用评分关注名单◼关注名单通过收录征信对象在各类场景下的违约行为,帮助合作伙伴过滤不良客户,规避和防范潜在风险。◼关注名单的常见数据来源包括政府及社会公共事业机构、行业组织和商业机构(如金融机构、电商、酒店、租车公司等),每类关注名单可体现一个细分行业的某类风险行为关注名单(续)案例:芝麻信用的行业关注名单◼芝麻信用的行业关注名单,为接入机构提供第一道风控屏障,帮助合作伙伴过滤不良客户◼例如,芝麻信用利用某互联网金融公司的历史客户样本数据进行测试,结果显示,行业关注名单客户最终表现为坏客户的比例为42.5%,非行业关注名单客户最终表现为坏客户的比例为9.8%,前者是后者的4倍多身份核实◼企业身份核实:主要解决线上政务、信贷、交易场景中企业身份的实时识别问题。与目前很多场景中由企业提供证照资料及书面授权书,并经人工审核的认证流程相比,大数据征信中的企业身份核实可以实现线上实时认证,速度快、体验好、通过率高◼个人身份核实:通过人脸识别、眼纹识别、姓名、身份证号、银行卡验证等手段,对个人用户进行实人验证,可有效地核实用户身份,防止身份冒用、欺诈等风险。身份核实,简单说就是验证“张三是张三”案例:个人身份核实助力直播平台◼根据规定,直播平台需要验证注册主播的用户身份真实性。直播平台在对接芝麻信用的个人身份核实产品芝麻认证后,利用其人脸验证服务,实现线上实时认证,速度快、体验好、通过率高◼认证流程为:首先验证该用户的姓名与身份证号的真实性,其次采用人脸识别技术,采集该用户活体人脸特征与身份证的公安留底照片进行比对,以验证该用户是否使用了本人身份证◼采用了芝麻认证服务,用户从注册到完成验证成为主播,从原人工审核的3天时间,缩短到3分钟完成,既提高了用户注册效率,又提高了新用户转化率反欺诈◼欺诈评分◼欺诈信息验证◼欺诈关注清单欺诈评分◼欺诈评分是对个人申请信息中的欺诈风险进行综合评估的评分◼申请欺诈评分主要解决信贷、租赁、交易等场景中个人用户申请信息的欺诈风险识别问题◼申请欺诈评分有助于快速识别虚假申请,减少业务损失;同时,有效降低审核成本,提高业务效率欺诈信息验证◼欺诈信息验证是验证个人信息的真实性,验证内容包括姓名、身份证号、手机号、地址、电子邮箱帐号、银行卡号、设备及网络环境等欺诈信息验证(续)◼欺诈信息验证主要解决信贷、租赁、交易等场景中个人用户信息的真实性验证问题◼例如,在银行信用卡申请、网络借贷申请、电商帐户注册等场景,欺诈欺诈信息验证对用户所提交信息的真实性有很强的验证能力案例:欺诈信息验证助力中国联通信用购机◼中国联通的信用购机业务,需要购机人提供身份信息、电话信息、地址信息这些信息的核验,不但耗费大量的人力成本,而且有一定的审核时间,客户体验不好。此外,由于信用购机的机器有价格的优势,导致一些用户冒用他人的信息进行购机申请◼中国联通与芝麻信用合作,利用芝麻信用的欺诈信息验证,通过电话有效性验证、地址有效性验证、网络设备验证等多维交叉验证,实现了快速审核申请件,同时还有效的降低了欺诈风险,使得违约风险由20%下降到10%左右欺诈关注清单◼欺诈关注清单是识别个人的欺诈相关风险,包括事实欺诈、信息泄露、关联风险、多头申请、设备聚集性申请等◼欺诈关注清单主要解决信贷、租赁、交易等场景中个人用户欺诈风险识别问题◼例如,在银行信用卡申请、网络借贷申请、电商帐户注册等场景,欺诈关注清单对用户的欺诈风险有很强的识别能力