1大数据在互联网保险的应用与创新GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC泰康在线大数据总监杨新刚大数据在泰康在线的实践与创新•泰康在线互联网发展历程•互联网保险行业创新的特点GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC•泰康在线的大数据战略•泰康在线的大数据实践•互联网保险行业大数据发展趋势2泰康在线互联网发展历程2013年•与“阿里小微金融”开启战略合作(乐业宝)•开创“222保险电商大促日”单日保费破记录•与“咕咚网”开启穿戴设备合作2000年泰康在线开通第一张电子保单诞生2011年理财产品“投连C款”3日销售4亿2012年•泰康在线呼叫中心大幅增员至百人创新事业部成立推出泰康网上专属产品系列32008年2002年业内率先开通网上续期缴费服务2005年•与“携程”开启战略合作•与“新浪”共建国内第一家金融保险超市•推出第一款互联网DIY保险产品“e爱家”2009年2015年•与腾讯联合策划春晚摇红包项目,获微信粉丝千万级粉丝关2014年注•。与腾讯推出轰动业内的创新产品“微互助”“求关爱”,被公认为首款互联网思维的保险产品。•与奇虎360开启战略合作,项目获得互联网营销金融行业金奖GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC4保险行业互联网化的特点保险保单多以家庭、朋友等受信任的关系为基础进行销售,互联网化后更多的是以单个用户进行销售寿G险ITC:G通ITC过G比ITC较G长ITC的GI时TC间GI与TC用GIT户C沟GIT通C互GIT动CG,IT引CG导IT用CGITC户通过互联网平台购买。财险:用户通过互联网平台主动购买,特点是高频、低价、用户互动。5保险行业互联网化的特点买家风险产品碎片化生活场景化支付安全:账户损失险物流费用:退费险资产安全商业信用:商业信用险产品责任:产品责任险物流风险物流财产损失:货运险、航运险、邮包险卖家风险数字资产损失:云端数据丢失、交易盗号、手机丢失险、手机碎屏险等放心医疗医疗责任险、小额贷款信用险健康服务电子病历管理、基因测序、挂号服务等玩的安全旅行社责任险航班延误、天气突变风险、行李丢失风险等吃的安全餐饮责任险、产品保证保险产G品I质T量C:G产品IT保C证险GITCGITCGITCGITCGITCG农IT产C品责G任I险TCGITCGITC健康G险IT、C泰康在线的大数据战略医疗养老投资6依托公司大健康战略,打通保险、医疗、养老、投资的数据资源,构建大健康生态系统保险GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC泰康在线的大数据实践与创新7•泰健康评分系统•G微ITC观GI用TC户GIT行CG为IT分CG析ITC系G统ITCGITCGITCGITCGITCGITCGITC•基于家族的精准营销系统泰康在线的大数据实践与创新GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC8泰康在线的大数据实践与创新MDM客户号手机号码微信openid证件号码性别邮箱地址收入最新测试类型最新测试结果最新测试时间核保结果核保原因会员等级风险额度健康测试种类数绑定泰康在线时间取消关注泰康在线时间关注泰康在线时间健康保障健康指数资料完整度健康活跃度好友数好友前四维度总分值人际关系健9康度泰健康评分体系项目是基于泰康在线亿级用户标签为基础,以用户抵御健康风险能力为主角度的客户价值评价管理数据系统,也是客户管理系统建设雏形。泰健康评分体系旨在对用户进行分级和标签记录,不同级别用户享受服务和产品不同,做到差异化、个性化的服务,提升用户粘性,提高保费转化效果,实现精准营销。体检数据基因筛查数据运动健康数据饮食健康数据全面打通各系统、各类型的风险保额泰康在线会员等级微信行为数据APP行为数据官网行为数据第三方行为数据家族关系邀请关注下载邀请购买GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC泰康在线的大数据实践与创新•10通过大数据技术,持续敏捷接入泰康会员在公司内外的各类健康数据(投保、体检、运动),利用大数据高效数据处理能力和精准的算法处理能力,快速反映用户健康状况和健康行为倾向的变化,支撑公司的快速决策。•前期以增加用户粘性,增强用户与我们的互动,提升用户参与感为主。后期拓展为以大数据挖掘带来的精准决策为基础,包括精准定价、精准推送、精准展现等,为用户提供差异化,个性化的健康产品和服务。提升客户体验,挖掘客户价值•通过大数据的高速运算能力,快速反映用户健康状况和健康行为倾向的变化,满足客户个性化,差异化的健康需求。•通过直观的分数展现,保额展现,根据分数匹配的专属泰健康服务,让客户更准确方便的得到自己需要的产品和服务。GITCGITCGITCGITCGI,T提C升转G化IT效C果。GITCGITCGITCGITCGITCGITC泰康在线的大数据创新亮点GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC11泰泰康康在在线线的的大大数数据据创创新新亮亮点点1.通用数据接入框架,实现多途径,异构数据源百万级日均增量敏捷接入。数据来源:电商主库,微信公众平台,用户行为数据,第三方健康数据300,000250,0件00GIT200C,000GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC150,000100,00050,000012泰康在线的大数据创新亮点2.10亿级大体量数据Spark高效处理20,000,000080,000,00060,000,00040,000,000100,000,000120,000,000全量源数据约6亿10,000,00020,000,00030,000,00040,000,00050,000,00060,000,000070,000,000全量结果数据约4亿件200,000,000件180,000,000100,000,000160,000,00090,000,000140,000,00080,000,000GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC13泰康在线的大数据创新亮点143.通用的数据挖掘框架,实现可定制的数据挖掘针对不同的数据源(结构化,半结构化,非结构化)和业务应用场景(精准营销,决策定价,风控与反欺诈),构建通用的数据模型框架,便捷使用不同的算法模型(聚类算法,分类算法,精算模型)进行数据挖掘,实现可定制的数据挖掘。对同一数据源,在已知类标和未知类表的场景下,分别使用分类算法和聚类算法进行挖掘,比对结果,以最大限度的挖掘发现数据价值和线索GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC泰康在线的大数据创新亮点154.海量数据处理---性能优化与数据倾斜通用业务逻辑抽取处理,生成共享Parquet文件GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC大表与小表的关联mapjoin,避免Shuffle阶段海量数据处理Reduce阶段,可以使用Repartition重新分区,防止内存溢出数据接入阶段,使用MD5避免数亿级据库表的数据倾斜泰康在线的大数据创新亮点Tx,2A,2A,2A,2ADataMDataTAx,3DataA,3MA,3DataA,3TAxmin{100,(Ax,1,Ax,2,Ax,3)MA(Ax,1,Ax,2,Ax,3)}xx,i}}nx,ixsitBmin{100,max{50,10uwj1tx,jxnxi1j100222216452024444034842444412444482444494591891620403481nxDiffx1e2•部分算法模型示例GITCGITCGITCGITCGITCGITCGITCGITCGITCG9IT4CGITCGITC泰康在线的大数据创新亮点关注泰康在线,进入泰康在线微信公众号,选择“我的”按钮,体验泰健康评分GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC17泰康在线的大数据创新亮点GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC18泰康在线的大数据创新亮点GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC19泰康在线大的数大据数项据目创的新效亮点果20•基于大健康的数据闭环初步形成•G数ITC据GI财TC富GIT多CG途IT径CG变ITC现G初ITC现GIT成C效GITCGITCGITCGITCGITC•数据已经(流)动起来,用起来泰互联康网在保线险的行大业数大据数创据新发亮点展趋势传统保险的基础是基于用户静态数据的大数法则;互联网的迅猛发展,产生了海量的动态用户数据,而这G些ITC动G态ITC数GIT据C更GIT能CG精ITC确G,I实TC时GIT地CG反ITC映G用ITC户GI的TC健GIT康CG状ITC况,购买健康服务的倾向和赔付风险.也就是说,基于互联网动态数据的算法模型,很有可能取代原有的大数法则,颠覆保险原有的行业规则2122祝全体伙伴周末愉快!GITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITCGITC