龙源期刊网大数据背景下寿险产品定价与创新作者:张宁来源:《贵州财经学院学报》2014年第02期摘要:论文主要探讨保险公司如何应用大数据,包括其在保险产品定价、客户价值挖掘以及巨灾风险估计方面的应用。首先基于实际调查结果对中国保险业的数据量进行了统计分析,并给出了数据使用效率的统计结果;其次以具体数据为基础,利用大数据方法和思想对传统的保险产品精算定价进行了改进,包括寿险产品以及财产险产品,该结果使保险公司获得了更大的比较优势;再次还基于寿险公司以及健康险公司的数据融合,通过设计全覆盖的保险产品来挖掘客户价值,并获得产品定价结果;最后还基于跨公司和行业的大数据应用,利用极值理论对中国巨灾风险进行了建模,使之能够应用于保险公司的保险和再保险业务中。关键词:大数据;精算定价;客户价值;巨灾风险;极值理论文章编号:2095-5960(2014)02-0036-07;中图分类号:F840;文献标识码:A一、引言信息是金融行业中最重要的资源之一,而数据是信息最直接的表现方式。随着电子技术发展以及世界金融市场交易规模的迅速扩大,金融行业中的数据量呈爆炸式增长趋势,如每一天世界金融产品交易数据达到500G以上,其中保险公司的数据占比达到12%(第一届CCF大数据学术会议,国家会议中心,2012年12月)。这充分说明金融行业已经进入了“大数据时代”。按照KennethCukier在《Bigdata》中的定义,大数据又被称为巨量信息、海量数据等,指的是所涉及的信息量非常巨大,超过传统软件和技术所涉及的范围[1],而所谓的大数据技术或大数据能力就是在这种海量数据下有效的数据分析技术,即能够利用各种各样类型的巨量数据,快速获取有价值信息,并使之应用的能力[2]。鉴于金融行业的巨量数据存量以及每天的新增数据规模,大数据分析能力对其尤为重要[3],保险公司是金融行业的重要组成部分,也不可避免要面对大数据现状,充分利用巨量数据来推动业务发展和创新,提升竞争力也自然成为当前最迫切的任务[4][5]。为了详细了解我国国内的大数据情况,我们对中国保险业进行了数据情况的统计(以下简称“中国保险业大数据背景调查”)。该统计所涉及的保险公司共122家,其中包括58家人身险公司、59家财产险公司以及5家再保险公司。在人身险公司中,中资公司35家,外资公司23家;在财产险公司中,中资公司38家,外资公司21家。这些公司的业务规模占全部保险市场的95%以上,可以认为调查结果具有一定的普遍性。龙源期刊网我们统计的数据种类包括以下五类:一是保单数据及保单维持数据:这部分数据组成了保险公司的业务系统,以专业的数据库软件来操作。二是核赔理赔数据:这部分数据随着电子化进程加快,大部分也在业务系统中,同时部门内部也有对应的数据库。三是投资理财数据:因为寿险经营时间长,需要对保费保值增值,所以寿险的保费投资是经营的重要方面,导致这部分数据非常丰富,相对来说,财产险公司中,这类数据量比例较小。四是定价数据:这部分数据是精算部门用来定价和利润测试,以及用来向保监会报送各类报表运算时候需要的数据,有相当一部分来自于业务系统。五是风险管理数据,这部分数据相当零散,且涉及以上各类数据,同时还包括公司的财务数据、行业数据、监管数据、宏观经济数据乃至宏观管理数据。六是再保险公司公司数据,再保险公司承担保险公司的分出业务,通常掌握了很多家原保险公司的数据,具有比原保险公司更多的数据,这部分数据尽管有相当一部分来自于原保险公司,但大数据的核心并非是关注数据的重复问题,而是如何利用数据进行快速决策,所以我们把再保险公司的数据也统计在内。我们对所有参与统计的原保险公司前五类数据并汇总,然后加上再保险公司数据,由此构成中国保险业整体的数据情况。这里需要注意到:汇总过程中会有很多冗余数据,例如投资相关的金融市场数据等,但从大数据的核心出发,这些数据应该不作区分。原因如下:首先,大数据的本质是快速和预测,而并不关心重复数据的冗余情况,对重复数据冗余的处理其实是降低大数据应用效率的,大数据更关心的是基于整体的巨量信息快速进行决策和分析[6][7]。其次,每家公司在经营过程中,即需要考虑公司本身特有的信息、特有的数据,同时也必然和其他公司一样面对公共的信息、公共的数据,这些数据都是他们决策基础[5]。最后,重复的数据虽然存在但其对决策的影响其实是不同的,这和一同协作的数据有关,也和每家公司的大数据能力有关,换句话说,对每家公司来说,即使是重复的数据但也意味着不同的信息。这种现状正是本文研究的出发点,我们将以掌握的数据为基础,在定价、巨灾分析以及健康险方面进行大数据应用研究的尝试。二、跨部门大数据应用:寿险产品精算定价产品精算定价能力是保险公司的核心竞争力之一,大数据在精算定价中的应用核心就是从“样本精算”过渡到“全量精算”。对寿险来讲,保险公司基于“精算模型”,并使用“资产份额”和“宏观定价”等方法来确定实际保费。对财险公司而言,保险公司通常利用历史数据来获得“损失模型”,并通过分析各因素作用来获得最终保费。传统的这些过程中,一般只涉及公司所掌握数据的很小一部分,是“样龙源期刊网本精算”,但为了获得更大的市场空间,保险公司有必要利用大数据来获得“定价”的比较优势,实现“全量精算”。这里我们仅以寿险定价为例来进行应用研究。寿险公司在长期经营过程中积累了大量的数据和信息,同时外部环境变化也积累了海量数据,而传统的寿险产品定价对这些数据置若罔闻,仍然是基于保监会公布的00—03生命表和一些公司的有限信息来进行,这必然不能反映真实的风险状况,也丧失了市场竞争中的比较优势。这里以一家普通的保险公司为例来说明大数据应用。我们将数据范围扩展到公司的全部部门(包含整个业务部门乃至核保核赔部门),这些部门的数据经过唯一的ID(如身份证号)链接,形成一个庞大的海量数据记录,在舍弃一些信息并整理后(仅包含索赔引起的死亡率信息)形成了一个900M的数据库,涵盖的时间是2003—2009。该数据即是进行“全量精算”的基础。接下来,我们对数据库进行整理并加上国家统计的数据(来自于《中国人口与就业统计年鉴》),获得了从1983年开始的分年龄段死亡率表(表1)。根据此定理,我们利用大数据的信息来进行参数估计,方法是最小二乘法或极大似然估计。保险公司仅需要在大数据的基础上,进行程序运算,给出对应的距离或其他信息,就可以得到该极值分布的具体参数。如我们以上述例子为样本,可以得到其参数估计值分别为-0.7和1.8。有了损失分布,财产险公司就可以用来进行定价或者进行分保安排,而再保险公司就可以进行风险控制。五、结论通过以上大数据在保险公司中的具体应用,我们得到几点结论:第一,保险公司应该在定价中充分利用公司所掌握的全部数据,让定价从“样本精算”转移到“全量精算”上来,让每个部门数据都发挥作用,通过整合和利用大数据技术,达到更精确的风险定价,从而获得更大的定价空间。第二,保险公司自身应该重视数据接力,甚至保险公司之间应该加强数据合作,通过针对性的保险产品覆盖来实现客户价值挖掘,扩大保险市场。第三,保险公是不但要重视本行业的数据积累,还要重视并挖掘其他行业的数据价值,通过与自身数据的融合来实现大数据所带来的价值。参考文献:[1]ViktorandKenneth,BigData:Arevolutionthatwilltransformhowweliveworkandthink[M].EamonDolan/HoughtonMifflinHarcourtPress,2013.龙源期刊网[2]RedmanT.Theimpactofpoordataqualityonthetypicalenterprise[J].CommunicationsoftheACM,1998,41(2):79-82.[3]张宁,云计算在保险公司信息化中的应用[J].数学的实践与认识,2012,42(27):97-103.[4]EckersonW.DataWarehousingSpecialReport:DataqualityandthebottomlineJR.ApplicationsDevelopmentTrends,2002.[5]EnglishLP.ImprovingDataWarehouseandBusinessInformationQuality:MethodsforReducingCostsandIncreasingProfits[M].NewYork:Wiley,1999[6]SwartzN.Gartnerwarnsfirmsof‘dirtydata’[J].InformationManagementJournal,2007,41(3):6-12.[7]KohnLT,CorriganJM,DonaldsonMS.ToErrisHuman:BuildingaSaferHealthSystem[M].Washington:NationalAcademiesPress,2000.[8]ZhangNing,ThemodifiedmortalitydecompositionmodelanditsapplicationintheChinalongevityriskanalysis,ICCIA12:1462-1465.[9]ZhangNing,Introductionandcomputationoflongevityriskindexbasedonmortalityratedecompositionmodel,SpringerCommunicationsinComputerandInformation,2012,289:608-615.