第八章信度理论本章主要内容一、引言二、信度的含义三、有限波动信度四、贝叶斯方法五、一致最精确信度六、NCD系统*引言例:假设某保险公司开发一新险种,保单组合由10位投保人构成。开始,由于没有任何理赔经验数据,只能先验地假定他们具有相似的风险水平。然后假定每一投保人每年至多引发一次理赔,且理赔额为1。最初,根据同行业的损失水平,估计这一保单组合的保费为0.2,我们称这种保费为先验保费,或集体保费。这样的估计是否符合实际情形,需要经验数据来验证。为了搜集足够的理赔数据,保险公司连续追踪十年,采集的全部数据显示于下表。请分析下表的数据,说明保费收取是否合理,该如何改进。年份投保人1234567891011211131114115111617111181191101iS0.60.30.20.20.20.1000.70iS0.23(1)总体平均理赔额为23/100=0.23。(2)投保人9和1的理赔记录明显偏高,0.7与0.6的比例足以认为这二人的风险水平要劣于集体的风险水平;(3)投保人7、8和10无理赔记录,表明他们的风险水平又优于集体的风险水平。经验费率厘定就是非寿险精算中用于消除风险子集的非同质性而发展起来的一类方法。这些方法主要包括两大类:一类是在保险年度开始前,根据被保险人最近几个保险年度的理赔经验确定下一个保险年度的续期保费。另一类是在保险年度末,根据被保险人当年的理赔经验来调整他在当年已经交纳的保险费。信度含义所谓经验费率厘定,就是在确定投保人的保费时,要考虑个人的理赔经验。信度的产生例:在劳工补偿保险中,根据近期经验,某工匠应该收取5美元的保费;另一方面通过对同类劳工保险调查显示,应收取保费10元,问明年该工匠的保费应收取多少?例:近五年,每个司机发生事故的频率为0.2/年,某个司机发生的频率为0.6/年,问该司机在来年发生事故的频率是多少?保险公司在对某个投保人进行经验费率厘定时,必须考虑区别该投保人的风险水平与风险子集平均水平的差别中有多少是由于随机波动所引起的,有多少是由于投保人真的优于或劣于风险子集平均水平而引起的。换句话说,投保人的自身理赔经验的可信度是多少?信度理论信度理论就是研究如何合理利用先验信息和个体理赔经验来进行估计,预测及制定后验保费。后验保费估计可以下面公式来表示后验估计值=z×经验值+(1-z)×先验值其中z(0≤z≤1)称为信度因子,后验保费估计值称为信度保费。只有正确地选择信度因子z,才能保证调整后的保险费接近于真实的风险水平。当1z,称理赔经验具有完全信度。当z0时,称为理赔经验没有信度。当01z时,称为理赔经验具有部分信度。第一节有限波动信度一、数学模型设jX表示某投保人在过去时期j的损失或理赔,jX也可以看作某风险同质的保单组合中第j份保单的损失,或者风险分级系统中第j类的损失。1,,jn。假设()jEX,var()jX,1,,jn。设:11()nXnXX表示投保人或保单组合的损失经验。M表示先验获得的的估计值,M通常称为手册保费。问题:如何确定的值?方法一:完全可信,忽略过去的经验数据,直接令=M。方法二:没有信度,忽略M,直接使用经验数据,即令X。方法三:部分可信,取M和X的加权值。(1)zXzM二、完全可信当观察值X与真值的差别相对于很小时,我们则认为X是稳定,具有完全信度。设为真值,11niiXnX表示观察值,则完全可信条件是指||()0,01XPrprp(1)当r接近0,p接近1时(通常选取r=0.05,p=0.9),则对X赋予完全可信。由(1)有(||)XrnPpn定义inf{(||)}pyXyPypn(2)当X是连续变量时,py满足||()pXPypn(3)因此,若经验值X是完全可信的,则有/prny,即0prnnyn(4)20/pnyr如果经验值X是完全可信的,则变量X的变差系数/不大于0/nn。注:X可以表示理赔额,也可以表示理赔次数、总理赔额等任何代表风险水平的变量。其他几个常用的完全可信条件(1)220()VarXnn(C1)202,nn此条件给出了经验估计值X完全可信所需要的最小样本量。(C2)20nn,此条件给出了为保证经验估计值X完全可信所需的最小总期望值。注:在一般情况下,,是不可知的,通常用估计值来代替。如何确定py和0n的值在很多情况下,我们可以使用正态分布来近似X的分布。由中心极限定理,当n充分大时,(0,1)XzNn由公式(3)有(||)()()()2()1pppppppPzyPyzyyyy解得1[(1)/2]pyp。例,10.90.9,(0.95)1.645py。若0.05r,则20/1082.41pnyr。个体保单理赔额的完全可信条件例:设X表示理赔额,服从均值为5的指数分布,假定0.050.9rp,求理赔额期望估计值X的完全可信条件(C1)和(C2)。解:设X服从均值为5的指数分布,()5,()25EXVarX。设n表示观察到的理赔额样本个数,则条件(C1)和(C2)2022251082.4110825nn2251082.41082.45412.655n因此当样本数n大于1082时,理赔额期望估计值X完全可信,当观察到的理赔额总期望值为5412.65时,理赔额期望估计值X完全可信。例*:假设有特定保单持有人过去的损失数据1,...,nXX。样本均值用来估计()jEX。求完全可信条件。再假设有10个观察值,其中6个为0,其余4个为253,398,439和756。求此时的完全可信条件。在此0.5r,p=0.9。解:根据投保人的索赔经验,我们可以计算出他的索赔额的期望和标准差无偏估计值分别为184.6和267.89。根据完全可信条件为202,nn得2267.891082.412279.51184.6n因此,至少需要有2279个样本数才能保证这个投保人的索赔经验是完全可信的。个体保单理赔次数的完全可信条件例:设N表示单位时间内理赔次数,设N服从泊松分布,12nNNN,,为过去n个时间内发生的理赔次数,00.9,0.05,10842.41prn,求使理赔次数期望估计值完全可信的总理赔次数的期望值。(theexpectednumberofclaimsisneededforfullcredibility)解:由条件(C2)知,12nNNN,,完全可信的条件为()1082.41082.4()VarNnEN至少有1083个理赔事件发生,才能使理赔次数期望估计值完全可信。例:已知:(i)赔款次数的概率函数为:()(1)0,1,2,...,xmxmpxqqxmx,(ii)实际赔付次数在期望赔付次数1%范围内的概率为0.95。(iii)期望赔付次数的完全可信条件为34,574。求q。.解:均值mq,方差2(1)mqq。由完全可信条件C2,20nn,220.9501.960.01ynr1.96(1)345740.01mqqmq即34574(1)0.938416q,0.1q。保单组合的总理赔额的完全可信条件设S表示单位时期内的某保单组合总理赔额,N表示单位时期内理赔发生数,iY表示第i次理赔额,假设每次理赔额iY独立同分布,且都与理赔次数N独立。则总理赔额为12NSYYY++由第三章,我们已经知道()()()ESEYEN2()((|))((|))()()()()VarSEVarSNVarESNEYVarNENVarY设1,,nSS表示总理赔额的经验数据,由条件(C1)和(C2’)可以得到总理赔额期望经验估计值的完全可信条件如下:(C1):20022()()()()()()(()())VarSEYVarNENVarYnnnESENEY此条件给出了为保证过去总理赔额期望经验估计值完全可信所需要最小的总理赔额样本数。(thestandardsintermsofthenumberofpolicies)(C2)200()()()()()()()()()VarSEYVarNENVarYnESnnESENEY此条件给出了为保证总理赔额期望经验估计值完全可信的总理赔额期望值。(thestandardsintermsoftheexpectedoftotaldollarsofclaims)(C3)设iN表示第i个时期发生的理赔数,1niiN表示过去n个时期内发生的总理赔数。由(C1)我们可以得到总理赔额期望经验估计值完全可信的另一个等价条件:2002()()()()()()()()()()VarSEYVarNENVarYnENnnESEYENEY此条件给出了总理赔次数期望值的最小值(thestandardsintermsoftheexpectedofclaims)。例**(例*续):假设某个特定保单持有人过去的损失1,...,nXX,假设jX相互独立,并且为复合泊松分布,即()()()12iiiiiNXYYY,其中iN为参数为的泊松分布,赔付金额分布Y的均值为Y,方差为2Y。求估计每份保单期望赔付次数的完全可信条件和估计每份保单期望赔付金额的完全可信条件。已知前3个非零的赔付来自同一次赔付,最后1次赔付数据来自2次赔付,1次129,1次627。问该完全可信条件是否满足例2的数据。解:设1,...,nNN表示该投保人的理赔次数,则为估计平均理赔次数的完全可信条件022()1082.41,(())VarNnnEN由于10年内总共有5次理赔,所以的估计值为0.5,因此完全可信条件为20.51082.412164.82,0.5n显然,投保人的10个观察数据量远远不满足完全可信条件。下面我们来看每张保单的平均总理赔额的估计。设第i张保单的总理赔额()()()12iiiiiNXYYY,()ijY表示第i期内第j次理赔额,iN为第i个时期的理赔次数,1,in。()()()12,,,iiijYYY1,,,1,iinjN独立同分布。设()YEY,2()YVarY,由于Xj服从复合泊松分布,因此,()jYEX,222()()jXYYVarX。由条件(C1)有:20022()()(1)()YYnVarXnnEX,完全可信条件是总理赔额的样本数大于202(1)YYn。完全可信条件也可以用n个时期的总期望理赔次数来表示,即202(1)YYnn其中n为过去n个时期内发生理赔事件的期望次数,也即1()niiENn。当不可知时,可用估计值1niiN代替n,这时完全可信条件也可以写为2021(1)nYiiYNn完全可信条件也可以用n个时期的总理赔之和来表示20()YYYYnnYn为过去n个时期内发生总理赔事件的期望值,1()()niiYiEXnEXn。当,Y不可知时,可用估计值1niiX代替n,这时完全可信条件也可以写为201()nYiYiYXn在本例中,由于ˆ(253398439129627)/5369.2Y,ˆY=189.3522021082.41189.35(1)(1)2734.020.5369.2YYnn显然,10个样本数远远不能满足估计每张保单总理赔额的所需完全可信条件。同学们可以验证另外两个完全可信条件是否满足?例(1104):已知:(i)赔付次数服从泊松分布。(ii)赔付金额服从参数0.5,6的帕累托分布。(iii)赔付次数和赔付金额相互独立。(iv)实际纯保费要求在期望纯保费的2%范围内的