第3章聚合风险模型本章我们要引入聚合风险模型.同第2章那样,我们要计算在某个时间段内理赔总额的分布函数,但是现在要把风险组合理解为在随机时间点上产生的理赔全体.记3.1引言其中N表示理赔次数,表示第i个理赔额.此外,按习惯约定当N=0时S=0.iX这样的模型称为聚合风险模型!•在聚合模型中我们要求理赔次数和理赔额之间相互独立,即(N与X1,X2,…Xn)这对于汽车保险行业来说就多少有些不妥了,例如恶劣的天气条件会导致大量的小理赔.不过,在实际中这些现象的影响是很小的。•聚合风险模型中,个体风险可以出现多次,各个风险是独立同分布的,即(X1,X2,…Xn)独立同分布。(1)由(3.1)给出的S具有一个复合分布。(3)利用给定N之下S的条件分布,可以计算S的期望值.(2)记:(4)总理赔额的方差可以由条件方差的公式得到。(5)同样技巧可以求出总理赔额S的矩母函数。例3.2.l(分布函数具有封闭形式的复合分布)设N服从参数为p的几何分布,0p1,X服从参数为1的指数分布,那么S的分布函数是什么?记.我们首先来计算S的矩母函数,然后尝试通过得到的矩母函数来确定该复合分布.当(即)时,有1qp1tqelogtq由知1XExp11Xmtt由分布函数与矩母函数之间的一一对应关系得到S的分布函数也具有同样的形式:这是一个混合分布。这是一个在0点有跳度p而在其它处为指数型的分布函数.直接代入计算利用给定N=n之下S的条件分布,可计算分布F:因此当选取的X为某些特殊的随机变量时,n重卷积比较容易计算,如正态分布和伽玛分布。(1)n个服从2,N分布的独立随机变量和的分布为2,Nnn;(2)n个服从,分布的独立随机变量和的分布为,n.设理赔额服从指数1Exp分布,即1,1分布.)1,(n卷积的分布为:•理赔发生应该是一个“稀有事件”。•泊松分布,负二项分布是较好的选择。理赔次数的分布)1exp(][,][][,!)(ttXkeeEXVarXEekkNP,)1(][,)1(][,)1(1)(2pprXVarpprXEppkkrkNPkrreppeEttX)1(1][泊松分布P(λ)负二项分布N(r,p)例3.3.l(泊松分布,参数的不确定性)设某个汽车驾驶员在一年中发生的车祸次数服从一个Poisson分布.参数未知,且因人而异.我们设是一个随机变量.如果给定,一年中车祸的次数N的条件分布是Poisson,那么N的分布是什么?设Λ的分布函数为,则N的分布为PrUN的期望和方差分别为现在再假设,,其中/1p,从而N服从参数为和/1的负二项分布(记为,/1NB).例3.3.2(负二项分布也是复合泊松分布)在某个交叉路口一年之中发生N次重大交通事故.第i次事故中伤亡人数是iL,所以总伤亡人数为1SL2NLL.设NPoisson,iL服从参数为c的对数分布,即其中log1hcc。现问S的分布是什么?注意到的矩母函数是iL于是S的矩母函数为这是一个参数为和的负二项分布的矩母函数.//log1hcc1c复合泊松分布定理3.4.l(复合泊松的和仍是复合泊松)如果12,,,mSSS是一列独立的复合泊松随机变量,分别具有参数i和理赔分布,1,2,,iPim,那么S=12mSSS仍是一个复合泊松随机变量,具有参数证明记为的矩母函数,则S的矩母函数为imiP故S是一个复合泊松随机变量.(1)m个独立复合泊松保单组合的总和仍然服从复合泊松分布.(2)对同一个复合泊松保单观测m年且假设逐年的结果相互独立,则m年结果的总和也仍然服从复合泊松分布.当每一个iS有非随机的理赔额ix时,我们有iiiSxN,其中iiNPoisson.现设所有ix全不相同,则随机变量是一个复合泊松变量,参数为定理3.4.2(逆命题)设S的形式如下:服从复合泊松分布,其中参数为,理赔分布是一个离散型分布,满足(1)mNNN,,21相互独立;(2)iN服从iPoisson分布。则:证明记11,mmNNNnnn.对N=n取条件得1,,mNN的条件分布为多项分布1,,,mMn.于是,把上式对所有的inik相加,可求出kN的边际分布为kPoisson.iN之间的独立性是由于11Pr,,mmNnNn等于iiNn的边际概率的乘积.例3.4.3(应用:稀疏向量算法)如果理赔额X是非负整值随机变量,可以用一种有效的方式来计算复合泊松分布F.设,4111Pr1,2,3,,.424X123123SNNN采用卷积来计算S的分布。1414,2214,1414321Panjer递推定理3.5.1(Panjer递推)考虑这样一个复合分布,其中理赔额取非负整值,具有概率分布函数而且事件“有n个理赔发生”的概率满足递归式,0,1,2,,pxx这里a和b是两个实数.于是事件“理赔总额等于s”的概率满足如下关系式:1.分布,,Poisson0,0ab2.负二项分布,,,NBrp1,1bpara3.二项分布,。,Bkp,1abapkaa证明初始值由给出.记0f0Pr0Pr0nnSNnpkT1.kXX由对称性得另一种方法Poisson分布,此时0,0ab,被简化为例3.5.3(Panjer递推)续例3.4.3,考虑复合泊松分布,其中4且111Pr1,2,3,,424X.于是把14,22p和1134pp代入Panjer递推公式得到初始值.我们有400.0183fe例3.5.4(Panjer递推与停止损失保费)对于一个整值随机变量S,其值整取自留额的停止损失保费可以表示为(见1.4节):既然停止损失保费的右导数满足而按照自留额所在的区间分布函数取常数值,故停止损失保费是逐段线性的.当d取非整数值时停止损失保费的计算可以通过插值法来完成.利用Panjer递归法,停止损失保费也可以通过递归求得.事实上,由(3.34)的后一式,对整数d,作为一个例子,我们取复合Poisson(1)分布,其中于是Panjer递推公式(3.31)可以被简化为1122pp初始值为计算结果:注3.5.5(Panjer递推式的基于概率母函数的证明)Panjer递推还可以通过概率母函数来证明.对于复合泊松分布,我们可以证明如下.首先,因为SXgtgstgt现在,代入gs和Xg的级数展开式,得比较的系数,我们有1st如何用Panjer递推公式计算卷积???复合分布的近似定理3.6.1(复合泊松分布与中心极限定理)设S服从复合泊松分布,其参数为,理赔分布P具有有限方差.记ES和2VarS,则证明如果12,,NN是一列独立1Poisson随机变量,,1,2,,ijXi1,2,j是一列相互独立且具有共同分布P的随机变量,那么对整数值,有上中的S是个独立同分布的随机变量的和,我们可以直接应用中心极限定理.注意到在上面取为整数值的做法是不失一般性的,这是因为当很大时对应的分数部分的影响是可以忽略不计的.记为理赔额分布的k阶矩,对于复合泊松分布,我们有k我们知上式的系数即为所需要的半不变量!ktk为使用近似方法,我们需要S的半不变量.偏度个体和聚合风险模型•考虑n个一年期寿险保单.•第i个被保人在年内死亡的概率为qi.•如果第i个被保人在年内死亡则保险公司应支付理赔bi.建立一个聚合模型来近似所有保单产生的总损失和总收益.(1)保单i导致赔付ib的次数为iiIBernoulliq分布,我们现在用一个iPoisson随机变量来替代赔付ib的次数iI.在个体模型中,考虑理赔总额(2)考虑下面的近似随机变量:(3)如果取iiq,则在两个模型中保单i的期望赔付次数相同.为了安全起见我们也可以取log1iiiqq.•在聚合模型和个体模型下保单i发生0理赔的概率相等.•比原先模型下有更大的理赔总额,因此,隐含了差额。(4)尽管上式仍然具有个体模型的形式,由定理3.4.1可知S服从复合泊松分布,S对应于聚合模型,其参数为如果,则期望赔付次数保持相等:iiqS和S的期望也是相等的:S和S的方差:S略大一些3.8几个理赔额分布的参数族1.伽玛分布(,):适用于理赔分布的尾概率不是太“重”情形,例如在机动车险中保对自己车辆损伤情况;2.对数正态分布2(,)LN:适用于理赔分布的尾概率略微重一些的情形,例如火险中的理赔额;3.Pareto0(,)x分布:在发生大理赔的可能性很大时用这个分布,特别是在责任险中.分布函数为0,X当x0时其极限为0;而当x时其极限为1。逆高斯分布(,)IG导数在0,上取正值,具有如下形式:矩母函数该矩母函数在2t处有穷,而在2t处无穷.“逆高斯”这个名字源于其累积量函数是正态分布累积量母函数的反函数.当时,逆高斯分布也被称为Wald分布.利用矩母函数容易证明是一个刻度参数,事实上,如果X服从(,)IG分布,那么尽X服从(,1)IG分布.把两个独立的服从参数分别为1,尽和2,的逆高斯分布的随机变量相加,便得到一个服从参数为12,的逆高斯分布的随机变量.(,)IG分布的期望和方差分别为和2,与伽玛分布类似;斜度为3略大于具有同样期望和方差的伽玛分布的偏度.指数分布的混合/组合(Coxian分布)混合指数分布的密度函数对每一个q,01q,函数.p是一个概率密度函数.不过当qO或者q1时,(3.60)中的.p有时仍然是一个概率密度函数对所有的x,不等式0px,(只需要00p).如果,那么00p等价于1q,我们称为指数分布的一个组合.指数分布组合例:(1)且2,1q2如果且,则,XExpYExp(2)2,1,3/4q两阶段模型:它可以产生所有的具有混合指数分布的概率密度函数的随机变量.设X,Y和I相互独立,X和Y分布服从数为1的指数分布,I是Bernoulli分布,其中01,又设0.记:具有如下的矩母函数比较(3.65)和(3.66)得到