序贯重要采样和重采样在动态投资组合信用风险中的应用摘要:我们提出一种序贯蒙特卡洛方法,用于估计在动态、基于强度点过程模型中的投资组合信用风险的极少事件概率。这种方法是基于测度的改变,并涉及一种重采样机制。我们确定重采样权重,使得在技术条件下,能够得到对巨额组合损失的概率的对数有效模拟估计。通过一种数值分析说明了这种序贯蒙特卡洛方法的特征,并与其他最新用于研究组合信用风险的极少事件方法进行了比较,这些极少事件方法包括交互粒子方法和重要采样方法。1、Introduction组合信用风险是一种由于像贷款和公司债券这样信用敏感资产组合的违约而导致的财务损失的分布。蒙特卡洛模拟方法就被广泛用于估计组合损失的分布。该方法几乎应用于任何与违约期限相关的模型中并且相对容易实现;但另一方面,精确估计组合巨额损失概率的计算工作量可能是巨大的。这个概率在风险管理应用中处于中心地位;比如,在风险价值中风险度量的估计。本文描述和分析了一种序贯蒙特卡洛方法,对组合巨额风险和其他极少事件的概率做出有效和无偏估计。该方法应用于违约期限相关的动态点过程模型中,在这些广泛应用的模型中,组合中的一种资产的违约受随机强度过程控制。强度过程与组合中的各种资产相关联,以反映组合的违约依附结构。类似于传统重要采样方法,序贯蒙特卡洛方法涉及概率测度的转变。违约事件是按照不同于标准测度的概率测度序贯采样的。另外,连续产生的样本路径需要使用一组状态依赖权重重新采样。重采样机制区分了序贯重要采样和重采样方法和现存的序贯重要采样方法。我们按渐进最优方式选择重采样权重,提供条件保证按SISR方法产生的组合巨额损失的概率的估计为对数有效的。SISR方法涉及到由Moral和Garnier(2005)研究的交互粒子系统方法,该方法被Carmona和Crepey(2010)、Carmona(2009)等人用于估计组合巨额损失的概率。IPS方法在标准测度下按序贯进行并包含了一个重采样机制。所谓重采样机制就是在路径空间上测度转变。重采样机制的有效性及由IPS方法产生的估计量的性能的高低,很大程度上取决于指定的重采样权重的参数的明智选择上,这个参数的渐进最优选择方法在文献中尚未解决。因此,点对点方法被用于决定这个参数。我们所采用的SISR方法排除了选择一个参数的需要,而是产生一个可证明有效的极少事件估计量。而且,SISR方法允许人们使用一种不同于标准测度的采样测度,这种方法能使采样更方便并可能导致额外的方差减少。数值经验证明了应用于组合信用风险的自激模型的SISR算法的性能良好,组合中资产的违约强度追随相关跳跃扩散过程。在给定计算预算条件下,SISR算法比IPS方法能更精确的估计巨额损失的概率。而且,SISR方法对非常小的概率产生有意义的估计。如果资产组合是相对多样化的,SISR方法也能超越对数效率IS方案。尽管SISR方法很早就用于发生在非线性滤波中的复杂多维的分布的样本中,但是该方法在极少事件仿真中的应用也只在ChanandLai(2011)的文章中出现过。他们给出了一个针对一般SISR估计量和渐进方差的一致估计的CLT(计算机语言翻译程序)。针对经典的大偏差设定,ChanandLai(2011)展示如何选择重采样权重,以便获得伴随有限短随机游走过程中的某种极少事件概率的对数有效估计量。在本文中,我们在多变量、基于强度点过程的设定下提出重采样权重用于构建相关事件到来的模型。建立在ChanandLai(2011)的文章中有关重采样权重讨论的基础上,我们发展了条件保证这些权重能产生巨额损失概率的对数有效估计量。文章其他部分的安排如下:第二部分阐述投资组合信用风险问题。第三部分描述了一个基本的SISR算法,第四部分分析了重采样权重的渐进最优选择。第五部分描述了伴随偶尔重采样的一个延伸的SISR算法。第六部分提供了数值结果。第七部分总结。2.动态投资组合信用风险考虑一个拥有n家公司股票的投资组合,这些公司易遭受违约风险。这些公司的随机违约时间以几乎完全不同的到期时间0i被引入到模型中,这些时间变量被定义在右连续和完全信息过滤的完全测度空间上(,f,P)。在风险管理应用中,P是统计概率,而在衍生品定价应用中,P是风险中性定价测度。与i相关的的是过程指标iN,其中iN=I(ti),在这里)(AI是一个事件fA的指示函数(数学中,指示函数是定义在某集合X上的函数,表示其中有哪些元素属于某一子集A)。对每一个i,都会有一个严格正的、可积的、逐步衡量的过程i使得随机变量dsNNistisit)1(0(1)形成一个鞅。过程)1(iiN代表条件违约率或者公司I的强度。i被认为是给定的相关的随机过程。i之间的相关性反映了投资组合个资产之间的违约依赖结构。大量的关于),(21n的详述在文献中都能看到,比如,见谁谁。与投资组合相联系的的信用风险被描述成组合损失NlL*,这里),(21nNNNN为违约指标向量,),(21nllll是损失头寸向量。我们首要目标是损失分布的尾部分布,这就代表了非典型巨额违约损失的概率。这些极少时间概率在投资组合风险管理和其他应用中处在中心的位置。比如,这些概率被用来估计风险组合测度,像高置信水平下的VaR。在固定水平T0上计算TN和TL的分布问题可被认为是马尔科夫链问题(该过程中,在给定当前知识或信息的情况下,过去(即当期以前的历史状态)对于预测将来(即当期以后的未来状态)是无关的。P(X{n+1}=J|X0=I0,X1=I1,……Xn=In)=P(X{n+1}=J|Xn=In)。Gieseckeetal(2010)中的命题3陈述:存在一个连续时间马尔科夫链nnSMMM1,0),(1使得对固定的t和所有的SB都有)()(BMPBNPtt成立。模拟链M自身各要素之间没有联合过渡,同时iM在0处开始并且转换密度为),(Mi,这里(),(EBti)1(itiN︱)BNt,SB(2)期望方程2可以被的很多标准模型计算出来,参见Gieseckeetal(2010)。马尔科夫链M的存在将计算TN分布问题归纳到计算TM上来。同样的,在每一个从固定分布中得出的独立于N的il变量已知的假设条件下,M的存在将计算TL分布的的问题归纳到计算TJ的分布上,这里TJ=Ml。这种归纳转换时非常重要的,它允许我们分析一个马尔科夫链模型M,而不是分析一个潜在复杂的点过程模型N(通过把点过程转换到马尔科夫过程,大大降低运算的难度)。跳跃过程J本身不是一个马尔科夫链,因为跳跃时间有一个),(1tniiMt形式的强度。然而,TJ的分布可以由TM的分布获得,TM的分布能通过解前向柯尔莫哥洛夫方程获得。然而这种方式是不切实际的,这是因为M的状态空间nS1,0的维度在实际应用中将趋向于非常大。在定价问题中,投资组合n在100到125之间,在风险管理设置中,n可能是更大的。我们提出使用一种蒙特卡洛模拟M的方法估计TJ的分布,M的转换可以使用稀释方法来抽样,这能导致分布的无偏模拟估计量。然而,为了获得精确的尾部分布的统计,(这是我们关注得中心),我们需要做大量的复制工作(即多次重复抽样)。我们发展了一种序贯模拟方法,该方法能极大的减少因获得精确的尾部分布的概率而需要的大量模拟试验。我们集中考虑)1,1,1(l的情况,后面我们会怎么对待一般的情况。3.序贯重要采样和重采样这一部分描述了用来有效估计分布尾部概率的SISR方法。3.1回顾让),(kkkUTY,这里kT是跳跃过程J的第k个到达的时间,kU=kTM。并且,让))0,0,0(,0(0Y,nK。KkkYY0)(是在RS上的离散时间马尔科夫链。我们用),(yxpk来表示Y的P转换概率。假设对一些合适的设置,感兴趣的极少事件采用K的形式,这里及接下来的叙述中,我们让),(0kKYYKk0。我们估计)(KP的算法结合了序贯重要采样和重采样。估计量采用)(~~KIdQPdPddP(3)的乘积形式,在这里Q是一个重要测量,P~是一个采样测量,两者都定义在流域):(KkYk。假设在P~条件下,Y是一个伴有跃迁密度),(~yxpk的马尔科夫链。那么(3)第一个似然比为KkkkkkkkYYpYYpPddP111),(~),(~(4)Y按照),(~yxpk顺序取样而改变。已经产生的样本路径使用状态依赖权重被重新采样;重采样机制努力使(3)中的似然比dQPd~有效。尽管不能排除PP~的情况,但是在一个不同于P的条件下采样可能是方便的,同时可能导致额外方差减少。我们会在§6用数字情况的背景来说明。3.2基本算法我们用一般重采样权重函数0kw来描述基本SISR算法,不一定试图模仿方程(3)中的dQPd~。在算法1中总结了操作步骤。对于mr,,1,让0)(0YYr,这里m是一个整数。对每一个阶段Kk,.1,我们从概率密度),(~)(1rkkYp中抽取m个独立变量)(~rkY,形成m个样本路径或粒子)~,(~)()(1)(rlrkrkY。从这些过程中,我们给出m粒子),()()(0)(rkrrkYYY并使用定义在标准化的权重的概率,该权重为)~()~()(1)(jkmjkrkkYwYw(5)对mr,,1我们在K阶段停止重采样,)(KP的基本的SISR估计量ˆ如下),~()()~(ˆ)()(11)(11rKrKKrmrKIVZmK(6)在这里,00V并且kiiiiiiikkkYYpYYpPddPZ1)1)1~,(~~,()~(~)~((7)kiiiikkwwV1)()(iw=)~()(11rimriwm(8)算法1m是一个整数。开始)(0)1(0,,mYY到0YforKk,,1doForallmr,,1doGenerate)(~rkYfrom),(~)(1rkkYp.set),(~)()(1)(rkrkrkY.compute)~()()(rkkrkwwendforifKkthenResampleusingweight)~()~()(1)(jkmjkrkkYwYwtodraw)(rkmr,,1endforreturnestimator)~()()~(ˆ)()(11)(11rKrKKrmrKIVZmK在估计量(6)中,KZ)~()(rK这一项是标准测度P和一个粒子)(~rK的采样测度P~之间的似然比。它解释了我们按测度P~而不是P来抽样的事实。)()(11rKKV这一项解释了在阶段1,,1Kk的重采样。重采样权重iw被选择的目的是使)(kkV接近于目标重要测度kQ的似然比kP~。在这种情况下,)(kkV的分母接近于目标重要测度kQ对kP~的似然比,而)(kkV的分子接近于这些权重所构建的样本均值这一标准化常数。具体来说,定义权重)(kkw,由(9)式递归)(1ikiiw∝)(~kkkPddQ(9)当kY在Q和P~下是一个马尔科夫链,(9)的右端归纳为)(~)(11kkkkkkYYpYYq,其中),(yxqk是在Q下的Y的转换密度,),(~yxpk是在P~的转换密度。重采样机制消除了直接从kQ采样的需要。使用)(kkV接近这个似然比kkdQPd~,我们有kkkkkkrkkrkkdQdPdQPdPddPVZ~~)()()()((10)11)(11)(~~)()~(KKKKrKKrKKdQPdPddPVZ(11)于是,SISR被用来接近重要测度Q,这种测度是经由kP~的序贯IS方法得出,这对应于(10)中的kkPddP~,而重采样对应于kkdQPd~。注意在阶段Kk处没有重采样。3.3中心极限定理及方差估计量因为在每一个阶段进行重采样,SISR粒子不在是独立的,意识到这一点很重要。因