极值理论在风险价值度量中的应用1、引言自20世纪70年代以来,金融市场的波动日益加剧,一些金融危机事件频繁发生,如1987年的“黑色周末”和亚洲金融危机,这使金融监管机构和广大的投资者对金融资产价值的暴跌变得尤为敏感。金融资产收益率的尖峰、厚尾现象也使传统的正态分布假定受到严重的质疑,因此如何有效地刻画金融资产收益率的尾部特征,给出其渐进分布形式,及各种风险度量模型的准确估计方法和置信区间,依此制定投资策略,确定国家监管制度,成为风险度量和管理所面临的巨大挑战。目前,对金融资产损失的估计方法主要包括历史模拟、参数方法和非参数方法。历史模拟是一种最简单的方法,它利用损失的经验分布来近似真实分布,但是该方法不能对过去观察不到的数据进行外推,更不能捕获金融资产收益序列的波动率聚类现象,而受到大量的批评。参数方法假设收益符合某种特定的分布如:正态分布、t分布等,再通过分布与样本的均值、方差的匹配对参数进行估计,或者是假设收益符合某种特定的过程如:ARMA模型、GARCH模型,该方法可以在一定程度上解释尖峰后尾现象和波动率聚类问题,具有比较好的整体拟和效果。不过参数方法只能对已经到来的灾难信息给出准确的估计,对于即将到来的灾难信息无法给出准确的预测,因此对极端事件的估计缺乏准确性。非参数方法则主要包括极值理论(EVT),该理论不研究序列的整体分布情况,只关心序列的极值分布情况,利用广义帕累托分布(generalizedParetodistribution)或者广义极值分布(generalizedextremevaluedistribution)来逼近损失的尾部分布情况。DanielssonanddeVries(1997)以7支美国股票构成的组合为样本比较各种模型的表现情况,发现EVT的表现比参数方法和历史模拟方法明显的好。Longin(2000)认为极值理论的优点在于它的没有假设特定的模型,而是让数据自己去选择,而GARCH模型作为估计风险的一种方法,它只能反映当时的波动率情况,对于没有预期到的变化缺乏准确性。不幸的是,LeeandSaltoglu(2003)把EVT模型应用到5个亚洲股票市场指数上,发现表现令人非常不满意,而传统的方法尽管没有一个在各个市场表现都是绝对优于其它模型的,但都比EVT模型的表现好。本人认为EVT模型之所以在亚洲市场表现不好主要是因为亚洲金融市场的数据具有很强的序列相关和条件异方差现象,不能满足EVT模型要求的独立同分布假定。另外,JondeauandRockinger(1999),RootzenandKluppelberg(1999),Neftci(2000),GilliandKellezi(2003)和ChristoffersenandGoncalves(2004)也分别采用极值原理和其他模型对金融数据的尾部特征进行了分析和比较。本章在传统单纯采用极值理论(假设被分析数据是独立同分布的)描述金融资产收益尾部特征的基础上,把ARMA-(Asymmetric)GARCH模型和极值理论有机的结合起来。首先利用ARMA-(Asymmetric)GARCH模型捕获金融数据中的序列自相关(Correlation)和异方差(Heteroskedasticity)现象,利用GMM估计参数,获得近似独立同分布的残差序列,再采用传统的极值理论对经过ARMA-(Asymmetric)GARCH模型筛选处理过的残差进行极值分析,在一定程度上克服了传统单纯采用极值理论时,由于金融数据序列自相关和波动率聚类现象不能满足极值理论假设所造成的估计误差。另外,本章还采用Bootstrap的方法给出了采用极值理论估计出的VaR和ES在某一置信水平下的置信区间改进了采用似然比率法估计置信区间时,由于极值事件的小样本所造成的误差。最后,我们利用中国上证指数自1990年12月19到2004年9月30日的对数日收益率进行实证研究给出上证指数的VaR和ES值,及置信区间。2、VaR和ES的概念:VaR(Value-at-Risk)是一种被广泛接受的风险度量工具,2001年的巴塞耳委员会指定VaR模型作为银行标准的风险度量工具。它可以定义为在一定的置信水平p下,某一资产或投资组合在未来特定时间内的最大损失,或者说是资产组合收益损失分布函数的分位数点。假设X代表某一金融资产的收益,其密度函数为()fx,则VaR可以表示为:inf{|()(1)}pVaRxfXxp(1)当密度函数()fx为连续函数是也可以写作:1()pVaRFp,其中1F称为分为数函数,它被定义为损失分布()Fx的反函数。该模型计算简单,在证券组合损失X符合正态分布,组合中的证券数量不发生变化时,可以比较有效的控制组合的风险。但是VaR模型只关心超过VaR值的频率,而不关心超过VaR值的损失分布情况,且在处理损失符合非正态分布(如后尾现象)及投资组合发生改变时表现不稳定,会出现()()()pppVaRXYVaRXVaRY(2)的现象,不满足Artzner(1999)提出了一致性风险度量模型的次可加性。()pES(Expectedshortfull)满足Artzner(1999)提出的次可加性、齐次性、单调性、平移不变性条件,是一致性风险度量模型。它的定义如下:在给定的置信水平p下,设X是描述证券组合损失的随机变量,()[]FxPXx是其概率分布函数,令1()inf{|()}FxFx,则()()ESX可以表示为:11()01()()ppESXFdp(3)在损失X的密度函数是连续时,()pES可以简单的表示为:{|()(1)}pESExFxp。本章将分别选用这两个模型来度量金融资产的风险,给出在修正过的极值模型下,其估计的方法和置信区间。3.ARMA-(Asymmetric)GARCH模型3.1ARMA-(Asymmetric)GARCH模型的性质ARMA(p,q)模型:11pqtitijtjtijyy(4)其中,t是期望为0,方差为常数2的独立同分布随机变量,ARMA(p,q)模型在可逆的情况下可以表示为()AR。该模型假设ty的条件期望是可得的,条件方差为常数,通常可以用来解释时间序列的相关性,并可以对时间序列进行的短期预测。但是该模型条件方差为常数的假设,使其无法有效的解释在金融时间序列中经常被观察到的波动率聚类现象,为此,我们需要在模型中进一步引入GARCH模型。我们令tttzh,其中tz是期望为0,方差为常数1,的独立同分布随机变量,2th是t在t时刻的条件方差。这里我们采用通常使用的最简单的(1,1)GARCH模型,则条件方差可以表示为:2220111ttthaabh,(1,1)GARCH模型也可以表示成平方误2t的形式:22222201111()()()ttttttaabbhh(5)其中221(()|)0tttEhF,因此(1,1)GARCH模型本质上是平方误2t的ARMA(1,1)。(1,1)GARCH模型的引入不仅可以捕获到金融时间序列的波动率聚类现象,而且可以在一定程度上改善tz尖峰后尾现象,因为44444422222222()()()()tttthzttttEEzEhEzkkEEzEhEz(6)其中4hk和4zk分别表示th和tz的峰度,th的峰度明显大于等于tz的峰度。另外,在金融序列中我们还可以明显的观察到,波动率正方向变动与收益率负方向变动的相关性大于与收益率正方向变动的相关性,一种可能的解释是收益率的负方向变动会加大波动幅度。而(1,1)GARCH模型认为收益的正方向变动和负方向变动对波动率变动幅度有着相同的影响,为了捕获金融序列波动率变动的这一不对称性,我们引入需要Glostenetal(1993)提出的非对称(1,1)GARCH模型:22220112111sgn()ttttthaaabh(7)其中00sgn()sgn()10ttxzx,在这个模型中我们通过21sgn()ta项来捕获收益率的正负变动对波动率变动的不同影响,如果收益率的波动与收益率波动率的变动像我们上面所预期的那样,则20a。这样我们就得到了ARMA-(Asymmetric)GARCH模型112222220121111(sgn())()()pqtitijtjtijttttttttttyyzhaaabbhh(8)3.2、ARMA-(Asymmetric)GARCH模型的参数估计:我们知道在条件正态分布的假设下,可以很容易的利用ARMA-(Asymmetric)GARCH模型的似然函数,给出参数向量012(,,,,,,)aaab的估计值,其中1(,,)p,1(,,)q。即使在金融收益率序列残差不满足条件正态分布的情况下,使用正态极大似然估计法,仍然可以得到参数的一致渐进正态非最小方差估计。但是这样我们得到的残差tz将有很大的误差,而tz是我们下一步进行EVT尾部估计的输入变量,它的有效性将会直接影响我们整个的估计结果,为此我们必须寻找一个更有效的估计方法。GMM(GeneralizedMethodofMoments)广义矩估计恰好可以满足我们的要求,它不需要假设tz符合任何分布,只需要tz的条件矩。在Skoglund(2001)“AsimpleefficientGMMestimatorofGARCHmodels”给出了该估计方法的计算过程和收敛情况。下面给去估计的步骤:首先,定义一个行向量22[,()]ttttrh和广义向量tttgIr,其中tI是工具变量,则参数的GMM估计可以通过下式得到:11111min[][]TTtTtttTgWTg(9)其中11TTttWTW是一个恰当的权重矩阵。在NeweyandMcFadden(1994)中,我们可以知道,有效的GMM估计可以通过另1()tttrI,1()()ttttrrW,其中11var(|)tttrF,()tr是Jacobian行列式。把tI和W带入上面的目标函数(9)得到:1111[]()[]TTTTttttttQTgg(10)其中,tttgg是一个含有参数的权重矩阵,它的元素可以表示为:2223222222321()[()(()1)]1()[()(()1)]()tttittittttttijtttittjhghvhhhhhvhhh其中,243[(1)]vv,2211ttthhcb,(0,0,0,0,)ttX,2221111112111(1,,sgn(),,2[sgn()])ttttttttchaaX11(1,,,,)tttpttqXyy,1(|)kkttvEzF通过上面对目标函数(9)的变化,我们得到函数TQ是恰好可识别的,即参数的最优估计是使函数TQ等于0。另外,我们要进行GMM估计还需要一个对参数的初始估计值和对tz的三阶矩和四阶矩的初始估计值,而这一初始值我们可以通过对ARMA-(Asymmetric)GARCH模型残差符合正态分布的情况进行最大似然估计得到。这样我们就可以得到有效的参数估计值和残差序列tz。4、极值理论极值理论是测量极端市场条件下风险损失的一种方法,它具有超越样本数据的估计能力,并可以准确地描述分布尾部的分位数。它主要包括两类模型:BMM模型(BlockMaximaMethod)和POT模型(PeaksoverThreshold),两类模型的主要区别有:1、极值数据的获取方法上的区别,BMM模型通过对数据进行