朱慧明,赵锐,郝立亚湖南大学统计学院,长沙(410079)摘要:随机波动性是经济金融时间序列中的一个普遍现象,它在金融风险管理研究中具有重要地位。通过分析随机波动模型的统计结构,推断了SV模型似然函数的具体形式,据此构造了模型参数的共轭先验分布;利用贝叶斯定理获得了相应的模型参数后验条件分布;同时,为了获得模型参数的贝叶斯估计及其置信区间,设计了基于Gibbs抽样的MCMC数值计算程序,并利用上海综合指数和深圳成份指数数据进行了建模实证分析。研究结果表明:贝叶斯方法是研究金融时间序列波动性问题的有效工具。关键词:随机波动模型,贝叶斯分析,Gibbs抽样,MCMC模拟中图分类号:F830.91,O212.8文献标识码:A波动性是金融市场的重要特征之一,它通过金融收益率的方差来测度。早期的金融理论认为金融收益率的方差恒定不变,但是这一假设越来越呈现不合理的方面。大量的实际数据表明:用来测度金融波动性的方差和协方差是随时间变化的,而且在方差变化过程中,幅度较大的变化后面往往跟随着幅度较大的变化,幅度较小的变化后面也往往跟着幅度较小的变化,这就是通常所说的波动聚集性(volatilityclustering)。目前,研究波动聚集性现象的模型主要有两类:一类是由诺贝尔经济学奖获得者、美国著名的统计学家Engle于1982年在研究英国通货膨胀指数问题时提出的自回归条件异方差(Autoregressionconditionalheteroscedasticityvariance)模型,简称ARCH模型;此后Bollerslev等学者将这一模型推衍成GARCH模型、LGARCH模型和GARCH—M模型[1-2]等。另一类模型是Taylor于1986年在解释金融收益序列波动的自回归行为时提出的随机波动模型(stochasticvolatilitymodel)[3],简称SV模型;当然,SV模型的产生既有其数理金融的背景,也有其金融计量的根源。与ARCH模型比较,SV模型提供了更加灵活与实际的金融时间序列建模方法,并在实践中获得广泛应用[4-6]。目前,SV模型的建模方法可以概括为两类,其一是矩估计法,如广义矩估计法、模拟矩估计法(simulation-basedmethodsofmoment)[7-8]等;其二是似然函数估计法,如Nelson和Ruiz的伪极大似然计估计法(quasimaximumlikelihoodmethod)[9],模拟极大似然估计法等。然而这些建模方法都是建立在频率统计理论基础之上,其基本前提条件是模型参数固定不变,这一观点与实际经济问题不相符的,因为经济环境是随着时间的推延而在不断变化的,经济现象不具有独立重复性,模型参数也会随着经济环境的变化而波动;因此,利用贝叶斯推断方法构建SV模型更科学,因为在贝叶斯理论体系中,模型参数也是随机变量;根据芝加哥大学统计学家Zellner[10]的观点,与频率统计方法比较,贝叶斯方法更适合经济现象的建模问题研究。本文拟在对SV模型的统计结构剖析的基础上,研究模型参数的贝叶斯分析方法,并进行实证研究。1.SV模型的统计结构Taylor在解释金融收益序列波动的自回归行为时提出了SV模型,其基本形式如下:tttuy)2/exp(θ=,nt,,2,1L=(1)其中},,,{21nyyyL为收益序列,nuuu,,,21L相互独立同标准正态分布)1,0(N,并且序列1本课题得到教育部新世纪优秀人才支持计划项目(NECT050704)、教育部人文社会科学研究规划项目(06JA910001)、湖南省自然科学基金项目(05JJ30130)和湖南大学985工程项目的资助。}{tu与}{tθ相互独立。此处tθ由如下线性时间序列自回归模型给出:tttηθφυθ++=−1,nt,,2,1L=(2)此处nηηη,,,21L相互独立同正态分布),0(2σN,),(~20σµθN,02σ;为方便起见,记2/1στ=,于是对于给定的φυ,和1−tθ,tθ服从均值为1−+tφθυ,方差为1−τ的正态分布,即),(~,,|111−−−+τφθυθφυθtttN,nt,,2,1L=(3)tθ确定了t时刻波动的大小,φ为持续性参数,反映了当前波动对未来波动的影响;并且,如果序列}{tθ平稳,则}{ty也是一个平稳序列。显然,模型(1)—(3)中有)4(+n个未知参数,即nθθθ,,,10L,φυ,和τ。为了减少表达式中符号的数量,引入如下两个向量:)',,,(21:1nnyyyyL=,)',,,(10:0nnθθθθL=不难看出,对于给定的参数tθ,ty服从均值为0,方差为)exp(tθ的正态分布,即))exp(,0(~|tttNyθθ,nt,,2,1L=(4)若将ty关于tθ的概率分布密度函数记为)|(ttypθ,则模型(1)的似然函数为)21exp()2(1)|(),,,(212/2/11:0tteyeypLtntntttnθθπθθτφµ−==−==∏∏)}(21exp{)2(1122/tnttnteyθπθ+−=∑=−(5)至此,我们已经解决了SV模型似然函数推断问题;下面研究模型的贝叶斯分析问题。2.SV模型的贝叶斯分析参数先验分布的设置是贝叶斯统计分析的前提条件,在SV模型中,参数τφυ,,和n:0θ的联合先验分布可以分解为三部分的乘积,即∏=−=ntttn110:0),,,|(),,|(),,(),,,(τφυθθπτφυθπτφυπθτφυπ(6)显然,由(3)式易见模型参数tθ关于),,,(1τφυθ−t的条件分布),,,|(1τφυθθπ−tt为正态分布),(1τφθυ−+tN;同时,根据美国学者Kim和Shephard的观点[11],参数τφυ,,和0θ相互独立,并且其各参数的先验分布如下:)(),(~)1,1(2φφ+−IbaN(7)),(~2dcNυ(8)),(~βατΓ(9)),0(~10−τθN(10)此处),(βαΓ表示形状参数为α,尺度参数为β的伽玛分布;)()1,1(φ+−I是一个示性函数,当)1,1(+−∈φ时,其取值为1,而当)1,1(+−∉φ时,取值为0。根据贝叶斯定理,参数的联合后验分布密度函数与模型似然函数的乘积成正比,即),,,(),,,()|,,,(:0:0:1:0nnnnLyθτφυπθτφυθτφµπ×∝(11)显然,参数的联合后验分布的形式比较复杂,在实践中难以应用;因此,下面重点研究各参数的后验条件分布。(1)参数υ的后验条件分布。根据条件概率的定义,参数υ关于),,(:0nθτφ的后验条件分布密度函数为(12))~,~(})]([2)1([21exp{})(21exp{)2(1})(2exp{)|,,()|,,,();,,|(2111222222/1121:1:0:1:0:1:0dcNdcndcbdyyynttttntttnnnnnn∝−+−+−∝−−−−−∝=∑∑=−−=−θφθθτυτφυπθφυθτθτφπθτφυπθτφυπ此处∑=−−−+=nttttdcdc11122)]([~~θφθθτ,122)1(~−+=τndd;由于cyEnn~);,,|(:1:0=θτφυ,因此参数υ关于),,(:0nθτφ的贝叶斯条件估计为c~。(2)参数φ的后验条件分布。类似地,参数φ关于),,(:0nθτυ的后验条件分布密度函数为(13))()~,~()(})](1[2)1([21exp{)())(21exp{)2(1})(2exp{)|,,()|,,,();,,|()1,1(2)1,1(11212122)1,1(222/1121:1:0:1:0:1:0φφυθθτφθτφφφπθφυθτθτυπθτφυπθτυφπ+−+−=−=−+−=−∝−+−+−∝−−−−−∝=∑∑∑IbaNIbbIabyyyntttnttntttnnnnnn此处∑=−−+=ntttbba1122)](1[~~υθθτ,112122)1(~−=−∑+=nttbbθτ。由于ayEnn~);,,|(:1:0=θτυφ,所以参数φ关于),,(:0nθτυ的贝叶斯条件估计为a~。(3)参数τ的后验条件分布。类似地,参数τ关于),,(:0nθφυ的后验条件分布密度函数为(14))~,~(}])([2[2exp{)()exp()(}])([2exp{)()|,,()|,,,();,,|(1202112111202121:1:0:1:0:1:0βαθθφυθβττβταβτθφθυθττθφυπθτφυπθφυτπαααΓ∝+−−+−∝−Γ+−−−∝=∑∑=−++++=−+ntttnntttnnnnnnnyyy此处)1(21~++=nαα,])([21~12021∑=−+−−+=ntttθθφυθββ;由于βαθφυτ~/)1~();,,|(:1:0−=nnyE,因此τ关于),,(:0nθφυ的贝叶斯条件估计为βα~/)1~(−。(4)参数tθ的后验条件分布。记)',,,,,,(1110~ntttθθθθθθLL+−=,nt,,2,1,0L=,它是一个n维向量,则参数tθ关于),,,,(:1~τφυθnty的条件后验边缘分布密度函数为(15))~,~()]}log(5.0)()1(()5.01([5.0exp{}2)(2)(4)log(exp{);,,,|(1211112212112122:1~−−+−−−+−−∝+++−+++−∝−−−−−−−−∝τµτθθφφυτφθτθφυθτθφυθθτφυθπttttttttttttnttNyhyhy此处1112)]()1()log(5.0[~−+−++−+=τθθφφυµtttty,nt,,2,1,0L=,τφτ)1(5.0~2++=;由于tnttyEµθτφυθ~);,,,|(:1~=,所以参数tθ关于),,,(~tθτφυ的贝叶斯条件估计为tµ~。3.SV模型的MCMC数值计算为了获得SV模型参数的贝叶斯估计及其置信区间,我们利用基于Gibbs抽样的MCMC数值计算方法;为此先给定参数n:0θ,φυ,和τ的初始值,将其记为)0()0()0(:0,,φυθn和)0(τ;假设第)1(−k次开始时参数的估计值为)0(:0nθ,)1()1(,−−kkφυ和)1(−kτ,则第k次抽样的迭代步骤如下:(1)由后验条件分布);,,,|(:1)1()1()1()1(~nkkkktty−−−−τφυθθπ抽取)(ktθ;(2)由后验条件分布);,,|(:1)(:0)1()1(nknkkyθτφυπ−−抽取)(kυ;(3)由后验条件分布);,,|(:1)(:0)1()(nknkktyθτυφπ−抽取)(kφ;(4)由后验条件分布);,,|(:1)(:0)()(nknkkyθφυτπ抽取)(kτ。从(1)到(4)是Gibbs抽样的一次完整记录,它完成了由)1(:0−knθ,)1()1()1(,,−−−kkkτφυ到)(:0knθ,)()()(,,kkkτφυ的转移;重复上述步骤(1)—(4)的Gibbs抽样过程,直至参数的后验条件分布为平稳分布为止;然后,根据Brooks和Roberts的方法[12]计算参数的贝叶斯估计值。4.实证分析作为上述方法的应用,我们利用上海和深圳两地股市的指数收益数据进行实证研究。由于上海和深圳股市最初采用人为定价,不是特别规范,所以我们舍弃前几年的数据,从万德数据系统选取2001年1月—2006年12月上海综合指数和深圳成份指数的收盘价,先根据公式1lnln−−=tttPPR计算出日收益序列,此处tP为上证综合指数或深证成指数第t个交易日的日收益;然后由公式RttSRRR/)(~−=其数据进行标准化处理,此处R为样本平均值,RS为样本标准差。为了获得模型参数的贝叶斯估计,我们通过运用MCM