-1-R/S类方法估计Hurst指数的有效性检验①黄诒蓉②中山大学管理学院,广州510275,中国【摘要】本文在设定不同H真实值的情况下,通过DHM算法模拟出一系列FGN序列,对CRS、MRS和VS等三种R/S类方法估计H指数的有效性进行了研究。研究结果表明,CRS受到序列长度、短期相关性处理和白噪声成分强弱的显著影响,MRS受到序列长度和白噪声成分强弱的显著影响,而VS受到白噪声成分强弱的影响,并且均不具有正态分布特性,分别当H真实值介于0.7至0.8、0.6至0.7和0至0.6之间时能对H指数做出较好的估计,而当H真实值介于0.8至1之间时,R/S类方法均低估H指数。关键词Hurst指数;经典R/S分析;修正R/S分析;V/S分析;有效性。TestingtheEfficiencyofHurstIndexEstimationBasedonR/STypeMethodYirongHuangSchoolofBusiness,SunYat-SenUniversity,Guangzhou510275,ChinaAbstract:ThispaperstudiestheefficiencyofestimatingHurstindexwithR/Stypeincludingclassicalrescaledrangeanalysis,modifiedrescaledrangeanalysisandrescaledvarianceanalysisbysimulatingFGNserieswithDHM.Thereareevidentdifferencesbetweentheeffectsofthelengthofseries,thetypeofdealingwithshort-rangdependence,strengthofaddedwhitenoiseinseriesonthreeestimators,moreover,theyhaveseparateapplicableintervalofestimatingHurstindex.Keywords:HurstIndex;ClassicalRescaledRangeAnalysis;ModifiedRescaledRangeAnalysis;RescaledVarianceanalysis;Efficiency.①资助项目:国家自然科学基金项目(项目名称:资本市场的分形结构及其应用研究,项目编号:70501034,项目负责人:黄诒蓉)。②黄诒蓉,男,1976.11,中山大学管理学院副教授、博士,通讯地址:广州市新港西路135号中山大学管理学院,邮编:510275,Email:huangyr@mail.sysu.edu.cn,电话:13719361509。-2-1引言Hurst(1951)[1]在长期的水文研究工作中发现,河流流量存在较强的长记忆性。后来,许多研究发现,该特性不仅存在于自然界,而且广泛存在于经济与管理领域的数据中。金融时间序列长记忆性的检测与建模目前已经成为金融计量领域研究的重要内容。长记忆性通常从具有双曲率缓慢衰减形式的自相关函数和在零频率处趋于无限值的谱密度函数等两个角度进行刻画,而且均通过Hurst指数(下文简称H指数)来表征长记忆性程度。因此,H指数的估计与检验是长记忆性研究的关键工作,其估计与检验的有效性直接影响对长记忆性的甄别。尽管现有文献提出多种估计H指数的方法,但是R/S类方法由于其简洁性而一直受到研究者的青睐,迄今为止仍是估计H指数最常用的方法。该类方法最早是由Hurst(1951)[1]和Mandelbrot&Wallis(1969)[2]提出的经典R/S分析方法(ClassicalRescaledRange,下文简称CRS),后来Lo(1991)[3]通过考虑序列的短期相关性对CRS进行了修正而提出修正R/S分析方法(ModifiedRescaledRange,下文简称MRS),Giraitisetal.(2003)[4]利用部分和序列的方差替代部分和序列的极差对CRS进行了修正而提出V/S分析方法(RescaledVariance,下文简称VS)。虽然MRS和VS均是从不同方面对CRS进行了某种程度的修正,但是能否真正提高H指数的估计有效性呢?尽管许多研究文献对R/S类分析方法的有效性提出许多质疑,但是目前大多数的研究都是这些估计方法在某些领域的直接应用,而对它们估计H指数的有效性的关注和研究却很少。R/S类分析方法由于产生于Hurst的长期实践工作过程而没有严格的数学推导,因此,我们难以使用严格数学证明来检验其有效性,但是可以通过模拟研究方法来综合评价它们的有效性。鉴于此,为检验R/S类方法估计H指数的有效性,下面将通过预先设定不同的H真实值并模拟出一系列的FGN序列,然后利用CRS、MRS和VS三种方法分别估计H指数,从H估计值的均值和标准差两方面反映序列长度、短期相关性处理、白噪声成分等因素对H指数估计的影响,并综合比较三种估计量的有效性,为R/S类分析方法使用者提供有益的参考。-3-2研究方法2.1R/S类分析方法通常将CRS、MRS和VS统称为R/S类分析方法,原因在于它们具有共同的基本原理,我们可将它们估计H指数的基本步骤概括如下:第1步,将原始序列划分成若干子序列。合适选定某标度长度n,将原始序列T1tty划分成M个互不重叠的长度为n的子序列:)y,,y,y(n21,)y,,y,y(n22n1n,…,)y,,y,y(Mn2n)1M(1n)1M(,其中,]n/T[M,表示取整,下同;第2步,计算出与标度长度n所对应的标度统计量。首先计算出根据标度长度n所划分出的所有子序列的局部统计量m,nLS,然后利用所有局部统计量计算出标度长度n对应的标度统计量nSS,此处标度统计量是所有局部统计量的平均值,即为M1mm,nnLSM1SS;第3步,改变标度长度n,重复前面的步骤,这样得到一系列的标度长度n及其相应的标度统计量序列nSS;第4步,若标度统计量序列与标度长度序列存在如下的标度关系:HnCn~SS,其中,C为某常数,则可以采用如下的双对数回归方式估计H指数:)nlog(H)Clog()SSlog(n。(1)CRS(Hurst,1951[1];Mandelbrot,1969[2])使用如下的局部统计量为:m,nm,nm,nS/R)S/R(,(2)其中,)]yy(min)yy(max[Rm,nk1tm,tnk1m,nk1tm,tnk1m,n为第m个子样本的极差,2m,nn1tm,tm,n)yy(n1S为第m个子样本的标准差,n1jm,tm,nyn1y为第m个子样本的均值。-4-MRS(Lo,1991)[3]使用如下的局部统计量:)q(/R)/Rm,nm,nn(,(3)其中,m,nR同上述CRS中的定义,)q(m,n由下式定义:jqjjynjtmnmjtmnmtqjjntmnmtqyyyyqnyynq)(2))(()(2)(1)(121,,,,121,,2mn,,(3)其中,2n1tm,nm,t2y)yy(n1ˆ,当nq时,1qj1)q(j为Bartlett权重,2m,n和j为第m个子样本n1tm,ty的样本方差和j阶样本自协方差。)(nq的选择至关重要,其直接影响到检验效果。Lo建议使用如下的q值最优选择公式:3/23/1ˆ1ˆ223nqopt,(4)其中,n为子样本长度,ˆ为一阶自相关系数的估计值,表示取整。当0q时,MRS与CRS方法一致。VS(Giraitisetal.,2003)[4]使用的局部统计量为:m,nm,nm,nSV)S/V(,(5)其中,m,nV为第m个子序列部分和序列n1kkS的方差,具体展开形式为:2n1kn1kk1tm,nm,t2k1tm,nm,tn1k2nkm,n)yy(n1)yy(n1)SS(n1V,其它与上述MRS中的定义相同。2.2模拟设计2.2.1FGN和FBM序列的模拟算法由Mandelbrot&VanNess(1968)[5]提出的分形高斯噪声(FractionalGaussianNoise,简称FGN)是第一个完整的长记忆模型,通常定义为具有H指数的分形布朗运动)t(BH的一阶差分过程0tHHtt)t(B)1t(By|y,其第k阶自协方差-5-函数为:H2H2H22y|1k||k|2|1k|2)k(,(6)其中,,1,0,1,k,)y(Vart2为任意正数,1H0为H指数。为模拟上述定义的FGN序列,许多学者提出了多种模拟算法,比如,基于条件分布的Durbin-Levinson方法(Brockwell&Davis,1991[6])、基于循环嵌入矩阵和傅立叶变换的模拟方法(Davies&Harte,1987[7];Wood&Chan,1994[8])、基于小波的合成模拟方法(Abtry&Sellan,1996[9])等。我们通过反复模拟比较发现,这些模拟方法的效果基本一致。因此,本文选择Davies&Harte(1987)[7]提出的算法(Davies&HarteMethod,简称DHM)模拟FGN序列。在式(1)给定自协方差序列T0kk}{的条件下,DHM算法模拟长度为T的FGN样本序列T1tt}y{的基本步骤如下:第1步,计算序列1T20kT,k}A{:T/kji1T21TjjT2T/kjiT0jjT,keeA,(7)其中,1i2,该步其实是对自协方差序列11TT1T10,,,,,,,实施离散傅立叶变换(DFT);第2步,检查非负条件:对所有k,0AT,k,该步也很重要,若不满足非负条件,则模拟序列是无效的;第3步,模拟产生均值为0、方差为1的独立高斯随机变量序列120}{TttZ;第4步,计算复值序列1T20kk}V{:,1T2kT,V,Tk,ZTA2,Tk1),iZZ(TA,0k,ZTA2V*kT21T2T,Tk21k2T,k0T,0k,(8)其中,*kT2V表示kT2V的共轭复数。-6-第5步,通过离散傅里叶逆变换(IDFT)可得到模拟序列T1tt}y{:1T20kT/)1t(k2ikteVT21y,T,,1t。(9)2.2.2模拟参数与程序的设定为综合对比3种估计量估计H指数的有效性,首先需要对模拟参数做出设定。我们选择0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9等9个数值作为H指数的真实值,这些取值范围基本覆盖了序列的各种特性:当H真实值介于0与0.5之间时,序列具有反持续性(或均值回复);当H真实值等于0.5时,序列没有记忆性;当H真实值介于0.5与1之间时,序列具有长记忆性(或状态持续性)。当考察序列长度对H估计值的影响时,我们选定72、82、92、102、112、122、132、142等8种长度,这些长度基本可覆盖目前大多数分析数据的长度范围,当考察相关性处理、白噪声成分对H估计值的影响时,模拟序列长度均选择为112,相关性处理仅考虑一阶短期相关性剔除的情况,白噪声成分考虑根据在FGN序列追加的白噪声成分标准差与FGN序列标准差之间的4个比值0、0.33、0.66、1.0划分的4种情况。本文的所有运行结果均是在Matlab7.0软件中自行编写程序得到的,如需源程序可向作者索取。首先,在上述模拟参数的设定下,每种情况均模拟出100个序列,利用3种估计量分别估计出每个序列的H估计值,这样每种情况均得到H估计值序列1001iiHˆ;其次,分别估计出在每