《数量经济研究》2006年第4期赫斯特指数(Hurst)指数及在Excel中的实现韩海波(兰州商学院统计学院,甘肃兰州730020)摘要:摘要:摘要:摘要:Hurst指数是描述非函数长周期的重要指标。它有别于传统单位根检验,可以发现时间序列存在的超长周期性,可以用于判断市场风险,但运算相当繁琐,单独利用Excel计算费时又费力,作者在充分理解Hurst指数内涵和应用的基础上,利用Excel的宏语言VBA编写宏程序轻松实现Hurst指数的计算,通过这一工作也希望能使Hurst指数能够得到广泛的应用。关键词:关键词:关键词:关键词:Hurst指数;R/S分析;Excel;VBA中图分类号:中图分类号:中图分类号:中图分类号:F224.0文献标识码:文献标识码:文献标识码:文献标识码:A1111HurstHurstHurstHurst指数的基本概念1.11.11.11.1重标极差法(rescaled(rescaled(rescaled(rescaledrangerangerangerangeanalysisanalysisanalysisanalysis,R/S)R/S)R/S)R/S)1.1.11.1.11.1.11.1.1R/SR/SR/SR/S分析的产生和发展标准统计分析假定系统基本是随机的,也就是说产生时间序列的过程有较大的自由度,而且序列内部的关系是非常复杂的,对它们进行确定性的说明是不可能的。只有概率论能帮助我们理解和利用这一过程。自然界和资本市场中充斥着大量的非线性随机和确定性系统。为了研究这些系统,就需要一个非参数的统计方法。在标准高斯统计中,要求被观测的对象一定是独立同分布(IDD)的,但是在系统不是IDD,要用什么样的方法去解决呢?1951年英国水文学家H·E·Hurst(1900-1978)发现了一个非常稳健的无参数统计方法。这一方法最初是用来考察尼罗河的流量变化的。但Hurst将他的研究扩大到许多自然系统,而且通过这个方法可以区分随机和非随机系统、趋势的持续、循环的持续。这一方法叫做“重标极差法”(rescaledrangeanalysis),或R/S分析。通过这一方法可以区分具有长期非函数周期时间序列与随机序列。爱因斯坦于1908年发表了关于布朗运动的论文,使得布朗运动成为随机游走的基本模型。爱因斯坦发现,分子随机运动的半径可以用涵盖时间的平方根来测度:R=分子随机运动的半径;T=时间(1)5.0TR=上式称作二分之一法则。在金融学中这一法则通常被用来对测量风险的标准差进行的年度化,比如用月收益的标准差乘12的平方根就得到年收益的标准差。Hurst就是从这一原则出发通过新的统计量来对序列的随机性进行检验。下面简要说明这一方法:假设x=x1,x2,…,xn为一时间序列,记做xi,i=1,2,…n。该时间序列的均值为xm,(2)nxxxn/)(1++=⋯标准差sn《数量经济研究》2006年第4期(3)nxxsrn2)(−=重标极差方法需要对原序列进行标准化,(4));(xxZii−=nr,,1⋯=这样Z就具有零均值,,下面由Z产生一个累积时间序列Y:0=Z(5));(11iZZY−=nr,,2⋯=依据这个规则便可产生新的时间序列Y,由定义可知,序列的最后一个Y(Yn)将一定为零。重标的极差Rn,是Yi的最大值减去最小值。(6)),,min(),,max(11nnnYYYYR⋯⋯−=对于Rn,下标n表明对于x1,x2,…,xn是一个调整过的极差。因为Z已经被调整为零均值,Y的最大值总是大于或等于0,而最小值总是小于或等于0。这样Rn将永远为非负。运用重标极差Rn,可以将等式(1)一般化,因为等式(1)仅仅适用于布朗运动,也就是随机过程。其形式如下:(7)HnncSR⋅=)/(n表示对应x=x1,x2,…,xn的R/S值;c=a常数这里R/S(rescaledrange)被称为重标极差。通常情况下,R/S随时间区间的增大而变大,H通常称做赫斯特指数(HurstExponent)。由于对R/S进行了标准化处理,重标极差允许研究者对各种现象和时间序列进行比较。这是因为重标极差分析方法可以对没有特征规模变化的时间序列进行描述和分析。1.1.21.1.21.1.21.1.2赫斯特指数(HurstHurstHurstHurstEEEExponentxponentxponentxponent)的计算与涵义(1111)赫斯特指数的计算赫斯特指数可以由绘制的Log(R/S)与Log(n)图形逼近,其近似值就是其回归模型的斜率。(8))()()/(nLogHcLogSRLogn⋅+=假如一个系统是独立分布的,那么H=0.5。Hurst对尼罗河的流量研究表明,其H=0.91,也就是说重标极差以快于时间平方根的速度在增长,这就意味着尼罗河的流量时间序列数据点的范围超过了一个随机过程可能覆盖的范围。而要覆盖更多的范围,序列间各点必定是相互影响的。尽管短期的自回归(Autoregressive,AR)会引起序列相关。但通过一阶和二阶自回归模型[AR(1),AR(2)]对数据进行处理并不能消除这种相关性。(2222)赫斯特指数的含义时间序列的Hurst指数居于0-1之间。以0.5为间隔,时间序列在不同的区间会表现不同的特性:①H∈(0,0.5):分形布朗运动。此时,时间序列的未来数据倾向于返回历史点,因此其发散的比标准布朗运动慢。可以证明,该序列在理论上会无数次的返回它的历史出发点。②H=0.5:标准布朗运动。此时,序列为随机游走,表现马尔可夫链特性。《数量经济研究》2006年第4期③H∈(0.5,1):长期和无周期的循环。此时,时间序列有混沌性,其增量会表现出长期增长的特性。因此,一定范围的记录会持续相当长的时期,从而形成一个个大的循环。但是这些循环没有固定的周期,难以依靠过去的数据预测未来的变化。④H=1:完全预测围。通常把这种过程称做均值回复过程。1.21.21.21.2R/SR/SR/SR/S分析实际操作(1)假定一个时间序列Pi,长度(数据个数)为M,逐一计算序列的对数比,这样就可以生成一个新的对数序列Ri,其长度为N=M-1,这样做的目的是消除序列的短期自相关性,以满足R/S分析对观测对象独立的要求,新的时间序列为:(9)),(1iiiPPLogR+=1,,3,2,1−=Mi⋯(2)以长度为A均分这个序列为n个相邻的子区间,这样A·n=N。任一子区间表示为Ia,a=1,2,3,…,n。在Ia中的元素表示为N(k,m),k=1,2,3,…,n,m=1,2,3,…,A。Ia的均值为:(10)∑==AkakaNAe1,1ea=子区间Ia中Ni的均值。(3)每个子区间Ia对于均值的累积截距(Xka)时间序列定义为:(11)∑=−=kiaaiakeNX1,,)(nk,,3,2,1⋯=(4)极差定义为(12))min()max(,,akakIXXRa−=nk≤≤1(5)子区间Ia的标准差为:(13)AeNSAkaakIa∑=−=12,)((6)每一个均由对应的进行标准化。则R/S定义为:aIRaIS(14)∑==naIInaaSRnSR11)/((7)不断增加A长度,并重复1——6步,直到A=(M-1)/2。以Log(n)为解释变量,Log(R/S)为被解释变量,进行线性回归,Log(R/S)=Log(c)+H·Log(n)+ε。计算得到的方程中斜率就是赫斯特指数H的估计值。1.31.31.31.3R/SR/SR/SR/S分析对循环的探测《数量经济研究》2006年第4期通过观察我们通常认为价格的波动具有周期性的规律,但这并不是我们一般所说的周期,周期是一个可以严格用正弦波来表达的概念,而通常经济指标波动表现出来的周期性波动并没有精确的周期长度,不同波的相位和振幅经常发生偏移。近期的研究成表明,存在着非周期循环这个概念,这些循环有一个平均持续周期,换言之,一个未来的循环是不确定的,但它大致位于平均的循环周期附近。这正好符合我们对经济指标变动的周期的观测。通过R/S分析,我们就可以找到这个平均的循环长度。在一个时间序列里,R/S分析不但能够发现持久性长期记忆还能估计周期性或非周期性循环的长度。而且这一循环对于噪声是稳定的,这对于经济分析是十分有效的。这里非周期循环是指这个循环没有绝对的频率,但有一个平均的频率,在相空间中表现为一个有限集,混沌理论中称作奇异吸引子。以往在时间序列分析中,我们的焦点一直放在规则、周期循环上。在傅立叶分析中,是假定形成时间序列不规则形状的是许多正弦波的集合组成,它们各自有不同的频率和振幅。而谱分析是试图用不明显的循环来分割时间序列,使其成为正弦波的集合。然而这些方法均不能是分析结果较好的符合实际观测。而非周期循环却可以对资本市场的循环做出解释。1.41.41.41.4VVVV统计量的计算及非周期循环的判断1.4.11.4.11.4.11.4.1VVVV统计量的计算V统计量计算的主要目是找到非周期循环的长度。计算公式为:(15)nSRVnn)/(=其中n为观测的天数。1.4.21.4.21.4.21.4.2非周期循环的判断在V统计中,若V线表现为水平,则序列为随机。反之,如果有上升趋势,则表现为序列的长期记忆,图形的拐点处即为序列的非周期循环的长度。2222HurstHurstHurstHurst指数的计算程序2.12.12.12.1HurstHurstHurstHurst指数的程序设计现有常用的统计软件中可以计算赫斯特指数的非常少,而根据前面所阐述的理论基础可以看出赫斯特指数计算量相当大,如果单纯依靠手工计算是很难做到的,为了方便更多的统计学者在实际的操作过程中可以计算赫斯特指数,我们决定编写程序来解决赫斯特指数复杂的计算问题。众所周知,如果在MicrosoftExcel中经常重复某项任务,可以使用宏将其变为可自动执行的任务。宏就是贮存在VisualBasic模块中的一系列命令和函数,并且在需要执行该项任务时可随时运行的程序。在Excel中记录宏就如同用磁带录音机录制音乐,然后运行宏使其重复执行或回放这些命令。可以使用VisualBasic编辑宏程序,也可以利用MicrosoftExcel自带的MicrosoftVisualBasic宏编辑器直接编制宏。由于宏程序可以方便灵活的加载到MicrosoftExcel中,而Excel又是统计中最常用的软件。我们选择使用VBA语言编写计算赫斯特指数的宏程序。2.22.22.22.2HurstHurstHurstHurst指数程序的特点本程序实际上是一个Excel文档,用户只需将逐一计算对数比后的时间序列数据输入到Excel的A列中,然后直接点击左上角的“Hurst”按钮,即可得出该序列的赫斯特指数和相应的V统计量图,为了使程序更加方便实用,我们将程序和所有附带文件打包为标准的安装软件,成功安装后即可直接在Excel中计算赫斯特指数,详细使用方法请参考程序使用说明。(源程序请参见附录),《数量经济研究》2006年第4期软件界面如下图:3333外汇市场R/SR/SR/SR/S实证分析3.13.13.13.1数据来源我们采用1998年9月19日——2006年5月18日的欧元对美元汇率的收盘价(共2799个数据点)为分析对象。由于数据量已超过了2000这个经验值,因此样本数量是足够。3.23.23.23.2数据初步处理根据R/S分析的要求对数据进行对数一阶差分(逐日对数收益)处理,消除序列的短期记忆。计算公式为:(16))ln(1−=tttPPX3.33.33.33.3赫斯特指数(HHHH)的计算将2799个经过处理的欧元对美元的汇率数据代入程序中进行计算,最后结果是:Hurst=0.625657443267641。V统计量图如下所示:3.43.43.43.4计算结果的非参数显著性检验为了验证计算所得H值的可靠性,我们打乱原时间序列的顺序,重新计算H。而这时的H应显《数量经济研究》2006年第4期著值地接近0.5。通过计算检验,结果证明H值是显著的。为了和传统单位根检