高频数据的计量框架金融高频数据是在细小的时间间隔上抽取的观测值,这些抽取的观测值是非等间距地观测到的,并且间距是随机的。处理这种数据有两种方法,一是对原始数据进行处理后使用经典的模型,二是考虑随机时间间隔建立处理高频数据的新的模型。将原始数据过滤产生新的固定频率的数据,这种处理方法减少了数据频率,丧失数据的某些特性。为了充分利用高频数据的信息,必须对随机时间间隔建模。统计理论中,常常将金融高频时间序列过程转化为一个点过程进行处理。考虑时间序列为事件发生时间,例如金融市场上交易的发生时间,可以将这个时间过程,视为一个简单的点过程。与每个交易时间对应的有一个计数函数为到第i笔交易时刻为止,所发生的交易次数。当然金融高频数据中,不仅仅包含这些简单的信息变量,还包含着大量的其他信息,如买卖价差、交易价格、交易量、报价深度、交易笔数等重要的信息。如果将这些信息与交易时间序列一同考虑,称这一种点过程为“标记的点过程”。首先引入信息集,对于一个平稳的标记点过程,可以利用它的联合概率密度函数(条件分布)来完全刻画:0101{,,,,},nntttttt其中(),0,Ntt1010{,,,}{,,,},iiiiiittttyyyy和例如,如果不考虑下一个交易点的标记值,仅仅对交易时间进行分析,研究下一笔交易发生的时间,可以得到以下边缘概率密度函数:称之为一个简单的点过程,这一点过程以过去的交易时间、交易标记值为条件。可以利用这个点过程分析下一笔交易的到达时间。()1()1()()(,/,)NtNtNtNtftyty()1()()()1()()(/,)(,/,)NtNtNtNtNtNtfttyftytydy为了得到一个适合金融高频数据特征的计量模型,首先建立一个标记的点过程。而金融数据由于受到过去信息的影响,需要考虑具有后效性的点过程,此时需要引入条件强度函数条件强度函数也称为危机函数t时刻发生交易的条件强度函数为这一强度函数通过基准危机函数和时间间隔的条件期望来反映这一动态的点过程。条件强度函数可以这样理解,即某个交易到达的瞬时概率。12()12()0(()()/();,,)/();,,.)limNtNttPNttNtNtttttNttttt(()1()0()1()1/(),,,)()NtNtNtNt+1tttNttt(持续期模型介绍考虑是第次交易发生的日历时间,从第到第次交易的时间持续期为持续期模型主要考虑交易之间的时间间隔。介绍一个简单的持续期模型—ACD(AutoregressiveConditionalduration)模型。正如GARCH模型是刻画波动率的聚类性,ACD模型是刻画持续期的聚类性。持续期的聚类性是指:短的持续期后面也往往跟随着短的持续期,长的持续期后面也往往跟随着长的持续期。iti1ii1iiittt自回归条件持续期(ACD)模型利用GARCH模型的思想研究调整的时间持续期的动态结构。日周期或者日模式的存在:在正常交易条件下,交易活动能够展示周期模式,举例说,在NYSE中,开盘与收盘时刻的交易比较频繁,而中午时间交易比较少,导致了“U”型的交易强度。因此,交易之间的时间持续期亦呈现日循环模式。是一个确定的函数,有的循环成分组成,所以(调整的时间持续期)就是要消除类似于每日模式这样的因素的影响。*/()iiittft*it()iftit*itACD模型我们定义令表示第次交易至第次交易的调整的时间持续期的条件期望,其中为第次交易时可以得到的信息集合,即为给定的条件下期望的调整持续期。基本的ACD模型定义为其中是独立同分布的非负随机变量满足。1(/)iiiExFi1i1iF1ii1iFiiix{}i)1iE(*iixt假设只有P阶滞后的持续时间影响条件持续期,可以得到:考虑更一般的情形,类似于GARCH模型,将q阶条件期望持续期引入,可以得到一般的ACD模型:式中p和q为相应的延迟阶数,这就是ACD(p,q)模型,第个持续期的条件期望由其滞后的q个条件期望和滞后的p个过去的实际的持续期共同决定。这与GARCH(p,q)模型具有非常相似的形式。1pijijjx11,1,2,,pqijijjijjjxiNi当服从不同的分布,会得到不同的模型形式。当它服从一个标准指数分布时,结果中的模型成为EACD(p,q)模型,当它服从标准化的韦布尔(Weibull)分布,则成为WACD(p,q)模型。iiix11,1,2,,pqijijjijjjxiNiACD模型与ARMA模型的关系将ACD(p,q)模型记为①其中L为滞后算子,对上式移项可得②又因为③将②式代入③式可得④11,1,2,,pqijijjijjjxiN()()iiiLxL11,(),1,2,,pqijijijijjjLxxLiN()[1()]()iiLLx()[()]iiiixLxxLx()[1()]iiiixLxxL对④式进行变换得⑤记,是一个鞅差分序列,序列不相关,则式⑤变为这样,可以把ACD(p,q)过程看作是关于的ARMA(max{p,q},q)过程,对于[()()](1)()()iiiiiixLLxLx(1)iiiiix{}i{}i[()()][1()]iiixLLxLix,0;,0jjjpjq一些概率分布的回顾指数分布称随机变量X服从参数为的指数分布,如果其概率密度函数(pdf)由下式给出这样一个分布表示为X~exp().我们有E(X)=,Var(X)=X累计分布函数(cdf)为当=1时,称X服从标准指数分布0)((/)fx/1,0,0,0.xeifxifx2(/)Fx/0,0,1,0.xifxeifx韦布尔分布称一个随机变量X服从参数为的韦布尔分布,如果其pdf为这里和分别为分布的尺度参数和形状参数。X的均值、方差分别为X的cdf为当时,韦布尔分布简化为指数分布。0,0)、((/,)fx1(/),0,0,0,xxeifxifx2221()(){(1)[(1)]}1EX1+VarX(),(/,)Fx(/)0,0,1,0.xifxeifx1定义可得E(Y)=1,而且Y的pdf为对于带韦布尔分布新息的持续期模型,最大似然估计中利用的就是上述的pdf.1/[(1)].Y=X(/)fy11[(1)]exp{[1]},0,0,0.1y+yifyify()广义伽玛分布称随机变量X服从参数为的广义伽玛分布,如果它的pdf由下式给出其中是尺度参数,为形状参数。这个分布可以写为当时,广义伽玛分布简化为韦布尔分布。广义伽玛分布韦布尔分布指数分布这样,指数分布和韦布尔分布都是广义伽玛分布的特殊情况。0,0,0),,((/,,)fx1exp[()],0,()0,kkxxifx其他,,XG=(),=1危险率函数介绍对持续期建模时一个有用的概念是由分布函数隐含的危险率函数,有些地方也叫条件强度函数。对随机变量X,生存函数定义为这给出了服从X分布的每个事物在时刻t生存的概率。X的危险率函数(或强度函数)定义为其中分别是X的pdf和生存函数。()()1()1(),0,SxPXxPXxcdfxx()(),()fxhxSx()fS和()对于参数为的韦布尔分布,生存函数与危险率函数分别为当时,得到因此,对于指数分布而言,其危险率函数是常数,对于韦布尔分布,危险率函数是单调的。如果,那么危险率函数是单调递增的,如果,那么危险率函数是单调递减的。、1/,)exp[()],(/,),0.xSxhxxx(=1(/)1/.hx11EACD模型一个EACD(1,1)模型可以写为⑥其中,服从标准指数分布。利用前面所讲的标准化指数分布的矩,假定是弱平稳的,可以推导的方差。对⑥式两端取期望:在弱平稳的条件下,,因此可推出又因为11,iiiiiixxi22)1,()1,()()[()]2iiiiiEVarEVarE(ixix111)[(/)](),()()()iiiiiiiiExEEFEEExE(1)()iiEE(()()1xiiExE222221()2,)[(/)]2().iiiiiiEExEEFE可得(1+⑥在上式中对于的平方去期望,通过代数运算可得最后,利用这个结果显示,为了得到时间不变的非条件方差,方程⑥中的EACD(1,1)模型必须满足通过以上分析,还可以得出非条件标准差大于非条件均值,也就是说存在过度离散现象。11,iiiiiixxi222221()).122ixE(22222212()2(),122iixxVarxE22122对于EACD模型的估计,采用极大似然估计法。ACD模型与GARCH模型具有非常相似的性质,对于ACD模型的估计可以利用类似于GARCH模型的估计方法来进行。对于EACD(1,1)参数的估计,使用的准似然方程为:因为当满足指数分布,而的条件期望是,所以的概率密度为这样,对数似然函数就为可以利用GARCH软件对ACD模型进行QML估计。()121/,,,){log()()}NTiniiixLxxx(iixiix()1()()ln()iixiiiiixfxel()121/,,,){log()()}NTiniiixLxxx(WACD模型如果假设服从标准的Weibull分布,称之为WACD模型。标准的Weibull分布为:它的均值和方差分别为考虑持续期为正,为了将之应用到ACD模型,需要对此进行变换,代入公式可得:i(/,)fx1(/),0,0,0,xxeifxifx2221()(){(1)[(1)]}1EX1+VarX(),/(11/)i=1(11/)(11/)(/,)[]exp([],0iiiiiiixxfxx得到条件危机函数为:为Gamma函数,当时便为前面讨论的EACD模型,当时,Weibull分布的危机函数为单调递增的,即出现长的持续期的可能性递增;而当时,它的危机函数为单调递减的,即出现长的持续期的可能性递减。也就是说Weibull分布对于极短和较长持续期出现的可能性可以更好的加以描述。模型的参数估计可以由极大似然估计法得到,给定的参数设定,WACD模型的对数似然函数可以表示为:11111/)[(1)]()iiiitttttt(()=111i1(11/)(11/)()ln()ln()()NiiiiiixxLxGACD模型将Gamma分布应用到ACD模型之中。如果假设服从独立同分布广义Gamma分布时,称之为GACD模型。Gamma概率密度函数为:将广义Gamma分布用于ACD模型时,进行变换可以证明当,一般的Gamma分布变为Weibull分布,当便成为了指数分布。i(/,)fx1exp(())000xxxx()(1/)/(),Exk()/(1/),i=