高频数据中内生测量时间的存在性肖鸿民,叶立(西北师范大学数学与统计学院,甘肃兰州730070)摘要:基于高频数据估计积分波动率的时候,一般的假设通常是测量时间和价格过程无关,但这个假设并不符合实际情况,这篇文章,我们在考虑噪音污染的影响下,为一般的受内生测量时间影响的实波动率建立了中心极限定理.同时我们用真实的股票数据呈现了这种内生性.关键词:内生性;高频数据;实波动率TheExistenceofEndogenousSamplingHighFrequencyDataXIAOHong-min,YE-Li(DepartmentofMathematics,NorthwestNormalUniversity,Lanzhou730070,China)Abstract:Whenestimatingintegratedvolatilitiesbasedonhigh-frequencydata,simplifyingassumptionsareusuallyimposedontherelationshipbetweentheobservationtimesandthepriceprocess.Inthispaper,weestablishacentrallimittheoremfortheRealizedVolatilityinageneralendogenoustimesetting.Wealsodocumentthatthisendogeneitycanbepresentinfinancialdata.Keywords:endogenous;highfrequencydata;realizedvolatility0引言二十世纪九十年代以前,人们对金融时间序列的研究都是针对日、周、月、季度或者年度数据进行的,这种金融数据在金融计量学研究领域通常称为低频数据.近年来,随着计算工具和计算方法的发展,极大地降低了数据记录和存储的成本,使得对更高频率的金融数据进行研究成为可能.在金融市场中,高频率采集的数据可以分为两类:高频数据(highfrequencydata)和超高频数据(ultrahighfrequencydata).高频数据即日内数据,是指在开盘时间和收盘时间之间进行抽样的交易数据,主要是以小时、分钟、甚至秒为抽样频率的、按时间顺序排列的时间序列.超高频数据则是指交易过程中实时采集的数据.高频数据和超高频数据两者之间的最大区别是:前者是等时间间隔的,后者的时间间隔是时变的.对这些数据进行各种分析、建立模型和相关的研究,都极大的推动了市场微观结构理论和金融计量学的发展,从而大大的丰富和推广了金融工程学和金融计量学的研究领域和视角.一般而言,金融市场中的信息是连续的影响股票价格的运动过程的,采用离散模型考察资产的价格行为必然会造成信息的丢失,数据的采集频率越低,信息丢失越多;反之,数据的采集频率越高,获取的市场信息也就越多.因此,在股票的交易过程中,记录出来的高频数据和超高频数据包含了更多的实时信息,因而能更加准确地捕捉到市场发生的微小的变化过程,所以利用高频数据和超高频数据的特性研究资产价格的相关特征与潜在过程比采用低频数据具有更多的优势.自从二十世纪九十年代以来,高频数据和超高频数据成为金融市场研究的全新手段,它们从根本上改变了以往对市场波动性的测量和应用.BollerslevandZhao(2002)基于高频数据的特点,提出了不需要模型的“已实现”波动率作为积分波动率的非参估计量,该估计方法计算简便且精度较高.由此也引发了国际国内关于高频数据相关特征研究的一个热潮.但其实质就是充实渐进理论使高频数据的可用性增加.具体来说,相关渐进理论是建立在两个收敛的结果之上,分别为伊藤公式tttttdWddX和观测时间1,0,,itin首先,如果观测时间int,是停时,即网络分割1,,maxinintt依概率趋近于0,已实现波动率21,,,ninintttTXXTiXX.是二次变分stTdXX02,的一致点估计.其次,在某些关于随机次数int,的假设之下,也就是所谓二次变分时间的过程收敛tininnHttn21,,lim.tH是一个适应过程,次数int,关于X过程是独立的.距离相等的情况可以推广到“次数变化”的情形,这时测量次数导致了某种程度的内生性.本文兴趣的焦点是当内生性的观测时间很重要时,这意味着TXXXn,,21有非零的极限,主要的理论成果是,给出了内生采样次数存在时的中心极限定理,同时通过对实际股票数据的3个实验,用统计检验的方法呈现了高频数据中的内生性.1.预备知识下面给出在随后的分析及证明中会用到的一些预备知识.我们在此简略地介绍一下估计.首先,我们考虑对数价格过程tX.10t并且此过程满足伊藤过程:stsststdWdbXX000事实上,我们所观察到的数据是受到微观结构噪音影响的数据,即我们得到的是tY而非tX.tttXY.其中,t是在t时刻的微观结构噪音.我们现在就是要利用tY来估计预测ISV.我们人为地划分区间1,0为m等子区间,令mnK,并记:Kkmrnkmrkr,1;1,,1,1选取一个l,令l,当0nl,n时,对于每个lr,我们令littnirrnYlY11.区间1,0上观测到的数据记为n个,其观测值为niYi2,1,我们令21111,krkrkrYYYfYYmrKkall.再令221111,krkrkrYYYfKYYmrKkavg.则ISV的估计可以定义为:allavgYYKnmYYISV,11,其中allYYkn,121是微观结构噪音的估计.在证明定理之前,我们还需要以下引理,它们对本文主要结果的讨论是必要的.2.引理(1)假设tttUX,,对过滤t是适应的nZ是一系列t-可测的随机变量,nZ依概率收敛到z.当n时,如果z在t的扩张下可测,那么对于所有tA对所有有界连续g.ZgEIZgEIAnA引理(2)假设,tx2,tt对过滤t是适应的,可积的并且局部有界的,02ct不随机,同样假设(所有的0)32,1,maxnOttpinin.同样假设对所有tstsptduXXXXn0,,,stsptdvXXXn021,,ttvu,是可积的,最后假设t是由有限的连续鞅生成,有以下结果成立:stsssstssttdBvudXvXXXXn0220221943232,,sb是Brawn运动。3.定理及证明令sb与s适应于虑子,并且局部有界和可积,我们有以下定理成立:)1(,11,02sttpallavgdYYKnmYY)2(,,11,,021stspallavgduYYYKnmYYYn)3(,,,11,,,0stspallavgdvYYYYKnmYYYYn证明1:22111,mrKkavgkrkrYYKYYmrKkmrKkmrKkkrkrkrkrkrkrkrkrkrYfKXXYfKXXYfK21212211111111121221111,mrKkallkrkrYYYY22121221111111111111111mrKkmrKkmrKkkrkrkrkrkrkrkrkrkrkrfXXYfXXYf我们有01112212211111XYfKnmYfKEmrKkmrKkkrkrkrkrkrkr并且02111111121pmrKkkrkrkrkrkrXXYfKE011111111121pmrKkkrkrkrkrkrXXYfKnmE则可得到:sttpallavgdYYKnmYYE02,11,这样,我们就证明了ISV依概率收敛于ISV.证明2:krkrkrkrkrkrkrkrkrkrXXKXXKXXkmrKkmrKkmrKk111111221321213311其中;041111221pmrKkkrkrkrkrXXKE同理:0111111121pmrKkkrkrkrkrkrXXYfE由于kr独立同分布,2212121111163krkrkrkrkrkrkrXXKXXkmrKkmrKk同理:221212111111111211krkrkrkrkrkrkrXXknmXXknmmrKkmrKk则:0]1166[221212111111pmrKkmrKkkrkrkrkrkrkrXXknmXXKE所以有:stsptduYYYn021,,证明3:42121411111111,,,mrKkmrKkkrkrkrkrYYknmYYKYYYY]11)(1[)1()1(2421212211111mrKkmrKkkrkrkrkrYYknmYYKknmm我们有:0411321pmrKkkrkrkrkrXXKE同理:011111321pmrKkkrkrkrkrXXE则:ttpmrKkdknmmXXKEkmkrkrkrkr101122221)1()1(2412则有:stsptdvYYYYn0,,,定理说明:我们知道,金融数据中的确存在时间内生性,因此,一致的估计引理中提到的偏和方差将会允许我们利用时间的内生性来提高波动率估计的精确性.截止目前为止,大部分的文章都假定观察的资产价格的时间间隔是等速的,而本章中,我们假定资产价格的观测时间是随机的.已知二阶变差的收敛结果在很弱的条件下都是成立的,因此我们可以将观测时间拓展到随机观测时间和有内生性的观测时间,在没有时间和基本半鞅过程独立的假定下,我们得到了随机速度观测下的二阶,三阶,四阶情况下的中心极限定理,这就使得结果极其重要了.4.实验部分在本节中,我们利用计算机模拟与实际数据对之前的理论结果进行验证说明.不论是模拟结果还是实际数据的估计,都与我们的理论结果相吻合,说明了我们采用的统计方法具有良好的可靠性与准确性首先,我们在完全独立地情况下,利用双时间序列的方法对检测量进行估计,得到了估计结果.之后,我们以深市股票中信证券600030SH,弘业股份600128S