我国时间序列分析研究工作综述(李锐向书坚)摘要:近年来我国学者对于时间序列的研究取得了极其丰硕的成果,主要体现在基础理论研究的不断加强(某些领域已经达到了国际前沿水平,而不再只是纯粹的吸收引进国外的先进成果);应用领域的不断拓展,在应用中求创新求发展,在部分应用领域中我们已经跟上了国际步伐。本文中我们将从理论与应用两个方面进行对我国时间序列分析研究的主要成果进行综述。关键词:非线性;非平稳;非参数;数据挖掘近年来我国学者对于时间序列的研究取得了极其丰硕的成果,主要体现在基础理论研究的不断加强(某些领域已经达到了国际前沿水平,而不再只是纯粹的吸收引进国外的先进成果);应用领域的不断拓展,在应用中求创新求发展,在部分应用领域中我们已经跟上了国际步伐。本文中我们将从理论与应用两个方面进行对我国时间序列分析研究的主要成果进行综述,主要介绍被SCI检索(2000-2004)的部分成果,以及在国内重点核心期刊(2000-2004)上发表的部分重要成果。一、时间序列分析在理论上的进展理论上的进展主要表现在两个方面:一是单位根理论;一是非线性模型理论,非线性模型理论的进展集中在几何遍历性问题和非线性过程的平稳性这两方面。我国学者在非线性时间序列分析方面取得了一系列高水平的成果。汤家豪教授将有关非线性时间序列分析的研究与动力系统科学的模型连接而备受赞赏。现在他着眼于非参数时间序列模型的发展,并与生态学家进行大量的合作研究。姚琦伟教授基于信息量,首次提出了描述一般随机系统对初始条件敏感性的度量及估计方法。在高维模型领域,姚琦伟教授提出用复系数线性模型近似高维非线性回归函数的新方法,以此克服高维非参数回归中样本量短缺的困难问题。此方法在生物、经济、金融等应用中获得了成功。在时间序列模型的最大似然估计方法的研究中,他完整地建立了在金融风险管理中有直接应用的ARCH和GARCH模型为最大似然估计的极限理论。对于重尾部(heavy-tailed)分布模型,提出了基于boostrap的新的估计方法以及稳健统计方法。他还首次建立了在空间域上空间ARMA过程的最大似然估计理论,这一工作同时也对Hannan1973年给出的关于时间序列的最大似然估计理论首次给出了一个完整的时域上的证明。安鸿志、朱力行、陈敏关于非线性自回归模型的平稳性、遍历性和高阶矩的成果,获得了有这些性质的最弱条件。关于回归或自回归的非线性检验问题,具有重要的实际意义。他们首次给出了完全对立的假设检验方法,无论从原理和应用都表明此方法有明显优点。他们研究了条件方差为非常数的回归和自回归模型的平稳性、遍历性和检验方法。二、时间序列分析研究的应用时间序列分析研究的一个重要原动力源自于金融市场、信息网络以及电子商务等领域超容量数据的获得,在全球化竞争日益激烈的环境中,这些数据的可利用价格越来越大。对这些数据进行综合分析的迫切性促进了我国时间序列分析应用研究的发展。1、在数据挖掘中的应用各种类型的数据都可以作为数据挖掘的对象,时间序列在数据集中十分普遍,对时间序列进行数据挖掘已成为当前研究的焦点之一。吴煲宁等针对商业销售的智能分析需求,提出了一种基于模糊集合的数据挖掘时间序列模式算法。吕安民等研究了某些时间序列所具有的分形特征,分析了利用分形理论中的R/S分析,发现具有分形特征的时间序列模式的方法。用R/S方法可以从具有分形特征的时间序列中寻找变化规律,从而预测时间序列未来的发展趋势。韩明涛提出一种进行时间序列模式挖掘的算法,用于对大型数据库的海量数据分析,从中挖掘出超过用户给定支持度和置信度的时间序列,从而为用户的决策支持和趋势预测提供依据。翁颖钧、朱仲英提出了基于动态时间弯曲技术的相似搜索算法,通过计算时序数据之间的最短弯曲路径来获得序列的匹配。对综合控制时序数据进行基于不同距离测度的聚类分析对比结果表明该文提出的算法有很高的精度和对振幅差异、噪声和线性漂移有强的鲁棒性,具有良好的应用价值。2、在气象、天文、地质中的应用李本纲等探讨一种处理多年气象观测数据的新方法,该方法以地理信息系统为技术支撑,以数字图像处理和标准主成分分析为核心,适用于处理空间分布广、时间序列长的多类型气象观测数据。江东等利用气象卫星NOAAAVHRR资料,反演出农作物生育期内每日和旬度的NDVI数据,分析了NDVI时间曲线的波动与农作物生长发育阶段及农作物长势的响应规律,并以华北冬小麦为例,探讨了NDVI在冬小麦各生育期的积分值与农作物单产之间的相关关系。结果表明,利用长时间序列的NDVI数据,结合作物的物候历,可以实现作物长势的遥感监测和产量遥感估算。李宏等将时间序列模式既用于具有时间关系的购买行为的分析,以揭示购买行为后面一种序列关系信息,又用于其他有时间关联的事件分析。通过实例指出了该算法和传统的Aprioriall算法的不同之处。结果表明,这种序列模式在网络通信、气象分析等领域具有广阔的应用前景。国家重点基础研究发展规划项目:《我国生存环境演变和北方干旱化趋势预测》,利用非线性时间序列分析的数学方法对我国多时空尺度历史和现代环境资料进行定量处理,从不同的资料中分析出极端事件的特点和频率变化信息,研究不同事件的联系,分析可能的物理机制为极端的事件和环境预测提供依据,应用处理非线性时间序列的数学方法对各种资料作了信号分析处理,揭示了环境要素中存在的年代际和世纪时间尺度的变化特征及其它们在空间上的信号传播规律。3、金融领域应用由于大量研究数据可获得性和相关问题具有的挑战性,金融领域一直是时间序列研究的热点,我国学者也取得了非常丰富的成果,为金融决策分析及金融风险规避提供了大量有价值的资料,并在应用领域研究中取得了重大的理论突破。陈平在世界上首先引进时间-频率分析于经济学,从美国股票价格指数中发现经济色混沌现象,并将经济诊断方法引入经济周期的分析预测。在新兴交叉学科——复杂系统科学和非线性经济动力学的研究中居于世界前沿。潘文卿等采用面板数据模型方法,运用中国1978~2001年28个省区的数据,对中国改革开放以来,尤其是20世纪90年代以来的资本配置效率及其与中国金融发展的相关性进行了时间序列分析与横截面数据分析。研究发现,随着改革的深入,资本配置效率总体上呈现上升趋势,但波动性很大,而且资本配置效率呈东、中、西梯度递减特征。中国的金融发展与资本配置效率总体呈现弱相关关系,信贷市场与股票市场对资本配置效率变化的解释能力较弱,其中国有银行的信贷行为抑制了资本配置效率的提高,而非国有银行金融机构的信贷与投资行为对资本配置效率有促进作用。王卫宁等以2002年上海证券市场10秒间隔的上证指数高频数据,分析了价格波动的非线性特征,通过重构相空间方法重构了2002年上证指数时间序列的奇怪吸引子,计算其关联维数,并求出其Lyapunov指数为正,从而确认了上证指数时间序列的混沌行为。钱争鸣分析了我国金融市场的有效性,对金融市场不确定性的探讨和实证分析,测度金融市场的系统风险,寻求最优动态无风险策略,帮助政府制订和完善金融政。张屹山等采用时间序列的谱分析方法,对我国工业生产、投资、消费、外贸、物价、财政、金融等主要月度经济指标的增长率周期波动进行了测定和分析,结果表明:20世纪80年代以来,我国向市场经济体制转轨过程中的周期波动出现了与以往不同的新特征,产生了7~9年为主的中周期波动。此外,围绕2~3年还存在一个作用相对较弱的短周期波动。4、信息领域中的应用计算机软件和硬件的飞速发展对时间序列分析的发展产生了巨大的影响,与计算机结合研究复杂数据的处理方法正成为时间序列研究的热点,我国学者在算法领域,非线性时间序列分析方面得到了一系列成果。孙枫等利用混沌序列的遍历性,给出了一种分组密码置换网络的设计,并对混沌序列的遍历性和置换网络的时间复杂度做了分析。计算机模拟结果显示,混沌分组密码置换网络具有复杂性高、抗破译性强的优点,可以增强信息系统的安全性。邹小平等分析了数字散斑时间序列相关方法中由于参考平面沿Z轴方向平移而引起的散斑场的平移和缩放,并进行了计算机模拟,得出了决定参考平面间距选取的因素。该分析的结果有助于确定数字散斑时间序列相关系统的设计参数,以及系统校准过程中参考平面间距的确定原则,为系统设计提供理论依据和技术方案。邓自立等提出了一种正向固定区间稳态Kalman平滑新算法和两种反向固定区间稳态Kalman平滑新算法,并给出了保证算法最优性的最优初值公式。金友渔研究了对由若干个Logistic混沌或非混沌序列叠加过程形成的有成因联系的多变量时间序列的弱信号进行高精度复原的分解模型和算法,通过数字仿真分析表明该分解模型和算法对Logistic混沌或非混沌序列弱信号具有高精度地复原的性能。5、商务中的应用翁宜慧等以商务流通中的经济时间序列数据为对象,设计实现了经济时间序列预测系统。在预测系统中采用了多种预测模型,设计实现了包括指数平滑算法、AR(AutoRegression)算法、Holt-Winter算法、回归分析算法在内的各种统计学算法,并且把神经网络引入到时间序列预测系统的模型中,采用动态学习的BP(BackPropagation)神经网络进行训练预测,取得了很好的实用效果。周春光等以商务流通中的经济时间序列数据为对象,设计实现了经济时间序列预测系统。在预测系统中采用了多种预测模型,设计实现了包括指数平滑算法、AR(AutoRegression)算法、Holt-Winter算法、回归分析算法在内的各种统计学算法,并且把神经网络引入到时间序列预测系统的模型中,采用动态学习的BP(BackPropagation)神经网络进行训练预测,取得了很好的实用效果。6、在抗击非典中发挥了巨大作用数理统计学专家方兆本教授领导的课题组基于全球公开发表的有关SARS确诊病例、疑似病例和死亡病例的实际数据,建立起有关流行病学的空间统计模型,并根据空间流行病学规律的统计研究预测,预测值结果基本吻合。研究还取得了其他一些重要成果:根据华北地区(包括北京、天津、河北、山西等省市)在2003年4月28日到5月28日公开发布的疫数据,建立了华北地区SARS扩散的非齐次空间Poisson过程模型,由于考虑了超级传染者出现的随机因素,使模型更加符合实际情况;建立了北京地区实施严格的切断传染途径措施之后的SARS流行的控制模型,估算了相应的感染强度函数和刻画疾病聚集程度的参数,这也与实际情况基本吻合;采用boltzman非线性曲线拟合方法估算出病死率。三、结论及几点建议虽然我们在时间序列研究领域取得了长足的进步,但是基础领域的研究状况仍不为乐观,主要体现在整体研究水平不高,国际领先成果往往集中于个别院校甚至个别人,这与国际研究趋势不符。应用领域也存在分析工具的滞后性,一些最新成果还没有得到及时的应用。加大对基础研究的投入力度,重点扶持几个方向,使之达到国际先进水平。加大学科人才及师资培养力度,采取派出去请进来的办法,加速与国际接轨的步伐。更多地引进国外先进的教材,目前时间序列方面的教科书仍比较匮乏,本科教材更为严重。我们应该多开展与国外的学术交流,及时地吸收国外最新成果。参考文献:[1]向书坚.20世纪90年代时间序列预测领域主要研究动态[J].中南财经大学学报,2001(2)[2]汪同三主编.数量经济学前沿[M].社会科学文献出版社,2001[3]刘金全,范剑青.中国经济周期波动的相关性和非对称性研究[J].经济研究,2001(5)[4]钱争鸣.ARCH族计量模型在金融市场研究中的应用[J].厦门大学学报(哲学社会科学版),2000(3)[5]沈根祥.股票收益随机波动模型研究[J].中国管理科学,2003(2)[6]李刚,汪寿阳,于刚,阎洪.牛鞭效应与生产平滑模型有效性问题[J].管理科学学报,2004(1)(作者单位:中南财经政法大学信息学院)