时间序列课程结课论文学号、专业:1507201013数学姓名:李东升论文题目:基于AR(1)模型对上海证券B股指数进行预测分析指导教师:朱宁所属学院:数学与计算科学学院成绩评定教师签名桂林电子科技大学研究生2016年7月14日基于AR(1)模型对上海证券B股指数进行预测分析摘要:本文基于AR(1)模型对上海证券B股指数的日交易量对其进行分析后作一阶差分,然后在SAS软件的基础下运用ARIMA过程对数据分析,发现其自相关图1阶结尾,偏自相关图也是1阶结尾,于是对其使用ESTIMATION(p=1)和(q=1)过程进行分析发现AR(1)模型为1=0.08199xxttt略优于MA(1)模型,最后对其模型进行5期预测。关键词:上海证券自相关图差分SAS目录引言1研究现状..........................................................................................................11.1研究对象现状................................................................................................11.2所用方法研究现状........................................................................................11.3本模型研究的意义和重要性.......................................................................12理论基础2.1方法................................................................................................................22.2软件基础........................................................................................................33实证研究3.1数据来源与特征分析...................................................................................43.2数据的预处理..............................................53.3模型的建立、求解与分析...........................................................................63.4小结................................................................................................................74模型优缺点......................................................................................................85总结与展望......................................................................................................9参考文献................................................................................................................9附录..................................................................................................................1011引言时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。时间序列法是一种定量预测方法,亦称简单外延方法,在统计学中作为一种常用的预测手段被广泛应用。时间序列分析在第二次世界大战前应用于经济预测。二次大战中和战后,在军事科学、空间科学、气象预报和工业自动化等部门的应用更加广泛。1.1研究对象现状对股票的趋势进行预测的方法有传统的基于数理统计的时间序列方法,也有近代的神经网络、遗传算法、遗传推理等,这些方法都有自己的优缺点,本文基于ARMA模型进行对数据进行分预测,得到较好拟合。1.2所用方法研究现状ARMA模型的全称是自回归移动平均(autoregressionmovingaverage)模型,它是目前最常用的拟合平稳序列模型。它又可以细分为AR模型(autoregression)、MA(movingaverage)和ARMA模型(autoregressionmovingaverage)三大类。2010年李惠在《ARMA模型在我国全社会固定资产投资预测中的应用》[2]中,通过1980-2007年我国全社会固定资产投资的相关数据,运用统计学和计量经济学原理,从时间序列的定义出发,运用ARMA建模方法,将ARMA模型应用于我国历年全社会固定资产投资数据的分析与预测,检验得出ARIMA(4,4)模型为最佳。2007年靳宝琳和赫英迪在《ARMA模型在太原市全社会固定资产投资预测中的应用》[3]一文中采用SAS软件系统中的时间序列建模方法对太原市的固定资产投资总额资料进行了分析,建立了ARMA模型。结果显示ARMA(2,3)模型提供了较准确的预测效果,可用于未来的预测。1.3本模型研究的意义和重要性本模型研究的意义:随着大数据时代的到来,研究随时间变化的变量变得日趋重要。本模型研究的重要性:观察数据的特征趋势进行预处理后分析使用哪种模型,对选定的模型优化后对数据进行预测。22理论基础2.1方法ARIMA模型全称为差分自回归移动平均模型,简记ARIMA,是由博克思和詹金斯于70年代初提出的一著名时间序列预测方法,所以又称为box-jenkins模型、博克思-詹金斯法。其中ARIMA(p,d,q)[4]称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。①自回归模型AR(p)如果时间序列{ty}满足:tptpttyyy...11其中:t是独立同分布的随机变量序列,并且对于任意的t,E(t)=0,Var(t)=20,则称时间序列{ty}服从p阶自回归模型,记为AR(p)。②移动平均模型MA(q)如果时间序列{ty}满足:qtqttty...11则称时间序列{ty}服从q阶移动平均模型,记为MA(q)。q,,,21是q阶移动平均模型的系数。③ARMA(p,q)模型如果时间序列{ty}满足:tptpttyyy...11qtqt...113此模型是模型AR(p)与MA(q)的组合形式,记作ARMA(p,q)。当p=0时,ARMA(0,q)=MA(q);当q=0时,ARMA(p,0)=AR(p)。ARIMA(p,d,q)模型对于非平稳序列,经过几次差分后,如果能得到平稳的时间序列,就称这样的序列为单整序列。设ty是d阶单整序列,记作:ty~I(d)。如果时间序列ty经过d次差分后是一个ARIMA(p,d,q)过程,则称原时间序列是一个p阶自回归、d阶单整、q阶移动平均过程,记作ARIMA(p,d,q),d代表差分的次数。稳化处理。如果数据序列是非平稳的,则需对数据进行差分处理。对数据进行对数转换可以减低数据的异方差性。(3)根据时间序列模型的识别规律,建立相应的模型:①若平稳时间序列的偏相关函数是截尾的,而自相关函数是拖尾的,则可断定此序列适合AR模型;②若平稳时间序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定此序列适合MA模型;③若平稳时间序列的偏相关函数和自相关函数均是拖尾的,则此序列适合ARMA模型。(4)进行参数估计。(5)进行假设检验,诊断模型的残差是否为白噪声,并检验模型的估计效果。(6)进行预测。2.2软件基础随着计算机科学的高速发展,现在有许多软件可以帮助我们进行时间序列分析。常用软件有:S-plus,MATLAB,Gauss,TSP,EVIEWS,SAS。我们在本书中介绍和使用的软件SAS。SAS的全称是StatisticalAnalysisSystem,直译过来就是统计分析系统。他最早由美国北卡罗来纳州立大学的两位教授A.J.Barr和J.H.Goodnight联合开发的,专门进行数学建模和统计分析的软件。发展到今天,它不仅成为统计分析领域的国际标准软件,而且成为具有完备的数据访问,数据管理、数据分析和数据呈现功能的大型集成化软件系统。由于领先的技术和全面的功能,它已经成为全球数据分析方面的首选软件。3实证研究4数据来源于上海证券交易所,此次研究所观察的数据是近期995组上海证券综合B股日交易量,趋势如图所示:图一数据时序图3.1数据特征分析通过SAS软件对数据调用ARIMA函数进行分析发现数据不平稳但是通过白噪声检验,均值为97.79,便准差为26.73。图二原始数据的自相关图和白噪声检验5利用自相关图对时序图进行平稳性判别的标准是:平稳序列通常具有短期相关性,也就说自相关系数会随着延迟期数k的增加很快衰减向零。如上图所示自相关图显示序列自相关系数长期位于零轴的一边,这是具有单调趋势序列的典型特征,不是白噪声序列。3.2数据的预处理由原始数据时序图可知数据序列是非平稳的,则需对数据进行差分处理,再对数据进行差分处理时先对对数据进行对数转换可以减低数据的异方差性。图三进行对数转换后的数据时序图图四一阶差分后的时序图63.3模型的建立图五数据的自相关系数对一阶差分后的数据调用ARIMA命令进行观察其自相关系数和偏自相关系数,从而对模型进行定阶。图六偏自相关系数7观察差分后数据的自相关系数发现在1阶延迟自相关系数落在两倍标准误差之内,因此可以尝试使用AR(1)模型进行预测;同观察其偏自相关系数在1阶延迟自相关系数落在两倍标准误差之内,因此可以尝试使用MA(1)模型。3.4小结在SAS中对模型定阶采用AR(1)模型和MA(1)模型8AR(1)模型和MA(1)模型对其数据拟合所呈现的AIC和BIC差不多,但是MA(1)模型中显著性检验概率P值没有通过检验,预算选择AR(1)模型进行优化和预测。AR(1)模型:1=0.08199xxttt4模型的优缺点在小节中已经说到,根据自相关图可以运用MA(1)和AR(1)模型来进行预测,两种模型其实差不多,其优点是可以对数据进行近期准确预测,对于长期预测就不怎么准确。从模型的公式我们可以看到,用AR(1)模型对其进行5期预测其第一期的滞后值、第三期的随机扰动项密切相关。从参数估计值来看,与第一、三期的随机扰动项负相关。因此,在引导投资时要注意这一点,以免投资不当,影响经济发展收益。该模型在短期内预测比较准确,随着预测的延长,预测误差会逐渐增大。这也是模型的一个缺陷。但尽管如此,与其它的预测方法相比,其预测的准确度还是比较高的,尤其在短期预测方面。95总结与