1基于ARMA模型的上证指数预测的实证报告引言生活中有很多问题都可以看成是时间序列问题,例如银行利率波动、股票收益率变化以及国际汇率变动等问题。所谓的时间序列问题,是指某一统计对象长时间内的数值变化情况。在实际应用中,经常会遇到许多不满足平稳性的时间序列数据,尤其是在经济、金融等领域。因此,能否有效地挖掘非平稳时间序列的有用信息,对于解决一些经济、金融领域的问题显得尤为重要。目前关于预测股票价格的研究文章有很多,这些已有研究大都采用回归分析、组合预测等方法对股票价格未来变动值进行探讨,得出股票价格在未来短期内的变化趋势及预测值,但预测结果并不非常精准,存在较大的误差。𝐴𝑅𝑀𝐴模型不仅可用于拟合平稳性时间序列问题,而且对非平稳时间序列问题同样具有良好的拟合效果,尤其是在金融和股票领域应用最为广泛。本文主要针对2016-04-18至2017-03-15(共计222个工作日)期间上证综合指数每日收盘价数据,建立上证综合指数每日收盘价预测模型,采用𝐴𝑅𝑀𝐴模型对上证综合指数每日收盘价进行高精度的拟合预测。研究结果表明,上证综合指数每日收盘价在短期内将保持平稳上涨,不会有大幅涨跌的情况。研究上证综合指数每日收盘价的短期变动情况了解股票市场变化及制定投资决策具有现实意义,能够为投资者和决策者提供可靠的信息服务及决策指导。1𝑨𝑹𝑴𝑨模型的理论介绍及平稳性检验1.1𝑨𝑹𝑴𝑨(𝒑,𝒒)模型建模流程1)时间序列的预处理,用𝐴𝑅𝑀𝐴(𝑝,𝑞)模型预测要求序列必须是平稳的,若所给的序列是非平稳序列,则必须对所给序列做预处理,使其为平稳非白噪声序列。2)计算出样本自相关系数和偏自相关系数的值。3)根据样本自相关系数和偏自相关系数,选取适当的𝐴𝑅𝑀𝐴(𝑝,𝑞)模型进行拟合。24)估计出模型中的未知参数。5)检验模型的有效性,如果拟合模型通不过检验,转向步骤3,重新选择模型再拟合。6)模型优化:如果拟合模型通过检验,仍然转向步骤2,充分考虑各种可能,建立多个拟合模型,从所有通过检验的模型中选择最优模型。7)利用拟合的模型,预测序列的将来走势。1.2𝑨𝑹𝑴𝑨模型的理论介绍1)𝐴𝑅模型是指利用以前的观察值和当前的干扰值并通过一定的线性组合来进行预测与分析。𝐴𝑅模型的数学公式为:𝑦𝑡=𝜙1𝑦𝑡−1+𝜙2𝑦𝑡−2+⋯+𝜙𝑝𝑦𝑡−𝑝+𝘀𝑡(1)式中:𝑦𝑡为一个平稳时间序列,𝜙𝑖(𝑖=1,2,…,𝑝)表示𝐴𝑅模型的待定系数,𝑝表示𝐴𝑅模型的阶数,𝘀𝑡为误差。2)𝑀𝐴模型是利用以前的干扰值和当前的干扰值并通过一定的线性组合来进行预测。𝑀𝐴模型的数学公式为:𝑦𝑡=𝘀𝑡−𝜃1𝘀𝑡−1−⋯−𝜃2𝘀𝑡−2−𝜃𝑃𝘀𝑡−𝑃(2)式中:𝑦𝑡为一个平稳时间序列,𝜃𝑗(j=1,2,…,p)表示𝐴𝑅模型的待定系数,𝑝表示𝐴𝑅模型的阶数,𝘀𝑡为误差。3)𝐴𝑅𝑀𝐴模型:是由𝐴𝑅模型和𝑀𝐴模型组合而成,主要用于描述平稳随机过程,数学公式为:𝑦𝑡=𝜙1𝑦𝑡−1+𝜙2𝑦𝑡−2+⋯+𝜙𝑝𝑦𝑡−𝑝+𝘀𝑡−𝜃1𝘀𝑡−1−⋯−𝜃2𝘀𝑡−2−𝜃𝑃𝘀𝑡−𝑃(3)1.3𝑨𝑹𝑴𝑨模型的定阶方法一般而言,可以根据序列的自相关系数与偏自相关系数选择合适的模型。(1)若自相关系数为拖尾,偏自相关系数为𝑝阶截尾,则选择𝐴𝑅(𝑝)模型。(2)若自相关系数为𝑞阶截尾,偏自相关系数为拖尾,则选择𝑀𝐴(𝑞)模型。(3)若自相关系数和偏自相关系数都为拖尾,则选择𝐴𝑅𝑀𝐴(𝑝,𝑞)模型。如果难以确定𝐴𝑅𝑀𝐴模型的阶数,还可以通过𝐴𝐼𝐶准则来确定。1.4𝑨𝑹𝑴𝑨模型的平稳性检验——𝑨𝑫𝑭检验𝐴𝐷𝐹检验的基本思想:首先对3∆𝑢𝑡=𝑐+𝛿𝑢𝑡−1+∑𝛽𝑖∆𝑢𝑡−𝑖+𝘀𝑡𝑝−1𝑖=1(4)作回归,构造𝐴𝐷𝐹检验统计量:𝐴𝐷𝐹=𝛿̂𝑆(𝛿̂)(5)其中,𝑆(𝛿̂)为参数𝛿的样本标准差。计算出𝐴𝐷𝐹检验统计量后,查𝐴𝐷𝐹临界表,看是否可以拒绝原假设𝛿=0。若𝐴𝐷𝐹的绝对值超过𝐴𝐷𝐹临界值的绝对值,则不接受原假设𝛿=0;反之,则选择接受原假设𝛿=0,说明该序列非平稳。2上证综合指数每日收盘价的实证分析与预测查找上证综合指数每日收盘价的历史数据,时间区间是2016-04-18至2017-02-28,共有211个工作日作为样本内数据。主要是基于𝐴𝑅𝑀𝐴模型的建模理论,建立上证综合指数每日收盘价预测模型,研究上证综合指数每日收盘价的短期变动情况。2.1原始数据的平稳化处理图1上证指数每日收盘价历史数据图2历史数据𝐴𝐷𝐹检验结果从图1可以看出,上证综合指数每日收盘价在2016-04-18至2017-02-28期间内是非平稳的时间序列,对其进行𝐴𝐷𝐹检验结果如图2,检验统计量-1.081203都大于各临界值,可以认为历史序列在这些显著性水平下都是非平稳的。4图3一阶差分后序列图图4一阶差分后𝐴𝐷𝐹检验结果之后对原始数据取一阶差分(如图3),利用𝐴𝐷𝐹检验来检验差分后数据的平稳性,若𝐴𝐷𝐹检验结果未通过,则该一阶差分序列是非平稳的。𝐴𝐷𝐹检验结果如图4所示,𝐴𝐷𝐹检验统计量为-14.04583,其绝对值超过1%的显著水平下临界值-3.451630的绝对值,因此不接受原假设,一阶差分后的序列是平稳的。2.2利用自相关图与偏自相关图识别序列的模型形式由图5可知,一阶差分后序列的自相关图与偏自相关图的拖尾性显著,所以应该利用𝐴𝑅𝑀𝐴模型的建模理论建立模型,最后模型中的𝑝、𝑞值则需要利用𝑡值和𝐴𝐼𝐶准则加以确定。图6一阶差分后自相关偏相关图由图5可知:一阶差分后的相关图已经是白噪声过程了。因此选取如下4种𝐴𝑅𝐼𝑀𝐴模型进行比较,这4种模型分别是𝐴𝑅𝐼𝑀𝐴(1,1,1)、𝐴𝑅𝐼𝑀𝐴(1,1,2)、𝐴𝑅𝐼𝑀𝐴(2,1,1)及𝐴𝑅𝐼𝑀𝐴(2,1,2)。5图7𝐴𝑅𝐼𝑀𝐴(1,1,1)图8𝐴𝑅𝐼𝑀𝐴(1,1,2)图9𝐴𝑅𝐼𝑀𝐴(2,1,1)图10𝐴𝑅𝐼𝑀𝐴(2,1,2)根据上面4个模型的检验结果并结合𝐴𝐼𝐶准则和𝑡值这两项检验结果比较可得:𝐴𝑅𝐼𝑀𝐴(1,1,1)模型较好,因此可用𝐴𝑅𝐼𝑀𝐴(1,1,1)模型对原始数据序列进行建模及预测分析。2.3上证综合指数收盘价序列模型的建立与参数估计通过前面对模型的识别与选择,认为建立𝐴𝑅𝐼𝑀𝐴(1,1,1)模型是最佳的选择(上图7)。下面是该模型所对应的数学表达式:(1+0.472759L)𝑌𝑡=(1+0.542029𝐿)𝘀𝑡(6)2.4收盘价序列模型的残差检验如果一个残差序列是白噪声,则该残差序列中的有用信息已被提取完;反之,则说明还存在部分未被提取的有用信息,还需要对模型做进一步的改进;若残差序列的自相关系数均在随机区间内,则该残差序列是白噪声。残差序列的检验结果如图11所示:6图11残差相关图由图11可知:由于𝑃值都大于0.05,在5%显著水平上,该模型的残差序列为白噪声,因此可以确定该模型的拟合效果较好。2.5收盘价序列模型的预测分析图12样本内动态预测运用模型进行样本内预测如图12,预测较好。之后对上证综合指数2017-03-01到2017-03-17的收盘价进行短期预测。这13天中前11天为已知数据,后两天为预测数据,预测如图13:图13样本外预测7图14预测值3结论本文基于𝐴𝑅𝑀𝐴模型的建模理论,采用𝐴𝑅𝑀𝐴模型对上证综合指数日收盘价进行高精度的拟合预测和实证分析,研究上证综合指数日收盘价的短期变动情况。从原始数据可以看出,2016-04-18至2017-02-28(共有211个工作日)期间上证综合指数日收盘价总体上呈总体上升的趋势,但起伏较大。这主要是由于国内股市剧烈变动所致,可见国内的股票市场仍存在非常大的起伏和波动,尤其是短时间大范围的股价剧烈变动。基于本文所建立的𝐴𝑅𝐼𝑀𝐴(1,1,1)模型并对上证综合指数日收盘价进行拟合预测和分析,结果表明在未来一段时期内上证综合指数日收盘价小幅上升,但不明显。说明短期内上证综合指数日收盘价不会有大幅度增长。但从未来长期的整体趋势来看,上证综合指数日收盘价将会保持持续上涨。这可能的原因有:第一,政府出台一系列针对股市的宏观调控政策;第二,国民经济持续保持稳步增长。总之,𝐴𝑅𝑀�模型对预测非平稳时间序列数据具有很好的效果,同时结合𝐸𝑣𝑖𝑒𝑤𝑠软件进行𝐴𝑅𝑀𝐴模型的建立与求解,能够为投资者和决策者提供可靠的信息服务及决策指导。