对“中国石化”股票价格的预测吴武陵(湖南科技学院数学与计算科学系湖南永州425100)摘要:主要采用ARMA模型对“中国石化”股票的发展规律进行了研究.通过对“中国石化”股票2006年11月到12月两个月中30天收盘价格进行实证分析,建立一个股票价格走势规律的统计预测模型ARIMA(1,1,0).最后,利用该模型对“中国石化”股票价格走势进行了预测。关键词:中国石化股票价格;时间序列分析;ARIMA模型;SPSS11.5系统PredictionontheStockPriceofSinopecWuWuling(DepertmentofMathsmaticandComputationalScience,HunanUniversityofScienceandEngineering.Yongzhou,425100,Hunan)Abstract:Inthispaper,weadoptprimarilytheARIMAmodelandstudythedevelopedlawofthestockofSinopec.Byanalysisingthepriceof30daysofSinopecthatoccuredfromNovembertoDecemberin2006,weestablishastatisticalpredictionmodelthatreflectsthelawofstockprice,whichwecallARIMA(1,1,0).Finally,bythemodel,wepredictthetrendofthestockpriceofSinopec.Keywords:thestockpriceofSinopec,Timeseriesanalysis,ARIMAmodel,SPSS11.5system一.引言股票市场是一个复杂的非线形系统,市场受到来自政治,社会,经济,心理等方面的影响,因而对其运动行为很难建模。但是,正如技术分析所假设的“市场是有趋势可循的,市场价格反映了一切,历史往往会重演”,这也就是说明尽管复杂,但市场还是隐含着某些规律性。股价的历史轨迹形态对未来价格趋势特别是短期趋势有着重要的预测价值。这不仅得到市场上许多技术分析者的支持而且一些研究结果也证实了这一点。然而基于技术分析的投资者,特别是一些经验不足的投资者在利用形态理论进行投资操作时结果却往往不尽人意。原因主要在于:1传统形态分析理论往往比较“机械”,所有股票套用的是一些相同的形态模式,而事实上,各种股票都有其自身运动规律,对价格趋势具有预测作用的形态表现是不尽相同的,2识别股价序列形态往往有一定困难,常常出现因人而异的现象。不同人对形态的识别有不同的看法,因此交易失败的原因即使是理论的缺陷,投资者也往往归咎与自身对形态的误判,从而可能重蹈覆辙。3许多形态在初期难以识别,而一旦形态分明时,往往已经错过最佳交易时机,大大影响投资效果。因此,具有自动识别股价形态,并及时发出交易信息的自动交易系统已被许多投资机构采用。但是现有系统往往基于固定的形态模式,而较少考虑投资者在长期的投资实践过程中获得的经验和直觉对交易规则发现的作用,事实上,市场上很多投资分析者经过在股市浪潮中的搏击经验,积累了不少体会和发现,对股价形态往往有着自己独特的见解和偏好。但遗憾的是,并没有系统能将其经验提升为规则。事实上以投资者经验为指导,个性化地挖掘出股市中隐藏的,具有规律性,令人感兴趣的规则是很有意义的。股票价格的形成机制是一个很有吸引力的研究课题。从市场方面来看它受一般投资人买卖股票决策的影响,从上市公司方面来看,公司发展变化的不确定性也会对股票几个产生相当大的作用,再有政府行为(如关于股票市场政策的变化)和投资机构违规炒作都会对股市形成巨大的冲击,本文的目的在于试图找到一种较为理想的模型可以以一定的精确度来描叙现实股票市场价格波动的现象,并得到一些有意义的结论。笔者以下分析ARIMA模型,然后对它们的可行性进行实证分析。二.模型简介通常,在某些季节性时间序列中不仅含有季节性成分,还有非季节性成分.若单一用季节性或非季节性ARIMA模型进行拟合和预测,本文采用ARIMA(p,d,q)模型(1)ARIMA模型三种基本形式:自回归模型(AR:Auto-regressive),移动平均模型(MA:Moving-Average)和混合模型(ARMA:Auto-regressiveMoving-Average)。①自回归模型(AR)由于经济系统惯性的作用,经济时间序列往往存在着前后依存关系。最简单的一种前后依存关系就是变量当前的取值主要与其前一时期的取值状况有关。用数学模型来描述这种关系就是如下的一阶自回归模型:Xt=φXt-1+εt常记作AR(1)。其中{Xt}为零均值(即已中心化处理)平稳序列,φ为Xt对Xt-1的依赖程度,εt为随机扰动项序列(外部冲击)。如果Xt与过去时期直到Xt-p的取值相关,则需要使用包含Xt-1,……Xt-p在内的p阶自回归模型来加以刻画。P阶自回归模型的一般形式为:Xt=φ1Xt-1+φ2Xt-2+…+φpXt-p+εt为了简便运算和行文方便,我们引入滞后算子来简记模型。设B为滞后算子,即BXt=Xt-1,则B(Bk-1Xt)=BkXt=Xt-kB(C)=C(C为常数)。利用这些记号,上式可化为:Xt=φ1BXt+φ2B2Xt+φ3B3Xt+……+φpBpXt+εt从而有:(1-φ1B-φ2B2-……-φpBp)Xt=εt记算子多项式φ(B)=(1-φ1B-φ2B2-……-φpBP),则模型可以表示成φ(B)Xt=εt例如,二阶自回归模型Xt=0.7Xt-1+0.3Xt-2+0.3Xt-3+εt可写成(1-0.7B-0.3B2)Xt=εt②滑动平均模型(MA)有时,序列Xt的记忆是关于过去外部冲击值的记忆,在这种情况下,Xt可以表示成过去冲击值和现在冲击值的线性组合,即Xt=εt-θ1εt-1-θ2εt-2-……-θqεt-q此模型常称为序列Xt的滑动平均模型,记为MA(q),其中q为滑动平均的阶数,θ1,θ2…θq为参滑动平均的权数。相应的序列Xt称为滑动平均序列。使用滞后算子记号,(2.1.4)可写成Xt=(1-θ1B-θ2B2-……-θqBq)qt=θ(B)εt③自回归滑动平均模型如果序列{Xt}的当前值不仅与自身的过去值有关,而且还与其以前进入系统的外部冲击存在一定依存关系,则在用模型刻画这种动态特征时,模型中既包括自身的滞后项,也包括过去的外部冲击,这种模型叫做自回归滑动平均模型,其一般结构为:Xt=φ1Xt-1+φ2Xt-2+……+φpXt-p+εt-θ1εt-1-θ2εt-2-……-θqεt-q简记为ARMA(p,q)。利用滞后算子,此模型可写为φ(B)Xt=θ(B)εt(2)时间序列模型的平稳性、可逆性和传递性首先介绍两个概念。序列的传递形式:设{Yt}为随机序列,{εt}为白噪声,若{Yt}可表示为:Yt=εt+G1εt-1+G2εt-2+……+Gkεt-k+……=G(B)εt且1kG,则称{Yt}具有传递形式,此时{Yt}是平稳的。系{Gk}称为格林函数。它描述了系统对过去冲击的动态记忆性强度。序列的逆转形式:若{Yt}可表示为:εt=Yt-π1Yt-1-π2Yt-2-……-πkYt-k-……=π(B)Yt且1k,则称{Yt}具有逆转形式(或可逆形式)。①MA模型ⅰ.MA模型本身就是传递形式。ⅱ.MA(q)总是平稳的(由上一章的例),MA(∞)在系数级数绝对收敛的条件下平稳。ⅲ.MA(q)模型的可逆性条件。先以MA(1)(Yt=εt-θ1εt-1)为例进行分析。MA(1)的可逆性条件为:11。如果引入滞后算子表示MA(1),则Yt=(1-θ1B)εt,可逆条件11等价于θ(B)=1-θ1B=0的根全在单位圆外。对于一般的MA(q)模型,利用滞后算子表示有:Yt=(1-θ1B-θ2B2-……-θqBq)εt=θ(B)εt其可逆的充要条件是:θ(B)=0的根全在单位圆外(证明见Box-Jenkins,P79)。在可逆的情况下,服从MA(q)模型的序列可以表示成无穷阶的AR模型:θ-1(B)Yt=εtMA(q)的可逆域:使θ(B)=0的根全在单位圆之外的系数向量(θ1,θ2,……,θq)所形成的集合。例:求MA(2)的可逆域。解:由2211ttttY,其特征方程为:01)(221BBB该方程的两个根为:2221112422211224由二次方程根与系数的关系,有2121221,1当MA(2)平稳时,根的模21与都必须大于1,因此必有:11212由根与系数的关系,可以推出如下式子:)11)(11(12112)11)(11(12112由于21、是实数,21与必同为实数或共轭复数。又因为1i,因此011i故121)11)(11(121反之,如果12,且112。那么从11212可以推出至少有一个1i,例如,假设11,则根据1)11)(11(121可推出0)11)(11(21,由0111可以推出0112,从而12。因此,01)(221BBB的根在单位圆之外。(平稳域为一三角形)。②AR模型ⅰ.AR(P)模型本身就是一种逆转形式。平稳性。ⅱ.先以AR(1)(Yt=1Yt-1+εt),进行分析。AR(1)平稳的条件为11,它等价于(B)=1-1B=0的根在单位圆外。ⅲ.在平稳的情况下,AR(1)有传递形式:(1-1B)Yt=εtjtjjttBY01111一般地,对于AR(P)模型:(B)Yt=εt,序列{Yt}平稳的充要条件是:(B)=0的根全在单位圆外。此时,Yt有传递形式:Yt=-1(B)εtAR(P)的平稳域:使(B)=0的根全在单位圆外的AR系数向量(1,2,……,p,)的全体形成的集合。练习:求AR(1)与AR(2)的平稳域。③ARMA(p,q)模型ⅰ.平稳性与传递形式首先考察ARMA(1,1)的平稳性:Yt–φ1Yt-1=εt–θ1εt-1Yt平稳︱φ1︱<1(与AR(1)的平稳域相同)此结论表明,ARMA(1,1)序列的平稳性仅与自回归系数有关,而与滑动平均系数无关。而且平稳条件与AR(1)的平稳条件相同。在平稳的条件下,Yt有上述形式的传递形式。一般地,服从ARMA(p,q)模型的序列Yt平稳的充要条件是:φ(B)=0的根全在单位圆外。在平稳的条件下,Yt有传递形式Yt=φ-1(B)θ(B)εtⅱ.可逆性对于ARMA(1,1),假定可逆形式为εt=π(B)Yt=(1–π1B–π2B2–…–πkBk–…)Yt代入ARMA(1,1)的滞后算子表示形式,采用类似前面的方法,比较同次冥系数可得εt=Yt–(φ1–θ1)Yt-1–θ1(φ1–θ1)Yt-2–…–θ1k-1(φ1–θ1)Yt-k–…根据前面的定义(可逆性定义),应有︱φ1︱<1。因此,ARMA(1,1)可逆的条件是︱φ1︱<1,它仅与滑动系数有关,而与自回归系数无关。而且可逆条件与MA(1)的可逆条件相同。一般地,服从ARMA(p,q)模型的序列Yt,其具有可逆性的条件是:θ(B)=0的根全在单位圆外。在可逆的条件下,Yt的逆转形式为εt=θ-1(B)φ(B)Yt(3)ARIMA(p,q)模型简介若有平稳零均值随机序列{Xt}及白噪声序列{αt}[2],满足Xt-φ1Xt-1-…-φpXt-p=αt-θ1αt-1-…-θqαt-q(1)引入后移算子B,记Φ(B)=1-φ1B-φ2B2-…-φpBpΘ(B)=1-θ1B-θ2B2-…-θqBq则式(1)又可写为XtΦ(B)=αtΘ(B)(2)若Φ(B)=0与Θ(B)=0的根都在单位圆外,则