基于时间序列预测的股票交易决策建议系统

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

基于时间序列预测的股票交易决策建议系统蒋倩仪(中南林业科技大学计算机与信息工程学院湖南长沙410004)摘要对股票市场特征选择的相关问题进行了研究和讨论。根据震荡盒理论提出一种新的适应于与机器学习相结合的交易边界模型,通过结合基于距离的多核极限学习机(DBMK-ELM)与交易边界模型,构建基于时间序列预测的股票交易决策建议系统,使得在股票交易中能稳定获得较高的收益率并保持较低的投资风险。该系统可以快速地学习股市的历史数据,以适应快速更新的股票价格变化模式。0引言目前,能帮助人们获得丰厚投资回报的股票市场研究是投资金融领域的一个焦点问题。然而,由于股票市场本身是动态的、非线性的、无参的以及混沌的,对于股票价格时间序列的预测被认为是时间序列预测[1-4]的各种应用中最优挑战性的应用之一。由于还没有方法能够高精度地预测出股票未来的价格,而适当的交易策略可以减小预测误差带来的风险,所以一个强大的交易策略对于股票价格预测的应用而言非常关键。一个好的股票时间序列预测结果结合适当的交易策略,就可以构造出基于时间序列预测的股票交易决策建议系统,为投资者在股票市场中的决策提供合理的建议。股票的交易策略众多,考虑到在基于机器学习的股票价格时间序列的应用中交易策略主要用途之一是消除预测误差带来的影响,所以在此合适的交易策略应该是能够放松原来的预测问题使其对预测精度的要求减小。这种交易的策略中,典型的就是应用Darvas[5]提出的震荡盒理论。该理论最基本的思想是股票价格在一段时间内将有一个确定的震荡区间,即在这段时间内它能达到的最大值和最小值之间震荡。而这一段震荡的时间和价格区间构成的广义空间称之为震荡盒。界模型,构建基于时间序列预测的股票交易决策建议系统。具体而言,首先通过股票市场的历史数据来训练DBMK-ELM,并使用其预测股票在后续交易日中的价格;接着,基于一套规则来监测股票价格预测的准确性以及是否突破了交易边界;最后,根据由交易边界模型制定出的交易策略来做出交易决策。1相关工作1.2灰色相关度Deng首次提出了灰色相关度GCD(GreyCorrela-[6-9]。该方法在tionDegree)这一特征相关度计算方法许多领域得到了大量的应用。该方法用两个序列曲线几何形状的相似度来衡量两个序列的相关性。两个序列的几何形状越相似,则认为两个序列的相关性越大。考虑有n个样本中某一个特征构成的序列为F=[f1,f2,…,fn]以及样本标签构成的序列为T=[t1,t2,…,tn],则GCD的计算公式为:1.1震荡盒理论r(T,F)=1∑in=1r(ti,fi)(1)震荡盒理论是Darvas根据其长期在股市交易中其中:n的经验提出的。该理论最基本的思想是股票价格在一段时间内将有一个确定的震荡区间,即在这段时间内min|ti-fi|+ξmax|ti-fi|r(ti,fi)=|ti-xi|+ξmax|ti-xi(2)它能达到的最大值和最小值之间震荡。假设在这一段|式中,ξ∈(0,1)是控制相似显著程度的系数,通常设时间内股票价格最大值所处的边为盒子的顶部边界,置为0.5。r(ti,fi)是目标值T和特征F在点i出的灰色股票价格最小值所处的边为盒子的底部边界,时间段相关度。而r(T,F)则是目标值T和特征F整体的灰色的起始点和终点所处的边界分别为左边界和右边界,相关度。则在由这些边界构成的盒子中,股票价格上下震荡。交易边界模型因此Darvas在理论中称之为震荡盒。在震荡盒中,若1.3股票价格接近于底部边界,则其有上涨的趋势。反之,本文尝试结合震荡盒理论与机器学习,通过机器若股票价格接近于顶部边界,则其有下降的趋势。此学习来判别股票形势是否满足震荡盒理论的交易条外,当股票的价格突破盒子的顶部或底部边界时,它将[11-12]。然而,这样的尝试面临着震荡盒的位置确定件进入新的盒子并在其中开始新的震荡。在图1中展示的问题,即如何动态调整震荡盒的大小。如果使用大了典型的震荡盒的样例,交易者在股票价格处于一个小固定的震荡盒,则实际股票价格在所设置的震荡盒震荡盒中靠近盒子底部边界买入并在其靠近盒子顶部中的位置可能滞后于其实际所在震荡盒中的位置,这边界时售出,将获得丰厚的投资收益。然而,如何检测样会影响交易的时机。例如,如果设置震荡盒的宽度出股票价格是否接近盒子的边界并且是否不会突破边固定为30天,而实际股票在10天之后就已在一个新界是需要丰富的实际经验的,对一般投资者而言是一的更窄区间内震动(该区间包含在原震荡区间中),那项挑战性的工作。本文利用基于机器学习的时间序列么由于震荡盒的边界值固定为前10天的最大值和最预测方法来对盒子的边界进行预测,并通过制定的规小值,后20天的股价总无法接近盒子边界,即使有适则来检测股票价格是否有突破震荡盒边界的趋势。希合交易的时机也不会产生新的交易。为了解决这一问望通过自动化地学习股市交易模式,来减少投资者的题,本文在震荡盒理论的基础上提出了自动调整震荡投资风险并增加收益率。然而,这种结合存在着无法盒位置的交易边界模型,取消了震荡盒的宽度限制,仅动态调整震荡盒位置的问题,使得部分交易时机延误。仅保留震荡盒的交易边界。在交易边界模型中,震荡本文根据震荡盒理论提出一种新的适应于与机器学习盒理论的交易边界变化不再与时间相关,其交易边界相结合的交易边界模型,以此解决该问题。依据股票价格与现有交易边界之间的差异来改变。若定义交易边界模型中交易上边界值为Boundaryupper,下边界值为Boundarylower,当前股票价格为C,则边界值的更新分别为:Boundaryupper=CC-Boundarylower>ηBoundaryupper(3)C-Boundarylower<ηBoundarylower=CC-Boundaryupper>ηBoundaryupper(4)C-Boundarylower<η图1震荡盒样例图,,式中η是交易边界的差异系数该值根据股票价格震第4期蒋倩仪:基于时间序列预测的股票交易决策建议系统77荡的周期规律确定。当差异系数设置较小时,可以捕捉股票价格在较短时间较小振幅中的震荡。当差异系数设置较大时,反映的是股票价格在较长时间较大振幅中的震荡。2股票交易决策建议系统2.1系统结构本文提出的基于时间序列预测的股票交易决策建议系统结构如图2所示,主要由如下三部分组成。第一个部分是数据预处理部分,其中包括提取数据特征值、对关键特征进行选择以及计算各个特征的灰色相关度并对根据该值对特征进行加权处理;第二个部分是基于机器学习的股票价格时间序列预测部分,主要利用DBMK-ELM来学习股市历史数据的模式,并且对震荡盒在下一个时间阶段的上下边界进行预测;最后一个部分是交易策略部分,在上一部分预测值的基础上依据基于震荡盒模型的交易策略进行分析判断,最终做出交易决策。图2基于时间序列预测的股票交易决策建议系统结构图2.2数据预处理数据预处理作为本系统的第一个部分有着直观重要的作用,其目标是提取并选择合适的股市特征,进而对这些特征进行加权处理后以便在系统后续的基于机[13-14]器学习的股票价格时间序列预测部分使用。显然,特征对机器学习来说至关重要,一组好的特征会大大提高基于机器学习的时间序列预测精度,相反一组不合适的特征甚至会导致错误的预测结果。系统可以从股票市场中获取的原始数据包括每只股票历史上每一日的开盘价、最高价、最低价、收盘价、成交量。在本系统中使用股票的收盘价作为当天股票的价格使用,也是股票价格时间序列需要预测的值。这是因为股票的收盘价是一个股票在当天众多投资者博弈后的最终结果,对于预测和分析股票价格未来的走势具有指导意义。同时收盘价也是一天中波动的股票价格最终的确定值,是一种通用的衡量每日股票价格的指标值,股票的大多数经济学指标也都是通过历史收盘价计算而来。对于单一股票而言,只用上述五维特征对于未来价格预测不够充分,因为时间序列的走势并不是单纯的依赖于前一个状态,而是前多个状态导致的综合结果。例如,股市中股票价格在大幅度上涨之前,往往会在一个低价位持续多天震荡,以让庄家获得足够多的低价筹码从而在拉升上涨后获利。因此,需要通过多日的数据来提取某一日的股市特征。本系统除了使用了上述五维基本特征外还使用了股市中常用的几个经济学直指标来构建包含有多日股票价格信息的特征。具体而言,这些指标为移动平均线指标MA(MovingAverage),变动速率指标ROC(RateofChange),相对强弱指标RSI(RelativeStrengthIndex),慢速随机摆动指标(SlowStochasticOscillator)。其中慢速随机摆动指标中包括三个指标:SLOWK,SLOWD,FASTK。本文关注于时间序列预测技术在股票市场中的应用,上述[10]指标的含义以及计算方法可参考计量经济学中的相关内容,在本文中不再详述。同时,考虑到结合震荡盒模型后,本系统的预测目标是股票价格时间序列在后一时间阶段所处的盒子边界,因此在前一个时间阶段股票价格时间序列所处的盒子的上下量边界同样也被提取为特征。本系统使用股票在未来n天中的最高价Upi和最低价Lowi作为第i天的股价所处的未来的震荡盒的边界值,即式(5):Upi=max(Ci+1,Ci+2,…,Ci+n)(5)Lowi=min(Ci+1,Ci+2,…,Ci+n)股票第i天价格所处的之前的震荡盒的边界值为前n天的最高价UpHistoryi和最低价LowHistoryi,即式(6):UpHistoryi=max(Ci-n,Ci-n-1,…,Ci-1)(6)LowHistoryi=min(Ci-n,Ci-n-1,…,Ci-1)78计算机应用与软件2017年其中Ci表示股票在第i天的收盘价。由于经济学指标(2)DBMK-ELM可以充分利用多源数据并且在分类的计算与所选取的时间参数相关,参数不同可以导致和回归的精度上优于之前的多核学习方法;(3)DB-不同的指标。在通常情况下,指标的时间参数是根据MK-ELM在分类和归回问题上较传统的基于核的经验来确定的。但是一方面由于这些经验需要大量的ELM有更好的鲁棒性与更高的精度。积累,不是所有投资者都具备的。另一方面,根据经验2.5交易策略选取的参数并不一定能取得最优的结果。因此,本系本系统采用由震荡盒理论改进的交易边界模型来统中采用的方式是先使用不同时间参数生成大量的指制定交易策略。当时间序列预测的阶段得到了股票价标,然后使用特征选择的方法,让系统自适应地选出合格未来的预测值时,首先检测该预测值的预测误差是适的指标。通过这样的方式选取的指标特征被用于系否在可接受范围。检测的依据是股票市场中单只股票统下一步的预测之中。选出所需的特征后,为了进一每日的涨幅和跌幅均在10%以内。所以,设定一个小步体现特征的重要程度,提升重要特征的作用,本系统于10%的误差控制参数σ,当预测值与当日股票价格为每一维特征计算其与预测结果的灰色相关度。在后的差价与当日股票价格的比例小于σ时则认为预测值续的预测中,对每一维特征使用其灰色相关度加权处是可靠的,继续后续操作。否则认为预测值不可靠,当理后再作为输入特征进行预测。日不进行交易。通过该方法,有效地控制了预测误易时间序列预测2.3的类型为买入时,系统检测预测的股票价格是否接近在时间序列的预测上,本系统基于前Dtraining的交易边界且为上升趋势,即预测的股票价格大于当日股票历史数据来预测后D天的股票价格。在此,也称为的股票价格,若满足该条件,则给出买入建议。当等待股票时间序列预测的滑动窗口大小为Dtraining+D。交易的类型为售出时,系统检测预测的股票价格是否采用这种方法进行预测是由于股票交易模式在不同时接近交易边界且为下降趋势,即预测的股票价格小于期内是变化的,在滑动窗口内学习到的交易模式用于当日的股票价格,若满足该条件,则给出售出建议。滑动窗口中的数据预测被认为是可靠的,但超出这个与此同时,为了控制预测误差以及市场不确定性范围的预测则被认为是不可靠的。该窗口的大小也是导致的亏损额度,本系统设置了止损参数θ,当

1 / 10
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功