基于人工智能的量化投资研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

基于人工智能的量化投资初探量化选股量化选股就是采用数量的方法判断某个公司是否值得买入的行为。根据某个方法,如果该公司满足了该方法的条件,则放入股票池,如果不满足,则从股票池中剔除。量化选股的方法1.公司估值法2.趋势法3.资金法量化选股采用基本面分析,“基本面决定价值,价值决定价格”根据市场表现,做出对应的投资行为追随市场主力资金的方向量化择时�量化择时就是利用数据模型来判断大盘的高点低点,从而进行波段交易的行为。�量化择时量化投资中难度最大的一个策略,所需要的数学工具也最为复杂。量化择时股市的可预测性问题与有效市场假说密切相关。如果有效市场理论或有效市场假说成立,股票价格充分反映了所有相关的信息,价格变化服从随机游走,股票价格的预测则毫无意义。量化择时从中国股票市场的特征来看,大多数研究报告的结论支持中国的股票市场尚未达到弱有效,也就是说,中国股票市场的股票价格时间序列并非序列无关,而是序列相关的,即历史数据对股票的价格的形成起作用,因此,可以通过对历史信息的分析预测价格。程序化交易�根据纽约证券交易所(NYSE)的定义,程序化交易是指包含15只股票以上、成交额在100万美元以上的一篮子交易。�程序化交易系统是指设计人员将交易策略的逻辑与参数在电脑程序运算后,并将交易策略系统化。算法交易�算法交易又被称为自动交易、黑盒交易或者及其交易,它指的是通过使用计算机程序来发出交易指令。�在交易中,程序可以决定的范围包括交易时间的选择、交易的价格,甚至可以包括最后需要成交的证券数量。算法交易算法交易1.被动型算法交易2.主动性算法交易3.综合性算法交易根据算法的主动程度,对算法进行分类。程序化交易与算法交易的比较�程序化交易更多强调的是订单是如何生成的,即通过某种策略生成交易指令,以便实现某个特定的投资目标。�算法交易更多强调的是交易的执行,即如何快速、低成本、隐蔽的执行大批量的订单。高频交易�高频交易(HFT)是一类特殊的算法交易,它是利用超级计算机以极快的速度处理市场上最新出现的快速传递的信息流(包括行情信息、公布经济数据、政策发布等),并进行买卖交易。�这种交易的速度非常快,以至于有些交易机构将自己的“服务器群组”(serverfarms)安置到了离交易所的计算机很近的地方,以缩短交易指令通过光缆以光速传播的距离。�人工智能(ArtificialIntelligence,AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。�人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的、能以人类智能相似的方式做出反应的智能机器。人工智能简介1.机器学习2.自动推理3.专家系统4.模式识别5.人工神经网络6.遗传算法人工智能简介人工智能领域的研究人工智能在量化投资中的应用模式识别短线择时RBF神经网络股价预测基于遗传算法新股预测�一般而言,对于股票较长时间的趋势判断难度很大,但对于短期趋势,投资者收集信息的方式及反映信息的方式有助于判断趋势。�投资者的预期通过市场的交易价格进行体现,在非有效的市场中部分知情交易者可以提前对未来行情进行研判,依此获取超额收益。模式识别短线择时知情交易者基于其信息优势很可能在当日的最后交易时段对第二日提前布局,所以最后交易时段价格的波动比其余时段包含了更多预期因素,更可能预示第二日的行情演绎。挖掘这些信息我们可以进行短线择时判断,这些择时判断可开发成短线交易策略。模式识别短线择时尽管半小时内交易数据的量比较大,通过观察不难发现,实际上这一时间段内的股票价格是由少量的趋势及转折构成的。如果可以提取出几个趋势的转折点,就可以以少量的数据描述这段时间的价格行为模式。模式识别短线择时模式识别短线择时2012年7月19日和7月20日2012年10月18日和10月19日①决定需要提取的特征点数量,把开盘后一分钟的价格及开盘后半小时的价格作为初始特征点。②把所有找到的特征点按顺序连接起来,构成一个简单的走势图。③把简化后的走势图与原走势图比较,寻找两者之间差异最大的点,作为新的特征点。④如果达到预设的特征点数量,即停止,否则从步骤(2)开始重复。模式识别短线择时通过以上的步骤,可以只用少量的点来描述开盘半小时内的股票价格走势。下一步就是把需要判断的那一天的价格走势与之前的价格走势放在一起做模式匹配,如果发现若干天的开盘模式与我们需要判断的相同,那么再看匹配的这几个交易日的涨跌情况,把涨跌出现的频率作为今日涨跌概率的估计。模式识别短线择时�受相似程度预期驱动的价格序列,其波动的相似性将比较强,第二日的涨跌状态也应该比较相似。�历史上N个时间序列可以根据相似性进行分类,每个类别与该类别下第二日涨跌分布可以建立关联,那些第二日行情表现为大概率上涨的类别值得关注。模式识别短线择时对于时间序列的相似性度量,我们在两个维度上进行度量,分别是水平偏移相似性偏量和幅度相似性分量。(1)水平偏移相似性分量模式识别短线择时)exp(),(22YXYXuuYXσσα+−−=模式识别短线择时(2)幅度相似性分量我们可以采用价格序列相似性模式识别进行短线择时交易策略的开发。22222),)(exp(),(YXYYXYXσσσσσβ−−−=RBF神经网络股价预测径向基函数(RBF-RadialBasisFunction)神经网络是由J.Moody和C.Darken在80年代末提出的一种神经网络,它是具有单隐层的三层前馈网络。RBF神经网络股价预测①对样本数据进行预处理。②用聚类算法确定RBF网络的中心。③用梯度下降法对每一个训练样本多次迭代训练RBF网络的输出层权值。④对股价进行实时学习式预测。RBF神经网络股价预测�由于股票市场不确定因素太多,政策、庄家操控、投资者的盲目任意性等,股票价格预测的难度很大。�利用径向基函数神经网络进行股票价格预测,对股票价格的短期预测能够取得较好的效果。基于遗传算法新股预测新股上市价格(首日的收盘价)预测方法的研究具有重要的理论和实践意义。新股上市价格1.上市公司情况2.投资环境基于遗传算法新股预测上市公司情况1.上市日总股本2.发行股数3.上市流通比率4.上市前一年度净资产收益率5.上市前一年度净资产收益率增长6.当前年度净资产收益率基于遗传算法新股预测同时,这里采用中国大陆同类股票上市时纳斯达克综合指数在前1个月、4个月和1年这3个阶段的涨跌幅作为金融市场短期、中期和长期投资氛围的表现。基于遗传算法新股预测将以上各指标作为输入,可以预测新股上市首日的收盘价。基于遗传算法新股预测股票名称当日收盘价/元预测价格/元预测误差(%)网易12.12512.0031.0搜狐13.00013.4863.7腾讯3.8503.7622.3九城23.62024.1072.1盛大16.33017.0134.2分众12.17012.2850.9E龙14.40014.6691.9百度122.540123.8671.1从上表我们可以得出,预测误差都在5%以内,平均预测误差为2.15%。从预测误差来看,本案例方法的预测结果是非常理想的。股市攻略:量化投资穿越牛熊(从3:05开始)BTV《财经5连发》——量化投资(播放至7:45)模拟炒股量化投资视频Thanks!Thanks!Thanks!Thanks!

1 / 33
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功