基于数据挖掘的量化投资研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

基于数据挖掘的量化投资初探Contents量化投资和对冲基金简介基于SOM网络的股票聚类分析方法基于关联规则的板块轮动量化对冲的发展前景当前趋势——金融市场20世纪90年代以来,数学、金融、计算机及全球经济呈现融合趋势。——摘自Goodman和Stampfli的《金融数学》美国最聪明的人都在华尔街做对冲基金。——摘自丁鹏的《量化投资:策略与技术》当前趋势——大数据2012年10月的《哈佛商业评论》和2012年秋季的《MIT斯隆管理评论》都以“大数据”作为主题,畅想大数据时代的企业管理。众多学者和企业家得出的结论是:在未来,数据将会像土地、石油和资本一样,成为经济运行中的根本性资源。数据科学家被认为是下一个十年最热门的职业。资本市场投资的五个阶段1.投机者2.职业经理人3.学院派、科学化——标志:Markowitz投资组合理论4.量化投资5.对冲基金当前所处阶段金融市场传奇人物詹姆斯·西蒙斯连续20年,每年赚60%(为投资者获得超过35%的收益率),从来没有出现过亏损。沃伦·巴菲特连续40年,每年可以获得20%的复合稳定收益。大奖章基金历经数次金融危机。它在1998年俄罗斯债务危机,本世纪初的互联网泡沫和2008年的次贷危机期间,均获得了高额收益。宁夏卫视量化投资再成机构投资模式风潮证券资讯频道解读量化投资丁鹏量化投资视频1.基本面分析2.技术面分析3.量化投资传统方法特点:定量化、精确化三大主流投资分析方法简单来讲,量化投资就是利用计算机科技并采用一定的数学模型去实现投资理念、实现投资策略的过程。传统的投资方法主要有基本面分析法和技术分析法这两种,与它们不同的是,量化投资主要依靠数据和模型来寻找投资标的和投资策略。什么是量化投资?对冲基金对冲基金的英文名称为HedgeFund,意为风险对冲过的基金,起源于50年代初的美国。其操作的宗旨,在于利用期货、期权等金融衍生产品以及对相关联的不同股票进行买入卖空、风险对冲的操作技巧,在一定程度上规避和化解投资风险。对冲基金在一类对冲操作中,基金管理人首先选定某类行情看涨的行业,买进该行业几只优质股,同时以一定比率卖出该行业中几只劣质股。如此组合的结果是,如该行业预期表现良好,优质股涨幅必超过其他同行业的股票,买入优质股的收益将大于卖空劣质股的损失;如果预期错误,此行业股票不涨反跌,那么较差公司的股票跌幅必大于优质股,则卖空盘口所获利润必高于买入优质股下跌造成的损失。相对价值套利相对价值套利方向性策略方向性策略事件驱动策略事件驱动策略�股票市场(beta)(beta)(beta)(beta)中性策略•Alpha对冲•成对交易(PairsTrading)•新股长期弱势表现�可转化债券套利�统计套利:股指与ETF期现套利、跨期套利�兼并重组等特殊境况套利•买入被兼并公司同时卖空实施兼并公司的股票�困境投资•买入ST公司股票同时卖空同行业可比公司股票�股票多空头(EquityLong/ShortEquityLong/ShortEquityLong/ShortEquityLong/Short)•融资融券、杠杆交易、期权、选股能力�管理期货(ManagedFuturesManagedFuturesManagedFuturesManagedFutures)•CTAs、趋势、全球分散化、程序化交易、模型同质�全球宏观对冲:索罗斯、量子基金量化对冲的策略类型数据挖掘在量化投资中的应用1.基于SOM网络的股票聚类分析方法2.基于关联规则的板块轮动1981年芬兰Helsink大学的T.Kohonen教授提出一种自组织特征映射网(Self-OrganizingMap),简称SOM网,又称Kohonen网。Kohonen认为:一个神经网络接受外界输入模式时,将会分为不同的对应区域,各区域对输入模式具有不同的响应特征,而且这个过程是自动完成的。自组织特征映射正是根据这一看法提出来的,其特点与人脑的自组织特性相类似。自组织特征映射神经网络(SOM)自组织特征映射神经网络(SOM)SOM神经网络的拓扑结构由两层节点构成:输入层和输出层(竞争层)。SOM网的生物学基础生物学研究的事实表明,在人脑的感觉通道上,神经元的组织原理是有序排列。因此当人脑通过感官接受外界的特定时空信息时,大脑皮层的特定区域兴奋,而且类似的外界信息在对应区域是连续映象的。  对于某一图形或某一频率的特定兴奋过程,神经元的有序排列以及对外界信息的连续映象是自组织特征映射网中竞争机制的生物学基础。基于SOM网络的股票聚类分析方法①数据处理为了更好地说明问题而不受个别变量单位的影响,在聚类分析计算之前需要对原始数据进行标准化处理。基于SOM网络的股票聚类分析方法其中,i为股票上市公司的数量,j为上市公司的综合盈利能力指标;xij为标准化后的数据,为某指标的均值,Sj为某指标的均方差。jx基于SOM网络的股票聚类分析方法本案例所选取的数据来自于2005年80家上市公司的年报信息,分析上市公司的每股收益、每股净资产、净资产收益率、每股经营性现金流量及净利润5项反应上市公司综合盈利能力的指标作为主要研究对象。②实验结果基于SOM网络的股票聚类分析方法邻域函数:学习速率因子函数:)*001.01(*)1()(ttata−−+=τ)/exp(*)0()(GAPtntn−=在本案例中,选取的参数:n(0)=0.1a(0)=5=0.5迭代次数GAP=14τ基于SOM网络的股票聚类分析方法类别每股收益每股净资产净资产收益率每股经营性现金流量净利润90.222.497.640.478374.780.0121.91.16-0.081591.37-0.163.11-7.990.45-39936-0.322.16-31.4-1.14-714950.431.8965.70.087893240.630.46159.80.019121553-0.652.81-26.91.48-245522-3.1-5.1-109-0.045-442201-1.51.09-193.6-0.087-63583基于SOM网络的股票聚类分析方法上述实验结果表明,利用SOM网络进行股票分析所得结果基本与公司的实际情况相符,为股票的分析和选择提供了较好的依据。基于关联规则的板块轮动股票市场交易规律显示:在股价波动的过程中,整个市场并不是经常性地普涨普跌,而是呈现出板块轮动、涨跌不一的状况。其实金融风险并不可怕,如果能够发现股票板块的运动规律及其相互的联动关系,那么金融风险在一定程度上可以通过风险流动得以规避。基于关联规则的板块轮动本案例使用的数据,来自2007年1月4日至2008年3月31日A股市场的21个板块指数的日收盘值,取得295条日收盘数据记录共6195个观察值进行分析。基于关联规则的板块轮动这21个板块指数分别为采掘指数、地产指数、食品指数、金属指数、批零指数、石化指数、运输指数、制造指数、机械设备指数、服务指数、金融指数、水电指数、医药指数、建筑指数、造纸指数、IT指数、农林牧渔指数、纺织指数、传播指数、电子指数及木材指数。在进行关联规则挖掘之前,必须对所收集的数据进行预处理,转化为二进制数据。“1”代表上涨,“0”代表下跌。日期采掘指数地产指数食品指数金属指数2007-1-400002007-1-511112007-1-81111基于关联规则的板块轮动基于关联规则的板块轮动数据预处理后,根据股票板块指数“涨”、“跌”情况,采用二值型关联规则算法进行挖掘,这里采用Apriori算法来实施关联分析。设定置信度1-a的区间,可以从模型中找到许多有意义的强关联规则。例如,当金属、机械设备、石化3种指数上涨时,100%的情况下,制造指数也在上涨。基于关联规则的板块轮动基于关联规则的板块轮动——结论1.制造、石化指数作为关联规则的核心,与其他板块指数(除金融、地产、食品与传播4种指数之外)之间有着密切的关系。2.模型结果显示,金融、地产、食品与传播4种指数与其他板块指数不存在关联规则。•过去10年间,全球对冲基金资产规模年复合增长率超过15%,对冲基金数量年复合增长率近10%。•根据对冲基金研究公司(HedgeFundResearch,Inc.,HFR)报告,截止2011年底,全球对冲基金数量达9,523家,管理的总资产规模达2.02万亿美元。自2008年金融危机以来,全球对冲基金的年收益率为4.1%,波动率为8.5%;而全球股市只有0.4%的年收益率,但波动率却高达20.4%。量化对冲的发展前景•2011年底,国内阳光私募基金中量化对冲类产品不超过100亿元,券商集合理财的量化对冲产品规模不足50亿元。•对冲工具缺乏、融资融券渠道限制、政策监管严格、准入门槛过高等市场现状是阻碍国内对冲基金发展的主要因素。量化对冲的发展前景•2012年5月券商创新大会之后,证监会推出一系列新政,券商、基金资产管理业务的监管政策大松绑,期货公司资管业务也将开放,保监会也陆续推出13条新规以促进保险资管机构的转型。•各种金融衍生工具的推出、市场准入门槛的降低、投资范围的扩大、投资渠道的多样化等等,都将为量化对冲的蓬勃发展提供历史性机遇。量化对冲的发展前景对冲基金视频金价下滑重创对冲基金大鳄鲍尔森何为对冲基金华尔街对冲基金大鳄内线做多AMD股票

1 / 34
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功