【南方基金―刘治平】大数据时代下的量化投资

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1大数据时代下的股票量化投资南方基金数量化投资部总监刘治平21.中国A股有2570个上市公司2.2013年有1051只个股其收益率超额上证综指30%以上3.移动互联网时代每天股吧,微博,微信等关于股票信息铺天盖地4.人类过去4年信息的积累量等同于之前的总量5.深度调研的主动投资管理组合一般管理在30-50只左右股票6.受内幕交易打击力度的影响,基金经理调研公司可以得到的信息越来越有限结论:靠市场广度获取超额收益的投资方法将会有更好的市场份额上升机会大数据时代股市特征3任何没有投资边界条件限制的投资策略都是瞎扯淡!1.投资管理者必须顺应投资者的边界条件,持有时间耐心,收益波动等2.投资管理者必须顺应自己职业要求的边界条件,老板考察你的耐心等只有你非常非常牛的时候,而且有长期资金投资者的时候,再去弘扬巴菲特投资理念吧,否则必须面对市场的短期波动,而这种短期波动和经济,公司盈利经常没有任何关联,更多的和“心中的花”有关系,这就是行为金融4什么是心中的花?市场的噪音严重影响人们的判断力!11.051.11.151.21.252009年9月2009年12月2010年3月2010年6月2010年9月2010年12月2011年3月2011年6月2011年9月2011年12月2012年3月2012年6月2012年9月2012年12月2013年3月2013年6月2013年9月2013年12月2014年3月2014年6月长期纯债基金收益5行为金融学在中国股市解释力更强我个人认为,下面三个认知偏差对职业投资者影响最大1.信息爆炸严重影响人的判断决定(informationoverload):开始时数据的增加会改善我们决断的质量,但随着数据信息的大量出现,人脑会停止接受大部分信息,而只会接受那些最容易从记忆里提出的信息。A.确认偏差(confirmationbias):选择性地消化那些支持自己论点的信息同时屏蔽不支持自己的信息B.可得性偏差(availabilitybias):决策时更倾向利用自己熟悉的,容易记起的信息6行为金融学在中国股市解释力更强我个人认为,下面三个认知偏差对职业投资者影响最大2.人脑会特别留意最近的信息(recencyeffect):人们会不由自主地对最新的事件更加警觉,而对历史稍长的事件淡忘。最近表现好的基金经理要比前几年的明星更受欢迎,最近好的投资方式更容易被人接受。对股市的走势判断更是特别受最近的事件影响。A.前后信息间隔时间越长,前面的信息在记忆中越模糊,从而使近期信息在短时记忆中更突出7行为金融学在中国股市解释力更强我个人认为,下面三个认知偏差对职业投资者影响最大3.绝大多数人做决定会以直觉代替统计,从无序中分析出有序的结论,这就是用“小数法则”来解读“大数法则”。比如硬币投掷,他们会觉得不论投掷的次数多少,头像朝上的概率都会接近50%。小数法则的最明显表现就是如果一个投资策略连续三年取得超越平均的业绩,那么这个策略就会得到“证明”而受到追捧看看下面哪个随机序列最不像随机的?A.0111100011110001100111001010B.1000000010101011100011010100C,1000001001000111011100000101D.01100101010101101001101001108大数据时代推进科学化投资---rulebasedinvestment1.行为金融学家推荐的办法就是有一套投资交易规则2.代表市场的指数就是有规则的投资模型,是最简单的模型。认同被动化的指数投资实际上就是认同量化投资3.优点:分散非系统性风险,对于基金经理依赖性低,工具属性强,管理成本低4.通常所谓的量化投资实际上是稍微复杂的rulebasedinvestment9大数据时代推进科学化投资---回测结果有多可靠?1.为什么人们对出色的基金短期业绩顶礼膜拜而对科学回测方法不屑一顾?2.量化方法不透明可能是最重要原因之一3.许多人以为回测结果是模拟,而不是对方法的检验4.理论基础都一样---过去好的表现将来有可能重复5.人们主观上愿意相信股神的意愿非常强10简单量化策略1:每年初,买入全市场所有股票,自由流通市值加权。买入价按前一天收盘价算起一年换仓一次。结论:从2006/1/12014/10/31,本模型累积收益率:330.78%,沪深300:171.62%这个回测结果有多少人相信?如果买入当时存在的40只股票型基金等权持有,会是什么样呢?这里给大家二个谁都可以去检验的简单量化模型11简单量化策略2:价值成长100:股票总分=50%行业内PE得分+50%行业内净利润同比增长率得分,每月取总分前100名构成等权组合。股票池:全市场剔除换仓当日停牌,PT股,ST股以及上市未满一年的股票。回测假设条件:85%股票仓位,15%仓位买债券放回购年收益率:4%,年管理费:1.75%,换仓按换仓当日均价成交,单边交易成本:0.5%此策略仅为非常简单的说明性策略,收益和稳定性与我们实际使用策略相比都很一般。但就算是这样一个简单的策略,除了由于仓位因素导致排名较低的大跌年08年,其余各年在主动型中P值排名最差也有P40的水准,7年平均水平位为P67。而我们实际使用的策略收益和稳定性都要远高于该简单说明性策略。这里给大家二个谁都可以去检验的简单量化模型12大数据时代复杂的科学化投资---i指数系列时间段大数据i100大数据i300巨潮A指沪深300深证100中小板指创业板指2010年38.3435.065.61-2.376.1325.5913.772011年-17.40-23.16-27.68-25.01-30.99-37.09-35.882012年16.3014.686.607.551.95-1.38-2.142013年83.8463.387.10-7.65-4.9017.5482.732014.7.3131.9624.258.560.87-1.25-0.592.94累计收益222.40141.58-5.35-26.65-29.87-8.9534.45注:创业板指2010年收益计算区间为2010年5月31日至2010年12月31日,其他指数2010年收益计算区间为2010年1月29日至2010年12月31日;13大数据时代复杂的科学化投资---i指数系列风险特征时间段大数据100等权大数据300等权巨潮A指沪深300深证100中小板指创业板指日收益率标准差1.501.491.371.351.471.521.88日均收益率0.1190.0920.004-0.019-0.0220.0030.047日收益率标准差年化23.7723.4921.7321.3823.1924.0029.79夏普比率7.355.64-0.28-2.04-2.06-0.362.06注:计算夏普指数时使用当前一年期定期存款利率3%,创业板指相关指标计算区间为2010年6月1日至2014年7月31日,其他指数相关指标计算区间为2010年2月1日至2014年7月31日。14样本外表现---i指数系列时间段大数据i100大数据i300沪深300中证500创业板指2014.9.12-2014.12.1214.46%11.93%31.76%16.75%7.31%15新浪大数据分析•个股新闻数据数据分布数据说明新闻数据表每日的新闻ID、url,标题等信息新闻股票关联表每条新闻所对应的股票新闻每日点击量表每条新闻所对应的每日的点击量PV、UV等16指数编制框架ST剔除上市时间筛选财务指标初步筛选全部A股选样空间初筛股票池财务因子大数据因子市场驱动因子量化引擎指数成分股17指数编制细则•指数以2010年1月29日为基日,基日指数为1000•选样空间:非ST、*ST的A股;上市一年以上的股票•选股因子:财务因子+大数据因子+市场驱动因子•成分股数:100、300•指数定期调整与计算–月度调整,等权重因子,采用派氏加权法,根据下列公式计算实时指数等权重因子)样本股权数市价(样本股上一交易日收等权重因子样本股权数样本股实时成交价)(上一交易日收市指数=实时指数18为什么行为金融数据有用?•互联网时代之前,行为数据非常难得到,可靠性差•中国股市面临转型,热点主题投资频繁变化•中国股市目前阶段股市的短期表现博弈胜于基本面•头一次使用,以后效果会减弱,市场会反馈调整的19我们更相信投资方法,不是投资思想。量化投资就是把好的投资思想方法化20量化投资是关于团队量化投资是一项复杂的系统工程,它的成功依赖于团队成员之间的紧密合作。因其业务链条的严密性和逻辑的环环相扣,许多繁琐的细节实际上都是成功的关键。作为一种复杂的高智能投资方法,目前只有机构投资者才有竞争能力使用此方法。经过多年不懈的努力,我们已经建立了包含清洗整理过的上市公司财务数据库,因子库,回测平台,样本外跟踪分析平台在内的南方基金量化投资系统。我们相信,系统建设上的精耕细作为将来的收获奠定了坚实的基础。我们认为,不存在一种适合各种市场环境的投资秘籍,市场是会自身调节的。所以我们不包装个人明星基金经理,而是要打造一个稳定的高效投资团队,通过向市场学习,不断地研究创新才是我们团队的制胜之道。21量化投资方法1、股票量化投资是一种投资方法,不是投资理念,投资模型,它与传统股票投资理念并不冲突。传统投资的核心就是通过分析公司找到便宜和低估以及良好成长性的资产;量化投资亦然,也是通过估值,成长等指标寻找市场的定价偏差。估值量化模型:各行业估值前10%成长量化模型:各行业利润成长前10%GARP模型:上述模型各50%22量化投资方法1、股票量化投资是一种投资方法,不是投资理念,投资模型,它与传统股票投资理念并不冲突。作为一种投资方法,量化投资的最大特点之一在于它的选股,交易,择时是完全建立在事前约定的规则下,它的每个决定不受基金经理的心理情绪影响。这一点非常重要,却不幸的是没有被众投资者认识到。导致投资成功的因素有许多,但导致失败的原因只有一个:没有控制好自我!最简单的有规则的投资方法是指数投资,而能长期打败指数的投资者却不是很多。代表市场的指数是最简单的rule-based投资方法23量化投资方法1、股票量化投资是一种投资方法,不是投资理念,投资模型,它与传统股票投资理念并不冲突。量化投资的这种事前约定的规则是建立在对此方法用历史数据回测的结果基础上的。历史数据越多,这一分析对将来的预测胜率会越大。中国股市历史非常短,跨市场代表性指数的历史更尤其短,典型地,沪深300指数产生于2005年,中证500指数产生于2007年。股市历史积累越长量化投资的有效性越好。许多人不相信量化模型的回测结果,但却对过去业绩表现好的基金经理独有情钟,其实他们的原理是一样的!过去的业绩和将来有关系吗?24我们的投资方法3、投资是对大量信息快速加工与预测的过程,大数据分析是量化投资的根本A.股票价格是对市场所有信息的预期价格的反映,A股市场2500只股票的大数据时代,能够运用大数据理念,快速处理信息,才能在市场上火眼金睛。和主动投资方法比较,量化投资是在广度上占据优势。B.量化投资是对投资方法的改进,是将科学的分析方法在投资实践中的应用。传统的投资方法可以看为钓鱼,量化投资是撒网捕鱼,投资方法也在从手工作坊向大数据分析的转变,是新的科学技术对传统行业的革新25我们的投资方法3、投资是对大量信息快速加工与预测的过程,大数据分析是量化投资的根本C.量化投资方法表现好的时间段,往往发生在有众多股票有表现行情的时候。比如2013年,有810只个股其当年收益率至少好于全市场指数30%以上!而2011年满足这样条件的只有77只股票。30%市场(万得全A)收益率超越市场的股票个数超越市场的股票占比超越市场的股票平均收益率2005/12/30-11.52%15412%42.88%2006/12/29111.90%26320%229.08%2007/12/28166.21%57842%316.33%2008/12/31-62.92%117

1 / 34
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功