对冲基金策略技术——量化投资概念丁鹏介绍中国量化投资学会理事长《量化投资-策略与技术》作者《量化投资与对冲基金丛书》主编东航金控财富管理中心总经理3•传奇量化投资大师•量化投资的理论基础•十大对冲基金策略分析•量化对冲策略阐述•量化策略分析语言•量化投资支撑:IT系统•中国量化投资学会部门介绍大纲概述传奇的量化投资大师:西蒙斯詹姆斯·西蒙斯(JamesSimons)是世界级的数学家,也是最伟大的对冲基金经理之一大奖章基金连续20年,每年35%的净回报创立著名的Cherm-Simons理论2006年,西蒙斯被国际金融工程师协会评选为年度金融工程师。2007年,他个人盈利大概28亿美元2006年,他赚了17亿美元2005年是15亿美元。学数学的也能赚大钱传奇量化投资大师:大卫.肖Shaw于1980年在斯坦福获得博士学位,随后在哥伦比亚大学计算机系做老师1986年成立肖博士公司从事对冲基金业务,截至2009年7月管理230亿美元的资产(全球第四大对冲基金)他成立了一个研究实验室(),主要搞计算生物化学领域的超级计算机。学计算机的也能赚大钱传奇的量化投资大师:伊曼纽尔·德曼毕业于哥伦比亚大学,获理论物理学博士学位他曾是爱因斯坦、薛定谔、李政道等物理学巨匠的门徒1985年起加入著名投资银行高盛集团他参与创作了业界广为采用的布莱克-德曼-托伊利率模型和德曼-卡尼局部波动率模型于2000年当选国际金融工程师协会年度金融工程师2002年入选《风险》杂志名人堂。学物理的也能赚大钱传奇的量化投资大师:RayDalio上世纪70年代,年仅26岁的达里奥被一家从事零售经纪预算业务的公司炒鱿鱼后,在一套两居室里成立了桥水公司目前是世界最大的对冲基金公司,管理的资金约1400亿美元在市场惨淡的2011年斩获138亿美元自1975年成立迄今,PureAlpha基金总共已为投资者赚取了358亿美元的收益。失业了也可以成为伟大的对冲基金经理8•定义:量化投资就是以数据为基础,以策略模型为核心,以程序化交易为手段,以追求绝对收益为目标的投资方法•中医VS西医:传统投资VS量化投资)•优点一:赌大概率事件(以组合对冲为主)•优点二:克服人性弱点(以机器交易为主)•优点三:精力无限(监控全市场、全产品、全周期)•优点四:精细化交易(利用算法交易降低对市场的冲击)•量化投资是投资从艺术走向科学的必由之路部门介绍大纲量化投资是什么一个案例假设我们有一个不均匀的硬币,有51%的概率正面,49%会反面。选择我们赌注在下一次投掷中,若出现正面,我们盈利相应的bet,反面我们输掉所有的bet。那么,现在有两种策略:A:投掷一次,赌注1000;B:投掷1000次,每次赌注1;你会选A还是B?因为我们知道硬币是不均匀的,我们有2%的概率优势。现在我们来做一个统计的分析,计算下这两种策略的风险收益比一个案例1.期望收益:A:0.51*1000-0.49*1000=20;B:1000(1*0.51-1*0.49)=20可见,两种策略有相同的期望收益。2.全输概率:A:输掉全部资本的概率=0.49B:输掉全部资本的概率=0.49*0.49...*0.49=0.49^1000.B策略全输的概率远小于A策略一个案例3.风险评估A:stdev(1000,0,0,0...0)=31.6;B:stdev(1,-1,1,1,-1,...1)=1可见,A策略的标准差远大于A。4.夏普比例A:SR=20/31.62=0.63;B:SR=20/1=20可见,B策略的收益风险比远高于A策略投资的核心是大数定律金融市场的数学定义Y=F(x1,x2,…….xn)其中Y是金融市场的波动(涨跌/涨跌幅/伸缩/概率)Xi为一系列因子数学可以描述金融市场看做是一个函数逼近问题案例:Y=F(换手率=300%,成交量100亿)=10%其中Y表示涨幅如何进行函数逼近?人工神经网络/回归/….看成是一个分类问题案例:Y=F(换手率=300%,成交量100亿)=1其中:1表示涨,0表示跌如何进行分类模型的学习?决策树/贝叶斯分类/支持向量机看成是一个概率问题案例:Y=F(换手率=300%,成交量100亿)=90%其中:90%表示涨的概率如何计算概率?概率分布/随机过程看成是一个模式识别问题案例:出现右侧的图形时,未来的走势是涨还是跌?如何进行图形模式识别?分形理论/机器学习/小波分析现代数学理论在量化投资中大有用武之地策略分类相对价值策略宏观因素策略事件驱动策略BridgeWater保尔森鲍波斯特摩根大通安祖高顿齐夫资本文艺复兴科技贝莱德埃利奥特法拉龙低收益/低风险/大容量高收益/高风险/大容量高收益/低风险/小容量策略类型策略转换图低收益/高风险/低容量投资者大量撤出低收益/低风险/高容量高收益/低风险/低容量高收益/高风险/高容量高收益/低风险/高容量低收益/高风险/高容量低收益/低风险/低容量高收益/高风险/低容量投资者大量涌入投资者大量撤出策略的类型高收益率策略:(1)要么承担了较高的风险(2)要么牺牲了资金规模对于资产管理而言,高收益率策略不可能成为主导策略。20•“穷人要搏命,富人要稳定”•高净值客户不喜欢高风险策略•银行理财:20万亿;保险资金:5.7万亿;基金:3万亿;期货:几千亿•市场份额与风险度负相关。•目前券商和基金的相对收益产品,决定了客户群中高净值客户比例不大•只有实现绝对收益才能扩大市场份额部门介绍大纲绝对收益是未来的趋势21•阿尔法套利•股指期货套利•商品期货套利•期权套利•统计套利•另类套利部门介绍大纲主要量化对冲策略22•正向Alpha:构建多头股票组合,同时做空股指期货•反向Alpha:构建空头股票组合(融券),同时做多股指期货•核心策略:量化选股模型•包括:多因子、风格轮动、行业轮动、动量翻转、资金流、一致预期、趋势追踪、筹码理论•代表产品:PureAlpha部门介绍大纲Alpha套利23•股指期货套利是指利用股指期货市场存在的不合理价格,同时参与股指期货与股票现货市场交易,以赚取差价的行为。•股指期货套利分为期现套利,跨期套利,跨市套利和跨品种套利,其中期现套利和跨期套利这两种最主流的方式。•策略核心:冲击成本和保证金管理•目前市场机会稀少,需要高速的套利系统部门介绍大纲无风险套利——股指期货套利24•与股指期货套利类似,商品期货同样存在套利策略,在买人或卖出某种期货合约的同时,卖出或买入相关的另一种合约,并在某个时间同时将两种合约平仓。•商品期货套利主要有期现套利,跨期套利,跨市场套利和跨品种套利四种。•策略核心:计算持仓成本、现货组织•期货公司CTA产品将有大发展的机会部门介绍大纲商品期货套利——基本概念25•有别于无风险套利,统计套利是利用证券价格的历史统计规律进行套利,是一种风险套利,其风险在于这种历史统计规律在未来一段时间内是否继续存在。•统计套利的主要内容包括:股票配对交易、股指套利、融券套利和外汇套利。•策略核心:协整模型、主成分模型•随着转融通成行,未来统计套利空间巨大部门介绍大纲统计套利——基本概念26•期权的优点在于收益无限的同时风险损失有限,因此在很多时候,利用期权来取代期货进行做空,进行套利交易,会比单纯利用期货套利具有更小的风险和更高的收益率。•利用期权的各种组合,有多种套利方法,包括股票—期权套利、转换套利、跨式套利、宽跨式套利、蝶式套利和飞鹰式套利等。•策略核心:折溢价率•目前国内还没有机会部门介绍大纲期权套利——基本概念27•算法交易指的是通过使用计算机程序来发出交易指令的方法。•根据各个算法交易中算法的主动程度不同,可以把不同算法交易分为被动型算法交易、主动型算法交易、综合型算法交易三大类。•策略核心:成交量分布的预测•机构目前的手动交易造成巨大的冲击成本损失部门介绍大纲算法交易——基本概念28•另类套利策略是指利用市场的缺陷进行的一些特殊场合的套利策略。•主要包括:封闭式基金套利、并购套利、定增套利、ETF套利、LOF套利•代表产品:定增系列产品部门介绍大纲另类套利《量化投资-策略与技术》策略建模语言目前比较流行的策略建模语言主要有:(1)MATLAB(2)R语言MATLAB简介MATLAB的是美国MathWorks公司出品的商业数学软件,用于算法开发、数据分析以及数值计算,主要包括MATLAB和Simulink两大部分。在金融领域,利用MATLAB以及相关产品,可以进行分析数据,评估风险、开发并优化策略等一系列金融建模工作。优势在于:强大的建模能力和全面的分析能力31MATLAB简介MATLAB金融工具箱主要有:DatafeedToolbox:金融数据工具箱EconometricsToolbox:计量经济学工具箱FinancialDerivativesToolbox:金融衍生品工具箱Fixed-IncomeToolbox:固定收益工具箱OptimizationToolbox:优化工具箱StatisticsToolbox:统计工具箱用户可以利用MATLAB进行(1)交易策略实现和回测、投资组合优化和分析(2)资产分配、金融时序分析、期权价格和敏感度分析、现金流分析(3)风险管理、预测和模拟、利率曲线拟合和期限结构建模(4)MonteCarlo模拟、基于GARCH的波动性分析等。32R语言免费开源的数据处理语言至少几百名世界知名统计学家在算法上的支持至少几百名世界顶尖的Fortran,C,C++数学库编程高手在代码上的支持大数据计算平台的运算支撑开放金融数据资源的免费接入前沿期刊与代码工具的协同R的本质:全世界统计学者的联合社区R社区中最活跃贡献者:金融统计学者与工程师,生物统计学者与工程师,计算机人工智能学者与工程师R语言是一个高效率的实验平台:通过R语言可以很高效的实现前沿paper的模型方法,同时R语言又提供与C,C++等传统语言工具的量化结合R社区遵守开源协议:R社区内富含众多商业级模块的前身,部分R软件包在成熟之后,也开始迁移出R社区,形成众多商业级前沿软件产品R语言与其他工具的对比R语言的总体优势R社区体系对其他语言和平台的整合功能开放体系与开源属性R语言与C++等通用软件开发语言相比:R语言可以做为C++的库使用大量C++金融工具包已经被纳入R语言R软件包多半是C++实现的R语言与SAS,Matlab等科学计算平台相比R语言在性能上不及SAS,Matlab统一的R社区的比众多分散的Matlab社区资源多R语言与EViews,RATS等专业统计与计量软件相比R语言更适合金融工程师使用R语言是通用的统计开发语言,跟适合作为于量化分析策略的研发平台量化投资重要支撑:IT系统历史数据统计后验历史数据高频后验高频数据实时模拟交易实盘实时交易历史数据统计后验历史数据统计一般以收盘价或者日均价作为买入卖出的交易价格。然后根据设定的交易价格计算出在某一段时间内的收益率、超额收益、夏普率等结果。历史数据统计后验的优势是效率高、简单方便。缺点是不够精确,尤其不能考虑资金量对市场的影响。这个阶段的IT要求:简单的原语/多市场的数据/各种盈亏报表分析。历史高频交易数据后验历史高频交易数据后验的核心在于根据历史高交易频数据进行模拟撮合,撮合算法主要是判断在某个时段的成交量的成交比例。例如某个股票在历史上5.0~5.1价位之间成交了10000股,其中的挂单量为50000股。那么在后验的时候,可以设定成交股的A%和挂单量的B%中最小值,为模拟撮合的成交量。一般经验公式:A和B的值一般取为10%和30%。这个步骤的IT要求:快速撮合能力高频数据实时模拟策略后验无法检验其在样本外的效果。解决这个问题的方法是进行高频数据的实时模拟交易。实时模拟交易是将策略写成一个DLL,放在模拟平台上自