证券投资基金评价方法研究*∗罗真【摘要】本文对国内外现有的基金业绩评价理论与方法进行了详细的分类研究,着重就其理论基础、特点、应用范围及其在中国证券市场的适用性进行了分析,在对这些理论进行简要评述的基础上得出若干有意义的启示,并指明了基金业绩评价理论的未来研究方向。【关键词】投资基金业绩评价理论研究如何客观、公正地评价基金业绩,一直是基金业发展过程中争论的焦点问题。从理论上说,国内外对基金业绩评价方面的理论与实践结果较多,而对基金投资进行全面分析的研究成果却很少,对该问题的研究实际上是对基金理论体系的发展。在国外,基金业绩评价方法不断得到发展和完善,已积累了大量的研究成果。目前,我国基金评价体系的理论研究基本上都是借鉴国外研究方法,如关于基金业绩评价,最初主要是应用基于风险调整的量化指标对基金进行排序分析(李博和吴世农,2000)。其后主要集中在基金择时和选股能力的研究上(沈维涛,2001)等。国内学者对基金业绩评价的理论、方法也进行了积极的探索,如通过对证券投资基金之间的风险和收益的比较,运用DEA方法,提出用风险-收益对比系数作为评价证券投资基金的投资绩效指数(陈刚和李光金,2001),从实践的角度进行研究(王霞,2001),对几种经典模型进行比较分析(王聪,2001)。由于客观条件的限制,目前国内有关研究存在以下问题:(1)样本期间比较短,多数在1年到1年半左右;(2)样本期间集中在2000-2001年之间,此期间内市场表现为明显的单边上升趋势;(3)多数研究仅使用单因素模型分析;(4)没有考虑到基金经理的时机选择能力对于证券选择能力造成的误差;(5)基本上只是针对于基金业绩的一个方面进行评价。总结起来,基金的评价方法有两大类:一类是基于基金的收益率时间序列这一信息的评价方法;另一类是基于基金的投资组合的基金评价方法。该方法的研究始于20世纪80年代,由于这类评价方法对数据的要求较高,因此目前相关的研究文献相对较少。一、基于基金收益率时间序列的评价方法20世纪60年代前,基金业绩评价的传统方法主要是根据基金单位净资产和投资基金的投资收益率这两个指标来进行的,但对基金资产组合的风险未能进行系统和合理的量化分析。(一)Markowits均值-方差模型基金投资及其它风险资产投资首先需要解决的是预期收益与预期风险这两个核心问题。如何测定组合投资的预期收益与预期风险、如何以这两项指标进行资产分配是市场投资者迫切需要解决的问题。Markowits阐述了如何利用组合投资,创造更多的可供选择的投资品种,从而在一定风险水平下取得最大可能的预期收益率。在一系列假设条件下,Markowits确立了证券组合预期收益、风险的计算方法和有效边界理论,建立了资产优化配置的均值-方差模型。虽然Markowits理论模型为精确测量基金的风险和收益提供了良好手段,但是这一模型涉及计算所有资产的协方差矩阵,面对上百种可选择的资产,其模型的复杂性制约了实际应用。(二)基于CAPM模型的经典方法收稿日期:2005-06-02作者简介:罗真,男,博士,北京大学博士后,现任职于中南财经政法大学会计学院。20世纪60年代出现的资产组合选择理论、资本资产定价模型(CAPM)和股票价格行为三大金融理论,为基金业绩评价创造了技术工具,开创了一个新的时代。以CAPM为研究基础的Treynor、Sharpe及Jensen三个指数模型大大简化了Markowits理论模型对基金整体绩效评价的复杂性,称为单因素整体绩效评价模型。1.Jensen指数模型。Jensen指数模型奠定了基金绩效评价的理论基础,也是至今为止使用最广泛的模型之一。Jensen(1968)利用美国1945-1964年间115个基金的年收益率资料以及S&P500计算的市场收益率进行了实证研究,文中给出了一个评价系数——α。Jensen指数为绝对绩效指标,它衡量的是基金的超常回报,表示基金的投资组合收益率与相同系统风险水平下市场投资组合收益率的差异。当α显著为正时,说明该投资组合的投资收益优于市场投资组合,有良好的预期;反之,如果其α值显著为负,说明该投资组合的投资收益低于市场投资组合,未来预期不可乐观。但是,Jensen指数模型隐含了基金已通过投资组合彻底分散非系统风险的假设,只反映了收益率和系统风险之间的关系。如果基金并没有完全消除非系统风险,则Jensen指数可能给出错误信息。比如,基金经理的市场判断能力的存在会使β呈时变性,使基金绩效和市场投资组合绩效之间存在非线性关系,从而导致Jensen模型评价存在统计上的偏差。同时,该指数并不能明确解释超常收益α是来源于购买了价值低估的证券,还是对市场的准确判断,或两者兼而有之。2.Treynor指数模型。美国财务学者Treynor(1965)设计了一条旨在反映基金收益与市场收益相互关系的特征线,用这条线的斜率反映基金收益对市场波动的敏感性,由此得到一个考虑风险因素、用于不同基金间相互比较的收益率相对指标,即Treynor指数。Treynor指数表示的是基金承受每单位系数风险所获取风险收益的大小,较大的Treynor指数意味者较好的绩效。Treynor指数同样隐含了非系统风险已全部被消除的假设,在这个假设前提下,不管市场是处于上升阶段还是下降阶段,较大的Treynor指数总是表示较好的绩效,这是Treynor指数比Jensen指数的优越之处。但是,如果非系统风险没有全部消除,则Treynor指数和Jensen指数一样可能给出错误信息,Treynor指数模型同样不能评价基金经理分散和降低非系统风险的能力。3.Sharpe指数模型。Sharpe(1966)考察了1954-1963年间34只共同基金的经营业绩,计算它们的风险回报率,即Sharpe指数。他认为,对于管理较好的投资基金,其总风险可能接近于系统性风险,而对于管理不好的投资基金,其总风险可能因非系统性风险不等而相差甚远。因此Sharpe用单位总风险所获得的超额收益率来评价基金的业绩。Sharpe指数把资本市场线作为评价标准,是在对总风险进行调整基础上的基金绩效评价方式,实际上是投资组合平均收益率超出无风险收益率部分(超额收益率)与投资组合收益率的标准差之商,即基金承担单位风险(包括系统风险和非系统风险)所获得的超额收益。Sharpe指数的优点是它并不需要以CAPM是否成立和市场组合是否已经确立为前提。其缺点是,该指数是建立在事后资本市场线之上的,它计算的是相对于基金组合总风险的回报率,是以回报率的标准差作为风险度量指标的,它较适合于那些投资品种很少,主要购买基金的投资者用来作为考察组合的收益风险的指标。4.2M指数。1997年,诺贝尔经济学奖得主FrancoModigliani和他的孙女,摩根斯坦利公司的LeahModigliani对Sharpe指数进行改进,赋予了指数值以明显的意义,从而提出2M指数。他们把国债引入证券投资的实际资产组合,通过一定量的国库券头寸,对基金构建一个虚拟的资产组合,使得这个重新调整的资产组合的总风险等于市场组合的风险,然后将虚拟资产组合与市场组合的平均收益率进行比较,就可评价基金业绩。2M指数数值越大,业绩相对越好。与Sharpe指数类似,2M指数也把全部风险作为风险的度量。但是,这种收益的风险调整方法很容易解释为什么相对于不同的市场基准指数有不同的收益水平。2M指数的提出至少在两方面受到了学术界和市场的正面评价:(1)2M指数纠正了基金评价行业中只考虑收益,不考虑风险的错误做法;(2)启示投资者可以采取将高风险投资与低风险投资进行组合,稀释原有资产组合较高的风险,从而为投资者带来另一种投资的思路。但是,2M指数只能说明基金过去的业绩如何,它没有考虑基金赢利的持续性,也没说明取得的业绩有多少是运气造成的。(三)基于择时和选股能力的评价方法基金经理的投资才能表现为时机选择能力和证券选择能力,研究者们分别建立模型对基金经理的时机选择能力和证券选择能力进行评价。根据他们对β系数的不同假设,将此类模型大致分为两类:第一类称为UD模型,将投资组合的β系数视为二项式变量;另一类则视投资组合的β系数为随机变量,其值随时变动,以下分别介绍。1.T-M模型。Treynor和Mazuy(1966)利用一个含二次项的单指数市场模型首次对基金经理的时机选择能力进行了计量分析。他们认为具备时机选择能力的基金经理应能预测市场走势:在多头时,通过提高投资组合的风险水平以获得较高的收益;在空头时则降低风险。因此,特征线不再是固定斜率的直线,他们根据弧线情形引入了一个二项式进行回归分析:ptftmtpftmtppftptrrrrrrεββα+−+−+=−221)()(其中,pα为证券选择能力指标,p2β为时机选择能力指标,为基金在t期的收益率。根据T-M模型,ptrp2β显著大于0时,基金的风险收益(ftptrr−)会大于市场投资组合的风险收益();反之,当市场呈现空头走势,基金风险收益的下跌幅度会小于市场投资组合风险收益的下跌幅度,这样,仍然有()大于(ftmtrr−ftptrr−ftmtrr−)。因此,选择p2β可用于判断基金经理的时机选择能力。ptα与市场走势无关,它代表基金收益与系统风险相等时的投资组合收益率差异,可以用来判断基金经理的证券选择能力。如果0ptα,表明基金经理具有证券选择能力。许多学者研究发现,p2β为负数的居多,呈现一种负的市场时机选择能力。尽管T-M模型尚有许多值得探讨的地方,但它为基金业绩研究开辟了一个考察基金管理人是否具备某一方面“特殊能力”的新视角。2.H-M模型。Henriksson和Merton(1981)在T-M模型基础上提出了H-M模型,只是将方程的右边改成了:),0(mtftrrMax−ptmtftpftmtppftptrrMaxrrrrεββα+−+−+=−),0()(21根据H-M模型,如果p2β显著为正,就说明有较好的市场时机选择能力。对于T-M模型和H-M模型,都有一些学者进行了实证分析,几乎都未发现基金有很好的时机选择能力。这些实证研究的结果与投资者的直观感觉有一定差距,这可能是由于这两个模型中的假设条件过于严格,致使它们实际上对基金经理的时机选择能力和证券选择能力对基金表现的贡献的估计造成了偏差,结果致使这两个模型的实用性不够理想。3.C-L模型。Chang和Lewellen(1984)的C-L模型是对H-M模型的变形和改进,其回归模型为:ptftmtftmtpftptrrrrrrεββα+−+−+=−),0max(),0min(21式中的1β为空头市场时的β,2β为多头市场时的β。),0min(ftmtrr−代表选取0与)(ftmtrr−二者的最小值。如果0)(12−ββ,表示基金经理具备时机选择能力。4.GII模型。Goetzmann、Ingersoll和Ivkovic(GII,2000)认为,利用月度收益数据的H-M模型可能难以发现市场时机把握能力,因为对于大多数基金来说,基金经理进行有关市场风险方面决策的频率要小于1个月,从而可能低估市场时机把握能力。他们使用相关指数的日收益率数据构建了一个类似看跌期权的公式,对月度内的这种看跌期权价值进行累计,评估每日市场时机把握产生的月度价值。该公式表达如下:mtttmonthfmmtrrrMaxP−−++=∏∈}1])1,1({[)(θθθ其中表示每日由把握市场时机带来的单位基金资产增加值,t为月度,mtPθ为交易日。如果经理预测市场超额收益为正,那么他就将头寸全部投入股票之中;反之,则将头寸全部投入到无风险资产中。通过这种操作,基金至少可以获取无风险资产收益率水平的收入,如果他能够正确把握市场时机,则基金将取得正的超额收益。据此,GII模型的表达式如下:εββα++−+=−mtftmtftptPrrrr21)(GII选择了558只基金在1988年1月至1998年3月间共123个月的月度收益率作为样本,利用H-M和GII模型,对这些基金的市场时机选择能力进行分析,结果发现这558个样本中很少有基金表