基于数据挖掘的内幕操纵行为甄别

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1基于数据挖掘的内幕操纵行为甄别研究课题研究人:张宗新、朱伟骅、沈正阳、陈剑波选送单位:东北证券有限责任公司2内容提要目前,我国内幕操纵监管仍侧重―事后‖监管,例如对―德隆系‖、―中科创业‖等内幕操纵等处罚,都是以广大中小投资者付出惨重代价为前提的。而国外学者研究表明,对内幕操纵事后监管却是无效的(LaPortaetal.,2006)。因而,在中国证券市场全流通条件下如何强化事前预防和事中监控,如何有效甄别内幕交易行为,及时对内幕操纵进行控制和禁止,成为证券监管部门实施反操纵监管的重要研究课题。正是基于证券市场反操纵监管的难题,课题以中国股市发生内幕操纵操纵的上市公司为研究样本,对内幕操纵股票的股价流动性、信息传递效率、股价运动行为自相关性、持股集中度与换手率等进行实证分析,从而提取内幕操纵数据挖掘方法的建模因子。在内幕操纵建模因子分析的基础上,课题应用SAS数据挖掘方法,利用Logistic模型、决策树模型和神经网络(NeuralNetwork)模型构建内幕操纵行为甄别方法,对证券内幕操纵行为进行识别,研究结果表明利用数据挖掘技术可以对内幕操纵进行有效甄别,应用Logistic判别模型的预测准确率为91.66%,决策树判别模型的预测准确率为93.19%,应用神经元网络预测准确率达到95.5%,略高于Logistic和决策树的预测结果。总之,应用数据挖掘方法构建的内幕操纵判别模型,可以达到有效甄别内幕操纵行为的效果,从而为证券监管层及时甄别证券内幕操纵行为,实施反操纵监管提供了重要的参考依据。3目录1.引言2.内幕操纵行为甄别的因子分析2.1流动性检验2.2股价自相关性检验2.2信息传递能力检验2.4Beta系数测度2.5持股集中度与换手率特征检验3.内幕操纵行为数据挖掘的甄别模型构建3.1Logitic模型判别3.2决策树模型判别3.2.1决策树模型3.2.2决策树模型判别结果3.3模糊神经网络模型判别3.3模糊神经网络模型判别3.3.1模糊神经网络模型3.3.2神经元网络模型判别结果4.简短结语与监管建议4基于数据挖掘的内幕操纵行为甄别研究1.引言内幕操纵行为不仅严重损害了中小投资者权益,破坏了市场的正常游戏规则,而且加剧了股价的异常波动,因而实施反操纵监管成为世界各国证券监管部门的重要职责。尽管监管部门一直致力于内幕操纵行为监管与防范,但是内幕操纵行为仍时有发生,其重要原因在于内幕操纵行为复杂性、难以甄别性,以及反操纵司法程序的难以执行性。在实施全流通的中国证券市场上,由于市场信息透明度不高、市场制度不完备性、投资者保护环境较差和反操纵监管不严等原因,内幕交易行为问题将尤为突出。目前,我国内幕操纵监管仍侧重―事后‖监管,例如对―德隆系‖、―中科创业‖等内幕操纵等处罚,都是以广大中小投资者付出惨重代价为前提的。而国外学者研究表明,对内幕操纵事后监管却是无效的(LaPortaetal.,2006)。因而,在中国证券市场全流通条件下如何强化事前预防和事中监控,如何有效甄别内幕交易行为,及时对内幕操纵进行控制和禁止,成为证券监管部门实施反操纵监管的重要研究课题。可见,进行内幕操纵行为甄别研究不但对有效实施反操纵监管具有重要的理论价值,而且对于及时打击内幕操纵行为、保护中小投资者合法权益具有重要的现实意义。针对内幕操纵行为复杂性、难以甄别性和司法执行的难题,对内幕操纵行为分析和内幕操纵识别就成为证券市场研究的重点和难点。国外学者对内幕交易作了大量理论研究与实证。Allen&Gale(1992)5对内幕交易和股价操纵问题进行研究,提出了市场上的三种操纵形态:行为操纵、信息操纵和交易操纵策略。Chakraborty&McConnell(1999)建立知情者交易动态模型,指出知情者进行交易操纵是其理性选择。Brunnermeier(2000)研究发现,知情内部人利用信息优势操纵股价。Huddart,Hughes和Levine(2001)提出的内部人交易披露规则下的掩饰策略理论,认为内部人在交易信息披露规则下,在其交易中加入一个噪音成分,从而降低了外部投资者从内部人的交易中推断信息的能力,使得市场上出现反常的交易行为。Aggarwal&Wu(2004)利用美国证券市场1990-2001年的内幕操纵对市场波动的影响,并对SEC反操纵监管效果提供了实证证据。JoonChae(2005)根据公告日对披露重大事件的划分,将主要事件划分为约定时期披露的事件(包括年报,中报等)和非定期披露的事件(包括资产重组,突发事件),检验了信息非对称条件下内部交易者和中小投资者对于事件预期的不同会导致股价和交易量发生不同变化。Beny(2004)研究发现,内幕交易规制越严格的国家,股价越能反映信息,股市流动性越好。LaPortaetal.(2006)从法金融的角度,验证了事后监管的无效性。国内对内幕操纵问题研究在近几年刚刚开始。陈晓、秦跃红(2003)对中国证券市场的―庄‖股特性进行了实证检验,考察―庄‖股披露信息与交易量和股价之间的关系,探讨―庄‖家存在对信息披露的质量(信息含量)的影响。张新和祝红梅(2003)讨论了交易量异动、公告效应等指标在识别潜在内幕交易中的作用。史永东和蒋贤锋6(2004)对我国股市内幕交易造成的信息不对称进行分析,认为内幕交易加剧了价格波动性和信息不对称性。郎咸平(2004)对国内证券市场大量存在的机构投资者和上市公司―合谋‖操纵市场的案例,以及对投资者造成的损害进行了经验分析。周春生等(2005)构建了一个交易操纵的行为过程,但并未进行相关实证研究。鲁桂华、李志文(2005)针对中国股市的坐―庄‖现象,应用户均持股数、股价涨幅、大户持股比率等指标对―庄家‖操纵行为进行实证检验。尽管国内外学者对内幕操纵行为特征及其行为识别进行了大量研究,但是这些研究仍侧重于市场波动性研究,尤其缺乏从证券市场微观结构视角研究内幕交易行为,因而很难构建一个对内幕操纵进行监管的有效甄别体系,从而使得这些研究难以切实提高反操纵监管的执行力度。针对证券市场内幕操纵行为甄别的难题,课题以中国证券市场内幕操纵行为甄别为研究主线,以内幕操纵行为甄别作为反操纵监管难题破解的突破口,从金融市场微观结构角度,按照―内幕操纵行为甄别问题提出→内幕操纵行为因子分析→内幕操纵甄别模型构建→结论与监管建议‖的逻辑思路,构建了一个全流通条件下的内幕交易与市场操纵行为甄别的研究框架。2.内幕操纵行为甄别的因子分析为构建内幕操纵甄别模型,我们首先有必要对内幕操纵行为进行分析,从而提取建模的因子。为此,我们应用市场微观结构理论,以中国股市发生内幕操纵操纵的上市公司为研究样本,提取内幕操纵行为甄别因子。在此,内幕操纵行为因子提取的实证检验如下:72.1流动性检验流动性指标反映了市场交易活动的活跃程度,因而内幕信息操纵必然对股票流动性存在一定的影响。Glosten(1989)在其研究内幕交易的模型中表明,若市场中私人信息太多,会降低市场的流动性。Leland(1992)在其模型中证明了,在正常情况下,内幕交易会使市场流动性降低,并且内幕交易存在的情况下,股票价格会对股票交易量的随机变动更敏感(由于人们认为这是由内幕人员利用内幕信息进行交易造成的),这增加的敏感性会进一步降低市场的流动性。国内外基于交易量和价格衡量流动性指标的很多,包括宽度(tightness)、深度(depth)、弹性等。另外还有流动性比率法,如Amivest、Martin、Hui-Heubel、Marsh-Rock流动性比率以及Hui-Heubel市场调整的比率。在此,本研究采用两基于日交易数据的Hui-Heubel指标流动性计算方法。HuiHeubel市场调整的比率是以市场收益率Mr对个股收益率ir残差项进行调整:iMirr,其中i为残差项,反映了价格波动性,然后考察个股交易量与波动性之间的相关性:201iiiVe,1就反映了个股交易量的变化对经过市场收益率调整后价格波动性的影响,1越小,表明交易量变化引起的价格变化越小,改股票的流动性越好。本文以Hui-Heubel市场调整的比率和蒋涛(2001)构造流动性指标的方法,计算所有样本的流动性指标。我们先对收益率和相对交易定义如下:收益率定义为日收盘价或者收盘指数的对数差分:1lnlntttrpp相对交易量为:11ttttVVvV。8采取与上面计算动态Beta系数相同的时间窗口方法,我们计算样本区间内流动性动态指标。以250个交易日为窗口长度,平移得到窗口序列。在每个时间窗口内,我们先用DW值检验、Q统计量检验和Lagrange乘子(LM)检验考察黑色样本和白色样本数据自回归条件异方差性。发现对于白色样本而言,几乎不存在GARCH特征,而黑色样本的GARCH特征很明显。通过LM检验及模型选择,我们发现市场调整的残差序列服从GARCH(1,1)过程。因此我们对白色样本采用Hui-Heubel市场调整的比率方法计算流动性指标,而对黑色样本我们采用GARCH(1,1)调整残差方法计算流动性指标。计算过程如下:在每一个时间窗口内,进行如下程序检验:(1)建立收益率回归模型,以市场收益率调整残差:,1mtitiMttirrre(1)其中Mr是上证指数的对数化收益率。在实际计算过程中我们取一阶滞后的自回归项,即取1m;(2)定义数据样本:将中国股市上典型―庄股‖为内幕操纵样本或黑色样本;同时,为了对内幕交易样本的信息发现效率进行对比,本文将无内幕交易的公司定义为白色样本。(3)对于白色样本,我们直接以1||||mtitittiebev(2)回归得到,作为流动性比率。计算过程中我们取1m;9(4)对于黑色样本,我们运用GARCH(1,1)过程调整残差序列:11,1111ttMttttttttrrreee(3)其中,t服从(0,1)N分布。然后以方程(3)回归得到。通过平移时间窗口,最后我们得到流动性比率指标序列1{,,,,}iNLiqdLiqdLiqd。2.2股价自相关性检验运用GARCH模型来拟合黑色样本股票的波动率,并考察其时序特征;使用了广义自回归条件异方差(GARCH)模型对收益率波动建模,即为简化起见,假定:Ruijij2,~0,uVVNijijijij22211uijijij(4)公式(4)计算得到的条件波动性2ij即代表了股票i的时变的异质波动性;而在事件研究窗口内如果波动性出现大的变化,可以看作有公司层面的信息对异质波动性造成了冲击,即信息泄漏或公布了;因为在正常情况下,如果没有信息冲击的话,波动率将趋于平稳。公式(4)当qipjji111时,方差不定。一般地,将qipjji11作为股票价格波动的持久性(persistency)指标。111qipjji,表示系统稳定,在稳定的系10统中,股票价格或高于价值,或低于价值,但在套利均衡定价力量的推动下,股票价格倾向于向股票价值进行回归;111qipjji,股票收益序列呈相关性特征,这将使得股价的运动将面临一个不稳定系统,系统偏离稳定状态后,将永远无法返回。尤其是时间序列相关度越高,这意味着股票价格被操纵的程度越严重,股票价格回归其价值的时间被拉长。根据ARCH模型的这个特点,我们就可以应用金融时间序列数据检验一个股票是否被内幕交易者所操纵,如果股票价格没有被―庄家‖操纵,则股票价格波动的持久性指标小于1;相反,如果股票价格被―庄家‖所操纵,则股票价格波动持久性指标大于1。2.3信息传递能力能力检验信息效率(informationefficiency)是指股价能对新信息做出迅速反应,以致当前股价能够反应关于股票可利用的信息的程度。内幕操纵对股票价格的冲击效应不仅仅表现在股票价格的剧烈波动上,而且在很大的程度上表现为被操纵股票信息含量的重大变化。因为在一个完美的市场中,证券

1 / 37
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功