股票成交量的马尔可夫链分析与预测论文关键字:预测股票成交链分析量的马尔【摘要】成交量是判断股票走势的重要依据,投资者对成交量异常波动的股票应当密切关注。股票的成交量对于投资者操作股票具有至关重要的参考意义,关系到投资者的切身经济利益。文章对股票成交量引入马氏链预测模型,通过研究发现,在短期里,该模型可以比较准确地预测成交量的变化趋势。【关键词】股票成交量;马尔科夫链;转移概率马尔可夫过程是以俄国数学家markov的名字命名的一种随机过程模型,它在经济预测、管理决策、水文气象等领域应用广泛。许多学者也将该方法应用于股价预测并建立预测模型,但很少有人用马氏链的理论和方法来对股票成交量进行分析与预测。股价之所以产生各种各样的波浪形态,主要是由于成交量变化引起的,成交量是股价各种走势的形成原因,所说的“量在价先”即是这个道理,成交量往往能先于股价预示出形态的未来发展方向或运行区间。所以如果我们理解了成交量各种变化过程及其对应k线走势的本质含义,就能动态地掌握成交量的分布变动状况,预测股价的未来走势,从而找到短线或中线的操作机会。股票成交量受诸多随机因素的影响,而这种影响常使股票成交量波动很大,不容忽略。本文运用马氏链理论建立股票成交量的数学预测模型,并以此来分析与预测股票成交量的波动,希望能使投资者避免盲目和不理性的投资行为,采取科学的投资策略。一、马尔科夫链预测原理马尔可夫过程概述定义1:设有随机过程{xn,n∈t},其时间集合t={0,1,2,…},状态空间e={0,1,2,…},亦即xn是时间离散和状态离散的。若对任意的整数n∈t及任意的i0,i1,…,in+1∈e,条件概率满足p{xn+1=in+1|x0=i0,x1=i1,…,xn=in}=p{xn+1=in+1|xn=in}(1)则称{xn,n∈t}为马尔可夫链,简称马氏链。(1)式称为过程的马尔可夫性(或称无后效性)。它表示若已知系统现在的状态,则系统未来所处状态与过去所处的状态无关。定义2:称条件概率pij(m,1)=p{xm+1=j|xm=i}(i,j∈e)(2)为马氏链{xn,n∈t}在时刻m的一步转移概率,简称为转移概率.若对任意的i,j∈e,马尔可夫链{xn,n∈t}的转移概率pij(m,1)与m无关,则称马氏链是齐次的,记pij(m,1)为pij。同时定义:系统在时刻m从状态i出发,经过n步后处于状态j的概率pij(m,n)=p{xm+n=j|xm=i}(i,j∈e,m≥0,n≥1)(3)为齐次马尔可夫链{xn,n∈t}的n步转移概率。由齐次性知其与m无关,故简记为pij(n)。定义3:齐次马尔可夫链的所有一步转移概率pij组成的矩阵p1=(pij)称为它在时刻m的一步转移概率矩阵(i,j∈e)。所有n步转移概率pij(n)组成的矩阵pn=(pij(n))为马尔可夫链的n步转移概率矩阵,其中:0≤pij(n)≤1,。设{xn,n∈t}为齐次马尔可夫链,则:pn=p1p1(n-1)=p1n(n≥1)(4)二、运用马尔可夫链预测马钢股份(600808)成交量变化趋势这里,用马尔可夫链对马钢股份(600808)2007年3月16日到2007年4月22日的日成交量变化过程进行分析。(数据来源:新浪网财经频道)分析过程分以下几步:第一步,构造成交量变化的分布状态;第二步,检验马尔科夫性;第三步,马尔可夫模型的建立和预测;第四步:历史数据的预测值和实测值的误差分析。(一)构造成交量变化的分布状态xt是代表股票成交量大小的随机时间序列,对xt所能取到的最小值m0和最大值mn所限定的区间划分成若干小区间:(m0,m1],(m1,m2],…,(mn-1,mn],其中mi≥mi-1。再记ek=(mk-1,mk],则可视xt(t=1,2,…,n)为一个以e=ek(k=1,2,…,n)为状态空间的随机时间序列(或称随机过程)。下面根据马钢股份(600808)这只股票成交量的实际情况划分,将2007年3月16日到2007年4月22日的日成交量划分为4个区域,使每一天的成交量仅落入其中一个区域内,每一区域可作为一种状态。需要注意的是,由一个标准划分的各个状态之间应相互独立,使预测对象在某一时间只处于一种状态。minxt=m0=304310maxxt=mn=1085344(mn-m0)/4=195258那么,xt是一个以e=ek(k=1,2,3,4)为状态空间的随机序列。分为4个价格区间,每一区间为一状态(如下表2)。(二)检验马尔科夫性用nij表示x1,x2,…,xn从状态ei经过一步转移到ej的频数,建立频数矩阵服从自由度为(n-1)2的χ2分布。选定置信度α,查表得χ2α((n-1)2),如果χ2α((n-1)2),则可认为xt符合马氏性,否则认为不是马尔可夫链。如果验证了xt为马尔可夫链,则当前股票的成交量符合随机游走的特性,股票成交量的走势包含和反映了历史信息,市场为弱有效,可构建马氏链模型分析股票成交量未来的变化情况。(三)马尔可夫模型的建立和预测根据股市的历史资料,统计得出在连续两天,前一天成交量处于ei区,而后一天成交量处于ej区的概率pij(i,j∈e),构造一步转移概率矩阵p1=(pij)。由(4)式知,k步转移概率矩阵pk为:pk=p1k(5)记概率向量p(t)=(p1(t),p2(t),…,pn(t))t为第t天成交量的绝对概率向量,其中pi(t)表示第t个时段股票成交量处于第ei(ei∈e)区的绝对概率,根据全概率公式和(5)式知,成交量第t+k个时段(k∈t)的绝对概率向量p(t+k)=p(t)pk=p(t)p1k(6)若给定初始概率向量p(0)=(p1(0),p2(0),…,pn(0))t,则由(6)式可得t个时段后的股票成交量预测的马尔可夫过程模型为:p(t)=p(0)pt=p(0)p1t因此,可在已知初始概率向量(即特定时段成交量所处的区间)的情况下,对之后任意时段成交量所处区间的概率分布作出预测。则p11=8/(8+2+1)=0.727p12=2/(8+2+1)=0.182…由表1知,第26个交易日的成交量是548833,落于第二状态区间,所以用马尔可夫链进行预测时,初始概率向量p(0)=(0,1,0,0),则预测第27,28,29,30,31,32交易日的成交量绝对概率向量分别为:p(1)=p(0)p1=(0,0.333,0.167,0.5)p(2)=p(0)p12=(0.198,0.343,0.287,0.167)p(3)=p(0)p13=(0.257,0.32,0.245,0.171)p(4)=p(0)p14=(0.292,0.308,0.231,0.16)p(5)=p(0)p15=(0.312,0.301,0.223,0.154)p(6)=p(0)p16=(0.322,0.297,0.219,0.151)由p(1)可以看出,第27个交易日的成交量落于第4区间的概率最大,由p(2)可以看出第28个交易日的成交量落于第2个区间的概率最大…结合实测数据,统计出下表4:(四)历史数据的预测值和实测值的误差分析在这6个交易日中,除了2007年4月24日的预测值和实测值相差2,2007年4月26日预测值和实测值相差1外,其他交易日的误差都为0,按照100%的吻合率,表3的历史吻合率为67%。预测值与实测值之间的误差取主要决于成交量变化区间的划分方法,本文的成交量变化区间是均匀划分的,可以根据正态分布的状况把区间划分的更细,误差就可以极大的减小。另外应用马尔可夫链对股指分析预测时,是假定未知的概率分布与已知的概率分布无太大出入,即市场外界环境比较稳定,但这点这在实际中是很难满足的,这同样也是导致误差的重要原因。四、结语由于马氏链具有“无后效性”,所以在市场有效的条件下,预测股票成交量的变化规律比较准确。但是,应该注意到使用该模型的条件,即假定对初始向量的认定和转移矩阵概率的不变,应根据实际情况对初始向量和转移矩阵做出调整,以符合变化规律,提高预测可信度。总之,在确定了股票成交量的马氏链特性后,应用马氏链分析股票成交量的变化趋势是一个比较好的选择。参考文献[1]侯永建,周浩.证券市场的随机过程方法预测[j].商业研究,2003.[2]施仁杰.马尔柯夫链基础及其应用[m].西安:西安电子科技大学出版社,1992.[3]毛炳等.股市经济学[m].陕西财经出版社,1992.[4]韩东.时间序列-马尔可夫链组合预测模型[j].数理统计与管理(增刊),1995.作者简介:王谨乐,男,安徽人,就读于合肥工业大学管理学院,管理硕士学位,研究方向:群决策、财经证券。