1改进的RBF神经网络对期货价格的预测分析摘要针对非线性变化的期货价格,建立了基于主成分分析的RBF神经网络模型首先利用主成分分析法从8个原始变量中提取主成分最后利用选定的3个主成分作为径向基神经网络的输入通过对比该方法较一般的径向基神经网络有更好的预测结果关键词期货;主成分分析;RBF神经网络;预测1引言在对实际问题进行描述和处理中为了能够获得更加全面的信息我们经常需要统计多个变量的数据但是这些多个变量之间经常存在一定的相关性并不是每个变量都是我们所需要的或者说它们携带的信息可能是重复的因此我们希望用2少数几个变量来代替原有的多个变量主成份分析法的基本思想就是通过对原始数据的降维将多个相互关联的变量转化为少数几个互不相干的变量的统计方法由于期货价格的变化是一个非线性的时间序列利用传统的统计方法对期货的价格直接进行预测所得到的结果不是很理想而神经网络在非线性模式中具有优势,因而它不需要建立复杂的数学模型就可以完成期货价格预测基于BP网络和RBF网络的预测都有较好的结果,但是相对BP网络而言,利用RBF神经网络不仅解决了常用BP网络易陷入局部最小的问题,而且训练时间更短,预测的精度也比BP网络高得多本文提出使用基于主成分分析法的RBF神经网络方法对期货价格进行预测通过主成分分析法对原始数据降维然后,再用这些个数较少的新输入变量作为RBF神经网络的输入进行模拟预测由于主成分之间是相互独立的,所以由各主成分组成的输入空间不存在自相关性,从而有效地简化了RBF网络在高维时难以寻找网络中心的问题,提高了预测精度2主成分分析法简介及RBF神经网络算法概述32.1主成分分析法主成分分析法的步骤如下(1)原始数据的标准化处理主成分分析法的目的就是使用较少的变量代替并综合反映原来较多的信息综合后的变量就是原来多变量的主要成分利用这些综合后的主要成分去代替原来的变量去解决实际问题这里首先利用以下公式对原始变量进行标准化处理其中原变量为xij其含义为第j个变量的第i个值则处理后的变量值为yij(3)计算矩阵R的特征根和特征向量利用R的特征方程|R-λi|=0求出其特征根其对4应的特征向量利用|R-λi|A=0和AA'=1求得然后对所求得的特征根按照大小顺序进行排列(4)计算方差贡献率与累计方差贡献率利用公式Ki=i/∑ni=1代入所求的特征根λi求出各个主成分的贡献率Ki其贡献率就代表了原数据信息量的百分比(5)确定主成分计算其得分值主成分的确定方法主要有两种(1)当前K个主成分的累计贡献率达到某一特定值的时则保留前K个主成分一般采用超过85%以上(2)选取特征值大于1的主成分这两种可视情况进行选取一般前者取得主成分要多后者要少通常情况下是将两者结合一起来进行使用2.2RBF神经网络算法概述径向基(RBF)网络是以函数逼近理论为基础构造的一类向前网络其网络结构为三层隐含层采用高斯函数为激励函数理论上,只要隐含层中有足够的径向基神经元,径向基函数网络就可以逼近任何非线性函数输出层为简单的线性加权5函数其网络结构如图所示其中W1i为每个隐含层神经元与输入层相连的权值向量Xq为输入矢量b1i为阈值则隐含层的第i个神经元的输入为kqi=j(w1ji-xqj)2×b1i输出为rqi=exp((-kqi)2)=exp(-(||w1ji-Xq||×b1i)2)输出层的输入则为各隐含层神经元的加权求和由于激励函数为线性函数因此输出为yq=∑ni=1ri×w22RBF网络首先通过无教师学习确定训练输入层与6隐含层间的权值w2再通过有教师学习,确定训练隐含层与输出层间的权值w1i在RBF网络训练中隐含神经元的数量确定是一个关键的问题其基本原理是从0个神经元开始训练通过检查输出误差使网络自动增加神经元每次循环使用使网络产生的最大误差所对应的输入向量作为权值向量w1i产生一个新的隐含层神经元然后检查新网络的误差重复此过程直到达到误差要求或最大隐含层神经元为止由此可见径向基函数网络具有结构自适应确定、输出与初始权值无关等特点3改进的RBF神经网络对期货价格的实例预测3.1主成分分析期货的价格是受很多因素影响,如国家政策、季节气候、供求关系、战争等,所以其价格会上下波动,呈现出一个非线性时间序列其交易价格本文选取2007年6月7日至8月29日燃油0801每个交易日的开盘价、最高价、最低价、收盘7价、交易量、持仓量、前5日均价、前10日均价为初始变量每个变量60个数据前59个为训练样本最后一个为检测样本考虑到期货交易与股票交易的不同其交易方式是双向交易从投资者获利的角度考虑其并不像股票市场一样单纯的考虑股票价格增长加上每个星期正常的期货交易日仅为5天所以在这里我们考虑选取后5日均价作为预测目标这样的选择更有实际意义在这里本文直接利用SPSS软件包选择数据降维再选用主成分分析可以直接得到各个主成分的方差累计贡献率如表1所示从表中我们可以看出第一个主成分主要包含了开盘价、最高价、最低价、收盘价、以及前5日均价共五个变量的信息第二个主成分主要包含了成交量和持仓量两个变量的信息而第三个主成分则主要包含了前十日均价一个变量的信息由此可以看出通过数据降维将原来的8个变量转化为现在的3个变量了3.2神经网络的设计及训练现设计一个三层的神经网络输入层有3个神经元输出层神经元为1个利用下式对输入、输出值进行标准化可使得输入、输出值其均落在[-11]区间8xn=2*(x-minx)/(maxx-minx)-1在matlab的神经网络工具箱中用newrb函数设计这个径向基函数网络,用其作函数逼近时,可自动增加隐含层神经元,直到达到均方误差为止,利用语句:net=newrb(P,T,GOAL,SPREAD)进行网络设计其中GOAL为均方误差这里取值为0.0001,SPREAD为径向基函数的扩展速度,其值越大函数的拟合就越平滑经过试验,当其取0.058时其预测效果最好把2007年6月7日至8月28日的燃油0801选定的主成分作为输入的训练样本标准化的后5日均价的值作为输出的训练样本8月29日的数据作为测试样本计算结果如下4结语由此可看出基于主成分分析法的径向基神经网络较一般的径向基网络有更简洁的网络结构对于相对比较复杂的9期货价格预测基于主成分分析法的径向基神经网络得到的结果也更加精确不过径向基神经网络本身对扩展速度的选择没有一个固定的标准不同的值得到的结果有较大的偏差这是该网络的一个缺陷也是今后研究的一个方向参考文献[1]黄颖,白玫,李自珍.基于主成分-BP神经网络的期货市场预测[J].数学的实践与认识.2007,(7)23-26.[2]刘兴彬万发祥.RBF神经网络主成分分析法在交通量预测中的应用[J].山西科技,2001,(1)54-56.[3]茆诗松.统计手册[M].北京:科学出版社,2003:559-561.[4]飞思科技产品研发中心.神经网络理论与MATLAB实现[M].北京:电子工业出版社,2005:117-119.