201105•中国证券期货12观察•Observation投稿信箱:zgzqqhzz@163.com基于支持向量机的股指期货合约价格预测毕欣1杨嫄嫄2(1.吉林大学商学院;2.吉林大学经济学院,吉林长春130012)【摘要】随着金融市场的不断发展,对于股指期货的预测变得十分必要。本文首先介绍了支持向量机并且分析了支持向量机的原理,并且建立了基于支持向量机的股指期货合约价格预测模型,最后应用实例验证其科学性。【关键词】股指期货;股指期货预测;人工神经网络;支持向量机k提出了支持向量机(SupportVectorMachine简称SVM)的概念。它以统计学习理论为基础,是一种建立在VC维和结构风险最小化原则基础上的一种新的机器学习方法。以其完善的理论基础、学习性能和预测性能得到了广泛的关注和应用。1.支持向量机介绍支持向量机(SVM)是近几年来一种新的学习方法,与一般神经网络相比,支持向量机算法将转化为一个二次型寻优问题,从理论上讲得到的是全局最优点,可以解决在神经网络中无法避免的局部极小值所出现的问题。支持向量机的拓扑结构由支持向量决定,避免了传统神经网络拓扑结构需要经验试凑的方法,而且SVM的最优求解基于结构风险最小化思想,因此具有比其他非线性函数逼近方法具有更强的泛化能力。2.原理分析给定一个数据集作为训练样本,其中是输入变量,是期望值,是数据点的总数。通过训练学习寻求一模式使得样本集不但满足,而且对于样本以外的通过能找出对应的。估计函数为式中:是从输入空间到高维特征空间的非线性映射,为偏置量。根据结构风险最小化原理函数估计问题就是寻找使下面风险函数最小:=式中:反映了回归函数的泛化能力,是正则化部分;为惩罚因子;是经验风险(即样本损失函数的累积)。常用的样本损失函数有二次函数、Huber函数、Laplace函数和不敏感函数等,由于不敏感函数能够忽略范围内的回归误差所以样本损失常由不敏感函数来度量引进不灵敏损失函数,可得到回归支持向量机模型:常用的核函数是径向基函式中为核参数。3.影响期货合约价格因素的分析在考虑对支持向量机模型进行训练之前,首先要考虑输入因素和输出因素的选取。对于影响股指期货合约价格的变动,从宏观经济条件方面考虑,主要受以下几个因素的影响:宏观经济运行状况、宏观经济政策变化、与标的指数成份股相关的各种信息、国际金融市场走势、股指期货合约到期日、投资者心理的变化等。如果从数据指标方面来看,主要是沪深300股指期货合约的每日基本数据信息,包括:(1)最高价数据;(2)最低价数据;(3)开盘价数据;(4)收盘价数据;(5)总持仓量数据;(6)期货合约成交金额总量;(7)平均价格。本文希望得到的是用训练模型预测期货合约第二天的收盘价。在支持向量机训练学习中,如果训练样本容量过小,将不利于预测精度的控制,就很有可能造成泛化性较差的状况出现。因而本文采用模拟仿真交易历史数据中一年的沪深3OO股指期货第一季月IFSC3合约相关数据,数据区间为2008年12月11日至2009年12月18日,共238个交易数据。4.数据的预处理与误差分析由于获取的样本数据的单位不同,如成交金额的单位是万元,开盘价的单位是点,持仓总数的单位是手,这三者的数据属性都是不同的,为了将从沪深3OO指数期货市场获得的数据转化为让模型接受的输入形式,本文对选取的数据进行预处理,采用对同类别组的数据归一化的方法,其过程是用同组类别的每一个值分别减去该组中的最小值,再除以该组最大值与最小值之差,使之归一化。例如设同组数据为。则归一化函数为:其中:5.结论分析通过不断训练,最后我们得到了高精度的支持向量机模型。最后我们对以上思路进行Matlab编程,利用Matlab7.0软件对样本数据进行实证研究。将训练样本数据的6个变量输入到我们训练好的模型中,会得到一个预测值,将第二天的期货收盘价格预测值对比真实的第二天的期货结算价格,可以观察其问的误差大小。其结果如图3所示。通过训练得到支持向量机的预测模型,对通过2009年11月19日的开盘价,最高价,最低价,平均价,成交量,持仓量,收盘价对11月20日的收盘价进行预测,通过分析得到3969.6,而真实值为3999,相对误差仅仅为0.74%。参考文献[1]胡莹.基于支持向量机的证券投资风险管理研究[D].西安电子科技大学,2010,1.[2]龙建成,李小平.基于神经网络的股票市场趋势预测[J].西安电子科技大学学报,2005(5):20-24.