基于GM(1,1)的棉花期货价格预测模型自2004年6月棉花期货在郑商所上市交易以来,其发展规模和影响力不断扩大,吸引越来越多的市场主体参与其中。众所周知,棉花期货的参与主体主要有三类:投机者、套保、套利。不论是什么样的主体,参与期货交易的首要事情就是要对当期价格及其未来价格走势进行分析预测,从而制定相应的交易计划。对价格进行分析预测主要有两种方法,基本面和技术面。基本面分析由于需要搜集大量的基本面数据,牵涉面广,而且信息相对滞后;技术面分析认为价格反映一切,相对简单,但是主观性较大,初学者很难掌握和运用。因此,能否依据已有的、每个市场主体都能简单获取的信息来建立一个价格预测模型来对棉花期货的价格在一定误差的范围内进行预测,对市场参与主体进行引导,规避相应的风险,是十分必要的。基于此,本文依据灰色系统理论,利用GM(1,1)模型,建立棉花期货的价格预测模型,以求能够合理的对棉花期货的未来价格走势作出预测。1、灰色系统简介灰色系统理论是有中国学者邓聚龙教授于1982年创立的,是一种研究少数据、贫信息等不群定问题的新方法。该理论以“部分信息已知,部分信息未知”的“小样本”、“贫信息”等不确定系统为研究对象,主要通过对“部分”已知的信息的生成、开发、提取有价值的信息,实现对系统运行行为、演化规律的正确描述和有效监控。其特点是“少数据建模”。灰色系统理论下的GM(1,1)模型是一种单序列模型,其不涉及到其它外生变量,只从系统的背景序列对未来的趋势进行预测。由于其对数据序列没有什么特殊的限制,因此应用范围十分宽广。利用灰色理论对棉花期货价格进行预测,主要基于以下三个假设:(1)价格反映一切;(2)价格运行是有趋势的,趋势延续的概率往往大于反转的概率;(3)新价格的认知作用大于老信息;1.1GM(1,1)模型简介建立原始GM(1,1)模型不需要考虑价格系统以外的因素,仅仅需要一个单独的数据序列x(0)就可以对未来的价格进行预测。假设原始价格序列为:(0)(0)(0)(0)((1),(2),())xxxxn...,,(1)则原始GM(1,1)模型的基本形式为:(0)(1)()()xkazkb,(2)其中:z(1)为一阶累加序列x(1)的紧邻均值序列;a值为发展系数,反映模拟值的未来发展情况;b为灰色作用量,反映数据变化的关系,其确切内涵是灰的。原始GM(1,1)模型的建模预测过程如下:第一步:对原始价格序列进行一阶累加变换,生成新的1-AGO价格序列x(1)和x(1)的紧邻均值序列z(1);(1)(1)(1)(1)((1),(2),())xxxxn...,;(3)(1)(1)(1)()0.5()0.5(1)zkxkxk(4)第二步骤:用最小二乘法估计参数列,确定原始GM(1,1)模型(式(5)及时间响应式(式(6))。baXtX11dd(5)abeabXkXak1011ˆ(6)第三步骤:则GM(1,1)模型的预测模型为:abeabXkXak11ˆ01(7)第四步骤:检查误差大小。通过求解样本的残差值以及相对误差值,分析其预测值的准确度。1.2GM(1,1)模型群简介在实际的预测过程中,取不同的数据建立的模型结果则不一样,即使都建立同类的GM(1,1)模型,由于选择的数据不同,参数a、b的值也不一样。建模的主要目的是预测,为提高预测精度,首先要保证样本内数据有充分高的模拟精度,尤其是k=n时期的模拟精度。因此,初次建模时,应选用不同的数据长度建立GM(1,1)模型,通过对残差的分析来却确定用什么样的数据建模。依据分析数据的长度不同,GM(1,1)模型群主要有四种:全数据模型、部分数据模型、新信息模型和新陈代谢模型。假设原始价格序列为:(0)(0)(0)(0)((1),(2),())xxxxn...,,(1)用(0)(0)(0)(0)((1),(2),())xxxxn...,建立的GM(1,1)模型为全数据模型;(2)K1,用nXkXkXX0000,...,1,建立的模型为部分数据模型;(3)设10kX为最新信息,将10kX置入假设序列,用1,,...,2,100000kXnXXXX建立的模型为新信息模型;(4)置入新信息10kX,去掉老信息10X,用1,...,3,200000kXnXXXX建立的模型为新陈代谢模型。单纯的从预测角度看,新陈代谢模型是最理想的模型。随着系统的发展,老数据的信息意义讲逐步降低,在不断补充新信息的同时,及时的去掉老信息,建模数据更可能反映系统目前的特征,尤其是系统醉着量变的积累,发生质变时,与过去的系统相比,已是面目全非。去掉已根本不可能反映系统目前特征的老数据,显然是合理的。二、实证分析过程2.1建模数据选取郑商所棉花期货的正常交易时间为每周的周一到周五,周六周日休市。所以数据选取2010年7月5日至2010年7月9日5天郑州商品交易所棉花期货主力合约1101当天的结算价,建立模型的样本数据序列为:}16405,16515,16455,16555,16565{0X;先建立原始的GM(1,1)模型;然后引进2010年7月12日的数据{16290},样本数据序列为:}16290,16405,16515,16455,16555,16565{1X,建立新信息GM(1,1)模型;最后剔除2010年7月5日的数据{16565},样本数据序列为:}16290,16405,16515,16455,16555{2X建立新陈代谢GM(1,1)模型。2.2模型建立过程由于这几个模型的建立的过程基本上都一样,唯一的区别在于建模数据选取的不同,因此,不在详细叙述每个模型的建模的具体过程。下面只对原始的GM(1,1)模型的建模过程进行叙述。首先,对原始的价格序列}16405,16515,16455,16555,16565{0X进行一阶段累加变换,生产新的1-AGO序列}82495,66090,49575,33120,16565{1X;紧邻均值序列为},5.41247,33045,24787,16290{1Z;然后运用最小二乘法估计出a=0.002366,b=16599.79628,则原始的GM(1,1)模型为:79628.16599002366.0dd11XtX;响应函数为:025641.701639802564.6999831ˆ)1(002366.01kekX;根据模型来还原出2010年7月5日至2010年7月9日的模拟值分别为{16565,16541.03,16501.94,16462.94,16424.04}以及2010年7月12日至2010年7月16日预测值分别为{16385.234,16346.515,16307.888,16269.351,16230.906},最后分别对模拟结果的残差进行检验,详细结果见表一。新信息模型的建立过程和新陈代谢模型的建立过程基本上跟原始信息模型的建立过程基本一致,因此不在分析,具体参数结果参见表二。表一、三种模型的预测结果和误差检验表表二、三种模型的一步预测精度比较三、结论(1)基于GM(1,1)模型的预测中,由于数据选取不一样,导致模型建立的结果也不一样,特别是参数a、b的结果不一致,这说明不同时间段的棉花价格对整个价格预测模型的预测结果的影响情况不一致;(2)从一步预测精度上来看,新陈代谢模型的预测精度高于新信息模型,新信息模型的预测精度高于原始模型,这主要是新信息的认知作用大于老信息,新信息能够及时的反映整个系统的变化。因此,在棉花期货的价格预测中,要及时的加入新的价格信息,同时提出老的信息,及时保持整个模型的新鲜性,以保障价格预测的精度;(3)GM(1,1)模型中的发展系数a有重要意义,可以确定建立的模型是适合于长期预测还是短期预测。当-a小于0.3时,可以用于中长期预测,当-a处于(0.3,0.5)之间时,可用于短期预测,但是中长期预测慎用;当-a处于(0.5,0.8)之间时,做短期预测应该谨慎;当-a处于(0.8,1)之间时,应采用残差项来建立GM(1,1)模型;当-a大于1时,不应采用GM(1,1)模型。从上面的分析结果可知,三种模型的发展系数分别为:-0.002366、-0.003523和-0.003678,远远小于0.3这个临界值,因此三种模型都可以运用于中长期预测;(4)对于5步的预测结果上看,对三种模型的残差分别进行统计性描述分析,其均值分别为{-112、-8.89和58.12},标准差分别为{65.8/82.9和165}。从分析结果上看,从较长的时期预测结果来看,新陈代谢模型和新信息模型的价格预测的残差变动幅度较大,而原始模型虽然残差相对较大,但是波动幅度相对稳定;从相对误差上来看,三种模型的平均相对误差分别为{0.5%、8.9%和7.2%},原始模型的平均相对误差较小,因此,要预测棉花期货长期价格的时候,采用原始的GM(1,1)模型更为可靠。