软件设计开发ComputerKnowledgeandTechnology电脑知识第11卷第18期(2015年6月)基于SPSS相关性和回归分析的股票投资算法研究徐奔(浙江行政学院,浙江杭州311121)摘要:该文是将计算机和统计学的相关性分析、回归分析相结合,将其应用到股票市场的数据分析中,通过分析股价间的相关性来进行投资策略的研究。该算法首先用SPSS对股票价格进行相关性分析,定量说明股票之间的相关性,并计算相关系数,确定其相关性强弱,然后用SPSS进行线性回归分析,初步确定股票的函数关系,通过预测出的函数关系寻找出最佳投资策略。关键词:SPSS;相关性分析;回归分析;股票投资中图分类号:TP399文献标识码:A文章编号:1009-3044(2015)18-0088-02股市已成为掌控经济整体运行情况的重要参考,因此一直都是经济领域研究的热点。但当前多专注于股价预测和各种实证分析,缺乏对股市进行系统的分析和认知,难以从整体上准确把握股市的结构特性。通过运用SPSS中强大便捷的相关性分析和回归分析功能,对股票价格波动趋势进行研究,预测出股票价格之间的函数关系,使之能在股票投资、预测中发挥重要作用。1相关理论1.1相关性分析相关性分析是通过样本数据,研究两变量间线性相关程度的强弱,反映出两变量间趋同关系。通常须遵循以下步骤:1)对变量间是否有相关关系做出定性判断。2)绘制散点图,通过变量间散点密集程度和未来趋势来确定和反映变量间相关关系的方向和具体表现形式。3)精确计算变量间相关系数大小。在实践中,最常用的是皮尔逊相关系数:(1)根据数值大小,将不完全线性相关的密切程度分为四级:为微弱相关;为低度相关;为中度相关;为高度相关。1.2回归分析回归分析是在掌握大量数据的基础上,利用数理统计方法建立自变量与应变量之间的回归关系函数表达式。通常遵循以下步骤:1)确定自变量和应变量。2)从样本数据出发,确定变量间的数学关系式,并对回归方程各参数进行估计。3)对回归方程进行各种统计检验。4)利用回归方程进行预测。2基于SPSS相关性分析的股票投资算法基本思路股票投资分析主要通过统计分析方法来实现,常用的方法有相对数、均值和方差、统计指数、时间序列分析、概率、相关与回归分析等。股票价格变化之间的相关性就是一种股票价格的涨落是否会影响另一种股票价格的变动,即二者之间是否有相互联系,是否存在相关性。其相关性可由相关系数值来确定。由公式(1)可知股票相关系数r,股票价格χ、y的函数关系,其中,为常数项,为y对χ回归系数。选择两支同行业的相关股票,其价格呈正相关,同时投资两支呈正相关的股票,且价格可用函数关系表示。当某一时段股票甲的价格χ、股票乙的价格y不满足函数关系时,在以后的某一时刻会回归到原有函数关系,则在这段时间内可对这两支股票进行投资。分两种情况:1)当时,把y对应的股票卖掉,买进χ对应的股票,当股票χ、股票y重新满足函数关系时则能盈利。2)当时,把y对应的股票买进,卖掉χ对应的股票,当股票χ、股票y重新满足函数关系时则能盈利。3实证分析3.1导入股票历史数据用股票软件导出相关性较强的两支股票的历史数据,本文以农业银行和建设银行两支股票为例进行研究,选取从2015年1月1日到2015年6月1日每日收盘价数据整理成Excel表格并导入SPSS中。Excel表中有Date、农行收盘价(以下简称农行Close)、建行收盘价(以下简称建行Close)、残差等字段。3.2相关性分析用SPSS进行相关性分析,判断分析农业银行和建设银行每日收盘价之间是否具有相关性。在SPSS软件中点击“分析”-“相关”-“双变量”,将“农行Close”和“建行Close”作为变量,“相关系数”选“Pearson”,“显著性检验”选“双侧检验”,并选“标记显著性相关”。得到如图1的结果:收稿日期:2015-03-15作者简介:徐奔(1981—),男,浙江杭州人,工程师,硕士,主要研究方向为软件工程,算法研究。E-mail:xsjl@dnzs.net.cn电脑知识Vol.11,No.18,June201588软件设计开发ComputerKnowledgeandTechnology电脑知识第11卷第18期(2015年6月)图1Pearson相关性图从图1中可以看出“Pearson”的相关性为0.910,所以“农行Close”和“建行Close”两者相关系数为0.910,属于正相关关系。“显著性(双侧)”结果为0.000,因0.0000.01,所以具备显著性,可得出:二者具有正相关性,有很强的关联性。3.3回归分析用SPSS进一步进行回归分析,构建一元线性方程。在SPSS软件中点击“分析”-“回归”-“线性”,以“农行Close”为应变量,“建行Close”为自变量,并在“统计量”中设置“回归系数”为“估计”,“残差”为“Durbin-Watson(U)”,并选“模型拟合度”,得到如图2结果:图2模型汇总b从图2中可以看出模型的拟合度是0.827,调整后的模型拟合度是0.825,说明“建行Close”的情况都可用该模型解释,拟合度相对较高。图3Anovab从图3中可以看出,回归模型的方差分析表中F的统计量为407.667,P为0.000,模型显著。图4系数从图4中可以看出,回归系数常量为-0.110,回归系数为1.695,对应sig为0.000,具有显著性。3.4最终结论1)通过相关性分析可知农行和建行两者股票价格相关系数为0.910,有高度相关性,且为正相关关系。2)通过一元线性回归分析可知农行和建行股票价格回归系数为-0.110,常数为1.695。3)根据算法的思路,设农行为x,建行为y,则函数关系为,则有下面两种情况:当时,卖掉y股票,买进x股票,重新满足时盈利;反之,买进y股票,卖掉x股票,重新满足方程时盈利。4结束语基于相关性分析的商业软件产品还不多,大多数相关性分析函数计算软件如R/S+、SAS、MATLAB等大都用于实验室研究中,还没有广泛的商业应用,本文旨在让更多的人特别是金融投资人士体会到相关性分析在股票投资方法研究方面的优点,今后,研究多只股票之间的动态相关关系,包括时变模型以及变结构模型,将会是研究的一个重点。参考文献:[1]葛毅.基于个股相关性的中国股市网络结构分析[D].上海:上海交通大学,2009.[2]郑娟.基于Copula函数股票相关性分析系统的设计与实现[D].太原:太原科技大学,2012.[3]蔡智澄,何立民.相关性分析原理在图书情报分析中的应用[D].杭州:浙江工业大学,2006.[4]张利,卢秀颖,吴华玉,郝胜志.基于粗糙集的启发式值约简的改进算法[J].仪器仪表学报,2009,1(1):82-85.[5]孙振宇.多元回归分析与Logistic回归分析的应用研究[D].南京:南京信息工程大学,2008.(上接第87页)参考文献:[1]孙超,徐全生.汇编语言程序设计题自动阅卷技术的研究与实现[J].科技信息,2007(3).[2]李强,陈遵德.基于XML的MicrosoftOffice操作题自动评分及题库建设的实现[J].顺德职业技术学院学报,2007,5(1):1-6.[3]安志红.基于VB,VC的试题库管理系统设计[J].辽宁师范大学学报:自然科学版,2004,27(1):112-114.[4]陆旦前,邱建林.基于Office对象库的多层结构的图表发布[J].南通大学学报:自然科学版,2007,5(4):90-92.[5]于淑香,徐汀荣.基于COM技术的Office自动评分系统的设计与实现[J].沙洲职业工学院学报,2007(3):1-3.[6]董跃武,黄凯东,勾学荣.遗传算法与试题库自动组卷[J].中国远程教育,2002(8):15-45.[7]李旌燕.EXCEL操作题自动出题和自动阅卷系统的设计与实现[D].长沙:中南大学,2009.89