硕士毕业论文__开题报告201304080最新

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

北京信息科技大学硕士学位论文选题报告选题名称基于时间序列多目标投资组合应用姓名专业、年级指导教师协助指导教师报告日期1填表说明1.应根据表中所提出的要求作开题报告,听取意见修改后,方可填写此表。2.封面“指导教师”一栏仅限正式指导教师,“协助指导教师”限在研究生部正式备案的协助指导教师。3.本表一式三份,经评议组及学科(专业)所在分委会批准后,本人、各分委会和研究生部各持一份。4.选题报告(连同评分附表)在第三学期末,由所在学科(专业)分委员会签署意见后,统一交研究生部备案。一、选题背景和立论依据21.选题背景(课题来源)(1)时间序列的分析研究始终是经济学和统计学的一个热点,对于制定精确定价和预测决策是至关重要的,近代计量经济学和金融市场的许多研究成果和市场决策理论愈来愈多是建立在时间序列分析的基础上。传统应用较广的是Box和Jenkins(1970)提出的ARIMA(自回归求和移动平均)方法;Engle(1982)提出了ARCH模型(一阶自回归条件异方差),用以研究非线性时间序列模型,由此开创了时序独树一帜的研究思路和方法。(2)时间序列分析是一种动态数据处理的统计方法。研究随机数据序列所遵从的统计规律,以用于解决实际问题。时间序列是按时间顺序排列的一组数字序列。而时间序列分析就是利用这组数据,应用数理统计方法加以处理,以预测未来事物的发展。它的基本原理:一是承认事物发展的延续性。应用过去数据,就能推测事物的发展趋势。二是考虑到事物发展的随机性。任何事物发展都可能受偶然因素影响,为此要利用统计分析中加权平均法对历史数据进行处理。(3)随着时间序列分析理论和方法的发展,美国学者Schemas和Lebanon发现股票日收益序列与周收益序列中存在混沌现象,米尔斯也指出金融时间序列似乎通常可以用随机漫步来很好近似,非线性时间序列模型被广泛应用在金融时间序列分析中。(4)数据挖掘是信息技术自然演化的结果。是机器学习,统计学,数据库设计,可视化和信息科学等学科的交叉,用到其他学科的技术,如神经网络,模糊或粗糙集理论,知识表示,归纳逻辑程序设计或高性能计算。针对不同数据库系统有不同的数据挖掘技术,其中之一为时间序列数据挖掘系统(TSMS),时间序列数据库是指由包含一些随时间变化的序列值构成属性的数据库,同传统数据库主要差异在于属性包含的信息内容,传统数据库每一记录包含属性独立于其他记录,而时间序列数据库中一些属性仅与时间分段有意义,如在股票时间数据库中,我们对一段时间股票价格更感兴趣,而不是仅仅对某一天的价格。(5)时序数据库挖掘一般包括趋势分析,相似性搜索,序列模式挖掘和周期模式挖掘,发现转折点(change-points),暂态规则等方面内容。用到技术和方法为类Apriori算法,离散傅立叶变换(DFT)和离散小波变换(DWT),模糊集,聚簇方法,神经网络等,其中,神经网络所具有的非线性,适应性,泛化能力使其在时序数据尤其对非线性时序数据挖掘研究中已被认为是一有效的挖掘技术而广泛研究。(6)时序分析是应用性很强的研究方向,数据具有数据量大,记录不等间隔,混合了含有连续型和离散型的变量,分布具有厚尾性等的特征使现有的时间序列分析方法无法下手,许多具体问题使现有的时间序列分析方法无法下手,探索将数据挖掘的处理方法应用到金融时序分析上具有深刻意义。(7)数据挖掘将成为时序分析的重要工具和组成部分。2.文献综述(包括选题依据、国内外研究现状、选取方法概述、课题研究意义等)国外研究现状1、Das等提出如何从时间序列中发现关联规则,其采用了平滑固定窗口来分离时序,然后用聚簇方法将子序列进行模式生成32、Han等提出周期分段和部分周期分段的数据挖掘方法,其中用到类Apriori算法,关注于发现暂态模式而不是暂态规则。3、Chung等提出动态分割方法对时间序列进行分段,需用户预选提供一组模式作为先验知识,在此基础上对原始时间序列进行分段4、Chan等提出用小波变换对时间序列进行相似性搜索,其基于两类重要距离定义,Eucliden距离和时间戳,Rafiei等提出相似性搜索的方法基于傅立叶变换。5、Almeida等提出用领域知识(DomainKnowledge)用来对经济时间序列进行预测。6、Vojinovic等提出用径向基神经网络对时间序列预测。国内研究现状1、陈哲等提出基于小波神经网络和相空间重构对混沌时间序列分析,并将其与MLP和ARMA模型作了比较。2杨益群提出对时间序列进行小波分析进行预测的方法.3、康卓等提出多尺度动态概念并运用宏观动力学模型进行时间序列的预测。存在问题用数据挖掘的方法对金融时间序列进行分析,方法多种多样,没有统一认识。目前数据挖掘的方法都只是针对特定时间序列分析,将其应用到不同非平稳时间序列上效果如何有待进一步研究。不同金融时序分析可能需要不同的分析方法。同时,对多元时间序列进行合成分析目前文献较少。3.所查阅的与选题有关的中外文献名称、作者、期刊及所用查阅手段参考文献:[1]董进1宏观经济波动周期的测度1经济研究,2006(7)[2]高铁梅1计量经济分析方法与建模1清华大学出版社,2005[3]李华,胡奇英1预测与决策1西安电子科技大学出版社,2005[4]Baxter,M1andR1G1King,MeasuringBusinessCycles:ApproximateBand2PassFiltersforEconomicTimeSeries,ReviewofEconomicsandStatistics,1999,Vol181,No14,Nov1,575~593.[5]RobertJ1Hodrick;EdwardC1Prescott,PostwarU1S1BusinessCycles:AnEmpiricalInvestigation,JournalofMoney,CreditandBanking,1997,Vol129,No111Feb1,1~16.[6]谷赫.时间序列的数据挖掘在证券预测分析中的应用研究[D].硕士学位论文.2005.5[7]李时银.期权定价与组合选择[M]。福建:厦门大学出版社,2002,269-278[8]王春峰,万海辉,张维.金融市场风险测量模型-VAR[J].系统工程学报,15(1):67-75,2000[9]宋博.基于GARCH模型的VAR计算[D].硕士论文南京工业大学2004.7[10]曾海泉.时间序列挖掘与相似性查找技术研究[D].复旦大学博士学位论文[D],2003.4[11]邢永康,马少平.一种基于Markov链模型的动态聚类方法[J],计算机研究与发展2003.2129-135[12]谢锦辉.隐马尔科夫模型及其在语言处理中的应用[M],华中理工大学出版社,19961-44[13]李斌,谭立湘,章劲松,庄镇泉,面向数据挖掘的时间序列符号化方法研究,电路与系统学报,2000.[14]陈文伟,黄金才.数据挖掘技术.北京:北京工业大学出版社,20024查阅手段:1.利用学校数据库搜集、下载与时间序列、数据挖掘、投资组合等有关的最新文献。2.到国家图书馆查阅相关文献。二、研究内容1.学术构想与思路、主要研究内容及创新点学术构想与思路:通过查阅大量文献资料,总结前人对时间序列和投资组合的应用和发展,对时间序列模型进行优化,对证券市场进行归类,选择最优组合,最后给出案例证明优化模型的可行性和实用性。主要研究内容:(1)深入分析了数据挖掘以及以及时间序列的基本理论,对研究现状进行了详细讨论,并对各常用方法进行了比较,保证了基于时间序列数据挖掘方法的可行性;(2)将模糊模型、聚类算法和神经网络方法三者结合,以数据对象对于类的隶属度代替其对规则的隶属度,以减少输入规则的条数,简化聚类模糊预测模型,并引入了滑动窗口技术以提高预测性能,并讨论了中国股市市场的收益率分布函数选取的相关问题。(3)从序列异常的角度提出了时间序列的偏差异常检测方法。(4)分别采用上述方法对中国证券市场实际数据进行了应用,对研究结果进行分析与验证。主要创新点:(1)对股票波动率序列进行子序列相似性搜索,在搜索过程中,通过一个迭代过程,查找到的相似时间序列点个数,将不相似的百分比作为序列波动相似程度的度量。并且得到相应的优化算法过程。同时考虑到了时间序列间量纲的差别和时间轴的不一致性。通过线性变换的方法使得量纲统一。(2)将股票的连续变量进行离散化处理,通过对每个股票序列建议一个Markov链,由于Markov转移矩阵从统计角度上表现了序列的波动特征。所以利用该模型的转移矩阵来描述该时间序列的动态特征,通过度量这些矩阵的距离,得到序列间的距离度量。也就是将这些时间序列的聚类问题转化为对这些Markov链的聚类问题。(3)利用ARMA模型对神经网络训练过程中的训练误差进行分析,预测在预测过程中的可能出现的误差,进行修正,提高了预测准确度。(4)利用matlaB/SPSS开发工具,开发出一个投资组合模块,其中包括股票基本统计分析,波动分析,聚类分析,投资组合分析等。2.可行性分析及论证在证券市场中每天产生大量的交易数据,这些数据影响着股票交易活动,同时也是人们买卖股票的重要依据,投资者根据主管判断,分析个股行情,同时选择不同的股票进行分散化投资,如何充分利用这些数据,从中获得有用的信息并转化为知识从而更好的知道股民进行科学的股票交易成为人们研究的热点。由于投资者最关心的是资产价格变化,对价格序列进行分析,可以借助时间序5列的分析方法。数理统计分析方法是目前金融时间序列分析中最重要的方法。但是随着数据量的不断增加,这些方法在分析方面存在一定的缺陷。指出各种统计分析方法的二个主要问题在于,其无法有效地处理具有较大规模的数据集。此外数据统计分析方法也不适用于从大量的数据中主动地发现各种潜在的规则。数据挖掘作为一种新兴的知识发现方法,面向具体问题,进行知识挖掘。三、研究手段及条件1.拟采取的研究方法、实施方案研究方法:在数据收集与整理过程中,作者拟对时间序列数据进行数值化、归一化处理,并对缺省数据进行进一步的处理,方法待定。实施方案:(1)介绍投资组合模型发展和数据挖掘技术在投资组合中的应用,以及投资组合模型的风险评估方法。(2)介绍时间序列聚类中的距离度量问题,为股市投资组合研究找出适合股票收益序列距离度量方法,指出各种算法的过程和各种指标的实现算法。(3)介绍了基于matlaB/SPSS模块的组合分析模块,并且对上证A股数据进行投资组合和风险分析,表明通过数据挖掘可以降低投资组合风险。2.所需经费,包括经费来源及开支预算四、拟解决的主要难点、问题1.研究过程中预计可能遇到的困难或问题(1)数据量巨大。由于现代存储手段和通信水平的提高,全球投资者脱离了地域时域的限制,交易投机活动随时随地都在进行,全球资本大规模的流动,高频数据的大量产生,无论对股民还是投资机构来说,手工或者基与常规方法分析股票数据几乎没有意义。(2)数据高度随机性。市场的不稳定不理智行为以及经济政治因素的交互影响市场冲击着资本市场,不同的信息对不同类型的股票的影响效果并不统一,不同市场的反应水平并不一致。(3)市场行为和市场理论并不一致。虽然经济理论层出不穷,但是与市场行为相比,经济理论的发展总是滞后的,往往总是市场行为与理论出现了较多的不一致,经济理论才开始寻找新的出路和新的工具。所以经济理论并不能动地。动态地跟踪市场的发展。2.解决的方法和措施(1)渠道多元化。通过多元化的渠道来源,尽可能多的收集有效数据。(2)运用各种算法优化模型,找到最有拟合模型。五、工作计划及工作量序号阶段及内容工作量估计起迄日期阶段成果形式6(时数)1资料翻译和网络信息搜集4002013.9-2013.11翻译材料、搜索相应期刊2完成开题报告1002013.12开题报告3掌握所需软件操作技巧5002014.1-2014.5掌握时间序列模型应用以及数据挖掘原理和matlaB、spss软件4指标体系的构建4002014.5-2014.7完整的方法理论体系、完整的理论体系5收集数据、进行

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功