基于粗糙集神经网络的数据挖掘系统及其应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

哈尔滨理工大学硕士学位论文基于粗糙集神经网络的数据挖掘系统及其应用姓名:穆丽新申请学位级别:硕士专业:计算机应用技术指导教师:刘胜辉20060301基于粗糙集神经网络的数据挖掘系统及其应用作者:穆丽新学位授予单位:哈尔滨理工大学相似文献(10条)1.学位论文乔磊基于神经网络方法的数据挖掘平台设计和实现200821世纪,随着信息社会的不断发展和互联网的逐渐普及,人们面对日益增加的信息量,迫切需要有效的工具来分析和处理所需要的数据。随着20世纪80年代神经网络的发展和KDD(数据库中的知识发现)的逐步推广,数据挖掘技术应运而生。数据挖掘是为了发现数据中事先未知的规则和联系而对大量数据进行选择、探索、分析和建模的过程,其目的在于帮助人们找到潜在的具有应用价值的挖掘结果。神经网络以模拟人脑神经元的数学模型为基础,并以此建立自适应的动态系统,具有适应能力强、并行速度快的特点。在数据挖掘领域,神经网络常用于分类(如感知机、BP、RBF网络)、聚类(如SOM、RBF网络)和统计预测(如RBF网络);神经网络尤其适合于处理描述性和预测性的数据挖掘。遗传算法作为一种模拟生物自然选择和遗传机制的随机搜索方法,具有隐含的并行性和全局搜索性,并且易于和其他模型相结合。Java强大的面向对象和网络编程特性以及方便的跨平台性,使得目前许多公司和组织用其进行基于Web的软件开发。而作为Java企业级开发平台的工业标准J2EE,更是为广大Java开发人员提供了一套完整而强大的中间平台。MVC(Model-View-Controller)设计思想由TrygveReenskaug提出,现已成为一种广泛应用于J2EE开发领域的设计模式。本文从理论和开发两方面进行相应的结构组织。理论部分,首先介绍了数据挖掘的概念以及神经网络在数据挖掘中的应用。按照数据挖掘的相关技术,本文详细介绍了处理分类问题的两层感知机、BP神经网络、RBF径向基函数网络以及用于无监督聚类问题的SOM自组织神经网络;对每种网络,还通过实际的用例给予了更为直观的功能描述;然后介绍了遗传算法的相关知识,本文重点分析了如何利用遗传算法优化BP神经网络的结构以及初始的连接权值;并用一个实验说明了遗传算法在优化BP神经网络中的优良表现。在挖掘平台的开发部分,本文首先介绍了在线数据挖掘项目MinerOnWeb;然后着眼于软件工程的需求分析、设计以及开发流程,详细介绍了在J2EE架构下基于神经网络方法的数据挖掘平台的设计方案和开发步骤。按照实际的开发需求,将挖掘平台划分成数据源的获取、神经网络挖掘模型的训练、神经网络挖掘模型的保存以及挖掘模型的应用四个部分;然后对每个部分进行了详细的介绍。挖掘平台的开发紧紧围绕两层感知机、BP神经网络、RBF径向基函数网络以及SOM自组织神经网络的数据挖掘应用而展开。本文同时还展示了这四种神经网络在挖掘平台上的实际应用效果。2.期刊论文王文斌.刘竹松基于神经网络的数据挖掘模型研究-广东科技2009,(12)在实代数理论的基础上引入样条权函数实现一个神经网络数据挖掘模型,克服传统神经网络训练的权值难以反映训练样本信息的缺陷;优化神经网络结构,简化数据挖掘模型结构;增强神经网络的泛化能力;解决神经网络神经元个数与样本有关的难点;采用以上方式实现一个能解决传统神经网络数据挖掘模型存在的挖掘速度慢、收敛速度慢、初值敏感等缺陷的高效神经网络数据挖掘模型.3.学位论文蒋良孝基于神经网络的医疗数据挖掘研究2004近来,医疗工程研究有了迅猛发展.测量仪器技术的提高使得大量医疗信息可以被精确地记录下来,从而导致医疗数据资料爆炸性增长.尤其随着医疗信息系统在各大医院逐渐投入使用,收集到的病人信息不仅包括医疗影像、各项生理指标,而且还有病人年龄、性别、身高、体重、既往病史等大量详细的背景资料.而且各大医院收集到的数据又进一步汇总,这样汇总的数据是相当庞大的,而且都是病人的真实数据.从这样的数据集中运用各种数据挖掘技术了解各种疾病之间的相互关系、各种疾病的发展规律,总结各种治疗方案的治疗效果,以及对疾病的诊断、治疗和医学研究都是非常有价值和发展前途的.与仅限于某一专项领域知识的医疗专家系统不同,医疗数据挖掘是面向整个医学数据库或医学信息集合提供知识和决策,是医疗决策支持系统的重要组成部分.由于医疗数据自身具有的特殊性和复杂性,与常规的数据挖掘相比,医疗数据挖掘在挖掘对象的广泛性、挖掘算法的高效性、提供知识或决策的准确性方面有着更高的要求.在医疗数据挖掘方法中,人工神经网络、粗糙集理论、进化计算、模糊逻辑和支持向量机等计算智能方法显示出了独特的优越性,并得到了广泛的应用.本文对基于神经网络的医疗数据挖掘技术进行了较为深入的研究,主要的工作如下:1)在阅读并消化大量相关的国内外文献的基础上,综述了医疗数据挖掘的主要特点、基本过程、关键技术、计算智能方法及发展方向,并给出了几个医疗数据挖掘的应用示例.2)回顾了粗糙集理论的几个基本概念,总结出了基于粗糙集的规则获取步骤,并用一个实例验证了算法的有效性和准确性.3)介绍了神经网络的发展历史、基本要素、神经元模型、基本特性以及基本原理,探讨出了基于神经网络的数据挖掘步骤,并对各个步骤涉及的算法进行了比较分析.4)根据基于神经网络的数据挖掘步骤和粗糙集理论在规则获取中的作用,提出了一种基于神经网络和粗糙集的分类规则挖掘新算法.并结合VC++6.0和MATLAB6.5两种语言编程环境的优势,以从加利佛尼亚大学FTP上下载得到的WisconsinBreastCancerDatabase医疗数据库为研究实例,实现了新算法,验证了新算法的准确性和有效性,开发出了一个医疗分类规则挖掘的演示系统,为以后开展医疗数据挖掘的研究工作提供了示例.4.期刊论文李别.LiBie基于神经网络的数据挖掘算法-广东技术师范学院学报2005,(4)数据挖掘涉及多学科技术的集成,包括数据库技术、神经网络、模式识别、信息检索、图像与信号处理和空间数据分析等.神经网络在数据挖掘中的应用也越来越广泛,尽管神经网络具有结构复杂、网络训练时间长、结果表示不容易理解等缺陷,但其对噪声数据的高承受能力和低错误率的优点是其他方法所不及的,并在数据挖掘所采用的方法中具有优势.本文对基于BP神经网络的数据挖掘算法进行了详细的讨论,并提出了算法改进方法.5.学位论文张波基于遗传BP神经网络的数据挖掘系统及其应用2005随着数掘库技术的成熟和数据应用的普及,大规模数据库和数据仓库的建、人们开始面对“数据丰富,但信息贫乏”的挑战,要从海量的数据中发现有用的规律就需要用到数据挖掘技术。数据是挖是从大量数据中挖掘出隐含的、先前未知的、对决策有潜存价值的知识和舰则。这些规则蕴涵了数据库中一组对象之间的特定关系,提出一些有用的信息,为经营决策、市场策划、金融预测等提供依据。数据挖掘是一门交叉性学科,涉及机器学习、模式识别、归纳推理、统计学、数据库、高性能计算等多个领域。针对煤炭行业的一般性、特殊性问题,本文提出并建立了一种基于遗传BP神经网络的数据挖掘系统,来解决目前煤炭行业中的不缺数据缺知识的现状。本文重点研究了数据挖掘中采用的算法问题,神经网络算法是数据挖掘技术中常用的一种算法,具有高正确率、抗噪声数掘能力强等优势,其中应用最泛的是BP神经网络算法。运用BP神经网络算法建立数据挖掘系统统对斛决煤炭行业中出现的实际问题有重大的意义。但是BP神经网络算法有算法效率低、收敛速度慢、易陷入局部极小值等问题,要解决这个问题,我们提出一种用遗传算法来对BP神经网络进行辅助优化的方法,即遗传BP神经网络算法。此算法充分避免了上述问题。最后,利用数据可视化技术解决了数据挖掘输出结果不能直观显示给用户的问题。本文利用先进的数据挖掘技术建立了一个基于遗传BP神经网络的数据挖掘系统,并用来指导煤炭行业中出现的问题,在拓展数据挖掘技术的应用方面做了一个有效的尝试,同时对其他行业中出现的类似问题的解决提供了一个方法,有一定的指导作用。6.学位论文林钢基于数据挖掘的前向型神经网络在交通流时序预测中的应用2004随着数据挖掘在各个领域内的展开,各种数据挖掘技术开始向深层次发展,其中比较有特色的新数据挖掘技术就是神经网络技术.神经网络技术是一种起源于仿生的技术,神经网络的构建目前尚未有比较成熟的理论来指导,一般只是用试探寻优的方法来实现,但是关于神经网络的学习训练则有比较成熟的理论指导.在本文讨论的前向型神经网络中最为典型的就是BP算法,目前关于对BP算法的改进研究也比较流行.随着计算机技术的发展,人们只需要几个函数几行代码就可以应用先进的神经网络技术,而不用去理解详细的神经网络原理,这使人们能够省下很多时间,把更多的精力放在对所要解决问题的研究上.因此神经网络的应用也得到了很大的普及.在解决交通领域内的问题时,神经网络具有得天独厚的先天优势,其中最为重要的就是神经网络可以很好的解决交通领域内的非线性问题,其中前向型神经网络特别适合对交通流的预测.随着人们对智能交通体系的要求提上日程,随着神经网络在训练速度和预测精度等方面不断的提高,把神经网络用于建设智能交通体系成为了一种非常明智的选择.为此,本文针对问题的现状与趋势,在总结他人成果的基础上,开拓创新,做了以下几方面的工作:1.在总结数据挖掘发展的基础上,对数据挖掘的概念、任务、方法进行了全面,细致而又带有创造性的总结,并且对数据挖掘的发展趋势进行了有充分依据的预测;2.对神经网络技术进行了全面系统的总结,并着重总结了用于前向神经网络的BP算法的实现与改进,提出了自己对改进的看法和建议,并在此基础上讨论了一种广义神经网络的构建问题;3.对数据挖掘、神经网络与交通流预测的关系进行的多方面的说明,使文章脉络更加清晰;4.通过预测仿真试验,讨论了前向型神经网络的设计对战略交通流时序预测效果的影响,并提出了对网络设计的建议;5.对BP算法提出了分四步走的全面智能改进方法,并把这种方法应用于对战略交通流的动态时序预测,通过仿真证明了这种改进的优异效果;6.提出了一种新型的用正弦余弦函数组构建的广义神经网络,并把它用于短期交通流的动态时序预测中,通过仿真证明了这种广义神经网络的先进性.7.期刊论文丁翔.方建安单纯形微粒群组合算法优化神经网络及在数据挖掘中的应用-微型电脑应用2009,25(1)神经网络作为数据挖掘的重要工具,如果提高神经网络训练过程的达优率与泛化能力,就能够改善其在分类预测任务中的预测准确度和噪声承受力.该文提出以复合适应度代替传统的均方误差作为神经网络的训练指标,从而改善神经网络泛化能力;并将用于训练神经网络微粒群算法通过单纯形算法改进,从而提高了全局搜索能力与达优率.最终产生一种基于复合适应度的单纯微粒群神经网络训练算法模型.将这样的模型应用于数据挖掘的预测任务中,实验结果表明,预测准确度和噪声承受力均有所提高.8.学位论文万鹏机械故障诊断中基于神经网络的数据挖掘方法研究2006随着生产的发展,机械故障诊断的重要性越来越明显。传统的诊断技术和理论方法对于具有多故障、多过程、突发性故障的现代化机械设备,往往显示出较大的局限性,难以从大量的故障信息中发现原因和准确地诊断机械故障。而数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,它能从数据仓库中自动分析数据,进行归纳性推理,从中挖掘出潜在的模式;或者产生联想,建立新的业务模型,帮助决策者做出正确的决策。数据挖掘研究和实践表明:知识就隐藏在日常积累下来的大量数据之中,然而仅靠复杂的算法和推理并不能发现知识。人工智能技术,特别是神经网络技术与数据挖掘的结合为机械故障诊断的研究指出了一条新的道路。首先,本文对机械故障诊断、数据挖掘的研究现状、发展趋势及应用领域进行了综述,阐述了数据挖掘、神经网络的基本概念、基本模型和实现方法。其次,针对数据挖掘具体的研究内容,提出并实现了神经网络数据挖掘中的数据准备的一般处理方法和基于自组织神经网络的聚类分析的模型和算法,并对算法进行了改进。最后,根据基于神经网络数据挖掘的研究成果

1 / 71
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功