基于微粒群优化算法的聚类分析及其在学生成绩管理中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

山东师范大学硕士学位论文基于微粒群优化算法的聚类分析及其在学生成绩管理中的应用姓名:刘梦琳申请学位级别:硕士专业:管理科学与工程指导教师:刘希玉20070410基于微粒群优化算法的聚类分析及其在学生成绩管理中的应用作者:刘梦琳学位授予单位:山东师范大学相似文献(10条)1.学位论文许存兴聚类分析在数据挖掘中的应用2004聚类分析是数据挖掘方法中的一个重要的方法.该文首先对数据挖掘进行了简要的描述;其次、着重对数据挖掘中的聚类分析法进行讨论;最后、以一个超市的商品销售为例,用数据挖掘中的聚类分析法进行了挖掘.因此,该文从研究数据挖掘的算法角度出发,从三个方面对数据挖掘进行了论述:一、数据挖掘的概述通过对数据挖掘的概念、方法、过程、特点、作用及其与统计学关系的描述,使我们对数据挖掘有一个整体的了解.二、聚类分析在数据挖掘中的应用在这部分首先介绍了统计学中的聚类分析基础知识,即距离与相似系数和聚类的特征与聚类间的距离.其次,介绍了具体的聚类分析方法,包括分层聚类法(最短距离法、最长距离法和中间距离法)、分割聚类算法(PAM算法、CLARA算法)、基于密度的方法、基于网格的方法和基于模型的方法.三、数据挖掘在超市中的应用在这部分以某一超市为例,以数据挖掘的过程为线索,对这个超市的销售数据用聚类分析法中的层次法进行了数据挖掘;其次,对数据挖掘的结果进行了描述;最后,分析了数据挖掘的结果.2.期刊论文陈学进.CHENXue-jin数据挖掘中聚类分析的研究-计算机技术与发展2006,16(9)聚类分析是由若干个模式组成的,它在数据挖掘中的地位越来越重要.文中阐述了数据挖掘中聚类分析的概念、方法及应用,并通过引用一个用客户交易数据统计出每个客户的交易情况的例子,根据客户行为进行聚类.通过数据挖掘聚类分析,可以及时了解经营状况、资金情况、利润情况、客户群分布等重要的信息.对客户状态、交易行为、自然属性和其他信息进行综合分析,细分客户群,确定核心客户.采用不同的聚类方法,对于相同的记录集合可能有不同的划分结果对其进行关联分析,可为协助各种有效的方案,开展针对性的服务.3.学位论文席景科数据挖掘中聚类分析的研究与实现2003该文首先概述了数据挖掘的概念、分类和数据挖掘过程;其次,介绍了聚类分析的定义,对聚类分析算法进行了系统地归纳和总结,并简要介绍了每一种代表性算法的实现思想及其优点和不足;然后,重点讨论了k-prototypes算法——一种能对数值型和分类型混合属性数据集进行聚类的算法,在此基础上,提出了基于k-prototypes算法的改进算法,并使用实验室数据集对改进算法进行了测试,证明新算法是有效的;最后,根据目前的研究状况,提出了聚类分析技术需要进一步的研究方向.4.学位论文周东华数据挖掘中聚类分析的研究与应用2006数据挖掘是目前信息领域和数据库技术的前沿研究课题,被公认为是最具发展前景的关键技术之一。数据挖掘涉及到统计学、人工智能(特别是机器学习)、模糊理论和数据库技术等多种技术,它强调的是大量数据和算法的可伸缩性,是一门很接近实用的技术,其技术含量比较高,实现难度也较大。聚类分析是数据挖掘的重要功能之一,近年来在该领域的研究取得了长足的发展,出现了许多聚类分析方法,如划分聚类方法、层次聚类方法、基于密度的聚类方法、基于网格的聚类方法、基于模型的聚类方法等。这些方法所涉及的领域几乎遍及人工智能科学的方方面面,而且在特定的领域中,特定的情形下取得了良好的效果。但是当处理数大量数据、具有复杂数据类型的数据集时,仍存在若干尚未解决的问题。本文系统地研究了数据挖掘的概念、功能、处理过程及技术算法,数据挖掘的核心技术是数据挖掘的算法,本文就数据挖掘的算法做了分析和比较,选取了K—平均算法和DBSCAN算法做了深入的研究,并给出了一种基于距离的异常数据挖掘算法。本文以山西省一所高职院校的学生成绩数据为背景,通过数据预处理工作,应用以上几种算法对上述数据进行了聚类分析,实现了可视化,最终挖掘到一定价值的信息。5.期刊论文梁志荣.LiangZhirong数据挖掘中聚类分析的技术方法-电脑开发与应用2007,20(6)数据挖掘是信息产业界近年来非常热门的研究方向,聚类分析是数据挖掘中的核心技术.对各种聚类算法进行了分类,对代表算法作了详细的分析,并对这些算法从多个方面进行了比较,从而为研究和在不同领域使用这些算法提供了参考.同时还阐述了聚类分析在数据挖掘中的应用.6.学位论文李浪波聚类分析在科学数据挖掘中的应用研究2006如何让各种数据挖掘技术更好地为实际工程所服务,一直是数据挖掘领域的一个挑战。一方面是人们对快速、准确而全面获取信息的渴望,而另一方面却是各种信息的纷繁芜杂,在这两者之间架设一座桥梁的确是一个巨大的挑战。聚类分析在数据挖掘技术中占有重要的位置。所谓聚类,是将一个数据单位的集合(数据源)分割成几个称为类或类别的子集,每个类内的对象之间是相似的,但不同类的对象间区别相对较大。聚类分析是在没有先验知识支持的前提下,根据事物本身的特性研究被聚类对象的类别划分,实现满足这种要求的类的聚合,它所依据的原则是使同一类中的对象具有尽可能大的相似性,而不同类中的对象具有尽可能大的差异性。论文基于大规模核物理科学数据挖掘的背景,全面介绍了数据挖掘的关键技术和主要任务,从理论、算法和应用三个层次,结合科学数据的特点来分析预处理技术和聚类方法,提出了很多实用的预处理方法:对HDF5科学数据进行分块、除噪、集成、变换等,同时对它使用“截断法”和“逐层求差法”进行规约,并对数据进行信息提取。在聚类方面,经过比较各种聚类算法和分析科学数据的特点,提出了结合k一平均思想的改进型系统聚类算法。此聚类算法有如下特点:能生成具有代表性的数据簇中心;使用相似系数计算距离,避免了距离受量纲影响的缺点;不需要多次迭代计算,减少了计算量;不需要指定初始中心;改进了聚类图,更容易得出聚类阀值。实验结果表明这种改进的系统聚类算法非常适合科学数据的处理。本文最后简单介绍了我们开发的科学数据挖掘系统。其中重点介绍了聚类分析模块的设计和功能。7.期刊论文王虹.时文.WangHong.ShiWen基于SOFM的聚类分析在数据挖掘中的应用研究-交通与计算机2005,23(3)阐述了聚类分析在数据挖掘中的应用及地位,研究并分析了通过SOFM实现聚类分析的算法,并用该算法进行了数据挖掘的仿真实验.结果表明,基于SOFM聚类分析方法可将抽象的数学聚类问题转化为直观的空间分布问题,降低了聚类分析的难度,说明了其可操作性及鲁棒性.8.学位论文陈志强数据挖掘中聚类分析技术的研究及应用2004随着计算机技术的发展,数据库得到了广泛应用.在数据库中积累了大量可用的数据,但是数据库管理系统却没有提供有效的工具和方法来分析和利用这些数据,如何充分利用这些数据,进行决策支持成为当今需要深入研究的课题.数据库的知识发现或数据挖掘随之出现,成为有效利用数据,进行数据分析的有力武器.聚类分析是数据挖掘的重要组成部分,应用范围非常广泛,其常规应用包括:模式识别、空间数据分析、图像处理、经济学(尤其是市场研究方面)、文档分类等等,因而成为各界研究的对象.本文首先阐述了数据挖掘技术,是本文的研究背景和基石;接着讨论了聚类分析技术,是本文研究的核心和关键;最后在以上两部分基础之上开展应用研究,是本文理论结合实际、多种技术和知识综合应用的体现.由此本文通过对以上各部分的研究,提供了一个实用的、有效的数据挖掘中聚类分析技术应用的参考模型,可供准备开展数据挖掘项目的广大企业用户参考使用,这也正是本文研究的创新和目的所在.本文分为五章,内容结构如下:第1章绪论介绍了本文的研究背景,所做的主要工作和本文的内容结构.第2章数据挖掘技术概述详细介绍了数据挖掘理论和技术,包括:数据挖掘和数据库知识发现定义,数据挖掘起源,数据挖掘处理过程模型,数据挖掘技术,数据挖掘分类,数据挖掘与相关学科的区别与联系,数据挖掘研究现状及存在的问题.第3章聚类分析技术概述详细介绍了聚类分析技术,包括:聚类分析综述,聚类分析中常用的两种数据结构,聚类分析中常用的几种数据类型,聚类分析中的常用方法.第4章聚类分析应用研究在以上两章的基础上,结合一个具体的数据挖掘任务实例,研究了数据挖掘应用的解决方案,包括:数据挖掘技术应用方案研究,聚类分析应用实例,实例系统的技术重点与难点及不足,实例系统的使用介绍.第5章结束语总结全文,给出本文研究中存在的问题和今后研究工作的方向.9.学位论文吴晓彬数据挖掘中金融时间序列的粗糙聚类分析2008传统统计分析与现代金融计量经济方法研究时间序列的主要思路是建立基于严格数学推导下的统计模型并对其进行参数估计与数据检验,目前已建立起一套较为成熟的理论体系。但该方法既依赖于苛刻的假设条件,又要求所有数据都符合一个固定的数学模型,显得过于牵强。数据挖掘研究时间序列的思路则不同,它由数据直接驱动建立模型,克服了上述的缺陷。时间序列数据挖掘已是当前的研究热点之一,人们也取得不少的研究成果,但对于时间序列相似性度量这一关键难题一直未能得到较好的解决,而很多时序挖掘方法都是建立在相似性的基础上,显然时间序列相似性度量直接影响着这些时序挖掘方法的结果,为此本文首先就该关键的基础性问题展开研究,进一步讨论了该度量方法在序列挖掘中的应用。由于数据挖掘方法众多,本文不可能一一涉及,所以只针对聚类分析进行深入的探讨。聚类分析不仅是数据挖掘的重要组成部分,同时也是多元统计分析的重要方法,在实际中有广泛的运用。本文绕开了已有较多成熟方法的硬聚类,而深入地研究了一种软聚类——粗糙聚类的方法及其在时间序列挖掘中的应用,同时从侧面反映了本文度量序列相似性方法的实用性。全文的主要工作及创新可归纳为以下几点。首先,结合小波分析的思想方法,提出一种基于小波多尺度变换的时间序列相似性度量方法,并通过金融时间序列的实例研究,说明该方法全面考虑了影响序列相似性度量的各种因素,很好地克服了已往方法无法兼顾序列整体形状轮廓与细节差异的缺陷。其次,在相似性度量方法的基础上,研究了序列粗糙聚类方法,通过金融实证研究表明粗糙聚类方法的优点。并深入研究了以下三个问题:(1)建立粗糙聚类质量指标,并研究不同阈值参数对聚类结果的影响;(2)将粗糙聚类法与层次聚类法进行整合,各取所长;(3)将软聚类转化为硬聚类,通过迭代剔除法对粗糙聚类结果精简化,并与之前聚类结果进行比较,说明其可行性。最后,本文模型方法尚无现成的软件模块实现,故本文还给出Matlab软件上具体实现的参考程序,结合实证研究取得较好的效果。10.期刊论文中国人民大学统计系数据挖掘中心数据挖掘中的聚类分析-统计与信息论坛2002,17(3)文章从聚类分析的作用、相异性度量、算法简介及计算机操作程序四个方面论述了如何在数据挖掘中进行聚类分析.本文链接:下载时间:2010年5月20日

1 / 52
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功