河海大学硕士学位论文决策树分类算法的研究及其在教学分析中的应用姓名:刘军申请学位级别:硕士专业:计算机应用技术指导教师:王志坚20061201决策树分类算法的研究及其在教学分析中的应用作者:刘军学位授予单位:河海大学参考文献(44条)1.JiaweiHan.MichelineKamber.范明.孟小峰数据挖掘概念与技术20012.MehmedKantardzic.闪四清.程雁数据挖掘--概念、模型、方法和算法20033.陈文伟.黄金才数据挖掘技术20024.邵峰晶.于忠清数据挖掘原理与算法20035.陈文伟.黄金才数据仓库与数据挖掘20036.卢启程.邹平数据挖掘的研究与应用进展[期刊论文]-昆明理工大学学报(理工版)2002(5)7.DataMining:AnIntroduction8.WangM.IyerB.VitterJSScalableminingforclassificationrulesinrelationaldatabases19989.刘红岩.陆宏钧.陈剑利用数据库技术实现的可扩展的分类算法[期刊论文]-软件学报2002(6)10.查看详情11.郭秀娟数据挖掘方法综述[期刊论文]-吉林建筑工程学院学报2004(1)12.汤小文.蔡庆生数据挖掘在电信业中的应用[期刊论文]-计算机工程2004(6)13.董彩云.曲守宁数据挖掘及其在高校教学系统中的应用[期刊论文]-济南大学学报(自然科学版)2004(1)14.彭玉青.张红梅.何华.顾军华数据挖掘技术及其在教学中的应用[期刊论文]-河北科技大学学报2001(4)15.陶兰.王保迎.吕建军数据挖掘技术在高等学校决策支持中的应用[期刊论文]-中国农业大学学报2003(2)16.张儒良.王翰虎论数据挖掘优化教学管理[期刊论文]-贵州民族学院学报(哲学社会科学版)2004(2)17.蔡勇.韩永国.刘自伟数据挖掘技术在生源分析中的应用研究[期刊论文]-计算机应用研究2004(12)18.查看详情19.李瑞欣.张水平数据仓库建设中的数据预处理[期刊论文]-计算机系统应用2002(5)20.菅志刚.金旭数据挖掘中数据预处理的研究与实现[期刊论文]-计算机应用研究2004(7)21.李军数据挖掘系统实现的一般模型[期刊论文]-大庆石油学院学报2003(3)22.戴稳胜.匡宏波.谢邦昌数据挖掘中的关联规则[期刊论文]-统计研究2002(8)23.中国人民大学统计系数据挖掘中心数据挖掘中的聚类分析[期刊论文]-统计与信息论坛2002(3)24.刘红岩.陈剑.陈国青数据挖掘中的数据分类算法综述[期刊论文]-清华大学学报(自然科学版)2002(6)25.罗海蛟.刘显数据挖掘中分类算法的研究及其应用[期刊论文]-微机发展2003(z2)26.王静红.王熙照.邵艳华.王伍伶决策树算法的研究及优化[期刊论文]-微机发展2004(9)27.谭勇.荣秋生一个基于SLIQ的分类算法的实现[期刊论文]-计算机工程2003(18)28.魏红宁基于SPRINT方法的并行决策树分类研究[期刊论文]-计算机应用2005(1)29.韩慧.毛锋.王文渊数据挖掘中决策树算法的最新进展[期刊论文]-计算机应用研究2004(12)30.姚家奕.姜海.王秦决策树算法的系统实现与修剪优化[期刊论文]-计算机工程与设计2002(8)31.中国人民大学统计学系数据挖掘中心数据挖掘中的决策树技术及其应用[期刊论文]-统计与信息论坛2002(2)32.栾丽华.吉根林决策树分类技术研究[期刊论文]-计算机工程2004(9)33.朱应庄.吴耿锋一种两阶段决策树建树方法及其应用[期刊论文]-计算机工程2004(1)34.JRQuinlanSimplifyingdecisiontrees198735.JMingersAnempiricalcomparisonofpruningmethodsfordecisiontreeinduction1989(02)36.包晓安.钟乐海基于ID3算法的快速分类方法研究[期刊论文]-现代电子技术2004(7)37.杨明.张载鸿决策树学习算法ID3的研究[期刊论文]-微机发展2002(5)38.王晓国.黄韶坤.朱炜.李启炎应用C4.5算法构造客户分类决策树的方法[期刊论文]-计算机工程2003(14)39.赵杰SQLServer数据库管理、设计与实现200340.李香敏SQLServer2000programmer'sGuide编程员指南200141.PearlBrereton.DavidBudgenComponent-BasedSystems:AClassificationofIssues200042.JiaweiHan.MichellineKamberDataMining:ConceptsandTechniques200143.KanekoN.TokuyamaTDataMiningSystembasedonDecisionTree200444.MylesAJ.FeudaleRN.LiuY.Woody,N.AAnintroductiontodecisiontreemodeling2004相似文献(10条)1.学位论文赵翔数据挖掘中决策树分类算法的研究2005决策树方法是数据挖掘中一种重要的分类方法。本课题从新的建树准则、决策树修剪、多变量决策树、多决策树组合、不完备信息系统下的模型建立等几个方面对决策树方法进行了研究和探讨。本课题的主要研究工作和成果有:1、针对传统决策树算法的不足(如ID3、C4.5),提出了基于协方差及高阶相关系数的决策树生成算法,避免了经典的以信息熵作为建树准则的决策树生成算法盲目地偏向于属性值较多的属性的缺点。2、针对决策树的构造和修剪通常不能同时进行所产生的效率低下的问题,提出了基于粗糙集的决策树构造方法。利用优先策略,将知识相依性同时作为属性约简和建树的准则,在决策树预修剪的同时进行节点生成,大大提高了决策树构造的效率。3、针对单变量决策树忽视信息系统中广泛存在的属性间的关联作用,而且修剪时往往代价很大的缺陷,提出了一种基于主成分分析的多变量决策树构造方法,提取信息系统中的若干主成分来构造决策树。4、探讨了用Boosting方法组合多决策树,构造决策森林的方法。5、在不完备信息系统中的模型拓展。提出了一种加权联系度容差关系,在各属性重要性排序的前提下对不完备信息系统进行进一步的粗糙集模型拓展,使其更加符合人的主观要求和客观现实。从而为进一步探讨在不完备信息系统中构造分类器模型打下基础。2.期刊论文田苗苗数据挖掘之决策树方法概述-长春大学学报2004,14(6)数据挖掘在科研和商业应用中正发挥着越来越重要的作用.分类器是数据挖掘的一种基本方法,决策树是一种最重要的分类器.本文介绍了分类器中的决策树方法及其优点,决策树表示法,决策树构造思想,并比较了各种重要的决策树算法.介绍了决策树算法的实现工具,决策树与数据仓库的结合,决策树的适用范围及应用,最后探讨了决策树的发展趋势.3.学位论文程向前基于决策树的数据挖掘算法和可视化研究2007数据挖掘是一种可以从海量数据中智能地和自动地抽取一些有用的、可信的、有效的、可以理解的模式的过程,也被称之为数据库中的知识发现。分类是数据挖掘的一种非常重要的方法。分类的概念是在已有数据的基础上学习一个分类函数或构造出一个分类模型(即分类器)进行类型的划分。该函数或模型能够把数据库中的数据记录映像到给定类别中的某一个。分类方法应用领域广泛,如金融市场走向分析、顾客信用度分析、医疗诊断等。决策树是数据挖掘中一种应用最为广泛的分类器。其原因主要有:(1)决策树分类的直观表示方法较容易转化为标准的数据库查询;(2)决策树分类归纳的方法行之有效、尤其适合于大型数据集;(3)决策树在分类过程中,除了数据集中己经包括的信息外,不再需要其他额外的信息;(4)决策树分类模型的预测准确度较高。由于决策树本身具有建树思想简单、易于提取规则、贴近人类思维、便于理解等优点,使其在分类数据挖掘中得到了广泛应用。决策树算法的研究可以扩大算法的应用范围,提高算法的运行效率以及分类的准确率。本文从属性离散化、降维、属性选择标准、剪枝、与其它数据挖掘方法的结合等几个方面对目前决策树在分类数据挖掘中的研究状况进行了阐述。本文在介绍了一些典型的决策树分类算法的基础上,重点描述了一种基于决策树的数据挖掘新算法,即基于属性相似度的决策树分类器的研究成果。不同测试属性在决策中的地位也不相同,部分测试属性甚至对决策不起任何作用,完全可进行约简。实验也证明数据集中无关的、干扰的属性会影响分类器的性能,导致性能变差。因而本文首先进行了属性选择,只保留与决策最为相关的属性,而将其他属性都去除。然后通过计算测试属性与决策属性的相似度作为启发规则来构造决策树。算法还使用了分类阈值设定方法简化决策树的生成过程。新算法在对UCI实验数据库中的四个数据集的实验中,运行效率明显高于ID3算法,预测精度在某些数据集中也优于ID3。Weka数据挖掘平台是新西兰怀卡托大学开发的基于Java语言的开源的数据挖掘平台。它提供了一个Java类库形式的框架,这个框架支持嵌入式及其学习的应用,以及新的学习方案的实现。本文在熟悉其API的基础上,成功地在此平台上实现了自己的新的算法。数据挖掘结果的可视化可以使用户和决策者非常形象和直观地分析得到的知识,本文在Weka平台上将新算法模型得到的决策树成功地以图形的方式展示。4.期刊论文李琳.陈德钊.束志恒.叶子青.LiLin.ChenDezhao.ShuZhiheng.YeZiqing基于预处理的决策树在化学数据挖掘中的应用-分析化学2005,33(8)化学数据挖掘可从海量数据中提取蕴含的知识,决策树方法是一种重要的挖掘工具.鉴于决策树在处理连续数据上的局限性,本研究提出先进行预处理,将连续属性离散化,通过特征选择删除其冗余量,以此为基础构建决策树.该方法可防止决策树模型过细,使之具有良好的预报性能.将此方法应用于两个化学样品分类实例,效果良好.与贝叶斯分析和单一的决策树方法相比,其预报正确率有显著提高,且表达形式直观明确,易于理解和分析,适用于化学分类知识模式的挖掘.5.学位论文宋广玲基于多关系决策树算法的研究2009多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。高效性和可扩展性一直是数据挖掘领域的重要研究课题。考虑多关系数据挖掘,这个问题尤为重要。多关系数据挖掘任务的复杂性对算法的性能提出了更高的要求。与传统的数据挖掘算法相比,多关系数据挖掘算法的搜索空间变得更复杂,更大。对于多关系数据学习算法,提高算法效率的主要瓶颈在于假设空间。针对以上问题,本文主要做了以下工作:首先,本文对数据挖掘理论、关系数据挖掘理论进行了研究,尤其是多关系数据挖掘的分类算法-多关系决策树算法及多关系数据挖掘的最新技术-元组传播技术进行了深入的研究。其次,本文提出了多关系决策树的改进算法。多关系决策树主要从两方面进行改进:1为了提高多关系决策树算法可扩展性,本文将虚拟连接元组传播技术应用到改进的多关系决策树算法中;2为了减少系统独自摸索的时间、减少系统搜索有用属性的时间和提高用户的满意程度,本文提出了在用户指导下完成分类任务的背景属性传递技术,并将该技术应用到改进的多关系决策树中。最后,本文对改进的多关系决策树算法进行了理论证明和实验验证。本文的实验主要利用了PKDDCUP'99中的Loan、Account、Transaction三个关系,采用两种方法对一般多关系决策树算法和改进的对关系决策树算法进行比较实验。第一种方法,固定三个关系的记录数不变,每个关系分别增加属性个数进行实验,第二种方法,固定三个关系中的属性个数不变,改变关系记录条数进行实验。通过上面的实验结果,本文研究认为,当改进的多关系决策树在搜索数据项未达到背景属性传递阀值时,改进多关系决策树算法的运行效率较低;当改进的多关系决策树在搜索数据项达到背景属性传递阀值时,改进的多关系决策树算法的效率相对很高且受属性个数增加(或