本科毕业论文(设计)(题目:决策树分类算法在教学分析中的应用)姓名:学号:1142151204专业:计算机科学与技术院系:信息工程学院指导老师:袁张露职称学历:助教/研究生完成时间:教务处制安徽新华学院2015届本科毕业论文(设计)安徽新华学院本科毕业论文(设计)独创承诺书本人按照毕业论文(设计)进度计划积极开展实验(调查)研究活动,实事求是地做好实验(调查)记录,所呈交的毕业论文(设计)是我个人在导师指导下进行的研究工作及取得的研究成果。据我所知,除文中特别加以标注引用参考文献资料外,论文(设计)中所有数据均为自己研究成果,不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的工作已在论文中作了明确说明并表示谢意。毕业论文(设计)作者签名:日期:安徽新华学院2015届本科毕业论文(设计)I决策树分类算法在教学分析中的应用摘要随着信息科技的高速发展,人们对于积累的海量数据量的处理工作也日益增重,需求是发明之母,数据挖掘技术就是为了顺应这种需求而发展起来的一种数据处理技术。数据挖掘技术又称数据库中的知识发现,是从一个大规模的数据库的数据中有效地、隐含的、以前未知的、有潜在使用价值的信息的过程。在学生管理以及教学科学化的今天,传统的教学分析已经不能适应社会发展的需求。学生信息数据不断的增多,教学分析工作也日益加重。学生信息数据量不断的增多,对之前所累计的大量学生考试成绩数据运用数据挖掘技术进行分析挖掘是具有重大的意义的,这样可以把所挖掘分析出来的信息反馈用于指导学校的教学分析,从而提高学生的学习成绩。本文通过学生成绩信息运用数据挖掘技术,对所采集的数据进行预处理,运用决策树分类算法中的C4.5算法对成绩进行分析得到了成绩分析决策树,分析研究出有用的信息找到影响学生的因素,发现某些规律的存在,用以指导学校教学分析工作的开展。关键词:数据挖掘;学生成绩;决策树安徽新华学院2015届本科毕业论文(设计)IIApplicationofdecisiontreeincomputergradeexaminationanalysisAbstractWiththerapiddevelopmentofInformationTechnology,peoplearefacingmuchmoreworkloadindealingwiththeaccumulatedmassdata.However,DataMiningTechniqueisakindofdataprocessingtechniquethatfollowsthischange.Inrecentyears,collegesandotherinstitutionsofhighereducationhadincreasedtheirenrollments,moreandmorestudentsgotenrolledandconsequently,thestudents’informationdatapoolgetsmuchbigger.However,thetraditionaldataprocessingtechnologycan’taccommodateitselftostudyandanalyzetheaccumulatedmassdataatadeeperlevelanymore,whileDataMiningTechniquecansolvetheseproblemsmuchbetter.Theincreasingdatabaseofthestudentsconcludesmuch,likestudents’testscore.Withtherapiddevelopmentofcomputertechnology,ComputerRankExaminationbecomesmoreandmorepopular;hence,thedatabaseofstudents’testscorebecomesmuchbigger.So,touseDataMiningTechniquetominetheaccumulatedmassCREscoreisofgreatmeaningwithregardingtotheimprovementofthestudents’scoreonCRE,sincepeoplecanapplytheresultsofdatamininginschoolcomputerteachingresearch.ThispaperintendstoshowtheuseofDataMiningTechniqueintheanalysisofstudents’scoreinformationinComputerRankExamination,fromthepretreatmentonthecollecteddatatotheuseofdecisiontreetechniqueindataanalysis.ThisemploysID3algorithmindecisiontreetechniquetogetthedecisiontreeofthestudents’score.ThenbyanalyzingtheusefulinformationtofindouttheelementsthatcaninfluenceCREscoreandtherulesintheseinfluencestoinstructschoolteachingwork.Keywords:Datamining;computerexamination;decisiontree;SqlServer2008安徽新华学院2015届本科毕业论文(设计)目录1绪论................................................11.1研究背景与意义.......................................11.2数据挖掘的产生.......................错误!未定义书签。1.3数据挖掘的国内外研究现状..............................11.4论文研究内容及结构安排................................22数据挖掘技术...........................................32.1数据挖掘的概念.......................................32.1.1数据挖掘的定义.....................................42.2数据挖掘的过程.......................................42.2.1数据对象确立阶段...................................42.2.2数据预处理阶段......................................52.2.2数据挖掘阶段.......................错误!未定义书签。2.2.3结果的解释和评估阶段................错误!未定义书签。2.3数据挖掘的主要方法....................................62.4数据挖掘的功能.......................................82.5数据挖掘的系统结构....................错误!未定义书签。2.6数据挖掘应用的成功案例...............................102.7本章小结............................................123决策树技术............................................123.1决策树简介..........................................12安徽新华学院2015届本科毕业论文(设计)3.2决策树的主要算法.....................................133.2.1ID3算法..........................................133.2.2C4.5算法.........................................153.3决策树剪枝..........................................183.3.1决策树剪枝的方法...................................193.4本章小结............................................204决策树在计算机等级考试成绩分析中的应用................214.1成绩分析方法的依据...................................214.2决策树算法在计算机等级考试成绩分析中的应用..........224.2.1确定对象集目标....................................224.2.2数据的采集........................................224.2.3数据预处理........................................244.2.4数据挖掘工作的展开................................244.2.5结果分析..........................................285总结与展望............................................295.1研究结果............................................295.2后续研究与展望......................................30参考文献................................................32安徽新华学院2015届本科毕业论文(设计)11绪论1.1研究背景与意义无论在企业应用领域,还是在科学领域,数据挖掘技术有着广泛的应用价值。在企业应用领域,用于制定好的市场策略以及企业的关键性决策。在商业方面,数据挖掘技术可以增强企业的竞争优势,缩短销售周期,降低生产成本,有助于制定市场计划和销售策略,并已经成为电子商务中的关键技术。近年来,随着我国高等教育的飞速发展,高校的教学管理信息不断增多。教学工作信息化有了很大的进步,好多高校在管理学生和教师信息方面有了很好的方式。比如我校的教务系统,这些系统为老师和学生提供了很好的帮助。这些系统中积累了大量的数据。目前的这些数据库系统虽然基本上都可以实现数据的录入、修改、统计、查询等功能,但是这些数据所隐藏的价值并没有被充分的挖掘和利用,信息资源的浪费还是比较严重的。随着数据挖掘技术的不断扩展,许多高校为了避免信息浪费,已经将数据挖掘技术应用于高校的教学分析中。数据挖掘技术的应用将对提高学生成绩和提高教学水平起到很好的指导作用。为了提高教学质量,将数据挖掘技术引入到高校学生成绩分析中,对这些数据进行深入的挖掘和合理的分析,从而挖掘出传统的分析方法所无法得出的结论。进而利用分析结果引导教学的开展,从而有利于提高教学质量。本文主要是基于如下背景开展的:以安徽新华学院历届学生成绩为背景,首先学习数据挖掘的理论知识以及决策树技术,然后建立新华学院学生成绩数据库,并利用数据挖掘技术中的决策树对自己建立的数据库进行深入的挖掘。最后对自己的挖掘结果进行分析,得到影响学生成绩的因素。从而更好的辅助今后学校的教学分析工作。1.2数据挖掘的国内外研究现状1989年8月在美国召开的第十一届国际人工智能联合会议的专题讨论会安徽新