本科生毕业论文(设计)计划书题目数据挖掘在学生信息系统中的应用学生姓名__肖希杰_____学号_200717020324__专业班级_信息管理与信息系统07103班指导老师_沙伯海_____2010年11月8日论文(设计)题目数据挖掘在学生信息系统中的应用一、目标:1.1、根据计划书能完成毕业设计所需资料和要求。1.2、保障毕业设计有质量的按时完成。二、措施:2.1充分利用本校图书馆和互联网的资源,查阅更多的相关专业知识。以获取毕业设计研究动态灵感。2.2学习数据挖掘相关概念知识,为顺利完成论文编写打下基础。2.3为完成合格的毕业设计,不能脱离学校,必须遵守学校的各种制度,按学校下达有求完成各项任务。2.4保持与指导老师的联系,多与指导老师交流各阶段任务。三、课题目的、意义及相关研究动态:1、课题目的:根据教育部提出的高等教育由精英化逐步转向大众化教育的思路,我国从1999年开始,大学本科生招生规模逐年扩大。由于学生人数的大幅增加给到校学生管理工作带来了诸多问题。学生管理者越来月感到管理的复杂性,对于学生的发展状态越来越难以预测。因此学生管理信息系统不能只满足于对海量数据进行简单第备份和查询,而应具备辅助决策的功能。为了解决这些问题,引用以数据挖掘技术为核心建立一套科学而完善的学生管理信息系统,从而进一步提高学生管理水平和管理效率。2、课题意义:数据挖掘是一门能够从大量数据中发现有用知识的技术学科,是从大型数据库或数据仓库中提取隐含的,未知的,非平凡的极有潜在应用价值的信息或模式,是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。利用这一技术,我们可以通过客观统计和分析,从大量数据中发现潜在规律,找出隐含的模式,准确掌握未来的信息动态,将数据挖掘技术与教学管理相结合,建立完善的学生管理系统,从中提取出隐藏在数据之中的有用信息.使学生信息系统的功能得到最大程度的利用.并使之能在功能上更加满足学校教学和管理的需要.提高学生管理水平和加快学生管理专业化建设,同时为学校管理决策起到指导和辅助作用。3、相关研究动态:数据挖掘和知识发现(KnowledgeDiscoveryinDatabases,KDD)正成为计算机科学于技术应用的一大研究热点。由美国人工智能所会主办的KDD国际研讨会已经烧开了7次,研究重点逐渐从发现方法转向系统应用。一些专题会议也把KDD列为会题之一,数据库、人工智能、信息处理、知识工程等领域的国际学术刊物也纷纷开辟KDD专题或专刊。GartnerGroup的一次高级技术调查结果显示,“未来3~5年内将对工业产生深远影响的5大关键技术”之首的是数据挖掘和人工智能,“未来5年内投资焦点的10大新兴技术”的前两位是并行处理体系和数据挖掘;麻省理工学院的《科技回顾》公布“改变未来的10项新兴科技趋势”之一是数据挖掘;美国国家科学基金会的数据库研究项目中,KDD被列为最有价值的项目。有利益就有市场,因此就,国内外的很多大型计算机公司都着力于研究数据挖掘系统。目前,国外比较有影响的典型数据挖掘系统有SAS公司的EnterpriseMiner、IBM公司的IntellingMiner、SGI公司的MinerSet、SPSS公司的Clementine、RuleQuestResearch公司的See5、还有CoverStory、EXPLORA、KDW、DBMiner和Quest等。四、课题的主要内容、创新之处:1、主要内容:本课题的内容主要由6部分构成:第一章绪论。简要的介绍课题提出的背景及研究意义、分析国内外的研究现状,并介绍本文的主要工作及结构安排;第二章数据挖掘的概念。介绍数据挖掘的基本概念、数据挖掘的功能、数据挖掘的过程,数据挖掘的应用领域;第三章数据挖掘的常用技术。着重介绍数据挖掘的关联规则和决策树两种技术;第四章数据准备。第五章数据挖掘提出一个灵活使用面向招生就业的数据挖掘系统模型,介绍系统的主要功能,分析数据挖掘技术在系统中的应用;第六章总结。对本论文做总结和展望。2、创新之处:本文从介绍数据挖掘技术产生的背景入手,阐述了数据挖掘的概念、功能、研究方向和挖掘步骤。结合具体的项目---湖南文理学院招生就业数据挖掘系统,介绍了有关数据挖掘的原理及方法。以实际数据为依据,验证了算法的各种性能指标,并对实验结果进行分析,证明了算法的有效性。在第三章中,重点介绍了现有的关联规则挖掘算法Apriori算法指出了该算法的不足,提出了算法改进的理论基础,使得改进算法的速度得到提高;重点介绍了决策树分类算法ID3,指出了该算法的弊端在于算法往往偏向于选择属性取值较多的属性,而属性值较多的属性却不总是最有的属性。本文在研究了其他算法的基础上,提出了改进建华算法,该算法不仅克服了ID3的缺点,可以应用在大量的显示数据中,而且经实际证明该算法具有较高的效率、较强的实用性。五、完成期限和预期进度:起始时间结束时间进度安排前期2010年10月10日2010年10月15日完成论文选题2010年10月16日2010年10月31日下达任务书2010年11月01日2010年11月07日收集数据挖掘相关资料2010年11月08日2010年11月15日了解数据挖掘的基本概念2010年11月16日2010年11月23日了解数据挖掘的常用技术2010年11月24日2010年11月30日完成开题报告中2010年12月01日2010年12月07日修改开题报告,熟悉外文资料2010年12月08日2010年12月28日熟悉数据挖掘基本概念2010年12月29日2011年01月15日熟悉OLAP相关知识期2011年01月16日2010年01月31日熟悉OLTP相关知识2011年02月01日2011年02月15日熟悉并理解决策树技术2011年02月16日2011年02月21日熟悉并理解关联规则技术2011年02月22日2011年02月28日湖南文理学院招生就业系统数据收集后期2011年03月01日2011年03月07日论文写作提纲;论文写作指导2011年03月08日2011年05月14日论文修改、定稿、评阅2011年05月15日2011年05月23日论文答辩与成绩评定序号输入风险事件可能性影响风险值应对措施1开题报告1、不符合要求2、不能按时完成60%20%12%1、在指导老师审核下反复修改2、多花时间2需求分析1、不够全面2、未能指出客户的核心需求60%50%30%1、多到网上去查找资料2、多寻找相关客户交流3系统设计1、设计功能不够完善2、模块区分不明确50%50%25%1、多寻求老师的帮助2、反复修改给老师审核4数据设计1、数据库设计不够合理,存在冗余2、数据库设计不够全面50%80%40%1、找老师技术指导2、在巩固数据库相关知识3、重新分析需求分析5模块功能实现1、有些模块无法实现2、编写代码工作量太大,无法按时完成40%60%24%1、寻求技术帮助2、硬是不行,酌情删除功能3、加班加点6界面优化1、不能完成理想的效果50%20%10%1、寻求技术指导2、降低自己的要求7测试1、电脑虚拟机测试通不过2、手机测试失败50%60%30%1、重新检测程序的内存2、修改部分算法,将重新偏向空间复杂度8论文1、论文无法正确描述系统功能2、论文无法按时完成50%50%25%1、多修改,分步骤多次审核2、花更多的时间9答辩1、技术问题无法描述2、研发问题无头绪20%20%40%1、多看一些专业文献2、回顾本系统的需求主要参考文献资料:[1]纪希禹.数据挖掘技术应用实例[M].北京:机械工业出版社,2009.4[2]刘玉文.数据挖掘在高校招生中的研究与应用[D].上海师范大学,2008.3[3]陈显祥.基于学生综合测评系统数据挖掘应用研究[D]贵州大学,.2007.4[4]王志浩.数据挖掘在招生信息处理系统中的应用研究[D]山东师范大学,2006.4[5]马冰冰.学生信息管理与数据挖掘的应用[D]山东大学,2008.4[6]李庆香.数据挖掘技术在高校学生成绩分析中的应用研究[D]西南大学,2009.12[7]刘静.数据挖掘技术在招生信息系统中的应用[D]北京工业大学,2006.2[8]彭松坡.数据挖掘技术在高校就业管理系统中的应用研究[D]浙江工业大学,2006.4[9]赵辉.数据挖掘技术在学生成绩分析中的研究及应用[D]大连海事大学,2007.3会议记录摘要:会议主持人:记录人:2010年11月20日