数据挖掘在高职教学中的应用汇报人:导师:学院:计算机科学与技术学院内容概要选题目的和意义国内外研究动态研究的主要内容实验设计方案准备工作情况和主要工作措施论文进度安排及预期达到研究结果选题目的和意义由于我国大众化高等教育的普及,高校学生数量的激增,给高校教学工作带来了诸多新的问题。尤其是高职学生,他们的主体是普通高中应届毕业生高考最后一批录取的学生。这些学生在学习意识、学习方法、学习能力及学习动力上比较欠缺,并可能有较多常见的心理问题。大部分学生没有养成良好的学习习惯。他们中的大部分学习基础比较差、自制力也比较弱,学习目标不够明确,缺乏刻苦钻研精神。很多学生就读离职并不是因为自身渴望学习,而是无可奈何或出于应付家长的要求。他们对所学的专业并没有太多了解,因此学习目标不够明确同时,他们还对社会对其的容纳有一种怀疑,这种怀疑直接导致了自信心的不足,由此也影响到学生学习的动力。此外,由于这批学生普遍没有养成良好的学习习惯,叉影响了良好学习氛围的营造,不良的学习氛围又反过来影响学生的学习动力。教师迫切地需要科学地研究高职教学各个环节中的大量的数据信息,从中获取知识,继而科学地指导教学。选题目的和意义二十世纪,数据库技术取得了决定性的成果并且得到广泛应用。大量信息在给人们带来方便的同时也带来了一大堆难题:第一是信息过量,难以消化;第二是信息真假难以辨识:第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。选题目的和意义数据挖掘技术(DataMining)被称为未来信息处理的骨干技术之一,是一个多学科交叉研究领域,融合了数据库,人工智能、机器学习,统计学,知识工程、面向对象方法、信息检索,高性能计算以及数据可视化等多项最新技术.数据挖掘技术从80年代末开始出现。短短二十多年它的发展速度很快。目前数据挖掘技术在零售业的购物篮分析、金融风险预测、产品质量分析、通讯及医疗服务、基因工程研究等许多领域得到了成功的应用。很多专题会议也把数据挖掘和知识发现列为议题之一。选题目的和意义虽然目前数据挖掘技术主要在商业领域中得到广泛发展,但它面向应用的本质决定了在任何需要的领域都会发挥它的价值。在高校教育教学及管理中有大量直接或间接的数据,关系到教师评价、人才管理及学生选课指导、学生成绩分析等内容。把数据挖掘技术应用于高等学校的教学与管理中,是数据挖掘技术在又一个领域的应用。选题目的和意义高等学校多年来的教学和管理工作积累了大量的数据,目前,鉴于社会对高等学校发展的需求和高校数据管理的现状,利用这些数据理性的分析学校各方面工作的成效以及教师发展状况,对高校教学管理决策支持系统的影响变得十分重要。利用数据挖掘技术从数据仓库中获取高质量的信息,可以检验教学效果,调节课程设置。合理安排师资,正确评价教师的年度工作,及辅助调整招生计划、分析预测就业趋势等等。选题目的和意义以学生成绩为例,教师对学生成绩的分析处理一般仅仅是统计成绩处在优、一般、差级别的人数,对于学生取得这些成绩的原因往往无法了解。如果教师能够找到有关影响学生学习成绩的因素,必然对教学质量的提高起到积极的作用。国内外研究动态自1989年第11届国际联合人工智能学术会议上首次提出KDD这一概念以来,数据挖掘日益受到人们的关注。并已经成为当前计算机领域的一大热点,其研究的重点也逐渐从发现方法转移到系统应用,并且注重多种发现策略和技术的集成,以及多学科之间的相互渗透。从总体上,国外在数据挖掘领域中的研究内容十分广泛,从挖掘知识的种类看,己经取得了明显的成果。国内外研究动态1、关联规则的研究。近几年对关联规则的研究内容较多。现在,关联规则的挖掘已经从单一概念层次关联规则的发现发展到多概念层次关联规则的发现,并把研究的重点放在提高算法的效率和规模可收缩性上。目前,人们对于定量关联规则以及其他种类的关联规则的发现研究较为深入,提出了关联规则的兴趣性的概念。与此同时,在提高挖掘过程的效率方面也作了不少的研究。2、数据分类技术研究。基于决策树的分类方法在大规模数据库条件下的应用研究;在较高的抽象层次分类中,M.Mehte.等人针对大型数据库提出了一种快速分类算法,称为QUEST中的超级学习算法,SLIQ:分类与回归的管状领域研究、最近邻分类方法的改进等等。国内外研究动态3、聚类规则研究。近年,聚类开始在大型数据库中得到研究,R.Ng和1.Han基于随机搜索以及统计学中的两个聚类算法PAM和CLARA,给出了一个适用于大型应用的聚类算法:CLARANS。M.Este等人针对CLARANS算法的缺点,提出了改进技术。T.Zhang等人则提出了另一种聚类算法:BIRCH。4、泛化、简约和特征提取研究。利用数据可视化大大扩展了数据的表达和理解能力,这是数据简约的一种非常重要的技术,它正受到广泛的重视。国内外研究动态与国外相比,国内对数据挖掘与知识发现(MDKD)的研究稍晚,1993年国家自然科学基金首次支持对该领域的研究项目。目前,清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等竞相开展数据挖掘的基本理论及其应用研究。其中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京大学也在开展对数据立方体代数的研究;华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和改造;南京大学、四川联合大学山东师范大学硕士学位论文上海交通大学等单位探讨,研究了非结构化数据的知识发现以及Web数据挖掘。数据挖掘最先应用于金融和商业领域,在教育层面上还只能算是新生事物,处于发展的初级阶段。国内外研究动态国内高校目前在校园信息网中开展数据挖掘的研究并不广泛。浙江大学使用关联规则发现技术对高校的人事信息库进行挖掘,试图找到影响学科发展的因素,发现如何评价一个学科,以及影响学科发展的各个要素之间的关系。在教育信息化的大趋势下,将数据挖掘技术应用于教育领域内的学生招募、市场细分、学生来源分析、课程相关性、学习评价度量、学生生涯规划、远程开放教育的个性化服务等方面,必然有十分广阔的前景。研究的主要内容本文主要研究在高校扩招、师生比过大的教学条件下,教师如何利用丰富的信息资源,采用数据挖掘技术,获得辅助决策知识,指导教学,从而进一步提高教学质量。数据挖掘技术主要介绍数据挖掘的基本知识,包括数掘挖掘的过程、数据挖掘的任务、数掘挖掘的分类以及数据挖掘的常用技术和方法。探索数据挖掘技术在高校教学中的应用,提出数据挖掘技术在高校教学应用中的实施方案。实验设计方案第一步,确定挖掘对象、目标。清晰地定义出问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结果是不可预测的,但要探索的问题应是有预见的。第二步,数据采集。这是一个工作量较大,占据时问较多的一个阶段。教师需要在以往的教学实践中,注意收集数据信息,有些数据的产生可以直接获得,有些数据需要对学生进行调查获得。第三步,数据转换。这一步是将教师收集到的不同的数据信息集成并转换为一个分析数据模型,这一数掘模型是针对算法而准备的.不同的算法可能需要不同的分析数据模型。实验设计方案第四步,数据分类挖掘。分类挖掘的目的是为了建立一个分类模型。首先要选择合适的挖掘算法,并使用合适的程序设计软件实现这一算法:接着对所得到的经过转换的数据进行挖掘。第五步,分类规则结果分析。这一步主要解释和评估分类结果。第六步。知识的应用。这一步是将分析所得到的知识集成到教师的教学环节中去,教师可利用所得知识改进教学策略,指导下一步教学。准备工作情况和主要工作措施利用学院的教务管理系统,获得学生的成绩信息。设计学生信息调查表,由学生填写,内容包括学生对计算机公共基础课程的感兴趣程度、课堂学习效果、对本课程的认识和教师的教学方法等。利用数据挖掘算法对数据进行处理,建立决策树,得出推动计算机课程教学的规则。论文进度安排及预期达到研究结果2010.4-2010.9资料查询、确定论文主题2010.9-2010.11数据挖掘的理论研究2010.11-2010.12数据挖掘的应用研究2011.1-2011.3撰写论文2011.4-2011.5论文修改谢谢!请老师和同学们批评指正