《大数据分析与挖掘》课程教学大纲一、课程基本信息课程编号:课程名称:大数据分析与挖掘英文名称:课程学时:48课程学分:3开课单位:计算机科学与技术学院授课对象:计算机科学与技术专业,计算机大类专业开课学期:先修课程:二、课程目标数据挖掘是一门新兴的交叉性学科,涵盖了数据库、机器学习、统计学、模式识别、人工智能以及高性能计算等技术。开设本课程的目的,是使学生全面而深入地掌握数据挖掘的基本概念和原理,掌握常用的数据挖掘算法,了解数据挖掘的最新发展、前沿的数据挖掘研究领域、以及数据挖掘技术在不同学科中的应用。课程具体目标如下:课程目标1:能够设计并实现大数据平台下的数据挖掘系统。了解由工程问题,到建模、再到数据挖掘算法设计的问题求解思维模式。具有将数据挖掘算法应用于具体工程的能力;课程目标2:掌握大数据预处理、关联规则、分类以及聚类技术,并能够在主流大数据平台上实现;课程目标3:具备较强的学习最新数据挖掘领域研究成果的能力;能够分析和评价现有研究成果的问题与不足,并能够提出自己独立见解的能力;课程目标4:能够撰写系统设计方案和阶段性技术报告,能够组织和协调项目组的工作,与成员进行交流与沟通。三、课程目标与毕业要求对应关系毕业要求毕业要求具体描述课程目标工程素质(1)具有工程意识和系统观;(2)具有运用工程基础和专业知识解决复杂工程问题的能力课程目标1个性素质(1)具有自主学习、终身学习和跟踪前沿的意识和习惯。(2)具有批判精神,对待事物有独立见解。课程目标3、4毕业要求毕业要求具体描述课程目标系统设计与实现能力(1)针对计算相关的复杂工程问题,能够综合运用所掌握的计算机类相关知识、方法和技术,进行问题分析与模型表达。(2)能够领导或独立设计解决方案或满足特定需求的计算机硬件、软件或网络系统,并能够实现相关系统或组件。课程目标1、2系统分析和评价能力针对计算相关的复杂工程问题解决方案或系统,能够综合运用所掌握的计算机类相关知识、方法和技术,设计实验,进行分析和评价,包含其对社会、健康、安全、法律以及文化的影响分析和评价,并能够提出持续改进的意见和建议。课程目标3组织/协调与项目管理能力(1)理解并掌握工程管理原理与经济决策方法,并能在多学科环境中应用。(2)具备较强的组织协调或项目管理能力、独立工作能力、团队协作能力和人际交往能力。课程目标4四、课程目标与课程内容对应关系序号教学内容教学要求学时教学方式对应课程目标1数据挖掘概述了解数据挖掘的概念及其发展过程,在各行业中的典型应用,以及数据挖掘的过程。2大班讲授课程目标1、32数据特征分析与预处理2.1数据的类型2.2数据的统计特征2.3数据预处理2.4缺失值的处理2.5数据可视化掌握数据预处理的常用算法6大班讲授课程目标23关联规则挖掘3.1基本概念3.2基于候选集生成-测试方法生成频繁项集3.3FP-growth:基于深度优先搜索的频繁项集生成算法3.4关联规则的评估方法掌握关联规则挖掘的概念,主要算法,并能够评价关联规则。4大班讲授课程目标2、34分类算法4.1决策树归纳4.1.1ID3算法4.1.2C4.5算法掌握分类算法的主要思想,能够针对不同的实际问题运用适当的分类器。12大班讲授课程目标2、34.1.3从决策树提取规则4.1.4决策树的过分拟合4.1.5决策树剪枝与优化4.1.6随机森林算法4.2贝叶斯分类器4.2.1贝叶斯定理4.2.2朴素贝叶斯分类器4.2.3贝叶斯信念网络4.3基于实例的学习算法4.3.1K-NN分类器4.3.2局部加权回归4.3.3基于案例的推理4.4回归分析4.4.1线性回归4.4.2逻辑回归4.6分类器算法的评估5聚类算法5.1相似性和相异性度量5.2聚类算法的分类5.3基于划分的聚类算法5.4层次聚类5.5基于密度的聚类算法5.6可伸缩的聚类算法5.7簇质量的评估掌握聚类中相异性度量的概念、掌握核心的聚类算法,了解不同算法的优缺点。12大班讲授课程目标2、36异常检测6.1统计方法6.2基于聚类的检测技术了解异常检测的概念,掌握主流的检测技术。4小班项目研讨课程目标3实验大纲:1分类项目开发实验应用决策树、随机森林、朴素贝叶斯、KNN算法,进行项目开发。4项目交流与答辩课程目标1、42聚类项目开发实验应用K-Means、BisectingK-means、Dbscan算法,进行项目开发。4项目交流与答辩课程目标1、4五、课程教学方法本课程教学将结合大班讲授、小班项目研讨、项目开发以及交流与答辩的形式。大班讲授主要培养学生对各种核心技术的掌握。小班项目研讨用来训练学生们沟通与交流的能力,同时提高对系统进行评价的能力。通过指导学生实现课堂上讲授的算法,学会比较各个算法的性能差异,激发学生的研究和创新兴趣。六、课程考核方法考核环节所占分值考核与评价细则对应课程目标(1)实验30%根据项目开发的结果质量课程目标1(2)交流与沟通10%根据项目小组在答辩与沟通过程中的表现课程目标4(3)期末考试60%闭卷考试课程目标2、3七、主要教材与参考书(黑体、小四、加粗、行距20磅)1.《大数据分析与挖掘》纲撰写人:石胜飞