《数据分析与挖掘》教学大纲一、课程的基本信息课程编号:02210216课程性质:专业课/必修课学时:48学分:2.5开课单位:信息管理学院适用专业:电子商务专业先修课程:计算机文化基础、C语言程序设计、统计学、数据库二、课程目的与任务数据挖掘是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。本课程全面而又系统地介绍了知识发现的方法和技术,反映了当前知识发现研究的最新成果。本课程的重点在培养学生的实际分析数据及处理数据的能力。三、课程教学基本要求通过本课程的学习,要求学生初步掌握数据挖掘的重要概念和任务、数据挖掘中的常用算法(决策树、关联规则、聚类算法、贝叶斯分类算法、支持向量机、神经网络),以及数据挖掘当前的研究动向四、教学内容及学时分配教学内容各教学环节学时分配讲授实验上机习题讨论小计绪论22数据预处理426关联规则挖掘426决策树分类算法448贝叶斯分类算法448人工神经网络算法44支持向量机426K-means聚类算法224K-中心点聚类算法22神经网络聚类算法:SOM22合计321648五、课程教学基本内容第1章绪论(2课时)教学内容:(1)数据挖掘的概念(2)数据挖掘的历史及发展(3)数据挖掘的研究内容及功能(4)数据挖掘的常用技术及工具重点:数据挖掘的研究内容及功能难点:数据挖掘的常用技术及工具第2章数据预处理(4课时)教学内容:(1)数据预处理的目地(2)数据清理(3)数据集成和数据变换(4)数据归约(5)特征选择与提取重点:数据集成和数据变换难点:特征选择与提取第3章关联规则挖掘(4课时)教学内容:(1)基本概念(2)关联规则挖掘算法---Apriori算法原理(3)Apriori算法实例分析(4)Apriori算法源程序分析(5)Apriori算法的特点及应用重点:关联规则挖掘算法---Apriori算法原理难点:关联规则挖掘算法---Apriori算法原理第4章决策树分类算法(4课时)教学内容:(1)基本概念(2)决策树分类算法---ID3算法原理(3)ID3算法实例分析(4)ID3算法源程序分析(5)ID3算法的特点及应用(6)决策树分类算法---C4.5算法原理重点:决策树分类算法---ID3算法原理难点:决策树分类算法---ID3算法原理第5章贝叶斯分类算法(4课时)教学内容:(1)基本概念(2)贝叶斯分类算法原理(3)贝叶斯分类算法实例分析(4)贝叶斯分类算法源程序分析(5)贝叶斯分类算法特点及应用重点:贝叶斯分类算法原理难点:贝叶斯分类算法原理第6章人工神经网络算法(4课时)教学内容:(1)基本概念(2)BP算法原理(3)BP算法实例分析(4)BP算法源程序分析(5)BP算法的特点及应用重点:BP算法原理难点:BP算法原理第7章支持向量机(4课时)教学内容:(1)基本概念(2)支持向量机原理(3)支持向量机实例分析(4)支持向量机的特点及应用重点:支持向量机原理难点:支持向量机原理第8章K-means聚类算法(2课时)教学内容:(1)基本概念(2)K-means聚类算法原理(3)K-means聚类算法实例分析(4)K-means聚类算法源程序分析(5)K-means聚类算法的特点及应用重点:K-means聚类算法原理难点:K-means聚类算法原理第9章K-中心点聚类算法(2课时)教学内容:(1)基本概念(2)K-中心点聚类算法原理(3)K-中心点聚类算法实例分析(4)K-中心点聚类算法源程序分析(5)K-中心点聚类算法的特点及应用重点:K-中心点聚类算法原理难点:K-中心点聚类算法原理第10章神经网络聚类算法:SOM(2课时)教学内容:(1)基本概念(2)竞争学习算法基础(3)SOM算法原理(4)SOM算法原理实例分析(5)SOM算法原理源程序分析(6)SOM算法原理的特点及应用重点:SOM算法原理难点:SOM算法原理六、考核方式与成绩评定考核方式:考试成绩评定:本课程成绩构成比例为:期末考核成绩占总成绩的70%,平时成绩占总成绩的30%;平时成绩的各部分占总成绩比例分别为:考勤占5%,课堂测验成绩占5%,实验占15%,作业占5%期末总评成绩=平时成绩×30%+考核成绩×70%。补考方法:总评成绩低于60分的学生,须参加学院统一组织的补考。补考成绩:卷面成绩60分以上(含60分)按60分计,卷面成绩60分以下按卷面成绩计。七、教材与主要参考书目教材:《数据挖掘算法原理与实现》,王振武,清华大学出版社,2017年1月参考书:《数据挖掘导论》,Pang-NingTan,MichaelSteinbach,VipinKumar著,范明,范宏建等译人民邮电出版社,2011年1月。八、大纲编写必要的说明执笔人签字:教研室主任签字:分管教学领导签字:制订日期:年月日