数据仓库与数据挖掘-教学大纲

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《数据仓库与数据挖掘》教学大纲一、课程概况课程名称:数据仓库与数据挖掘英文名称:Datawarehousinganddatamining课程性质:选修课程学时:32课程学分:2授课对象:信息类的大学本科高年级学生开课时间:三年级下学期讲课方式:课堂+实验主讲老师:二、教学目的本课程把数据视为基础资源,根据软件工程的思想,总结了数据利用的历程,讲述了数据仓库的基础知识和工具,研究了数据挖掘的任务及其挑战,给出了经典的数据挖掘算法,介绍了数据挖掘的产品,剖析了税务数据挖掘的案例,探索了大数据的管理和应用问题。三、教学任务完成《数据仓库与数据挖掘》教材内容,及教学计划中的互动实践内容,另有学生自主选题的大作业、选作的论文报告。32学时:课堂24、实验2、课外2、研讨4学时。四、教学内容的结构课程由9个教学单元组成,对应于《数据仓库与数据挖掘》的内容。第1章数据仓库和数据挖掘概述1.1概述11.2数据中心41.2.1关系型数据中心1.2.2非关系型数据中心1.2.3混合型数据中心(大数据平台)1.3混合型数据中心参考架构第2章数据2.1数据的概念2.2数据的内容2.2.1实时数据与历史数据2.2.2时态数据与事务数据2.2.3图形数据与图像数据2.2.4主题数据与全部数据2.2.5空间数据2.2.6序列数据和数据流2.2.7元数据与数据字典2.3数据属性及数据集2.4数据特征的统计描述222.4.1集中趋势222.4.2离散程度232.4.3数据的分布形状252.5数据的可视化262.6数据相似与相异性的度量292.7数据质量322.8数据预处理322.8.1被污染的数据332.8.2数据清理352.8.3数据集成362.8.4数据变换372.8.5数据规约38第3章数据仓库与数据ETL基础393.1从数据库到数据仓库393.2数据仓库的结构393.2.1两层体系结构413.2.2三层体系结构413.2.3组成元素423.3数据仓库的数据模型433.3.1概念模型433.3.2逻辑模型433.3.3物理模型463.4ETL463.4.1数据抽取473.4.2数据转换483.4.3数据加载493.5OLAP493.5.1维493.5.2OLAP与OLTP493.5.3OLAP的基本操作503.6OLAP的数据模型513.6.1ROLAP523.6.2MOLAP523.6.3HOLAP53第四章数据仓库和ETL工具544.1IBMDB2V104.1.1自适应压缩544.1.2多温度存储554.1.3时间旅行查询564.1.4DB2兼容性功能604.1.5工作负载管理614.1.6PureXML624.1.7当前已落实634.1.8DB2PureScaleFeature634.1.9分区特性654.1.10并行技术674.1.11SQW684.1.12CubingServices684.1.13列式存储及压缩技术(BLU)704.2InfoSphereDatastage714.2.1基于InformationServer的架构724.2.2企业级实施和管理754.2.3高扩展的体系架构794.2.4具备线性扩充能力814.2.5ETL元数据管理824.3InfoSphereQualityStage82第5章数据挖掘基础845.1数据挖掘的起源845.2数据挖掘的定义855.3数据挖掘的任务865.3.1分类5.3.2回归分析5.3.3相关分析5.3.4聚类分析5.3.5关联规则5.3.6异常检测5.4数据挖掘标准流程5.4.1商业理解5.4.2数据理解5.4.3数据准备5.4.4建立模型5.4.5模型评估5.4.6结果部署5.5数据挖掘的十大挑战性问题5.5.1数据挖掘统一理论的探索5.5.2高维数据和高速数据流的研究与应用5.5.3时序数据的挖掘与降噪5.5.4从复杂数据中找寻复杂知识5.5.5网络环境中的数据挖掘5.5.6分布式数据挖掘5.5.7生物医学和环境科学数据挖掘5.5.8数据挖掘过程自动化与可视化5.5.9信息安全与隐私保护5.5.10动态、不平衡及成本敏感数据的挖掘第6章数据挖掘算法6.1算法概述6.1.1分类算法及评估指标6.1.2聚类算法及其评价指标6.2C4.56.3CART算法6.4K-Means算法6.5SVM算法1216.6Apriori算法6.7EM算法6.8PageRank6.9Adaboost算法6.10KNN算法6.11NaiveBayes第7章数据挖掘工具与产品7.1数据挖掘工具概述7.2商业数据挖掘工具IBMSPSSModeler7.3开源通用的数据挖掘工具WEKA第8章数据挖掘案例8.1概述8.2纳税评估示例8.3税收预测建模示例8.4税务行业纳税人客户细分探索8.5基于Hadoop平台的数据挖掘思考题第9章大数据管理9.1什么是大数据9.2Hadoop介绍9.3NoSQL介绍9.4InfoSphereBigInsights3.0介绍五、教学活动以及教学方法上的基本要求课堂教学、实验、课外作业、自选题目的大作业、论文和报告结合,另有课外讨论环节。通过课堂教学讲解基本原理和方法;通过互动实践课巩固课堂教学内容,并在助教辅导下完成基础实验,由助教验收;课外作业由学生独立完成,并提交系统进行评分。自选题目的大作业可以分组进行,要在期中提交选题报告,期末提交全部文档及程序并且逐一答辩。答辩形式为:学生演示9分钟,教师提问3分钟,当即给出成绩。论文和报告属于加分因素。课外讨论安排在每次课堂教学之后,加1学时,自愿参加,每人每学期至少参加一次。内容为:教师对难点进行复习、讲解补充例题,学生提问和讨论。六、主教材袁汉宁,王树良,程永,金福生,宋红,数据仓库与数据挖掘,2015年,人民邮电出版社.七、电子资源电子学习资源通过网络学堂发布:课件PPT讲稿

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功