《Python数据分析》教学大纲课程编号:120973B课程类型:□通识教育必修课□通识教育选修课√专业必修课□专业选修课□学科基础课总学时:48讲课学时:16实验(上机)学时:32学分:1+2适用对象:数据科学与大数据技术先修课程:计算机基础一、教学目标该课程是针对数据科学与大数据专业本科学生开设的,其主要目的是教会学生能够利用python语言处理和分析实际数据。本课程以实际工作中的数据进行实训教学,达到的教学目标是:增强学生实际动手解决问题的能力,掌握python编程的基础,学会利用python处理和分析实际数据。二、教学内容及其与毕业要求的对应关系重点讲授python编程基础、数据结构和数据预处理和常用统计分析方法的基本思路和软件实现,python面向对象的编程是本课程的难点内容,课程拟结合实际工作中的案例数据对该部分内容进行举一反三来强化学生的学习和训练学生的数据分析思维。课程内容以多媒体的课件讲授为主,同时上机应用python对统计分析的各常用方法进行实现,上机完成每种方法的练习。采用课堂练习和课后作业方式对学生掌握知识情况进行考核,建议采用开卷或论文方式进行课程考核,本课程平时成绩占30%,期末考试成绩占70%。三、各教学环节学时分配以表格方式表现各章节的学时分配,表格如下:(宋体,小四号字)教学课时分配序号章节内容讲课实验其他合计1Python环境与编程基础2462数据结构与序列2463语句与控制流2464函数48125迭代器和生成器2466面向对象的编程技术2467Python数据分析基础246合计1632048四、教学内容第1章Python环境与编程基础1.1python系统配置1.2python基础知识1.2.1python帮助1.2.2python标识符1.2.3行与缩进1.2.4python对象1.2.5数字与表达式1.2.6运算符1.2.7字符串1.2.8日期和时间教学重点、难点:python的环境配置与面向对象的编程基础课程的考核要求:了解python环境与界面、运行方式;理解python一切皆对象,掌握python编程基础,灵活应用编程的基本构成。复习思考题:1、搜集行业需求数据,了解python在大数据析领域的地位。2、如何理解python中的“一切皆对象”?第2章数据结构与序列2.1列表2.2元组2.3字典2.4集合2.5推导式教学重点、难点:python核心的数据结构:序列课程的考核要求:了解序列的基本特性;理解python中列表、元组、字典、集合的基本特征及其生成方式,掌握推导式的基本用途。复习思考题:1、理解推导式的工作方式。2、序列这中数据结构为什么在大数据分析中具有极其重要的作用?第3章语句与控制流3.1条件语句3.2循环语句教学重点、难点:python的条件语句和循环语句及其控制课程的考核要求:理解python中的循环语句工作的机制,掌握条件语句和循环的基本用法。复习思考题:1、循环语句与推导式有何异同?第4章函数4.1函数的参数4.2全局变量与局部变量4.3匿名函数4.4递归和闭包4.5柯里化与反柯里化4.6常用的内置函数教学重点、难点:python函数的基本特性,常用函数的生成、操作及调用方式课程的考核要求:理解python函数的工作机制,掌握生成函数的基本方法并熟悉函数参数的各种形式,理解递归、闭包、柯里化等函数操作。复习思考题:1、什么叫做柯里化和反科里化,反科里化与闭包有何异同。2、举例说明函数是如何提高数据分析的工作效率的?第5章迭代器和生成器5.1迭代器5.2生成器教学重点、难点:python的迭代器和生成器课程的考核要求:理解迭代器和生成器的工作机理,掌握迭代器和生成器的用法。复习思考题:1、迭代器和生成器是如何提高数据分析的工作效率的?第6章面向对象的编程技术6.1文件I/O6.2模块6.3类6.4包教学重点、难点:python面向对象编程的基本技术课程的考核要求:了解python文件I/O操作,掌握类与模块的基本用法,了解包的生成及调用。复习思考题:1、函数与类有什么区别和联系?第7章Python数据分析基础7.1numpy基础17.1.1向量7.1.2数组7.1.3矩阵7.1.4文件读写7.2pandas基础7.2.1pandas的数据结构7.2.2pandas的数据操作7.3matplotlib绘图和可视化基础教学重点、难点:numpy和pandas的数据结构和数据分析功能、matplotlib的基本绘图语法课程的考核要求:掌握numpy的ndarray对象和matrix对象,掌握利用numpy进行数据分析的基本语法;掌握pandas的Series和DataFrame对象,掌握利用pandas进行数据分析和可视化的基本技术;熟悉matplotlib的基本绘图技能。复习思考题:1、为什么利用numpy的ndarray对同一个数据对象进行分析,其效率会更高?2、DataFrame对象可以通过哪些方式来构造?五、考核方式、成绩评定本课程采用课堂练习和课后作业方式对学生掌握知识情况进行考核,建议采用开卷或论文方式进行课程考核,本课程平时成绩占30%,期末考试成绩占70%。六、主要参考书及其他内容【1】阮敬编著,实用Python数据分析教程,中国统计出版社,2017年(待出版)【2】MagnusLieHetland著,司维等译,Python编程基础(第二版),人民邮电出版社,2014.6【3】WesMcKinney著,唐学韬等译,利用Python进行数据分析,机械工业出版社,2014.1【4】张若愚著,Python科学计算,清华大学出版社,2012.1执笔人:阮敬教研室主任:系教学主任审核签名: