《R语言PPT》全套PPT教学课件(大数据应用人才培养系列教材)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

大数据应用人才培养系列教材R语言第一章绪论1.1为什么学习R语言1.2正确的数据思维观习题大数据应用人才培养系列教材1.1为什么学习R语言第一章绪论R是什么随着我们数据分析能力的不断提升,Excel渐渐无法满足日常需求,我们需要更专业化的软件来帮助我们做数据分析。相应的问题就来了:统计学软件那么多:SPSS、R、Python、SAS、JMP、Matlab……该选哪一个?目前市场上较为火热的软件是R和Python。R语言是在统计和数据科学界广泛应用的编程语言和开发环境,其免费、开源、灵活的特点与统计之都的文化不谋而合。2008年起,统计之都在中国人民大学举办了第一届中国R语言会议。自此R语言会议规模越来越大,至今已成功举办了11届。1.1为什么学习R语言第一章绪论2014年数据分析常用语言排行榜1.1为什么学习R语言第一章绪论R语言主要优势(1)作图美观,完全免费1.1为什么学习R语言第一章绪论R语言主要优势(2)算法覆盖广,软件扩展易作为统计分析工具,R语言几乎覆盖整个统计领域的前沿算法。截止2017年2月25日,CRAN(ComprehensiveRArchiveNetwork)上已经有10162个可以获取的R扩展包,并且以每个月200多个包的速度发布,内容涉及各行各业,可以适用于各种复杂的统计,如:贝叶斯推断、分类方法、计量经济学、生态学、金融学、遗传学、机器学习、稳健统计、空间统计、生存分析、时间序列等多个方面。数千个R包,上万种算法,开发者都能找到可直接调用的函数实现。1.1为什么学习R语言第一章绪论R语言主要优势(3)算法覆盖广,软件扩展易1.1为什么学习R语言第一章绪论R语言主要优势(4)强大的社区支持作为一个开源软件,R背后有一个强大的社区和大量的开放源码支持,获取帮助非常容易。比如国外比较活跃的社区有GitHub和StackOverflow等,通常R包的开发者会先将代码放到GitHub,接受世界各地的使用者提出问题,然后修改代码,等代码成熟后再放到CRAN上发布。国内最活跃的R社区就属统计之都以及统计之都旗下的COS论坛了。1.1为什么学习R语言第一章绪论R语言主要优势(5)非过程模式Python虽然也支持命令模式,但是相对来说,更偏向于流程控制语句,也就是可以写一堆语句,然后执行。R本身基本上不需要用到流程控制(当然,它也支持流程控制)。1.1为什么学习R语言第一章绪论R语言主要优势(6)交互性敲回车,出结果。但是又不像SPSS那种用鼠标扎针的交互方式。第一章绪论1.2正确的数据思维观1.1为什么学习R语言习题大数据应用人才培养系列教材第一章绪论1.2正确的数据思维观数学思维数学思维一方面体现在它的方向性,另一个重要特征是客观性。数学思维它能够帮助你摒弃主观的偏见与看法。诸如遇到突发事件能在第一时间冷静下来,抛去恐慌的情绪;对自己喜欢的项目客观分析,不对数据进行修饰;对自己犯下的错误能客观评论,给出解决方法等。喜怒哀乐是每个人都会有的情绪,而对数据分析师而言,一旦进入工作就要绝对理性与客观,这也是数据分析师思考问题的前提。第一章绪论1.2正确的数据思维观统计思维相比于数学,统计学在日常生活中的应用要明显而又简单得多。我们日常生活中接触的求和、平均值、中位数、最大值等其实都是统计思维的一部分。统计思维可归类为:描述、概括、分析。第一章绪论1.2正确的数据思维观统计思维(1)描述描述就是对事物或对象的直接描写,是对事物的客观印象。如果我们把描述概念对应到数据上,可以理解为这堆数据“长什么样”,通过对数据的描述能够让人感悟到数据的真实长相。在统计学描述数据使用的指标通常是如下统计量:平均数、众数、中位数、方差、极差、四分位点,这些指标就好像是数据的“鼻子”“眼睛”“嘴唇”“眉毛”等。第一章绪论1.2正确的数据思维观统计思维(2)概括概括是形成概念的过程,把大脑中所描述的对象中的某些指标抽离出来并形成一种认识,就好像对一个人“气质”的概括,“气质”是基于这个人的“谈吐”“衣着”“姿势”“表情”等指标综合在一起,然后基于历史对“气质”这样的概念得出结论,“气质”不可以依靠眼睛感受直接获取,而是需要收集这个人的细节描述信息,形成对这个人的整体印象。第一章绪论1.2正确的数据思维观统计思维(3)分析分析就是将研究对象的整体分为各个部分、方面、因素、层次,并加以考察的认知活动,也可以通俗地解释为发现隐藏在数据中的“模式”和“规则”。第一章绪论1.2正确的数据思维观统计思维(4)三者之间关系通过描述获取数据的细节,通过概括得到数据的结构,通过分析得到想要的结论。分析区别于描述和概括一个非常重要的特征就是以目标为前提,以结果为导向。第一章绪论1.2正确的数据思维观逻辑思维逻辑思维是人的理性认识阶段,是人运用概念、判断、推理等思维类型反映事物本质与规律的认识过程。它是人的认识的高级阶段,即理性认识阶段。逻辑思维是一种确定的,而不是模棱两可的;前后一贯的,而不是自相矛盾的;有条理、有根据的思维;在逻辑思维中,要用到概念、判断、推理等思维形式和比较、分析、综合、抽象、概括等思维方法,而掌握和运用这些思维形式和方法的程度,也就是逻辑思维的能力。第一章绪论1.2正确的数据思维观逻辑思维逻辑思维具体包括:(1)上取/下钻思维上取思维就是在看完数据之后,要站在更高的角度去看这些数据,站在更高的位置上,从更长远的观点来看,从组织、公司的角度来看,从更长的时间段(年、季度、月、周)来看,从全局来看,你会怎样理解这些意义呢?也许向上思维能让你更明白方向。下钻思维就是把事物切细了分析。数据是一个过程的结果反映,怎样通过看数据找到更多的原因隐藏在现象背后的真相,需要把事物切细了分析。原理:显微镜原理。关键:知道数据的构成、分解数据的手段、对分解后的数据的重要程度的了解。第一章绪论1.2正确的数据思维观逻辑思维(2)求同/求异思维求同思维就是,当一堆数据摆在我们面前时,表现出各异的形态,然而我们却要在种种的表象背后,找出其有共同规律的特点。关键:找到共性的东西进行分析,要客观。求异思维就是在看到每一个数据都有相似之处同时,也要看到他们不同的地方,特殊的地方。关键:对实际情况的了解,对日常情况的积累,对个体情况的了解,对个体主观因素的分析。第一章绪论1.2正确的数据思维观逻辑思维(3)抽离/联合思维当你从一个旁观者的角度不思考看待数据时,你往往能发现那些经常让我们迷失方向的细枝末节并没有太多的意义,我们迷失方向,忘记了自己的价值,同时深受情绪困扰。这时,你采用抽离思维更加能够帮助到你。关键:多种分析方法,多角度看问题,不要钻牛角尖,多学习别人的好方法,学会集思广益,发散性思维。第一章绪论1.2正确的数据思维观逻辑思维(4)离开/接近思维通过数据分析,你发现你处在一个不太有利的地位,那么,此时你就要有离开思维去替你想办法,离开困境。关键:学会自我调节,自我放松。要达成目标,实现销售增长,这时候你需要接近思维来帮助你。关键:多接触你要解决的问题,花时间分析,你要的是方案,不是问题。第一章绪论1.2正确的数据思维观逻辑思维(5)层次思维问题发现是第一步,要怎样分析问题,找到真正的原因,那么要熟练地运用理解层次。关键:你需要熟悉客观环境,员工的能力、行为的规律、他需要什么?第一章大数据概述1.2大数据库的类型习题1.1从数据库到大数据库大数据应用人才培养系列教材1.正确的数据思维观包括:数学思维、()、逻辑思维。2.()是容易掌握的,但是()却是很难培养的。3.数学思维的两个特征是()和()。4.常用统计量包括()、()、()、()。5.从思维科学角度看统计思维可归类为()、()和()。6.把大脑中所描述的对象中的某些指标抽离出来并形成一种认识称为()。7.把事物切细了分析称为()思维。8.显微镜原理属于()思维。9.当一堆数据摆在我们面前时,表现出各异的形态,然而我们却要在种种的表象背后,找出其有共同规律的特点。称为()思维。10.换位思考属于()思维。习题:第二章R语言入门2.1新手上路2.2R语言开发环境部署习题大数据应用人才培养系列教材2.3获取帮助2.4工作空间2.5脚本2.6R包2.1新手上路第二章R语言入门两个例子年龄(月)体重(kg)年龄(月)体重(kg)014.4097.3035.3036.0057.20910.4025.21210.2118.5036.1【例2.1】数据如下表,分析体重的分布及体重和月龄的关系。age-c(1,3,5,2,11,9,3,9,12,3)#产生向量weight-c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6.1)#产生向量mean(weight)#计算平均体重[1]7.06sd(weight)#计算体重标准差[1]2.077498cor(age,weight)#体重和月龄的关系[1]0.9075655plot(age,weight)#绘制散点图R代码2.1新手上路第二章R语言入门运行结果2.1新手上路第二章R语言入门R语言主要优势(2)算法覆盖广,软件扩展易作为统计分析工具,R语言几乎覆盖整个统计领域的前沿算法。截止2017年2月25日,CRAN(ComprehensiveRArchiveNetwork)上已经有10162个可以获取的R扩展包,并且以每个月200多个包的速度发布,内容涉及各行各业,可以适用于各种复杂的统计,如:贝叶斯推断、分类方法、计量经济学、生态学、金融学、遗传学、机器学习、稳健统计、空间统计、生存分析、时间序列等多个方面。数千个R包,上万种算法,开发者都能找到可直接调用的函数实现。2.1新手上路第二章R语言入门R语言主要优势(2)算法覆盖广,软件扩展易2.1新手上路第二章R语言入门【例2.2】绘制股票实时数据K线图。在R的控制台输入如下命令:library(quantmod)#引用quantmod包getSymbols(GOOG,src=yahoo,from='2016-01-01',to='2016-04-24')#从雅虎财经获取google的股票数据chartSeries(GOOG,up.col='red',dn.col='green')#显示K线图addMACD()#增加MACD图执行后效果如下2.1新手上路第二章R语言入门第二章R语言入门2.2R语言开发环境部署2.1新手上路习题大数据应用人才培养系列教材2.3获取帮助2.4工作空间2.5脚本2.6R包2.2R语言开发环境部署第二章R语言入门Windows下安装RR语言下载地址:语言欢迎界面安装RstudioRStudio安装地址:包文档和搜索help.start()命令会打开浏览器,显示全部帮助文档。包括一些入门的文档,以及搜索功能。2.3获取帮助第二章R语言入门演示demo()列出所有可用的演示,如下图所示。2.3获取帮助第二章R语言入门输入名称可以开始演示制定对象的帮助,如:demo(is.things)帮助函数2.3获取帮助第二章R语言入门函数功能help(foo)或?foo查看函数foo的帮助(引号可以省略)??foo以foo为关键词搜索本地帮助文档example(foo)函数foo的使用示例(引号可以省略)apropos(foo,mode=function)列出名称中含有foo的所有可用函数data()列出当前已加载包中所含的所有可用示例数据集第二章R语言入门2.4工作空间2.1新手上路习题大数据应用人才培养系列教材2.2R语言开发环境部署2.3获取帮助2.5脚本2.6R包用于管理R工作空间的函数函数功能getwd()显示当前的工作目录se

1 / 424
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功