R语言基础培训第一讲R语言入门

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

R语言入门2什么是R?•R是一种统计绘图语言,也指实现该语言的软件。TheRProjectforStatisticalComputing3为什么要学会R?SPSS(StatisticalPackagefortheSocialSciences)的发明者诺曼·奈伊(NormanNie)说:“没有什么统计概念是R不能表现的。5R简史R语言是从S统计绘图语言演变而来,可看作S的方言。S语言上世纪70年代诞生于贝尔实验室,由约翰·钱伯斯(JohnChambers)开发。基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,在国外学术界应用很广,对SPSS和SAS有力冲击。1995年由新西兰Auckland大学统计系的罗斯·艾卡(RossIhaka)和罗伯特·简特曼(RobertGentleman),基于S语言的源代码,编写了一能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。R的起源RobertGentlemanRossIhaka自1997年以后,有一个核心团队,这一团队能对R的源代码进行修改。7R的优点多领域的统计资源目前在R网站上约有8230个程序包,涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。免费开源统计分析能力突出作图功能强大拓展与开发能力强8R的缺点•用户需要对命令熟悉与代码打交道,需要记住常用命令。•帮助系统均为英文•占用内存所有的数据处理在内存中进行,不适于处理超大规模的数据。•运行速度稍慢即时编译,约相当于C语言的1/20。如何学习R?•熟悉语法•训练思维•善于求助•熟能生巧•保持兴趣…10R软件首页下载和安装R下载完成后,双击R-3.2.4-win.exe开始安装。一直点击下一步,各选项默认,语言建议选英文。12图4R登陆界面(Windows版)路径:开始所有程序R3.2.4菜单栏快捷按钮控制台光标:等待输入13R图形界面:Rstudio•Rstudio是R的图形界面之一,可以让R语言代码更直观、明了地运行。RStudio同样是免费和开源的,可以在网站上自由下载与使用()。•安装Rstudio•双击Rstudio-0.98.501.exe开始安装。RStudio有以下几大优点:•代码字体高亮,代码完整性智能识别、自动缩进;•可直接执行R程序代码;•可运行多个R程序;•可直接浏览工作表和数据;•可随意缩放绘制的图形,并且有多种输出格式;•整合R帮助和R使用文档;•可查看R命令的运行记录。1517R程序包(RPackages)程序包是什么?R程序包是多个函数的集合,具有详细的说明和示例。Window下的R程序包是经过编译的zip包。每个程序包包含R函数、数据、帮助文件、描述文件等。为什么要安装程序包?R程序包是R功能扩展,特定的分析功能,需要用相应的程序包实现。例如:系统发育分析,常用到ape程序包,群落生态学vegan包等。18install.views(Environmetrics)�19三种平台上的程序包20R程序包在CRAN提供了每个包的源代码和编译好的程序包以vegan包为例,CRAN提供了:Packagesource:vegan_1.17-2.tar.gzMacOSXbinary:vegan_1.17-2.tgzWindowsbinary:vegan_1.17-2.zipReferencemanual:vegan.pdfWindow下程序包为zip文件,安装时不要解压缩。21安装程序包的方法1菜单安装在联网的条件下,按菜单栏【程序包】下拉选择【安装程序包】,选择所需的程序包进行实时安装;2联网命令安装例如:要安装vegan包,在控制台中输入install.packages(vegan)3本地安装路径:Packagesinstallpackagesfromlocalfiles选择本地磁盘上存储zip包的文件夹。4脚本安装在联网的条件下,请运行Rpackages.install.R程序,即可完成本培训所需的程序包安装。22程序包使用与更新程序包的中函数,都要先导入,再使用,因此导入程序包是第一步。在控制台中输入如下命令:library(lattice)library(ggplot2)所有程序包的更新update.packages()注意:R命令对大小写敏感,因此使用命令方式安装和载入程序包时应特别注意。23查看程序包帮助文件vegan程序包内部都有哪些函数?分别有什么功能?查询程序包内容最常用的方法:1菜单帮助Html帮助2查看pdf帮助文档24查看函数的帮助文件函数的默认值是什么?怎么使用?使用时需要注意什么问题?需要查询函数的帮助。1?t.test2RGuiHelpHtmlhelp3apropos(t.test)4help(t.test)5help.search(t.test)6查看R包pdf手册2526帮助文件的内容•t.test{stats}#函数名及所在包•FittingLinearModels#标题•Description#函数描述•Usage#默认选项•Arguments#参数•Details#详情•Author(s)#作者•References#参考文献•Examples#举例27练习一安装R并导入程序包1.安装R和Rstudio软件、熟悉菜单2.本地安装程序包:vegan3.调用程序包,查看程序包的帮助library(vegan)查找vegan包中cca函数的帮助输入?cca(试试??cca)将其中的Example粘贴到控制台中,查看运行的结果。R数据集创建•数据创建向量,数组,矩阵,数据框,列表,因子•数据输入scan(),csv文件,excel文件,sas数据…•数据存储write.table(),write.csv(),save()向量vector•概念:用于存储数值型、字符型或逻辑型数据的一维数组。例子:a-c(1,2,5,3,6,-2,4)#数值型向量b-c(one,two,three)#字符型向量c-c(TRUE,TRUE,TRUE)#逻辑型向量注意:单个向量中的数据必须是相同的类型(数值型、字符型或逻辑型)。创建重复的向量rep(2:5,2)#等价于rep(2:5,times=2)[1]23452345rep(2:5,rep(2,4))[1]22334455rep(1:3,times=4,each=2)[1]112233112233112233112233paste(c(X,Y),1:10,sep=-)#不规则[1]X-1Y-2X-3Y-4X-5Y-6X-7Y-8X-9Y-10rep(factor(LETTERS[1:3]),5)[1]ABCABCABCABCABCLevels:ABC向量中元素的访问a-c(1,2,5,3,6,-2,4)#向量a中第三个数据a[3][1]5#向量a中第一、三、五个数据a[c(1,3,5)][1]156#向量a中第二到第六个数据a[2:6][1]2536-2#向量a中数值大于3的所有数据a[a3][1]564#去掉第一个值a[-1][1]2536-24#去掉前三个值a[-1:-3][1]36-24矩阵matrix概念:一个二维数组#创建一个2×2的矩阵matrix(1:4,nrow=2,ncol=2)[,1][,2][1,]13[2,]24#生成单位阵diag(3)[,1][,2][,3][1,]100[2,]010[3,]001•mat1-matrix(1:12,3,4,byrow=T)•mat2-matrix(1:12,3,4,byrow=F)矩阵子集(元素)的提取x-matrix(1:6,2,3)[,1][,2][,3][1,]135[2,]246x[2,2]#第二行、第2列的元素[1]4x[2,]#第二行的所有元素[1]246x[,2]#第2列的所有元素[1]34x[2,c(2,3)]#第二行中第2、3列的元素[1]46数据框dataframe使用函数data.frame()创建:mydata-data.frame(col1,col2,col3,…)其中的列向量col1,col2,col3,…可以是任何数据类型。patientID-c(1,2,3,4)age-c(25,34,28,52)diabetes-c(Type1,Type2,Type1,Type1)status-c(Poor,Improved,Excellent,Poor)patientdata-data.frame(patientID,age,diabetes,status)patientdata[1:2]#第1、2列的所有元素patientdata$age#$符合用于选取一个指定的变量。列表list•R数据类型中最为复杂的一种数据结构。•列表就是包含任何类型的对象,可以是若干向量、矩阵、数据框,甚至其他列表的组合。•通过函数list()来创建:mylist-list(object1,object2,…)其中的对象object1,object2,…,可以是向量、矩阵、数据框或列表的任何一种结构。#创建列表g-MyFirstListh-c(25,26,18,39)j-matrix(1:10,nrow=5)k-c(one,two,three)mylist-list(title=g,ages=h,j,k)因子factor概念:是一种向量对象,它给自己的组件指定了一个离散的分类(分组),它的组件由其他等长的向量组成。用函数factor()创建一个因子,levels按序(字母序或数值序)排列。#为province创建因子province-c(四川,湖南,江苏,四川,四川,四川,湖南,江苏,湖南,江苏)pf-factor(province)#创建province的因子pfpf[1]四川湖南江苏四川四川四川湖南江苏湖南江苏Levels:湖南江苏四川数据的输入1键盘输入mydata-data.frame(age=numeric(0),gender=character(0),weight=numeric(0))mydata-edit(mydata)#输入或修改mydata中的数据2使用scan()函数mydata-scan(file=ex.data,what=list(,0,0))#将压缩型数据读入一个向量或列表3导入csv文件mydata2-read.table(file=D:/dbh.csv,header=T,sep=,)mydata3-read.csv(file=D:/dbh.csv,header=T)4网络中读取表格或csv文件tbl-read.csv()tbl2-read.table()5导入Excel数据library(RODBC)channel-odbcConnectExcel(d:/test.xls)mydata-sqlFetch(channel,Sheet1)channel2-odbcConnectExcel2007(d:/test.xlsx)mydata2-sqlFetch(channel,Sheet1)6导入SAS数据library(foreign)mydata-read.sas(d:/test.ssd)library(Hmisc)data-sas.get(D:/test.ssd)7导入SPSS数据library(foreign)mydata-read.spss(d:/test.sav)2.3数据的存储df-dat

1 / 65
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功