此文档由李浩宇制作完成。严禁将此文档用于商业用途。《R语言实战》识记、练习、注释手册(2018年2月19日版)by李浩宇此文档由李浩宇制作完成。严禁将此文档用于商业用途。前言本手册的内容:本手册来源于《R语言实战》和我本人的R学习笔记,是对R语言经典教材《R语言实战》的重新编排和梳理,而且就一些需要进一步解释或者值得补充的地方添加了脚注(本手册对原书添加了一百余处注释,全部放在了手册的脚注中;如在第8章的注释100中补充了如何将回归结果工整地导入Excel)。在一些地方,本手册采用更便于理解和更通俗的语句阐释了命令的含义和功能(如7.2.1节对三维列联表边际频数的阐述)。本手册参照《R语言实战》第一版进行编排(包含了第一版的第1章至第15章),还纳入了《R语言实战》第二版新添加的“第15章——时间序列分析”。另外,有一些案例代码使用了第二版的内容(如4.3.1节中选入观测的代码以及7.1.2节中有关by()分组计算描述性统计量的代码)。凡是没有特别说明的,都是参照第一版内容所写,凡是在第1章至第15章使用了第二版内容的地方都会加以注明。本手册指出了若干第一版存在翻译错误且第二版仍未更正的地方(如9.3.1节的倒数第二段),若干原文作者的代码错误或遗漏(如9.3.2节绘制图9-4的代码),若干原文作者理解错误的地方(如对代码清单9-3中table(dose)的解释),以及若干作者未加以阐述而又难以理解的地方(如对5.2.3节中yaxs=i参数的解释以及为什么在设定了option(digits=3)参数的情况下数字仍呈现了不同的有效位数)。本手册力争做到对代码的严谨解读。对疑似有问题的地方,会同时参考中文第一、二版,英文原版第一、二版,再结合其他参考资料进行阐述。本手册的目的:《R语言实战》是很多同学学习R语言的首选材料。按该书中文第一版封底的一句话来说:“通读本书,你将全面掌握使用R语言进行数据分析,数据挖掘的技巧,并领略大量探索和展示数据的图形功能。”然而,仅“通读”显然是不够的。其一,相信大家在初学R的时候遇到的一大困难就是难以在短时间内理解、识记庞杂的命令代码。经常是看到后一页时已经忘了前一页的代码,看到第二章的时候已经忘了第一章的内容,一段时间不复习连R是怎么工作的都忘了。实际上如果学习和使用过程是同步的,以上问题能够很好的解决。但受到很多现实原因的限制,往往学习过程和使用过程是分开的。很多同学在使用R之前会抽出一整段时间学习《R语言实战》,以应对未来的使用,但往往等到使用的时候,已经遗忘了学习到的命令。于是又只能重新学习,陷入不断重新学习的怪圈。本识记,练习手册的目的在于让R学习者能不用上机实操就够方便快捷地识记、练习R命令(当然实操练习是无法被取代的)。其二,对于新手而言,《R语言实战》对有些命令的解释不够充分,也不便于理解。有一种情况是作者在后文中采用了前面讲过的命令,进而不再赘述。但是对于新手来说看到后面的时候早就忘了前面的内容。本手册使用了大量更加具体,更加生动的语句对命令进行了重新描述,基本做到了对原文的所有命令进行逐行逐个描述。如果通过此文档由李浩宇制作完成。严禁将此文档用于商业用途。阅读原文无法理解某个命令的含义,读者可以在本手册对应处中找到更“傻瓜”的描述。我想在这一方面,这本手册应该不会让大家失望,因为我在学习R时就是一个“傻瓜”。本手册的特点:1.在排版上采用了右描述,左命令的方式。对于有“识”要求的读者,可以遮住右侧(解释部分),思考左侧命令的含义。对于有“记”要求的读者,可以遮住左侧(命令部分),通过右侧的释义写出相应的命令。2.右侧的描述以祈使句、疑问句,或需要填空的句子撰写,相当于每一个描述都是一个练习题,由此达到练习的目的。3.本手册本着零基础用户也能看懂的原则,对一些值得补充或者需要进一步明确的内容进行了注释,也在原书的基础上增加了一些批注和辅助理解、记忆的内容(这使得本手册的一些注释显得比较啰嗦)。4.为了达到练习的目的,或是为原书中仅以文字描述的内容增添举例,本手册改写了一些书中的命令,并丰富了一些命令的实例。本手册的使用方法:1.复习时遮住右侧和左侧,分别练习“识”和“记”。2.个别内容只在右侧出现了描述,而左边代码部分为空白,此时只需要阅读右侧内容即可。3.对于初学者来说越是基础的章节(第1章至第7章)越需要熟练掌握其代码,而具体到某种统计或计量方法的章节反而没有那么重要。其他说明:“_______”表示此处需要填空。“【补】”表示此处是此手册补充的内容。本手册于2018年1月18日首发于人大经济论坛李浩宇2018/01/18于世界尽头与冷酷仙境此文档由李浩宇制作完成。严禁将此文档用于商业用途。目录第1章R语言介绍...............................................................................................................11.1为何要使用R?...........................................................................................................................................................11.2R的获取和安装..........................................................................................................................................................11.3R的使用......................................................................................................................................................................11.4包................................................................................................................................................................................21.5批处理........................................................................................................................................................................31.6将输出用为输入——结果的重用............................................................................................................................31.7处理大数据................................................................................................................................................................31.8示例实践....................................................................................................................................................................3第2章创建数据集...............................................................................................................42.1数据集的概念............................................................................................................................................................42.2数据结构....................................................................................................................................................................42.3数据的输入................................................................................................................................................................72.4数据集的标注............................................................................................................................................................72.5处理数据对象的实用函数........................................................................................................................................8第3章图形初阶...................................................................................................................93.1使用图形....................................................................................................................................................................93.2一个简单的例子........................................................................................................................................................93.3图形参数...........................................................................................................................