《应用《应用StataStata做数据分析之快速入门》讲稿做数据分析之快速入门》讲稿第1讲Stata操作入门百度百度wheatorwheator友情制作友情制作内容概要第一节概况第二节Stata操作入门一、Stata的界面二、数据的录入与储存三、分析结果的储存第三节Stata的帮助功能第一节概况Stata最初由美国计算机资源中心(ComputerResourceCenter)研制,现在为Stata公司的产品,其最新版本为12.0版。它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。Stata最为突出的特点是短小精悍、功能强大,其最新的9.0版整个系统只有13M左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是他的统计分析功能极为全面,比起1G以上大小的SAS系统也毫不逊色。另外,由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。由于Stata的用户群始终定位于专业统计分析人员,因此他的操作方式也别具一格,在Windows席卷天下的时代,他一直坚持使用命令行/程序操作方式,拒不推出菜单操作系统。但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。更为令人叹服的是,Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。除了操作方式简洁外,Stata的用户接口在其他方面也做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于进行统计教学的统计软件。Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件(ADO文件),这些文件可以自行修改、添加和下载。用户可随时到Stata网站寻找并下载最新的升级文件。事实上,Stata的这一特点使得他始终处于统计分析方法发展的最前沿,用户几乎总是能很快找到最新统计算法的Stata程序版本,而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。由于以上特点,Stata已经在科研、教育领域得到了广泛应用,WHO的研究人员现在也把Stata作为主要的统计分析工作软件。第二节Stata操作入门一、一、StataStata的界面的界面图1即为Stata启动后的界面。Stata的界面主要是由四个窗口构成。Stata启动后的界面命令窗口结果窗口命令回顾窗口变量名窗口1.结果窗口:位于界面右上部,软件运行中的所有信息,如所执行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本,如白色表示命令,红色表示错误信息。2.命令窗口:位于结果窗口下方,相当于DOS软件中的命令行,此处用于键入需要执行的命令,回车后即开始执行,相应的结果则会在结果窗口中显示出来。3.命令回顾窗口:即review窗口,位于界面左上方,所有执行过的命令会依次在该窗口中列出,单击后命令即被自动拷贝到命令窗口中;如果需要重复执行,用鼠标双击相应的命令即可。4.变量名窗口:位于界面左下方,列出当前数据及中的所有变量名称。除以上四个默认打开的窗口外,在Stata中还有数据编辑窗口、程序文件编辑窗口、帮助窗口、绘图窗口、Log窗口等,如果需要使用,可以用Window或Help菜单将其打开。二、数据的录入与储存二、数据的录入与储存Stata为用户提供了简捷,但是非常完善的数据接口,熟悉它的用法是使用Stata的第一步。在Stata中读入数据可以有三种方式:直接从键盘输入、打开已有数据文件和拷贝、粘贴方式交互数据。(一)从键盘输入数据(一)从键盘输入数据在Stata中可以使用命令行方式直接建立数据集,首先使用input命令制定相应的变量名称,然后一次录入数据,最后使用end语句指明数据录入结束。例1在某实验中得到如下数据,请在Stata中建立数据集。观测数据x13579y246810此处需要建立两个变量x、y,分别录入相应数值。Stata中的操作如下:其中黄色底色部分为操作者输入部分。.clear.inputxyxy1.122.343.564.785.9106.end(二)用(二)用StataStata的数据编辑工具的数据编辑工具1.进入数据编辑器进入Stata界面,在命令栏键入edit或在Stata的window下拉菜单中单击dataeditor或点击编辑图标(注意:是浏览图标,点击后只能浏览,不能编辑)即可进入Stata数据编辑器。2.数据编辑Stata数据编辑器界面如图2所示,此时进入了数据全屏幕编辑状态。在第一列输入数据后,Stata第一列自动命名为var1;在第二列输入数据后,第二列自动命名为var2,……,依次类推。在输入数据后,双击纵格顶端的变量名栏(如:Var1或Var2处),可以更改变量名,并可以在label栏中注释变量名的含义,点击OK确认(如图3所示)。仍沿用上例,双击观察值所在列顶端的变量名栏,更改变量名为x,并在label栏中注明“7岁男童身高(cm)”。图3数据输入完毕后,单击preserve键确认所输数据,按关闭键即可退出编辑器。(三)拷贝、粘贴方式交互数据(三)拷贝、粘贴方式交互数据Stata的数据编辑窗口是一个简单的电子表格,可以使用拷贝、粘贴方式直接和EXCEL等软件交互数据,在数据量不大时,这种方式操作极为方便。例2现在EXCEL中已录入了三个变量,共5条记录,格式见下图,请将数据读入Stata。首先将EXCEL中的A1~C6全部18个单元格选中,选择编辑菜单中的“复制”,将数据拷贝到剪贴板上;然后切换到Stata,选择Window菜单中的“DataEditor”,打开数据编辑窗口;再选择Edit菜单中的“Paste”,相应的数据就会被直接粘贴至数据编辑窗口中,并且变量名、记录数、变量格式等的自动设置与原EXCEL中的设置相同。见图5和图6。图5在EXCEL中的数据图6粘贴入Stata后的数据(四)读入已有的数据文件(四)读入已有的数据文件Stata能够直接打开的数据文件只能是Stata专用格式数据文件或者纯文本格式数据文件。1.读入Stata专用格式数据文件。Stata的专用格式数据文件的扩展名为.dta。可以点击图标,然后选择路径和文件名来打开。也可以使用use命令打开。例如要打开数据文件“c:\data1.dta”,则命令为:.usec:\data1在这里,扩展名可以省略,如果Stata中已经修改或者建立了数据集,则需要使用clear选项清除原有数据,命令为:.usec:\data1,clear2.读入纯文本格式数据文件。需要使用insheet命令实现,例如需要读入已建立好的文本格式数据文件“c:\data1.txt”,则命令为:.insheetusingc:\data1.txt该命令会自动识别纯文本格式数据文件第一行是否为变量名,以及变量列间的分隔符是Tab、逗号还是其他字符。如果Stata中已经修改或者建立了数据集,则需要使用clear选项清除原有数据,命令为:.insheetusingc:\data1.txt,clear(五)数据文件的保存(五)数据文件的保存为了方便以后重复使用,输入Stata的数据应存盘。Stata实际上只能将数据存为Stata专用数据文件格式或者纯文本文件格式。1.存为Stata专用格式数据文件。可以直接使用文件菜单保存,点击图标,然后选择路径和文件名,点击“保存”即可。也可以使用save命令操作,例如欲将上面建立的数据文件存入“C:\”中,文件名为mydata1.dta,则命令及结果为:.savec:\mydata1filec:\mydata1.dtasaved该指令将在C盘根目录建立一个名为“mydata1.dta”的Stata数据文件,后缀dta可以在命令中省略,会被自动添加。如所指定的文件已经存在,则该命令将给出如下信息“filec:\mydata1.dtaalreadyexists”,告诉用户在该目标盘及子目录中已有相同的文件名存在。如欲覆盖已有文件,则加选择项replace。命令及结果如下:.savec:\mydata1.dta,replacefilec:\mydata1.dtasaved2.存为纯文本格式数据文件。需要使用outsheet命令实现。该命令的基本格式如下:outsheet[变量名列表]using文件名[,nonamesreplace]其中变量名列表如果省略,则将全部变量存入指定文件。如欲将上面建立的数据文件存入文本文件“c:\data1.txt”中,则命令为:.outsheetusingc:\data1.txt此时建立的文件data1.txt第一行为变量名,第2~6行为变量值。变量列间用Tab键分隔。如果不希望在第一行存储变量名,则可以使用nonames选项。如果文件已经存在,则需要使用replace选项。三、分析结果的储存三、分析结果的储存Stata在屏幕上显示的运行结果有两种,-纯字符型的(如方差分析结果,回归分析结果等),-图形。记录字符型结果记录字符型结果工具按钮操作法:开始进行分析之前,点击常用工具栏中的“BeginLog”图标,然后选择路径和输入保存结果的文件名,建议选择扩展名为smcl或log的文件,字符型结果都将保存其中。当分析结束时,仍点击该图标,则关闭相应文件。记录图标命令语句法:打开一个log文件:.logusing文件名若执行某一指令后的结果没有必要记录下来,则可事先用指令“logoff”暂停记录,需要记录时再用“logon”继续记录最后用“logclose”关闭文件。若已存在,则.logusingresult1,replace如要在其后进行添加,则键入:.logusingresult1,append友情提示:字符型统计分析结果文件可以用word打开和编辑记录图形结果记录图形结果●在绘图指令中加上“saving”选择项。例如,画例1.1中x与y的散点图并存入文件“ex1.gph”,可用下述指令:.scatteryxsaving(d:\mydata\ex1)●直接复制第三节Stata的帮助功能有多种途径可以获得Stata的帮助,主要的途径有三个:手册、Stata自带帮助和网络帮助。★一套完整的手册有10余本。纸质书价格昂贵。Help菜单中有PDF格式电子书(默认用AdobeReader打开)。★Stata的自带帮助,我们可以在记住极少量的基本命令的基础上,方便地运用Stata命令。.help显示出Stata所有帮助内容的目录结构。如果输入具体的命令,则只显示该命令的帮助,如.helpsummarize也可以通过菜单式的点选方式获得帮助:Helpstatacommand…,在弹出的对话框中输入summarize,然后回车,得到与helpsummarize同样的结果。使用帮助的小窍门:先看命令描述(Description)部分,然后直接看帮助文件后面的命令示例(Examples),将命令示例复制到命令窗口,执行,看看执行结果,体会命令的用法。★网络帮助可以采用如下命令获得:.finditscat3,net.searchscat3,net这两条命令等价,均为寻找命令scat3。由于scat3不是Stata内置命令,所以需要通过这两个命令搜索并下载安装后才能使用。Search命令亦可以通过菜单调用。Thanks!