刘永东的《STATA在实证研究中的应用》

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

LOGOSTATA在实证研究中的应用刘永东中国科学院农业政策研究中心数据分析基础软件名称最新版本安装文件大小SAS9.1.33GSPSS15.01CDStata10.094MGAUSS8.025M计量经济学专用Limdep/Nlogit9.0/4.03MShazam10.090MEviews6.0100MWinrat6.021MTSP5.0Rfree30M中国科学院农业政策研究中心数据分析基础Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(ComputerResourceCenter)研制。从1985到现在,已连续推出1.1,1.2,1.3,1.4,1.5,……及2.0,2.1,3.0,3.1,4.0,5.0,6.0,7.0.,8.0,9.0.,10.0等多个版本。Stata里不要修改原始数据,不可恢复中国科学院农业政策研究中心数据分析基础Stata主要功能数据管理功能统计分析功能•统计分析:描述统计、交叉表格•回归分析:OLS,2SLS,Logit,Probit,Tobit,Heckman,GMM,Paneldata,Timeseries,Surveydata•多变量分析:multivariateregression,clusteranalysis,•抽样和模拟:绘图功能编程和矩阵运算功能中国科学院农业政策研究中心数据分析基础Stata软件的特点Stata功能强大Stata软件小巧Stata操作灵活、简单,易学易用Stata编程语言简单,容易上手Stata功能更新快中国科学院农业政策研究中心数据分析基础三类文件数据文件:*.dta程序文件:*.do结果文件:*.log四个窗口和1个程序编辑器中国科学院农业政策研究中心数据分析基础STATA的界面中国科学院农业政策研究中心ResultWindowCommandWindowReviewWindowVariableWindowButtons中国科学院农业政策研究中心数据分析基础中国科学院农业政策研究中心STATA的界面Buttons:open,save,print,openlogfile,openviewer,bringresultswindowtofront,bringgraphwindowtofront,opendo-file,editwindow,browsewindow,continue,break中国科学院农业政策研究中心数据分析基础Stata的运行方式菜单操作:•执行菜单操作后,在结果窗口能够显示命令行和命令的结果命令行操作:•在命令窗口中直接写入命令,一次只能写一行命令程序操作:•利用doedit编辑do文件,执行批量的命令中国科学院农业政策研究中心数据分析基础如何导入数据直接输入(通过edit窗口)粘贴数据(通过edit窗口)容易出错用命令从外部文件导入(insheet命令)•insheet命令:•Insheetusingfilename,options•通过option指定外部文件类型Excel的sls文件不能直接读取如何导出数据粘贴使用outsheet命令中国科学院农业政策研究中心数据分析基础如何保存数据Save命令如何调用数据Use命令•Usefilename,options查看内存中的数据Browse命令List命令order命令中国科学院农业政策研究中心数据分析基础练习数据导入中国科学院农业政策研究中心数据分析基础do-file什么是do-file?•通俗来说,do-file就是STATA命令和程序的记事本。使用do-file的理由?•可追溯过往操作•可以整合庞杂的命令,减少命令输入•便于发现错误怎么打开do-file?•ButtonDo-file中做注释•程序前打*号,换行///中国科学院农业政策研究中心数据分析基础do-file如何写do-file?规范的do-file应该包括哪些内容•第一步:清理内存,clear•第二步:设定内存,setmemory•第三步:指定路径–cd:f/research/stata/….Use打开文件(比Globallibname方便)–Globallibname“文件夹路径”,用$libname代替该路径•第四部:打开log:–Caplogclose–Logusingfilename–Log的暂停和开启,logon/logoff–查看log:viewd:\stata\data\auto.log中国科学院农业政策研究中心clearsetmemory50mcdF:\stataseminar\practisedatacaplogcloselogusingzheda.loglogonuse2006.datauseruralincome.dta,clearsumruralincomeviewzheda.log数据分析基础数据的初步处理If语句,in语句和by语句生成新变量•generate和egen(egen后面可以跟函数,比generate功能强大)改名字•Rename替换•ReplaceSTATA中的逻辑运算符•And/or:&/|•等于“==”,不等于“!=”(负值=)中国科学院农业政策研究中心数据分析基础代数运算逻辑运算比较关系+加!不大于-减~不小于*乘|或=不小于/除&和=不大于^指数==等于sqrt()开方!=不等于~=不等于~=不等于+字符相加中国科学院农业政策研究中心数据分析基础数据的初步处理删除/保留变量或者观测•Drop/keep排序•Sort与gsort的区别(gsort可以设置排序,多个变量排序)•gsortvariable,option(降序在变量前加-)•gsort-yearcode,generate(order)合并数据•Merge(两个或多个文件必须有一个唯一对应的默认值建立链接关系)save2004_2006.dtasortyearcodesave,replacefile2004_2006.dtasaveduseruralincome.dta,clearsortyearcodemergeyearcodeusing2004_2006.dta需要检查variables窗口是不是有1,2的情况存在,如果存在需要重新检查续接数据•Appenduse2004_2005.dta,clearappendusing2006.dta中国科学院农业政策研究中心数据分析基础数据的初步处理贴标签•Label–Labeldata–Labelvar–des(显示命令)labelvarcode省代码“labeldata农村收入“des面板数据与截面数据转换•Reshapelongreshapewideruralincome,i(code)j(year)面板到截面•Reshapewidereshapelongruralincome,i(code)j(year)截面到面板“压缩”数据(如取平均值)•Collapsecollapse(mean)ruralincome,by(code)中国科学院农业政策研究中心数据分析基础数据的初步处理STATA中常用的operator•生成dummy–Xi:i.year•_n与_N的区别(_N默认最大值)•面板数据tssetcodeyear告诉stata是面板数据,然后使用下面功能–滞后算子l.–差分算子d.•截面数据–滞后与滞前[_n+1][_n-1]bysortcode:gentry1=ruralincome[_n-1]bysort是通过code相同的变量才进行命令中国科学院农业政策研究中心数据分析基础练习数据处理中国科学院农业政策研究中心数据分析基础STATA的描述统计功能Summarize—最常用的描述统计命令•均值、方差、百分位数、最大值、最小值……usefinal.dta,clearsumTable—功能强大的表格统计命令(常用)•多变量表、多变量表……Tabulate—简写为tab,是table的简化版Count—数数命令Correlate—相关系数Pwcorr—correlate姊妹版•Corr可以报告协方差,pwcorr可以报告p值(p值表示两变量在多大的显著程度上是相关的)•Corr删除所有缺失值,pwcorr仅删除pairwise中的缺失值中国科学院农业政策研究中心数据分析基础STATA的描述统计功能—画图直方图•Histogram,options(kden,normal)分布检验的图形•QQ图—qnorm,pnorm•对称分布—symplot•均匀分布—quantile•数学变换后的分布检验—qladder中国科学院农业政策研究中心数据分析基础STATA的描述统计功能—画图Graph命令•Graphbar/box/dot/pie•Graphtwoway(双变量图)–Graphtwowayline/scatter/connected(连线图)……•Graphmatrix(多个变量矩阵图)中国科学院农业政策研究中心数据分析基础练习数据的描述性统计中国科学院农业政策研究中心应用OLS的五个经典假设1线形模型假设Y=Xβ+u2样本随机3E(u|x)=04不存在完全共线性5同方差假设其中前四个假设保证OLS估计量无偏,加上第五个假设,使得OLS成为BLUE(BestLinearUnbiasedEs

1 / 67
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功