Stata操作实例

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

StataStata1212操作实例操作实例华南师范大学经济与管理学院主讲教师:林可全电话:020-39310352robert_washington@126.com先思考两个问题先思考两个问题—1、计量经济学能做什么?◦例子:◦收入与幸福的关系;◦夫妻共同生活与各自生活的效用比较与关系研究;◦企业捐款与避税行为之间的关系;◦企业捐款与避税行为之间的关系;◦汽车销售与环境保护的关系;◦GDP增长与人民生活水平提高的关系。—2、Stata能做什么?◦软件的用处◦论文的写作11、揭示社会现象背后的规则、揭示社会现象背后的规则—这是计量经济学走得最远的能力。—例如:关于研究生复试的规则:有四项成绩,英语笔试、英语口试、专业笔试和专绩,英语笔试、英语口试、专业笔试和专业面试,学生不知道面试的分数,老师制定规则计算综合分,然后分班,但是学生是不知道老师怎么加权的。—判断这个问题需要什么数据和方法?22、刻画经济运行的特征、刻画经济运行的特征—例如:Kuznets曲线:收入不平等是经济水平的倒U形曲线;拉弗曲线:税收与税率的关系;菲普斯曲线:失业与通胀的关系等胀的关系等—从模型的设定到估计的结果都不一定是真实经济规律的反映,但这些统计特征可以给我们提供一些判断的依据。33、解释经济变量之间的关系、解释经济变量之间的关系—通常的方法:回归分析—例如:房价的推动因素(政府支出、建筑成本、收入、市场结构等);女性外貌与收入高低的关系。貌与收入高低的关系。—1、依据现有经济理论指导—2、回归结果通常不能提供真实的因果关系。(既然如此,我们的研究价值在哪?预测!)44、验证经济理论的适用性、验证经济理论的适用性—实证分析的基本形式—例如:购买力平价理论;格雷欣法则;恩格尔定律;模块化理论等恩格尔定律;模块化理论等—实证文章切入点(西方理论在中国的适用性)—方法准确性—数据类型:时间、截面、面板—计量模型选择StataStata能做什么?能做什么?—计量分析的便利——软件适用性—工具主义——“黄金与垃圾”——做论文的良好帮手;文的良好帮手;—工具只是工具,用得是否得当取决于人◦同学们计量经济学的作业量与美国人吃汉堡的关系◦高速公路假日通行免费与月饼销售的关系◦高富帅与30万一平米StataStata1212基本界面基本界面Stata12Stata12新版Stata12Stata12菜单命令Stata12功能窗口Stata12历史命令Stata12内存中的变量信息新版Stata12变量与数据属性信息Stata12执行命令后的输出结果Stata12输入想要执行的命令StataStata基本介绍基本介绍—Stata统计软件包是目前世界上最著名的统计软件之一,国外将Stata与SAS、SPSS一起被并称为三大权威软件。它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,几乎可以完成全部复杂的统计分析工作。作。—目前最新版本为12,主流版本有SE(特殊版)和MP(多处理器版),功能完全相同,但MP版的运算速度比SE版的要快很多,适用于庞大数据。—命令栏输入about可查看Stata安装信息。—Stata的命令语句极为简洁明快,易学易记。—强大的计量统计功能。—强大的帮助信息。◦本地帮助help命令名◦在线帮助findit命令名—始终处于计量经济学和统计学的最前沿。StataStata优势优势—始终处于计量经济学和统计学的最前沿。◦许多Stata程序员会针对计量经济学发展编写一些最新的程序(ado文件),Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,同时可随时到Stata网站寻找并下载最新的升级文件。下载后可以直接使用,也可以自行修改、添加功能。(例如当前流行的随机前沿模型、DID、分位回归、面板门限数据等,均可以安装下载使用)—Data菜单—Graphic菜单—Statistics菜单◦每执行一个菜单性会自动产生相应的命令。◦我们的讲述以命令方式为主。StataStata重要菜单项重要菜单项StataStata的文件的文件—文件名.dta数据文件—文件名.do命令文件—文件名.ado程序文件—文件名.smcl记录文件—Stata的命令严格区分大小写。—大部分命令可以缩写,用下划线标注缩写。—use打开数据文件,一般加clear清空内存中现有数据—sysuse打开系统数据文件。—describe描述数据—edit利用数据编辑器进行数据编辑本本StataStata实例主要用到的统计分析命令实例主要用到的统计分析命令—edit利用数据编辑器进行数据编辑—list类似于edit,但只能显示不能修改数据—display显示计算结果。简写为di—summarize求某变量观察值个数、均值、标准差、最小和最大值—scatter生成两个变量的散点图—setobs定义样本个数(用前一定要用drop或clear命令清空)—generate建立新变量并赋值,与egen区别。—[byvarlist:]command[varlist][=exp][ifexp][inrange][weight][,options]—Command命令动词,经常用缩写。—varlist表示一个变量或者多个变量,多个变量之间用空格隔开。如sumpriceweightStataStata计量分析的命令格式计量分析的命令格式用空格隔开。如sumpriceweight—byvarlist分类信息按照某一变量的不同特性分类—=exp赋值及运算—ifexp挑选满足条件的数据—inrange对数据进行范围筛选—Weight给数据赋一个权重—,options命令增加一些可选信息StataStata数据类型数据类型—数值型:用0、1、2…9及+、–(正负号)与小数点和()来表示。—字符型:字符串变量由字母数字或一些特殊的符号组成(如地名、住址,职业等等)。注意:数字不表示大小信息,如电话、身份证—注意:数字不表示大小信息,如电话、身份证号等。字符型数据必须要加“”。—日期型:在Stata中,1960年1月1日被认为是第0天,因此1959年12月31日为第-1天,表示形式为:jan/10/2001或者10jan2001。案例数据情况案例数据情况—文件:nerlove.xls/nerlove.dta—来源:Nerlove-1963-Original.pdf,主要包括1955年美国145家电力企业的横截面数据—数据格式:excel格式/stata格式—参考文献:陈强:《高级计量经济学及STATA运用》,高等教育出版社,2010注:(陈老师主要采用Stata10,本课程采用Stata12,部分内容输出可能会有所不同)—smcl是Stata日—smcl是Stata日志文件,使用Stata打开;log则用记事本打开—请跟随着上述要求操作nerlove.dta,下同—注意要点解锁,方能输入内容—形如summarize是Stata命令全称,而下划线部分su是实现该功能的最简短可识别命令,且Stata命令一般为小写,下同。—相关系数命令是考察变量间关系的主要方式之一。—散点图(scatter)是回归前考察变量之间关系的重要图形方法之一。StataStata简单作图简单作图—STATA提供各种曲线类型,包括点(scatter)、线(line)、面(area),直方图(histogram)、条形图(bar)、饼图(pie)、函数曲线(function)以及矩阵图(matrix)等。—同时,对时间序列数据有以ts开头的一系列特殊命令,如tsline。还有一类是对双变量的回归拟合图(lfit、qfit、lowess)等。lfit、qfit、lowess)等。—Stata简单作图我们一般采用菜单形式。—组合作图由于难度较大,一般采用命令—不同类型图形用()或||隔开—可查阅helpgraph或helptwowayStataStata组合作图组合作图重要实例*散点图+线性拟合直线twoway(scatterlogyh)(lfitlogyh)*散点图+二次拟合曲线twoway(scatterlogyh)(qfitlogyh)*散点图+线性拟合直线+置信区间twoway(scatterlogyh)(lfitlogyh)(lfitcilogyh)—*按不同个体画出散点图和拟合线,可以以做出fevsre的初判断*—(graph)twoway(scatterlogyhifid4)(lfitlogyhifid4)(lfitlogyhifid==1)(lfitlogyhifid==2)(lfitlogyhifid==3)—*按不同个体画散点图*—graphtwowayscatterlogyhifid==1||scatterlogyhifid==2,msymbol(Sh)||scatterlogyhifid==3,msymbol(T)||scatterlogyhifid==4,msymbol(d)||,legend(position(11)ring(0)label(1北京)label(2天津)label(3河北)label(4山西))label(3河北)label(4山西))—**每个省份logy与h的散点图,并将各个图形合并—twowayscatterlogyh,by(id)ylabel(,format(%3.0f))xlabel(,format(%3.0f))—*每个个体的时间趋势图*—xtlinehifid11,overlaylegend(on)实例实例—twoway(scatteryx)(lfityx)—,title(不同可支配收入水平组家庭消费支出的条件分布图)xtitle(每月可支配收入(元))ytitle(每月消费支出(元))—xtick(500(500)4000)ytick(0(500)3500)注意:Scatter表示散点图选项,lfit表示回归线,title表示题目,xtick表示刻度,(500(500)4000)分别表示起始刻度,中间数表示以单位刻度,4000表示最后的刻度,4000表示最后的刻度。要注意的是命令中的符号都要用英文字符,否则命令无效。generate命令也可写成g或者gen,如果是复杂函数则用egen命令生成变量。—如果只是计算采用di,如果计算后生成变量则用gen或egen。—下面比较display与predict命令—Stata使用_b[varname]where表示某个变量的系数估计值,而常数项的估计表示为_cons◦display_b[_cons]+_b[x]*0.7209—如果我们要计算出所有x对应的y的预测值,display_b[varname]命令命令—如果我们要计算出所有x对应的y的预测值,可以使用刚才记住的系数计算完成◦geny_hat=_b[_cons]+_b[x]*x—估计的残差项表示y的真实值与预测值之间的差异◦genres=y-y_hat◦listxy_hatyrespredictpredict命令命令—一个更快的方法是在使用regress命令之后使用predict命令◦predictyhat◦predictres,resid◦predictres,resid—检查一下答案是否一致:◦list◦listyyhatresStataStata简单数学运算简单数学运算—主要命令:display或di,涉及变量的用gen或egen—注意:display只输出结果并不保存结果,如要保存则可采用gen或egen1.1.代数运算代数运算—包括加(+)、减(-)、乘(*)、除(/),幂(^)和负数(-),当遇到缺失值或者运算不可行时(比如除数为零)均会得到缺失值。—例:di8/2/*计算8/2,结果为4*/—di3^2、diln(2)、diexp(0)、disqrt(4)2.2.关系运算关系运算关系运算包括大于、小于、等于;不等于、不小于、不大于等多种比较关系。特别要注意到STATA中的等于符号为“==”,是两个等号连写在一起,不同于赋值时用的

1 / 61
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功