stata软件基本操作和简单的一元线性回归

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Stata基本操作及简单的线性回归邬龙2Page2Stata是世界著名的统计分析软件之一。Stata是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。一、Stata软件介绍3Page3STATA软件的安装1.点SetupStata14安装,激活码在txt中,一直下一步2.IC版本即可,越高版本运行越慢3.开始菜单里找到图标运行程序,第一次输入序列号,不要online注册4Page4Stata界面分析命令在这里输入查看历史命令所有的图表绘制都在graphs里面简单的分析功能在Statistics里面5Page5数据读入和保存(从Excel)1.点击dataeditor(edit)图标进入数据编辑器2.复制数据(连同第一行表头),在数据编辑器里粘贴3.弹出提示,询问第一行是否要当成变量名称(表头),选左边为是,选第二个为否4.点击保存,存为xxx.dta文件,便于以后使用6Page6变量的使用1.查看和更改变量名忘了有哪些变量、想把中文变量名改成其他怎么办?点击红圈的variablesmanager图标,即可看到有哪些变量,每个变量是什么数据类型(int表示整数,double表示双精度浮点等)例如,可以把右侧变量名(name)改为sale,标签(Label)只是用来显示的,可以还叫销售额,改完后点击apply2.命令行查看数据:输入:listsale7Page7变量的使用3.生成新变量,例如想生成变量Y,Y是sale的平方用generate函数即可(简写为gen)genY=sale^24.删掉变量:drop变量名8Page8二、一元线性回归9Page9书p51页现代经济学家针对消费和储蓄行为提出了许多假说,包括凯恩斯的绝对收入假说、杜森贝利的相对收入假说、莫迪利安尼的生命周期假说和弗里德曼的持久收入假说等。用我国1992-2009年城镇居民家庭人均食品消费和人均可支配收入的实际数据来估计凯恩斯消费函数,并进行样本内预测。方程形式:其中:C代表食品消费,Y代表收入,𝛽为边际消费倾向第一节问题提出𝐶𝑡=𝛼+𝛽𝑌𝑡+𝑢𝑡10Page10进行回归分析的步骤1.画出散点图/描述统计2.模型估计3.模型检验:R方、t、F检验11Page11第一步导入数据1.点击dataeditor(edit)图标进入数据编辑器2.复制“时间序列”工作表的消费和收入数据(连同第一行表头,不要第一列),在数据编辑器里粘贴3.弹出提示,询问第一行是否要当成变量名称(表头),选左边为是4.点击variablesmanager按钮,更改变量名为英文,消费为Y,收入为X12Page12第二步描述统计/画散点图(1)描述统计按钮操作方法1:在dataeditor数据表窗口中,点击Data—Describedata—Summarystatistics,如图所示选择第二个13Page13第二步描述统计/画散点图(1)描述统计命令操作方法2:若想对现在程序中已粘贴进去的全部数据进行描述,则直接在命令栏输入:summarize,detail注意用英文逗号,然后空格!!若只想对某一个变量进行描述,则输入summarize变量名,detail多个变量直接以空格隔开即可14Page14第二步画散点图/描述统计(2)图形描述在命令栏输入:scatterYX即可,注意纵轴变量在前扩展:让图形更美观,可自行查阅helpscatter的帮助文件如:想每个点标上是第几行数据怎么做?genn=_nscatterYX,mlabel(n)15Page15第三步模型估计设定模型为一元回归模型的命令为:regressYX,简写regYX即可若想做无常数项回归则为:regYX,noconstant𝑌𝑖=𝛽1+𝛽2𝑋𝑖+𝑢𝑖𝑌𝑖=622.7921+0.1346691𝑋𝑖16Page16第四步模型检验(1)经济意义检验斜率为边际消费倾向,表明人均可支配收入每增加1元时,食品消费平均增加0.135元。从经济意义上是合理的。(2)拟合优度检验、t检验和F检验P值为0.000,在任何显著性水平下,斜率项和截距项显然不为零,拒绝两系数为零的假设。另外,拟合优度R方表明,食品支出的97.5%的变化也以由收入X的变化来解释,因此拟合情况较好。如果需要查看残差值e,输入scattere即可,liste可以列出所有ei值,scattereX可以看ei残差图𝛽17Page1717回归结果的提供和分析回归结果提供的两种格式se:2ˆ3.8050.48450.9655(1.79)(14.96)tYXR注:括号内数字为检验值2ˆ3.8050.48450.9655(2.12)(0.03))YXRse注:括号内数字为标准误(这两种方式都要自己查表找ta/2(n-2)临界值对比当然,除了这些基本信息以外,一般还会列出样本区间、DW值等重要信息。这会在后面的课程中说明。18Page18思考:目前,无论时间序列还是截面数据,我们导入的方式完全一样,做法也完全一样,是否有区别?

1 / 18
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功