运用Stata做计量经济学运用Stata建模的7步骤:1、准备工作;目录、日志、读入数据、熟悉数据、时间变量、more、……;2、探索数据:数据变换、描述统计量、相关系数、趋势图、散点图、……;3、建立模型:regress、经济理论检验、实际经济问题要求、统计学检验、计量经济学检验:R2,T,t,残差;4、诊断模型:异方差、序列相关、多重共线性、随机解释变量问题、……;5、修正模型:WLS、GLS、工具变量法(ivregress),……;6、应用模型:置信区间、预测、结构分析、边际分析、弹性分析、常用模型回归系数的意义、……;7、整理:关闭日志、生成do文件备用1、准备工作让STATA处于初始状态,清除所有使用过的痕迹clear指明版本号version11设定并进入工作文件夹:cdD:\(设定路径,将数据、程序和输出结果文件均存入该文件夹)关闭以前的日志capturelogclose建立日志:logusing,replace设定内存:setmem20m关闭more:setmoreoff读入数据:use.dta,clear认识变量:describe建立时间变量:tsset2、用描述统计方法探索数据特征必要的数据转换:gen、replace、……;描述统计量:summarize,detail相关系数矩阵:corr/pwcorr散点图和拟合直线图:scatteryx||lfityx矩阵散点图:graphmatrixyx1x2x3,half线性趋势图:lineyx3、建立模型OLS建立模型:regressyx1x2x3;由方差分析表并用F和R2检验模型整体显著性;依据p值对各系数进行t检验,一次只能剔出一个最不显著的变量,直到不包含不显著的变量;估计参数,判别变量的相对重要性;构造和估计约束模型,用以检验经济理论4、诊断模型(1)检验异方差残差拟合值散点图:rvfplot残差平方与某个自变量的散点图predicte,residualsgene2=eˆ2scattere2x1Breusch-Pagan拉格朗日乘数异方差检验estathettest通过信息矩阵检验执行的white异方差检验estatimtest,white解析检验的零假设H0:同方差(2)检验序列相关散点图法predictrgenlagr=l.rscatterrlagr,xline(0)yline(0)趋势图法lineryear,yline(0)Breusch-GodfreyLMtestforautocorrelationestatbgodfrey,lags(123)Durbin’salternativetestforautocorrelationestatdubinalt,lags(123)Durbin-Watsondw-statisticestatdwatson(3)多重共线性检验多重共线性是否存在:R2和F很高,但t检验不显著判定系数检验法:某一自变量对其余自变量回归的R0.8,判定该自变量引起多重共线性方差膨胀因子大于5estatvif5、修正模型(1)异方差的修正——WLSpredictr,residualsregressyx1x2x3[w=1/abs(r)](2)修正同时存在异方差和序列相关之prais选项是corc变换,循环迭代Praismgdp,corc第一次迭代后停止,两步法praismgdp,twostep矫正同时存在异方差和序列相关之Newey-West假定模型存在异方差和滞后3阶的序列相关,用OLS估计Newey-West标准误Neweymgdp,lag(3)(3)多重共线性的修正排除引起共线性的变量差分法(短期模型)岭回归法(有偏估计)逐步回归法A.向前法(只进不出)swreg...,pe(0.#)B.向后法(只出不进)swreg...,pe(0.#)C.(有进有出)向前法swreg...,pe(0.#)pr(0.#)forwardpe(0.#)pr(0.#)向前法是空模型的开始D.(有进有出)向后法swreg...,pe(0.#)pr(0.#)pe(0.#)pr(0.#)向后法是满模型的开始(4)修正随机解释变量tssetyearivregconsp(gdpp=l.gdpp)用滞后一期的gdpp作gdpp的工具变量常数项虚拟变量自己作自己的工具变量。ivregy1x1x2(y2y3=z1z2z3)x3用z1z2z3作y2和y3的工具变量x1x2x3和常数项虚拟变量自己作自己的工具变量6、运用模型(regresspostestimation)点估计:predictyhat残差:predictr,residuals均值预测的标准误:predictzxbzw,stdp个别值预测的标准误:predictrxbzw,stdfF的临界值invFtail(df1,df2,0.05)F的临界概率(边际概率)Ftail(df1,df2,ftest)t的临界值invttail(df,0.025)t的临界概率(边际概率)ttail(df,ttest)常用模型回归系数的意义线性模型:边际效应^^^01iiyx^1dydx线性-对数模型:自变量的相对变化引起因变量的绝对变化^^^01lniiyx^1dydxx对数-线性模型:自变量的绝对变化引起因变量的相对变化^^^01lniiyx^1dyydx双对数模型:弹性系数^^^01lnlniiyx^1dyydxx差分模型:短期边际效应^^1iiyx^1yx自变量x比上期增加一个单位,平均来说因变量y比上期增加了^1个单位。无常数项。7、整理在results窗口审视整个估计过程,尤其注意出错的地方关闭日志文件:logclose生成do文件:(1)记录和再现建模分析过程(2)为分析类似项目提供借鉴操作:(1)在回顾窗口选择命令并复制(2)点击do-fileEditor,或打开一个已存在的do文件(3)将复制的命令粘贴在do文件中(4)编辑已执行过的命令,包括增加注释(5)调试do文件(6)保存