stata初级入门5-线性回归模型估计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2020/2/9计量经济学软件应用1Stata初级入门5——线性回归模型江金启沈阳农业大学经济管理学院2020/2/9计量经济学软件应用2一、计量回归前的知识回顾数据结构数据结构、数据类型和估计模型选择线性回归的OLS的基本假定基本假定引申的定理2020/2/9计量经济学软件应用31数据结构截面数据(Cross-SectionData):给定时点对个人、家庭等样本单位所采集的数据。时序数据(Time-SeriesData):某一或某几个变量在不同时点的观测值。混合截面数据(PooledCrossSectionData):不同时点的多个同单位截面样本混合得到。面板数据(亦称综列数据,PanelData/LongitudinalData):同一截面样本在不同时点的观测值。通常是对同一截面样本的持续跟踪调查得到。2020/2/9计量经济学软件应用42数据结构、类型及模型选择连续变量离散变量截面数据时序数据混合截面数据面板数据非分类变量分类变量线性模型截面模型时序模型离散选择模型分类变量模型计数模型面板或差分模型2020/2/9计量经济学软件应用53线性回归要满足的基本假定参数线性:Y=β0+β1x+μ随机抽样性:意味着cov(ui,uk)=0零条件均值(亦称严格外生性):E(u|x1,x2,x3,…)=0,意味着E(u)=0,cov(x,u)=0。计量回归的最关键假定。如果E(u|xi)=0,而E(u|xk)≠0,则xi为外生解释变量,xk为内生解释变量。违背零条件均值假定的情况:(1)模型形式误设,(2)遗漏重要解释变量;(3)解释变量的测量误差;(4)联立因果;(5)样本选择偏误。2020/2/9计量经济学软件应用6不存在完全或多重共线性:在总体中,自变量间不存在严格的线性关系。该假定不意味着自变量间无相关关系,而是要求它们间无高度相关或完全相关。引起完全共线性的情况:(1)一个自变量是另一个自变量的常数倍;(2)一个自变量恰好可以表达为其它两个或多个自变量的一个线性函数。如果此情况发生,自变量间就有多重共线性关系。*自变量的样本有变异:在样本中,自变量不为相同的常数。同方差性(亦称有效性):var(u|x1,x2,x3,….)=σ2。假定1-5统称为截面回归的高斯—马尔科夫假定。2020/2/9计量经济学软件应用74基本假定所引申出的四个定理无偏性OLS斜率估计量的抽样方差iiE)ˆ(2020/2/9计量经济学软件应用8无偏估计高斯-马尔科夫定理二、Stata计量模型估计概述模型估计模型预测参数检验对虚拟变量的处理变量的边际影响或弹性对模型估计结果的相关操作模型估计结果的提取2020/2/9计量经济学软件应用91模型估计的语法基本语法格式单方程模型估计的命令格式系统方程模型估计的命令格式估计选项常数项、offset、exposure、参数约束、置信度、标准差的计算方法、组内相关结构、一阶自相关系数的计算2020/2/9计量经济学软件应用101.1基本语法格式单方程模型commandvarlist[if][in][weight][,options]范例:regressdepvar[indepvars][if][in][weight][,options]——线性回归模型系统方程模型command(varlist)(varlist)[if][in][weight][,options]范例:sureg(depvar1varlist1)(depvar2varlist2)...(depvarNvarlistN)[if][in][weight]——似不相关回归模型varlist为模型的因、自变量,中间空格分开,其中第1个变量,软件自动识别为因变量,其余为自变量。2020/2/9计量经济学软件应用111.2估计选项设定(options)1.2.1常数项noconstant:模型没有常数项hascons:用户自己设定的常数项1.2.2offsetoffset(varname)表示约束模型中变量varname的系数为1。该选项多出现于离散选择模型、计数模型中。1.2.3exposureexposure(varname)表示约束模型中变量ln(varname)的系数为1。该选项多出现于计数模型中。2020/2/9计量经济学软件应用121.2.4参数约束constraints(numlist):通过constraint命令设定线性约束constraints(matname):通过矩阵设定线性约束constraints(clist):在个别命令中使用,如mlogit命令该选项多出现于离散选择模型、分类变量模型、计数模型中。1.2.5置信度level(#)设定置信区间,默认值为951.2.6组内相关结构corr(correlation)设定组内相关结构,该选项一般多在“面板数据”的广义方程估计中出现2020/2/9计量经济学软件应用131.2.7标准差的计算方法vce(vcetype)是stata中设定参数估计量协方差矩阵计算方法的最主要选项。vcetype的常见形式:oim:基于最大似然估计中的观测信息矩阵进行计算opg:基于最大似然估计中梯度向量进行估计robust:异方差稳健估计,又称Huber/White/Sandwich估计量clusterclustvar:组内相关稳健估计bootstrap:自举法jackknife:刀切法ols:用OLS残差计算协方差矩阵hackernel:异方差自相关一致标准差rgf:将稳健方差估计量乘以(N-1)/(N-P)2020/2/9计量经济学软件应用141.2.8一阶自相关系数的计算该选项不常使用,默认是dw法。rhotype(method):用于设定时序/面板数据模型中AR(1)系数的方法。method包括:dw:rho_dw=1-dw/2,其中dw是Durbin-Watson值regress:从残差回归方程et=rho_regress*et-1+vtfreg:从残差回归方程中et=rho_freg*et+1+vttscorr:rho=e‘et-1/e’e,其中e和et-1是残差和滞后一期残差。theil:rho=rho_tscorr*(N-k)/Nnagar:rho_nagar=(rho_dw*N2+k2)/(N2-k2)onestep:rho_onestep=(n/m_c)*rho_tscorr,其中n是样本单位总数,m_c是consecutivepairsofresiduals的数目2020/2/9计量经济学软件应用152模型预测2020/2/9计量经济学软件应用163参数检验2020/2/9计量经济学软件应用174对虚拟变量的处理2020/2/9计量经济学软件应用185变量的边际效应或弹性2020/2/9计量经济学软件应用196对模型估计的相关操作2020/2/9计量经济学软件应用207模型估计结果的提取2020/2/9计量经济学软件应用21三、一元线性回归命令:regressvarlist[if][in][weights][,options]菜单:StatisticsLinearmodelsandrelatedLinearregression常数项的设定2020/2/9计量经济学软件应用222020/2/9计量经济学软件应用23[if][in]的设定2020/2/9计量经济学软件应用24weights的设定2020/2/9计量经济学软件应用25标准差计算方法的设定2020/2/9计量经济学软件应用26结果报告的设定置信度标准化回归系数报告系数报告e系数不报告多重共线性变量2020/2/9计量经济学软件应用272020/2/9计量经济学软件应用28四、实例例:收入对消费的影响拟回答的问题:(1)当期收入对居民的消费支出究竟有怎样的影响?(2)边际消费倾向是多少?(3)农村和城镇的边际消费倾向差异?理论:凯恩斯的绝对收入假说变量:当期收入和消费支出模型:Y=𝑥𝛽+𝑢,Y是消费支出,x是当期收入,u是随机扰动项打开数据文件:useC:\Users\jjq\Desktop\计量经济学软件应用讲稿\ch5OLS.dta,clear2020/2/9计量经济学软件应用291消费支出和收入散点图:农村2020/2/9计量经济学软件应用30命令:twoway(scatterrconsumrneti,sort)(lfitrconsumrneti),ytitle(农村人均消费支出)xtitle(农村居民人均纯收入)title(收入与消费支出关系:农村)note(数据来源:中国统计年鉴2011年)200040006000800010000农村人均消费支出400060008000100001200014000农村居民人均纯收入农村居民消费支出Fittedvalues数据来源:中国统计年鉴2011年收入与消费支出关系:农村2回归结果:农村命令:regressrconsumrneti2020/2/9计量经济学软件应用31_cons482.8383265.2681.820.079-59.695741025.372rneti.6478134.038718316.730.000.5686257.7270012rconsumCoef.Std.Err.tP|t|[95%Conf.Interval]Total99229442.4303307648.08RootMSE=566.74AdjR-squared=0.9029Residual9314546.2729321191.251R-squared=0.9061Model89914896.1189914896.1ProbF=0.0000F(1,29)=279.94SourceSSdfMSNumberofobs=31TSS=ESS+RSS样本数,F统计值、R2回归系数标准误t统计量p值,用于判断变量是否影响显著2回归结果:城镇命令:regressuconsumpdi2020/2/9计量经济学软件应用32_cons704.8237625.69411.130.269-574.86451984.512pdi.6676549.033514519.920.000.5991101.7361998uconsumCoef.Std.Err.tP|t|[95%Conf.Interval]Total3277600293010925334.3RootMSE=877.29AdjR-squared=0.9296Residual22319559.929769639.998R-squared=0.9319Model3054404691305440469ProbF=0.0000F(1,29)=396.86SourceSSdfMSNumberofobs=313Breusch-Pagan,Cook-Weisberg异方差检验命令:estathettest[varlist][,rhs[normal|iid|fstat]mtest[(spec)]]在一元线性回归中,设定varlist或rhs,或都不设定的结果是一样的。normal表示误差项独立正态分布,iid表示误差项独立同分布,计算卡方统计量,fstat表示误差项为独立同分布,计算F统计量,mtest表示同时进行上述各种检验。2020/2/9计量经济学软件应用33菜单:StatisticsPostestimationReportsandstatistics2020/2/9计量经济学软件应用34异方差检验:农村范例:estathettest2020/2/9计量经济学软件应用35Probchi2=0.0005chi2(1)=12.08Variables:fittedvaluesofrconsumHo:ConstantvarianceBreus

1 / 45
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功