2020/2/9计量经济学软件应用1Stata初级入门5——线性回归模型江金启沈阳农业大学经济管理学院2020/2/9计量经济学软件应用2一、计量回归前的知识回顾数据结构数据结构、数据类型和估计模型选择线性回归的OLS的基本假定基本假定引申的定理2020/2/9计量经济学软件应用31数据结构截面数据(Cross-SectionData):给定时点对个人、家庭等样本单位所采集的数据。时序数据(Time-SeriesData):某一或某几个变量在不同时点的观测值。混合截面数据(PooledCrossSectionData):不同时点的多个同单位截面样本混合得到。面板数据(亦称综列数据,PanelData/LongitudinalData):同一截面样本在不同时点的观测值。通常是对同一截面样本的持续跟踪调查得到。2020/2/9计量经济学软件应用42数据结构、类型及模型选择连续变量离散变量截面数据时序数据混合截面数据面板数据非分类变量分类变量线性模型截面模型时序模型离散选择模型分类变量模型计数模型面板或差分模型2020/2/9计量经济学软件应用53线性回归要满足的基本假定参数线性:Y=β0+β1x+μ随机抽样性:意味着cov(ui,uk)=0零条件均值(亦称严格外生性):E(u|x1,x2,x3,…)=0,意味着E(u)=0,cov(x,u)=0。计量回归的最关键假定。如果E(u|xi)=0,而E(u|xk)≠0,则xi为外生解释变量,xk为内生解释变量。违背零条件均值假定的情况:(1)模型形式误设,(2)遗漏重要解释变量;(3)解释变量的测量误差;(4)联立因果;(5)样本选择偏误。2020/2/9计量经济学软件应用6不存在完全或多重共线性:在总体中,自变量间不存在严格的线性关系。该假定不意味着自变量间无相关关系,而是要求它们间无高度相关或完全相关。引起完全共线性的情况:(1)一个自变量是另一个自变量的常数倍;(2)一个自变量恰好可以表达为其它两个或多个自变量的一个线性函数。如果此情况发生,自变量间就有多重共线性关系。*自变量的样本有变异:在样本中,自变量不为相同的常数。同方差性(亦称有效性):var(u|x1,x2,x3,….)=σ2。假定1-5统称为截面回归的高斯—马尔科夫假定。2020/2/9计量经济学软件应用74基本假定所引申出的四个定理无偏性OLS斜率估计量的抽样方差iiE)ˆ(2020/2/9计量经济学软件应用8无偏估计高斯-马尔科夫定理二、Stata计量模型估计概述模型估计模型预测参数检验对虚拟变量的处理变量的边际影响或弹性对模型估计结果的相关操作模型估计结果的提取2020/2/9计量经济学软件应用91模型估计的语法基本语法格式单方程模型估计的命令格式系统方程模型估计的命令格式估计选项常数项、offset、exposure、参数约束、置信度、标准差的计算方法、组内相关结构、一阶自相关系数的计算2020/2/9计量经济学软件应用101.1基本语法格式单方程模型commandvarlist[if][in][weight][,options]范例:regressdepvar[indepvars][if][in][weight][,options]——线性回归模型系统方程模型command(varlist)(varlist)[if][in][weight][,options]范例:sureg(depvar1varlist1)(depvar2varlist2)...(depvarNvarlistN)[if][in][weight]——似不相关回归模型varlist为模型的因、自变量,中间空格分开,其中第1个变量,软件自动识别为因变量,其余为自变量。2020/2/9计量经济学软件应用111.2估计选项设定(options)1.2.1常数项noconstant:模型没有常数项hascons:用户自己设定的常数项1.2.2offsetoffset(varname)表示约束模型中变量varname的系数为1。该选项多出现于离散选择模型、计数模型中。1.2.3exposureexposure(varname)表示约束模型中变量ln(varname)的系数为1。该选项多出现于计数模型中。2020/2/9计量经济学软件应用121.2.4参数约束constraints(numlist):通过constraint命令设定线性约束constraints(matname):通过矩阵设定线性约束constraints(clist):在个别命令中使用,如mlogit命令该选项多出现于离散选择模型、分类变量模型、计数模型中。1.2.5置信度level(#)设定置信区间,默认值为951.2.6组内相关结构corr(correlation)设定组内相关结构,该选项一般多在“面板数据”的广义方程估计中出现2020/2/9计量经济学软件应用131.2.7标准差的计算方法vce(vcetype)是stata中设定参数估计量协方差矩阵计算方法的最主要选项。vcetype的常见形式:oim:基于最大似然估计中的观测信息矩阵进行计算opg:基于最大似然估计中梯度向量进行估计robust:异方差稳健估计,又称Huber/White/Sandwich估计量clusterclustvar:组内相关稳健估计bootstrap:自举法jackknife:刀切法ols:用OLS残差计算协方差矩阵hackernel:异方差自相关一致标准差rgf:将稳健方差估计量乘以(N-1)/(N-P)2020/2/9计量经济学软件应用141.2.8一阶自相关系数的计算该选项不常使用,默认是dw法。rhotype(method):用于设定时序/面板数据模型中AR(1)系数的方法。method包括:dw:rho_dw=1-dw/2,其中dw是Durbin-Watson值regress:从残差回归方程et=rho_regress*et-1+vtfreg:从残差回归方程中et=rho_freg*et+1+vttscorr:rho=e‘et-1/e’e,其中e和et-1是残差和滞后一期残差。theil:rho=rho_tscorr*(N-k)/Nnagar:rho_nagar=(rho_dw*N2+k2)/(N2-k2)onestep:rho_onestep=(n/m_c)*rho_tscorr,其中n是样本单位总数,m_c是consecutivepairsofresiduals的数目2020/2/9计量经济学软件应用152模型预测2020/2/9计量经济学软件应用163参数检验2020/2/9计量经济学软件应用174对虚拟变量的处理2020/2/9计量经济学软件应用185变量的边际效应或弹性2020/2/9计量经济学软件应用196对模型估计的相关操作2020/2/9计量经济学软件应用207模型估计结果的提取2020/2/9计量经济学软件应用21三、一元线性回归命令:regressvarlist[if][in][weights][,options]菜单:StatisticsLinearmodelsandrelatedLinearregression常数项的设定2020/2/9计量经济学软件应用222020/2/9计量经济学软件应用23[if][in]的设定2020/2/9计量经济学软件应用24weights的设定2020/2/9计量经济学软件应用25标准差计算方法的设定2020/2/9计量经济学软件应用26结果报告的设定置信度标准化回归系数报告系数报告e系数不报告多重共线性变量2020/2/9计量经济学软件应用272020/2/9计量经济学软件应用28四、实例例:收入对消费的影响拟回答的问题:(1)当期收入对居民的消费支出究竟有怎样的影响?(2)边际消费倾向是多少?(3)农村和城镇的边际消费倾向差异?理论:凯恩斯的绝对收入假说变量:当期收入和消费支出模型:Y=𝑥𝛽+𝑢,Y是消费支出,x是当期收入,u是随机扰动项打开数据文件:useC:\Users\jjq\Desktop\计量经济学软件应用讲稿\ch5OLS.dta,clear2020/2/9计量经济学软件应用291消费支出和收入散点图:农村2020/2/9计量经济学软件应用30命令:twoway(scatterrconsumrneti,sort)(lfitrconsumrneti),ytitle(农村人均消费支出)xtitle(农村居民人均纯收入)title(收入与消费支出关系:农村)note(数据来源:中国统计年鉴2011年)200040006000800010000农村人均消费支出400060008000100001200014000农村居民人均纯收入农村居民消费支出Fittedvalues数据来源:中国统计年鉴2011年收入与消费支出关系:农村2回归结果:农村命令:regressrconsumrneti2020/2/9计量经济学软件应用31_cons482.8383265.2681.820.079-59.695741025.372rneti.6478134.038718316.730.000.5686257.7270012rconsumCoef.Std.Err.tP|t|[95%Conf.Interval]Total99229442.4303307648.08RootMSE=566.74AdjR-squared=0.9029Residual9314546.2729321191.251R-squared=0.9061Model89914896.1189914896.1ProbF=0.0000F(1,29)=279.94SourceSSdfMSNumberofobs=31TSS=ESS+RSS样本数,F统计值、R2回归系数标准误t统计量p值,用于判断变量是否影响显著2回归结果:城镇命令:regressuconsumpdi2020/2/9计量经济学软件应用32_cons704.8237625.69411.130.269-574.86451984.512pdi.6676549.033514519.920.000.5991101.7361998uconsumCoef.Std.Err.tP|t|[95%Conf.Interval]Total3277600293010925334.3RootMSE=877.29AdjR-squared=0.9296Residual22319559.929769639.998R-squared=0.9319Model3054404691305440469ProbF=0.0000F(1,29)=396.86SourceSSdfMSNumberofobs=313Breusch-Pagan,Cook-Weisberg异方差检验命令:estathettest[varlist][,rhs[normal|iid|fstat]mtest[(spec)]]在一元线性回归中,设定varlist或rhs,或都不设定的结果是一样的。normal表示误差项独立正态分布,iid表示误差项独立同分布,计算卡方统计量,fstat表示误差项为独立同分布,计算F统计量,mtest表示同时进行上述各种检验。2020/2/9计量经济学软件应用33菜单:StatisticsPostestimationReportsandstatistics2020/2/9计量经济学软件应用34异方差检验:农村范例:estathettest2020/2/9计量经济学软件应用35Probchi2=0.0005chi2(1)=12.08Variables:fittedvaluesofrconsumHo:ConstantvarianceBreus