计量经济软件应用——Stata软件实验之一元、多元回归分析内容概要一、实验目的二、简单回归分析的Stata基本命令三、简单回归分析的Stata软件操作实例四、多元回归分析的Stata基本命令五、多元回归分析的Stata软件操作实例一、实验目的:掌握运用Stata软件进行简单回归分析以及多元回归分析的操作方法和步骤,并能看懂Stata软件运行结果。二、简单回归分析的Stata基本命令简单线性回归模型(simplelinearregressionmodel)指只有一个解释变量的回归模型。如:其中,y为被解释变量,x为解释变量,u为随机误差项,表示除x之外影响y的因素;称为斜率参数或斜率系数,称为截距参数或截距系数,也称为截距项或常数项。简单线性回归模型的一种特殊情况:即假定截距系数时,该模型被称为过原点回归;过原点回归在实际中有一定的应用,但除非有非常明确的理论分析表明,否则不宜轻易使用过原点回归模型。01yxu101yxu0000二、简单回归分析的Stata基本命令regressyx以y为被解释变量,x为解释变量进行普通最小二乘(OLS)回归。regress命令可简写为横线上方的三个字母reg。regressyx,noconstanty对x的回归,不包含截距项(constant),即过原点回归。predictz根据最近的回归生成一个新变量z,其值等于每一个观测的拟合值(即)。predictu,residual根据最近的回归生成一个新变量u,其值等于每一个观测的残差(即)。ˆiyˆiiieyy三、简单回归分析的Stata软件操作实例实验1简单回归分析:教育对工资的影响劳动经济学中经常讨论的一个问题是劳动者工资的决定。不难想象,决定工资的因素有很多,例如能力、性别、工作经验、教育水平、行业、职业等。在这里仅考虑其中一种因素:教育水平,建立如下计量模型:其中,wage为被解释变量,表示小时工资,单位为元;edu为解释变量,表示受教育年限,即个人接受教育的年数,单位为年;u为随机误差项。假定模型(3.1)满足简单回归模型的全部5条基本假定,这样的OLS估计量将是最佳线性无偏估计量。请根据表S-2中给出的数据采用Stata软件完成上述模型的估计等工作。01,,,,,,,,,,,,,,,,,,(,,,,,,,3.1)wageeduu01,01ˆˆ,三、简单回归分析的Stata软件操作实例1、打开数据文件。直接双击“工资方程1.dta”文件;或者点击Stata窗口工具栏最左侧的Open键,然后选择“工资方程1.dta”即可;或者先复制Excel表S-2中的数据,再点击Stata窗口工具栏右起第4个DataEditor键,将数据粘贴到打开的数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左起第二个Save键保存数据,保存时需要给数据文件命名。2、给出数据的简要描述。使用describe命令,简写为:des得到以下运行结果;三、简单回归分析的Stata软件操作实例结果显示“工资方程1.dta”数据文件包含1225个样本和11个变量;11个变量的定义及说明见第3列。morewagefloat%9.0ghourlywagemigrantfloat%9.0g1:migrantworker;0:localworkerhealthfloat%9.0g1:bad;2:good;3:verygoodexpsqfloat%9.0gexp^2age-edu-6expfloat%9.0gyearsofworkexperience:edufloat%9.0gyearsofeducation4:collegeedulevelfloat%9.0g1:primary;2:junior;3:senior;marriedfloat%9.0g1:married;0:unmarriedfemalefloat%9.0g1:female;0:maleagefloat%9.0gageinyearsvariablenametypeformatlabelvariablelabelstoragedisplayvaluesize:58,800(99.4%ofmemoryfree)vars:1125Aug200908:38obs:1,225ÿμþ¡¿\10649289\stata10\¹¤×Ê·½³Ì1.dtaContainsdatafromD:\½²¿Î×ÊÁÏ\ÖÜÝíµÄÉÏ¿Î×ÊÁÏ\Êý¾Ý\¡¾ÖØÒª¡¿\¡¾¼ÆÁ¿¾¼ÃѧÈí¼þÓ¦Ó三、简单回归分析的Stata软件操作实例3、变量的描述性统计分析。对于定量变量,使用summarize命令:suageeduexpexpsqwagelnwage,得到以下运行结果,保存该运行结果;第1列:变量名;第2列:观测数;第3列:均值;第4列:标准差;第5列:最小值;第6列:最大值。lnwage12251.808352.5307399.22314353.624341wage12257.12554.7668281.2537.5expsq1225613.9776548.307202500exp122521.804911.77443050edu12258.9926532.719068019age122536.7975510.676311660VariableObsMeanStd.Dev.MinMax三、简单回归分析的Stata软件操作实例4、wage对edu的OLS回归。使用regress命令:regwageedu,得到以下运行结果,保存该运行结果;(1)表下方区域为基本的回归结果。第1列依次为被解释变量wage,解释变量edu,截距项constant;第2列回归系数的OLS估计值;第3列回归系数的标准误;第4列回归系数的t统计量值;写出样本回归方程为:即如果受教育年限增加1年,平均来说小时工资会增加0.39元。_cons3.584695.45890887.810.0002.6843594.485031edu.3937442.04884918.060.000.2979069.4895815wageCoef.Std.Err.tP|t|[95%Conf.Interval]Total27812.5191122422.7226463RootMSE=4.6469AdjR-squared=0.0497Residual26409.5445122321.5940675R-squared=0.0504Model1402.9746111402.97461ProbF=0.0000F(1,1223)=64.97SourceSSdfMSNumberofobs=1225ˆ3.58470.3937(0.4589)(0.0488)wageedu三、简单回归分析的Stata软件操作实例(2)表左上方区域为方差分析表。第2列从上到下依次为回归平方和(SSE)、残差平方和(SSR)和总离差平方和(SST);第3列为自由度,分别为k=1,n-k-1=1225-1-1=1223,n-1=1225-1=1224;第4列为均方和(MSS),由各项平方和除以相应的自由度得到。(3)表右上方区域给出了样本数(Numberofobs)、判定系数(R-squared)、调整的判定系数(AdjR-squared)、F统计量的值、回归方程标准误或均方根误(RootMSE,或S.E.)以及其他一些统计量的信息。上述回归分析的菜单操作实现:Statistics→Linearmodelsandrelated→Linearregression→弹出对话框,在DependentVariable选项框中选择或键入wage,在IndependentVariables选项框中选择或键入edu→点击OK即可_cons3.584695.45890887.810.0002.6843594.485031edu.3937442.04884918.060.000.2979069.4895815wageCoef.Std.Err.tP|t|[95%Conf.Interval]Total27812.5191122422.7226463RootMSE=4.6469AdjR-squared=0.0497Residual26409.5445122321.5940675R-squared=0.0504Model1402.9746111402.97461ProbF=0.0000F(1,1223)=64.97SourceSSdfMSNumberofobs=1225ˆ三、简单回归分析的Stata软件操作实例5、生成新变量z为上一个回归的拟合值,生成新变量u为上一个回归的残差;然后根据u对数据进行从小到大的排序,并列出u最小的5个观测。命令如下:predictz(生成拟合值)predictu,residual(生成残差)sortu(根据u对数据从小到大排序)listwagezuin1/5(列出u最小的5个观测值以及对应的实际样本观测值和拟合值)即对于观测1,小时工资的实际观测值(wage)为2.46,拟合值(z)为9.10,残差(u)为-6.64。5.1.2597.128393-5.8783934.2.380952128.309626-5.9286733.3149.097115-6.0971142.1.785714117.915882-6.1301671.2.455357149.097115-6.641757wageeduzu三、简单回归分析的Stata软件操作实例6、画出以wage为纵轴,以edu为横轴的散点图,并加入样本回归线。命令如下:graphtwowaylfitwageedu||scatterwageedu得到以下运行结果,保存该运行结果;01020304005101520yearsofeducationFittedvalueshourlywage三、简单回归分析的Stata软件操作实例7、wage对edu的OLS回归,只使用年龄小于或等于30岁的样本。命令如下:regwageeduifage=30得到以下运行结果,保存该运行结果;写出样本回归方程为:对于年龄在30岁及以下的劳动者,增加1年受教育年限使得工资会增加0.41元,略高于针对全体样本的估计值。_cons2.760707.96879862.850.005.85554474.66587edu.4145793.09322864.450.000.2312433.5979153wageCoef.Std.Err.tP|t|[95%Conf.Interval]Total7156.3437836419.6602851RootMSE=4.3239AdjR-squared=0.0490Residual6786.6309536318.695953R-squared=0.0517Model369.7128271369.712827ProbF=0.0000F(1,363)=19.78SourceSSdfMSNumberofobs=365ˆ2.76070.4146(0.9688)(0.0932)wageedu三、简单回归分析的Stata软件操作实例8、wage对edu的OLS回归,不包含截距项,即过原点回归。命令如下:regwageedu,noconstant得到以下运行结果,保存该运行结果;edu.7590026.014475252.430.000.7306037.7874016wageCoef.Std.Err.tP|t|[95%Conf.Interval]Total90009.1429122573.4768514RootMSE=4.7595AdjR-squared=0.6917Residual27727.1519122422.6529019R-squared=0.6920Model62281.9911162281.9911ProbF=0.0000F(1,1224)=2749.40Sour