当前位置:首页 > 商业/管理/HR > 质量控制/管理 > chap06 stata基本回归分析解析
主要内容1.小样本的OLS估计与分析2.大样本的OLS估计与分析3.约束回归4.非线性最小二乘分析实验6-1:小样本普通最小二乘分析一、实验基本原理二、实验内容和实验数据根据统计资料得到了美国汽车产业的横截面数据(1978年),变量主要包括:price=汽车的价格,mpg=每加仑油所行驶的英里数,weight=汽车的重量,foreign表示是否是进口车,如果foreign=0代表是国产车,如果foreign=1代表是进口车。完整的数据在本书附带光盘的data文件夹的“usaauto.dta”工作文件中。利用usaauto数据,对汽车价格的影响因素进行计量分析,分析mpg、weight和foreign对价格的边际影响,包括进行OLS的估计、检验、预测和绘制图形等相关内容。三、实验操作指导1打开数据文件、观测数据特征(1)若要进行各种对原始数据的操作,首先必须正确地打开数据文件,在Stata中打开数据文件的方法有多种,其中较为常用的方法是通过命令直接打开或是使用菜单操作打开。我们在此使用命令方式,在命令窗口中输入如下命令:sysuseusaauto,clear(2)在进行回归分析之前,可以先关注一下原始数据及其统计特征。在命令窗口中输入如下命令:edit如果想得到数据的统计特征,则需要在命令窗口中输入如下命令:describe2利用最小二乘法进行模型的估计对模型进行回归的仍然是采用命令方式进行操作,命令的基本格式如下:regressdepvar[indepvar][if][in][weight][,options]其中regress代表“回归”的基本命令语句,depvar代表被解释变量(或称因变量)的名称,indepvar代表解释变量(或称自变量)的名称,if代表条件语句,in代表范围语句,weight代表权重语句,options代表其他选项。表6.1的内容显示了options所代表的其他选项的具体内容,主要包括选项的命令语句及其所代表的含义。要想得到OLS的回归结果,只需本实验的模型在命令窗口中输入如下命令:regresspricempgweightforeign这个命令就表示以price作为因变量,mpg、weight、foreign作为自变量建立线性回归模型,运用OLS方法进行回归分析。3模型的检验基本回归分析之后,还要对模型的整体和系数进行检验,以求证其是否符合经济理论或现实情况的要求。用户可以发现刚才的回归结果中已经给出了最基本的F检验和t检验的结果,下面将介绍其他检验的相关命令,这些检验均为Wald检验。(1)线性检验命令的基本格式如下:test(spec)[(spec)…][,test_options]在这个命令中,test是线性检验的命令语句,而(spec)则表示线性检验的形式,主要包括以下五种:第一种检验所设定的系数都为0,命令形式如下:testcoeflist第二种检验所设定的系数表达式都为0,命令形式如下:testexp=exp[=…]第三种检验方程eqno中的变量varlist的系数都为0,命令形式如下:test[eqno][:varlist]第四种检验不同方程中变量varlist的系数相同,命令形式如下:test[eqno=eqno[=…]][:varlist]第五种检验方程eqno中的变量varlist系数相同,命令形式如下:testparmvarlist[,equalequation(eqno)](2)如果检验为非线性检验,则需要将命令的基本格式调整如下即可:testnlexp=exp[=exp...][,options]这个命令中,testnl是非线性检验的命令语句,而exp=exp[=exp...]表示系数之间的非线性关系式。在本实验中,如检验“weight”“foreign”的系数是否同时显著不为零,则需要输入如下命令:testweightforeign(也可以输入test(weight=0)(foreign=0)这个命令,效果相同。)4模型的预测经济计量模型设定的最终目的是使其能够对社会经济生活有一定的预测功能,所以一个模型在估计和检验之后,就可以用其进行预测了,下面将着重介绍线性预测的主要内容。线性预测的基本命令格式如下:predict[type]newvar[if][in][,options]在这里,predict是预测的基本命令语句,newvar代表将要进行预测的变量,if代表条件语句,in代表范围语句,options代表其他选项,在预测中起重要作用,表6.2显示了预测命令中options的命令语句和含义。利用本实验的数据,预测因变量和残差“price”和“e”值的具体操作步骤如下:若要得到“price”的预测值,需要输入如下命令:predictyhat,xb这个命令就表示对因变量price进行线性预测,生成的变量名称为yhat。若要得到残差序列的预测值,则需要输入如下命令:predicte,residual这个命令就表示对残差值进行预测,生成的变量名称为e。5基本回归图形的绘制在回归分析中,图形是十分重要的一种分析工具,其不仅具有直观的视觉优势,且能包含巨大的信息量。鉴于图形的画法本书前面章节已经介绍,这里不再赘述,且多元线性回归大部分为超平面图形,所以不宜用散点图和回归线表示,所以这里仅仅介绍简单的残差图形的画法。残差对预测值标绘图提供了较为有用的诊断工具,在回归分析之后,我们就可以画出如图6.6所示的残差对预测值的标绘图了。这种图形的得到只需要在命令窗口中输入如下命令语句:rvfplot,yline(0)在这个命令中,rvfplot表示自动生成残差e和因变量预测值yhat的散点图,并标识出纵轴值为零的直线。当然,图6.6也可以通过更为基本的graph命令得到,命令如下:graphtwowayscattereyhat,yline(0)这个命令的还以就是画一个两轴的散点图,一个轴是残差预测值e,一个轴是因变量预测值yhat,同时还要标出纵轴值为零的直线。实验6-2:大样本普通最小二乘分析一、实验基本原理二、实验内容和实验数据为了检验美国电力行业是否存在规模经济,Nerlove(1963)收集了1955年145家美国电力企业的总成本(tc)、产量(q)、工资率(pl)、燃料价格(pf)及资本租赁价格(pk)的数据。变量名前面加ln表示取自然对数以后的数值。完整的数据在本书附带光盘的data文件夹的“nerlove.dta”工作文件中。利用nerlove的数据,我们分别用大样本理论和小样本理论进行回归分析,以比较二者的不同,从而使用户更加深刻地理解这两个理论。三、实验操作指导1模型的建立2使用小样本理论进行回归首先,我们假设数据符合小样本理论严格的假设,所以可以直接运用小样本理论进行回归。使用use命令打开数据后,在命令窗口中输入回归命令如下:regresslntclnqlnpllnpklnpf这个命令的含义就是以lntc作为因变量,以lnq、lnpl、lnpk、lnpf作为自变量建立线性回归模型。之后,我们就可以得到如图6.7所示的小样本理论下的回归结果了。3使用大样本理论进行回归大样本OLS经常采用稳健标准差估计(robust)。稳健标准差是指其标准差对于模型中可能存在的异方差或自相关问题不敏感,基于稳健标准差计算的稳健t统计量仍然渐进分布t分布。因此,在Stata中利用robust选项可以得到异方差稳健估计量。在本实验中,利用稳健标准差进行估计的命令如下:regresslntclnqlnpllnpklnpf,robust这个命令表示是以lntc作为因变量,以lnq、lnpl、lnpk、lnpf作为自变量建立线性回归模型。命令最后的robust命令代表使用大样本稳健标准差进行各种预测和检验。之后,我们就可以得到如图6.8所示的大样本理论下的回归结果了。4大、小样本理论结果对比从这两个结果可以看到:稳健标准差与普通标准差的估计的系数相同,但标准差和t值存在着较大的差别,尤其是lnq的标准差。在现实社会的各种数据中,很少有数据能够满足小样本理论的严格假设,所以当样本数据足够大时,我们最好采用稳健标准差进行估计和检验,这样得到的结果将会更加准确。实验6-3:约束回归一、实验基本原理二、实验内容和实验数据本实验中,我们将利用与实验6-1相同的数据,即本书附带光盘data文件夹下的“usaauto.dta”文件中的数据,来研究回归系数存在约束的情况下,价格、汽车重量等因素对每加仑汽油所行驶的路程的影响。我们将介绍如何定义约束、列出已定义的约束、取消已定义的约束、以及在定义好约束后如何进行约束回归。三、实验操作指导1约束的定义、列出和取消(1)要进行约束回归,首先应对约束进行定义。其语法格式如下:constraint[define]n约束条件其中,constraintdefine代表“定义约束”的基本命令语句;define可以省略。n必须是位于[1,1999]的整数,用于表明这是第几个约束。(2)要显示已定义的约束,可以使用如下的语句:constraintdir[numlist|_all]或者constraintlist[numlist|_all]其中,constraintdir或constraintlist代表“显示约束”的基本命令语句,numlist指明要显示的约束,_all表示显示所有约束。当我们不指定要显示的约束为哪几个时,默认显示所有的约束条件。例如,我们想看到所有已定义的约束,输入命令:constraintdir(3)要删掉某个或几个已定义的约束,则可使用以下语句:constraintdrop[numlist|_all]2进行约束回归定义完约束之后,就可以进行约束回归了。约束回归的基本语法格式如下:cnsregdepvarindepvars[if][in][weight],constraints(constraints)options其中,cnsreg代表“约束回归”的基本命令语句,constraints可简写为c。depvar代表被解释变量的名称,indepvar代表解释变量的名称,if代表条件语句,in代表范围语句,weight代表权重语句,options代表其他选项。options中,我们可以使用异方差稳健标准差(r)或汇报其他水平的置信区间等,详见表6.3。下面,让我们通过例子来加深对命令的理解。拟合前面的约束回归:cnsregmpgpriceweightdisplgear_ratioforeignlength,c(1-5)命令中,cnreg代表进行约束回归,mpg是被解释变量的名称,priceweightdisplgear_ratioforeignlength为各个解释变量的名称,选项c(1-5)表示在1到5个约束之下进行回归。实验6-4:非线性最小二乘一、实验基本原理二、实验内容和实验数据使用本书附带光盘的data文件夹的“profunc.dta”工作文件,我们研究劳动投入和资本投入对产量的影响,即进行一个生产函数的回归。变量包括产出的对数(lnoutput)、劳动(labor)和资本(capital)。三、实验操作指导1利用非线性最小二乘法进行模型的估计NLS回归的命令格式为:nl(depvar=sexp)[if][in][weight],options其中,depvar代表被解释变量的名称,sexp代表可替代表达式(substitutableexpression),if代表条件语句,in代表范围语句,weight代表权重语句,options代表其他选项。其中,可替代表达式与普通的数学表达式基本一致,但要求将参数用大括号括起来。此外,在可替代表达式中,参数都可以被赋予初值,格式是:{参数=初始值}。当不赋予初值时,系统默认使用
本文标题:chap06 stata基本回归分析解析
链接地址:https://www.777doc.com/doc-3393071 .html