1第三章基本回归模型经济计量研究始于经济学中的理论假设,根据经济理论设定变量间的一组关系,如消费理论、生产理论和各种宏观经济理论,对理论设定的关系进行定量刻画,如消费函数中的边际消费倾向、生产函数中的各种弹性等进行实证研究。单方程回归是最丰富多彩和广泛使用的统计技术之一。本章介绍EViews中基本回归技术的使用,说明并估计一个回归模型,进行简单的特征分析并在深入的分析中使用估计结果。随后的章节讨论了检验和预测,以及更高级,专业的技术,如加权最小二乘法、二阶段最小二乘法(TSLS)、非线性最小二乘法、ARIMA/ARIMAX模型、GMM(广义矩估计)、GARCH模型和定性的有限因变量模型。这些技术和模型都建立在本章介绍的基本思想的基础之上。2对于本章及随后章节所讨论的技术,可以使用下列的经济计量学教科书作为参考。下面列出了标准教科书(逐渐变难):(1)Pindyck,Rubinfeld(1991),EconometricModelsandEconomicForecasts,《经济计量模型和经济预测》,第三版。(2)Johnston和DiNardo(1997),EconomtricMethods,《经济计量方法》,第四版。(3)Greene(1997),EconomtricAnalysis,《经济计量分析》,第三版。(4)Davidson和MacKinon(1993),EstimationandInferenceinEconometrics,《经济计量学中的估计和推断》。在适当的地方,对于特定的专题,我们也会提供专门的参考书。3§3.1创建方程对象EViews中的单方程回归估计是用方程对象来完成的。为了创建一个方程对象:从主菜单选择Object/NewObject/Equation或Quick/EstimationEquation…,或者在命令窗口中输入关键词equation。在随后出现的方程说明对话框中说明要建立的方程,并选择估计方法。4§3.2在EViews中对方程进行说明当创建一个方程对象时,会出现如下对话框:在这个对话框中需要说明三件事:方程说明,估计方法,估计使用的样本。在最上面的编辑框中,可以说明方程:因变量(左边)和自变量(右边)以及函数形式。有两种说明方程的基本方法:列表法和公式法。列表法简单但是只能用于不严格的线性说明;公式法更为一般,可用于说明非线性模型或带有参数约束的模型。5§3.2.1列表法说明线性方程的最简单的方法是列出方程中要使用的变量列表。首先是因变量或表达式名,然后是自变量列表。例如,要说明一个线性消费函数,用一个常数c和收入inc对消费cs作回归,在方程说明对话框上部输入:cscinc注意回归变量列表中的序列c。这是EViews用来说明回归中的常数而建立的序列。EViews在回归中不会自动包括一个常数,因此必须明确列出作为回归变量的常数。内部序列c不出现在工作文档中,除了说明方程外不能使用它。在上例中,常数存储于c(1),inc的系数存储于c(2),即回归方程形式为:cs=c(1)+c(2)*inc。6在统计操作中会用到滞后序列,可以使用与滞后序列相同的名字来产生一个新序列,把滞后值放在序列名后的括号中。csccs(-1)inc相当的回归方程形式为:cs=c(1)+c(2)cs(-1)+c(3)inc。通过在滞后中使用关键词to可以包括一个连续范围的滞后序列。例如:csccs(-1to-4)inc这里cs关于常数,cs(-1),cs(-2),cs(-3),cs(-4),和inc的回归。在变量列表中也可以包括自动序列。例如:log(cs)clog(cs(-1))log((inc+inc(-1))/2)相当的回归方程形式为:log(cs)=c(1)+c(2)log(cs(-1))+c(3)log((inc+inc(-1))/2)7§3.2.2公式法说明方程当列表方法满足不了要求时,可以用公式来说明方程。许多估计方法(但不是所有的方法)允许使用公式来说明方程。EViews中的公式是一个包括回归变量和系数的数学表达式。要用公式说明一个方程,只需在对话框中变量列表处输入表达式即可。EViews会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中的参数。8用公式说明方程的好处是可以使用不同的系数向量。要创建新的系数向量,选择Object/NewObject…并从主菜单中选择Matrix-Vector-Coef,为系数向量输入一个名字。然后,选择OK。在NewMatrix对话框中,选择CoefficientVector并说明向量中应有多少行。带有系数向量图标的对象会列在工作文档目录中,在方程说明中就可以使用这个系数向量。例如,假设创造了系数向量a和beta,各有一行。则可以用新的系数向量代替c:log(cs)=a(1)+beta(1)*log(cs(-1))9§3.3在EViews中估计方程说明方程后,现在需要选择估计方法。单击Method:进入对话框,会看到下拉菜单中的估计方法列表:标准的单方程回归用最小二乘估计。其他的方法在以后的章节中介绍。采用OLS,TSLS,GMM,和ARCH方法估计的方程可以用一个公式说明。非线性方程不允许使用binary,ordered,censored,count模型,或带有ARMA项的方程。10§3.4方程输出在方程说明对话框中单击OK钮后,EViews显示估计结果:根据矩阵的概念,标准的回归可以写为:其中:y是因变量观测值的T维向量,X是解释变量观测值的Tk维矩阵,T是观测值个数,k是解释变量个数,是k维系数向量,u是T维扰动项向量。uXβy11§3.4.1系数结果1.回归系数(Coefficient)系数框描述了系数的估计值。最小二乘估计的系数b是由以下的公式计算得到的如果使用列表法说明方程,系数会列在变量栏中相应的自变量名下;如果是使用公式法来说明方程,EViews会列出实际系数c(1),c(2),c(3)等等。对于所考虑的简单线性模型,系数是在其他变量保持不变的情况下自变量对因变量的边际收益。系数c是回归中的常数或者截距---它是当其他所有自变量都为零时预测的基本水平。其他系数可以理解为假设所有其它变量都不变,相应的自变量和因变量之间的斜率关系。yXXXb1)(12例3.1:本例是用中国1978年〜2002年的数据建立的城镇消费方程:cst=c0+c1inct+ut其中:cs是城镇居民消费;inc是可支配收入。方程中c0代表自发消费,表示收入等于零时的消费水平;而c1代表了边际消费倾向,0c11,即收入每增加1元,消费将增加c1元。从系数中可以看出边际消费倾向是0.514。也即1978年~2002年中国城镇居民可支配收入的51.4%用来消费。132.标准差(Std.Error)标准差项报告了系数估计的标准差。标准差衡量了系数估计的统计可信性----标准差越大,估计中的统计干扰越大。估计系数的协方差矩阵是由以下公式计算得到的:这里是残差。而且系数估计值的标准差是这个矩阵对角线元素的平方根。可以通过选择View/CovarianceMatrix项来察看整个协方差矩阵。其中)1/(ˆˆˆ2kTuuXbyuˆuˆ12)(ˆ)cov(XXb143.t-统计量t统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系数为零的假设的。4.概率(P值)结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下,指出t统计量与实际观测值一致的概率。这个概率称为边际显著性水平或P值。给定一个P值,可以一眼就看出是拒绝还是接受实际系数为零的双边假设。例如,如果显著水平为5%,P值小于0.05就可以拒绝系数为零的原假设。对于例1的结果,系数inc的零假设在1%的显著水平下被拒绝。15§3.4.2方程统计量1.R2统计量R2统计量衡量在样本内预测因变量值的回归是否成功。R2是自变量所解释的因变量的方差。如果回归完全符合,统计值会等于1。如果结果不比因变量的均值好,统计值会等于0。R2可能会由于一些原因成为负值。例如,回归没有截距或常数,或回归包含系数约束,或估计方法采用二阶段最小二乘法或ARCH方法。EViews计算R2的公式为:,其中,是残差,是因变量的均值。y)()(ˆˆ12yyyyuuRXbyuˆuˆ162.R2调整3.回归标准差(S.E.ofregression)kTTRR11122)/(ˆˆkTuus4.残差平方和TtttbXyuu12)(ˆˆ5.对数似然函数值))/ˆˆlog(π)2log(1(2TuuTl176.Durbin-Watson统计量uuˆˆTtttTttuuuDW12212ˆ)ˆˆ(7.因变量均值和标准差(S.D)TyyTii1112TyysTtiy8.AIC准则(AkaikeInformationCriterion)TkTlAIC22其中l是对数似然值))/ˆˆlog(π)2log(1(2TuuTl9.Schwarz准则TTkTlSClog21810.F统计量和边际显著性水平F统计量检验回归中所有的系数是否为零(除了常数或截距)。对于普通最小二乘模型,F统计量由下式计算:kTRkRF2211在原假设为误差正态分布下,统计量服从F(k–1,T–k)分布。F统计量下的P值,是F检验的边际显著性水平。如果P值小于所检验的边际显著水平,则拒绝所有系数都为零的原假设。注意F检验是一个联合检验,即使所有的t统计量都是不显著的,F统计量也可能是高度显著的。19§3.5方程操作3.5.1方程视图以三种形式显示方程:EViews命令形式,带系数符号的代数方程,和有系数估计值的方程。可以将这些结果剪切和粘贴到支持Windows剪贴板的应用文档中。20·EstimationOutput显示方程结果。·Actual,Fitted,Residual以图表和数字的形式显示因变量的实际值和拟合值及残差。·Actual,Fitted,ResidualTable以表的形式来显示这些值。21·GradientsandDerivatives...描述目标函数的梯度和回归函数的导数计算的信息。详细内容参见附录E,“梯度和导数”。·CovarianceMatrix以表的形式显示系数估计值的协方差矩阵。要以矩阵对象保存协方差矩阵,可以使用@cov函数。·CoefficientTests,ResidualTests,andStabilityTests这些是“定义和诊断检验”中要详细介绍的内容。223.5.2方程过程·Specify/Estimate...编辑方程说明、改变估计方法、估计样本。·Forecast...用估计方程的预测。·MakeModle创建一个与被估计方程有关的未命名模型。·UpdateCoefsfromEquation把方程系数的估计值放在系数向量中。·MakeRegressorGroup创建包含方程中使用的所有变量的未命名组(常数除外)。·MadeResidualSeries...以序列形式保存回归中的残差。·MakeDerivativeGroup创建包含回归函数关于其系数的导数的组。·MadeGradientGroup创建包含目标函数关于模型的系数的斜率的组。231.回归方程的函数形式下面讨论几种形式的回归模型:(1)双对数线性模型(不变弹性模型)(2)半对数模型(3)双曲函数模型(4)多项式回归模型所有这些模型的一个重要特征是:它们都是参数线性模型,但是变量却不一定是线性的。(1)双对数线性方程双对数线性模型估计得到的参数本身就是该变量的弹性。§3.6线性回归方程的应用实例例3.3:下面建立我国居民消费的收入弹性方程:log(cst)=0.18+0.917log(inct)t=(1.01)(45.72)R2=0.989D.W.=0.447其中cst是城镇居民消