1计量软件实验:EViews软件应用基本回归模型2第二章基本回归模型本章介绍EViews中基本回归技术的使用,说明并估计一个回归模型,并对回归结果进行简单分析和说明。3§2.1方程对象EViews中的单方程回归估计是用方程对象来完成的。为了创建一个方程对象:从主菜单选择Object/NewObject/Equation或Quick/EstimationEquation…,或者在命令窗口中输入关键词equation。在随后出现的方程说明对话框中说明要建立的方程,并选择估计方法。下面我们详细介绍在EViews中如何说明方程。EViews将在方程窗口中估计方程并显示结果。估计结果会作为方程对象的一部分存储起来以便随时提取。这样我们只需打开方程对象来显示简要结果,或者利用EViews工具来处理方程对象的结果。4§2.2在EViews中对方程进行说明当创建一个方程对象时,会出现如下对话框:在这个对话框中需要说明三件事:方程说明,估计方法,和该估计使用的样本。在最上面的编辑框中,可以说明方程:因变量(左边)和自变量(右边)以及函数形式。有两种说明方程的基本方法:列表法和公式法。列表法简单但是只能用于不严格的线性说明;公式法更为一般,可用于说明非线性模型或带有参数约束的模型。5§2.2.1列表法线性方程编辑最简单的方法是列出方程中要使用的变量。首先是因变量或表达式名,然后是自变量列表。例如,要说明一个线性消费函数CS,用一个常数和inc对其作回归,在方程说明对话框上部输入:cscinc注意回归变量列表中的序列c。这是EViews用来说明回归中的常数而建立的序列。EViews在回归中不会自动包括一个常数,因此必须明确列出作为回归变量的常数。内部序列c不出现在工作文档中,除了说明方程外不能使用它。注意到在工作文档中有一个预先定义的对象C。这是缺省系数向量——当通过列出变量名的方式说明方程时,EViews会根据变量在列表中出现的顺序在这个向量中存储估计系数。在上例中,常数存储于c(1),inc的系数存储于c(2),即回归方程形式为:cs=c(1)+c(2)*inc。6在统计操作中会用到滞后序列,可以使用与滞后序列相同的名字来产生一个新序列,把滞后值放在序列名后的括号中。例如:cscs(-1)cinc该语句命令EViews使用cs的滞后值、常数和inc对cs作回归。cs滞后的系数将存放在c(1)中,常数系数在c(2)中,inc的系数在c(3)中,即回归方程形式为:cs=c(1)*cs(-1)+c(2)+c(3)*inc。通过在滞后中使用关键词to可以包括一个连续范围的滞后序列。例如:csccs(-1to-4)inc这里cs关于常数,cs(-1),cs(-2),cs(-3),cs(-4),和inc的回归。7如果写成:cscinc(to–2)inc(-4)表示cs关于常数,inc,inc(-1),inc(-2),和inc(-4)的回归,即回归方程形式为:cs=c(1)+c(2)*inc+c(3)*inc(-1)+c(4)*inc(-2)+c(5)*inc(-4)在变量列表中也可以包括自回归序列。例如:log(cs)clog(cs(-1))((inc+inc(-1))/2)说明了cs的自然对数关于常数,其滞后值和inc的两项移动平均的回归,即回归方程形式为:log(cs)=c(1)+c(2)*log(cs(-1))+c(3)*log((inc+inc(-1))/2)8§2.2.2公式法说明方程当列表方法满足不了要求时,可以用公式来说明方程。许多估计方法(但不是所有的方法)允许使用公式来说明方程。EViews中的公式是一个包括回归变量和系数的数学表达式。要用公式说明一个方程,只需在对话框中变量列表处输入表达式即可。EViews会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中的参数。9用列表说明方程时,EViews会将其转换成等价的公式形式。例如,下面的列表:log(cs)clog(cs(-1))log(inc)EViews会理解为,log(cs)=c(1)+c(2)*log(cs(-1))+c(3)*log(inc)这种形式并不是必须的,=符号可以出现在公式的任何地方,如:log(urate)+c(1)*dmr=c(2)这个方程的残差为:ε=log(urate)+c(1)dmr-c(2)EViews将最小化残差平方和。10估计严格的非线性的方程或带有参数约束的方程必须用公式法说明。例如,假如要约束变量x,使x及其滞后变量的系数和为1。可以采用带参数约束的线性模型:y=c(1)+c(2)*x+c(3)*x(-1)+c(4)*x(-2)+(1-c(2)-c(3)-c(4))*x(-3)估计一个非线性模型,只需输入非线性公式。EViews会自动检测非线性并用非线性最小二乘估计模型。用公式说明方程的好处是可以使用不同的系数向量。要创建新的系数向量,选择Object/NewObject…并从主菜单中选择Matrix-Vector-Coef,为系数向量输入一个名字。然后,选择OK。在NewMatrix对话框中,选择CoefficientVector并说明向量中应有多少行。带有系数向量图标β的对象会列在工作文档目录中,在方程说明中就可以使用这个系数向量。例如,假设创造了系数向量A和BETA,各有一行。则可以用新的系数向量代替C:log(cs)=a(1)+beta(1)*log(cs(-1))11§2.3在EViews中估计方程§2.3.1估计方法说明方程后,现在需要选择估计方法。单击Method:进入对话框,会看到下拉菜单中的估计方法列表:标准的单方程回归用最小二乘估计。其他的方法在以后的章节中介绍。采用OLS,TSLS,GMM,和ARCH方法估计的方程可以用一个公式说明。非线性方程不允许使用binary,ordered,censored,count模型,或带有ARMA项的方程。12§2.3.2估计样本可以说明估计中要使用的样本。EViews会用当前工作文档样本来填充对话框,可以通过在编辑框中输入样本字符或对象来改变样本。改变估计样本不会影响当前工作文件样本。如果估计中使用的任何一个序列的数据丢失了,EViews会临时调整观测值的估计样本以排除掉这些观测值。EViews通过在样本结果中报告实际样本来通知样本已经被调整了。DependentVariable:YMethod:LeastSquaresDate:08/19/02Time:10:24Sample(adjusted):1959:041989:12Includedobservations:369afteradjustingendpoints在方程结果的顶部,EViews报告样本已经得到了调整。从59.01-89.12期间的372个观测值中,EViews使用了369个观测值和所有相关变量的观测值。13如果在回归中包括了滞后变量,样本的调整程度会不同,这取决于样本期前的数据是否可得到。如假设M1和IP是两个没有丢失数据的序列,样本区间为59.01-89.12而且回归说明为m1cipip(-1)ip(-2)ip(-3)如果设定估计样本区间为60.01-89.12,EViews会把样本调整为:DependentVariable:M1Method:LeastSquaresDate:08/19/02Time:10:49Sample:1960:011989:12Includedobservation:360因为直到1959年4月ip(-3)才有数据。然而,如果把估计样本区间定为60.01-89.12,EViews不会对样本进行任何调整,因为在整个样本估计期间ip(-3)的值都是可以得到的。一些操作不允许样本中间有数据丢失,如带MA和ARCH项的估计。当执行这些步骤时,如果在样本中间遇到一个NA就会出现一错误信息而且执行过程也会停止。14§2.3.3估计选项EViews提供很多估计选项。这些选项允许进行以下操作:对估计方程加权,计算异方差性,控制估计算法的各种特征。§2.4方程输出在方程说明对话框中单击OK钮后,EViews显示估计结果:15根据矩阵的概念,标准的回归可以写为:y是因变量观测值的T维向量,X是解释变量观测值的T*k维矩阵,β是k维系数向量,ε是T维扰动项向量,T是观测值个数,k是解释变量个数。在上面的结果中,y是log(M1),X包括三个变量c、log(IP)、TB3,其中T=372,k=3。Xy16§2.4.1系数结果1、回归系数(Coefficient)系数框描述了系数的估计值。最小二乘估计的系数b是由以下的公式计算得到的如果使用列表法说明方程,系数会列在变量栏中相应的自变量名下;如果是使用公式法来说明方程,EViews会列出实际系数c(1),c(2),c(3)等等。对于所考虑的简单线性模型,系数是在其他变量保持不变的情况下自变量对因变量的边际收益。如果存在的话,系数c是回归中的常数或者截距---它是当其他所有自变量都为零时预测的基本水平。其他系数可以理解为假设所有其它变量都不变,相应的自变量和因变量之间的斜率关系。yXXXb1)(17例如,简单的消费方程:cst=c0+c1inct+εt,其中cs是消费;inc是收入。方程中c0代表自发消费,表示收入等于零时的消费水平;而c1代表了边际消费倾向,0c11,即收入每增加1元,消费将增加c1元,若c1等于0.6,则收入每增加1元,消费将增加0.6元。如果在消费方程中加上实际利率rs,即cst=c0+c1inct+c2rst+εt,从经济学角度看c2应是负数,实际利率下降将使消费增加。如果使用线性对数方程,估计得到的参数本身就是该变量的弹性。如在log(Qt)=α+βlog(Pt)的估计式中,P增加1%时,Q大约增加β%,所以β相当于价格弹性。182、标准差(Std.Error)标准差项报告了系数估计的标准差。标准差衡量了系数估计的统计可信性----标准差越大,估计中的统计干扰越大。估计系数的协方差矩阵是由以下公式计算得到的:)/(ˆˆ2kTs这里是残差。而且系数估计值的标准差是这个矩阵对角线元素的平方根。可以通过选择View/CovarianceMatrix项来察看整个协方差矩阵。ˆ其中12)()var(XXs,ˆXby193、t-统计量t统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系数为零的假设的。4、概率(p值)结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下,指出t统计量与实际观测值一致的概率。这个概率称为边际显著性水平或p值。给定一个p值,可以一眼就看出是拒绝还是接受实际系数为零的双边假设。例如,如果显著水平为5%,p值小于0.05就可以拒绝系数为零的原假设。20§2.4.2统计量总结1、统计量统计量衡量在样本内预测因变量值的回归是否成功。是自变量所解释的因变量的方差。如果回归完全符合,统计值会等于1。如果结果不比因变量的均值好,统计值会等于0。可能会由于一些原因成为负值。例如,回归没有截距或常数,或回归包含系数约束,或估计方法采用二阶段最小二乘法或ARCH方法。EViews计算的公式为:2R2R2R2R2RyyyyRˆˆ12其中,是残差,是因变量的均值。ˆy,ˆXbyTyyTtt1212、调整后的R2调整后R2的通常解释为,消除R2中对模型没有解释力的新增变量。计算方法如下:从不会大于R2,随着增加变量会减小,而且对于很不适合的模型还可能是负值。2R2RkTTRR11122223、回归标准差(S.E.ofregression)回归标准差是在残差的方差的估计值基础之上的一个总结。计算方法如下:KTsˆˆ4、残差平方和残差平方和可以用于很多统计计算中,为了方便,现在将它单独列出:tiiibXy12ˆˆXbyˆ235、对数似然函数值EViews可以作出根据系数的估