数说工作室新浪微博:数说工作室一、面板数据简介二、静态面板数据及Eviews实现(1)静态面板数据简介(2)EVIEWS操作三、动态面板数据及Eviews实现(1)动态面板数据简介(2)Eviews操作数说工作室一、面板数据简介信息技术的发展使得数据越来越膨胀,传统的截面数据和时间序列已经不能全面刻画经济的演变,在大数据背景下,同时分析比较横截面观察值和时间序列观察值的需求越来越大。面板数据就是指既含有截面又含有时间序列的数据,分析比较这种数据的模型就是面板数据模型。相对于一般的回归模型,面板数据模型不仅能够更好的识别和度量单纯时间序列模型和单纯横截面数据模型所不能发现的影响因素,而且可以克服多重共线性的困扰,能够提供更多的信息、更多的变化、更高的自由度和更高的估计效率,减少共线性。因此,面板数据可以更准确地刻画更为复杂的经济行为,具有更好的理论价值和应用价值。按照模型中是否含有滞后项,又分为静态面板数据和动态面板数据,本指南将分别简介原理和Eviews操作方法。二、静态面板数据及Eviews实现(1)静态面板数据简介一般的静态面板数据模型的一般形式如下:𝐲𝐲𝐢𝐢𝐢𝐢=𝐂𝐂+𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢+𝐯𝐯𝐢𝐢𝐢𝐢,𝐢𝐢=𝟏𝟏,…𝐍𝐍,𝐢𝐢=𝟏𝟏,…,𝐓𝐓(1)其中C为截距,vit为误差项,i为截面下标,N表示截面的个数,t为时间下标,T表示时间序列的长度。面板数据由于同时含有了多个横截面数据,有时需要考虑不同横截面个体存在的特殊效应,其误差项被设定为:𝐯𝐯𝐢𝐢𝐢𝐢=𝛂𝛂𝐢𝐢+𝐞𝐞𝐢𝐢𝐢𝐢(2)其中αi代表个体效应,反映了不同个体之间的差别。当个体效应为固定常数时,式(1)为固定效应模型,此时每个个体截面都有不同的截距项α1、α2...αn,即其分布式与Xit是有关的,反映了该个体的固定效应,因此固定效应模型又称为相关效应模型,严格说来,这个名字更加准确。固定效应模型的形式为:𝐲𝐲𝐢𝐢𝐢𝐢=𝐂𝐂+𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢+𝛂𝛂𝐢𝐢+𝐯𝐯𝐢𝐢𝐢𝐢,𝐢𝐢=𝟏𝟏,…𝐍𝐍,𝐢𝐢=𝟏𝟏,…,𝐓𝐓(3)用矩阵表示为:数说工作室ααβα=++(4)即,Y=Dα+xβ+e(5)当个体效应αi为随机变量时,式(5)为随机效应模型,此时其分布与Xit是无关的,因此随机效应相应又称为非相关效应模型,随机效应模型的形式为:𝐲𝐲𝐢𝐢𝐢𝐢=𝐂𝐂+𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢+𝛂𝛂𝐢𝐢+𝐯𝐯𝐢𝐢𝐢𝐢,𝐢𝐢=𝟏𝟏,…𝐍𝐍,𝐢𝐢=𝟏𝟏,…,𝐓𝐓(6)对于这两种模型,最长采用的估计方法为虚拟变量最小二乘法和广义最小二乘法。(2)Eviews实现1)录入数据以A、B、C、D四家银行,2000-2010年十年的面板数据为例(变量为var1、var2):建立新的工作文件:File—New—Workfile;选择Dated-regularfrequency,填入开始年份(startdate)2000和结束年份(startdate)2010,点击OK;右键—newobject—选择pool—点击OK;填写CrossSectionIdentifiers截面名:A、B、C、D;选择view—spreadsheet—输入变量名(注意变量名后面要带?号):var1?、var2?输入数据2)单位根检验各个变量必须同阶平稳,否则即使最终模型显著,也可能是“伪回归”。在pool界面选择view—unitroottest—在poolseries中分别输入待检验的变量(后面要接?号)。Level、1stdifferent、2nddifferent用来确定变量差分几阶,一般从level零阶开始检验,到1阶、2阶。根据变量是否有截距项、是否同时有截距和明显趋势项、都没有,来相应选择individualintercept、individualinterceptandtrend、none数说工作室点击OK,出现结果,原假设是不平稳,P值小于0.05时认为变量平稳3)协整检验在pool界面中选择View—cointegrationtest—variables中输入待检验的变量,并选择截距情况点击OK,出现结果,none代表“有0个协整关系”、atmost1为“至多一个协整关系”……拒绝none则意味着至少有一个协整关系。4)模型效应形式确定此步中要检验模型是随机效应模型还是固定效应模型,思路是先建立随机效应模型,然后检验这种形式是否正确:数说工作室建立随机效应模型:POOL—ESTIMATE。在dependentvariable中填入因变量,在右边填入自变量,cross-section选择radom进行Hausman随机效应检验:View—Fixed/RandomEffectsTesting—CorrelatedRandomEffects-HausmanTest。原假设是应该建立随机效应模型,如果P值小于0.05,则认为应该建立固定效应模型,否则建立随机效应模型。5)模型建立如果单位根检验是同阶平稳的,协整关系存在,并确定了模型的形式(随机或固定),则可以建立正式模型。POOL—ESTIMATE,选择自变量和因变量,并相应选择模型的形式,如果是固定效应Fixed,还可以选择不同的加权方法,以使得结果更加显著。数说工作室三、动态面板数据及Eviews实现(1)动态面板数据简介在现实社会中,很多经济关系是动态的,有时需要引入滞后项去解释这些经济关系。动态面板数据模型,即面板数据模型的解释项中纳入被解释变量的滞后项,以反映动态滞后效应。但滞后项与随即误差项组成部分的个体效应相关,会造成模型的内生性偏倚,本节将重点介绍动态面板数据模型的形式和估计方法。①动态面板数据形式以模型中包含滞后一起的被解释变量为例,动态面板数据的基本形式为:𝐲𝐲𝐢𝐢𝐢𝐢=𝐚𝐚𝐲𝐲𝐢𝐢𝐢𝐢−𝟏𝟏+𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢+𝛆𝛆𝐢𝐢𝐢𝐢,𝛆𝛆𝐢𝐢𝐢𝐢=𝐮𝐮𝐢𝐢+𝐯𝐯𝐢𝐢𝐢𝐢(7)与静态面板数据的不同在于,解释变量引入了滞后项∑yit,其误差项也由两部分组成,ui为个体效应,vit为异质性冲击。从动态面板模型的形式看,右侧的滞后项会与其个体效应相关,造成内生性问题,这使得OLS估计量是有偏和不一致的估计量(BadiH.Baltagi),Arellanod等提出的基于工具变量的广义矩估计方法,可以减弱内生性,得到一致的估计量。②广义矩估计GMM数说工作室广义矩估计的基本思想在总体未知的情况下,参数的矩估计就是用样本矩去估计总体矩。比如,可以通过样本得到样本的两个矩:X(1)和X(2)(1)(2)21111nniiiiXyXynn====∑∑(8)并通过样本的两个矩来估计总体矩:(1)(1)(2)2(2)21111ˆˆ()()nniiiiMEYXyMEYXynn========∑∑(9)在进一步计算总体参数:(1)(1)2(2)(1)2(2)(1)2ˆˆˆˆˆ()()()MEYXMMXXµσ====+=+(10)这是用两个矩估计总体的两个参数,当选择的矩估计方程个数多于待估参数个数时,广义矩估计方法应运而生:设样本的r个矩为X(i),i=1,...,r,对应的有r个总体矩M(i)(b),i=1,...,r,为待估总体参数b的函数,且r大于待估总体参数的个数,则最小二乘矩的参数估计量是使下式最小的参数估计量b�:()()21ˆ()(())riiiQbXMb==−∑(11)此式中,有时会希望某些矩的作用大些,此时会用到加权最小二乘法。写成向量形式,记X=(X(i),…,X(r))T,M=(M(i),…,M(r))T,则加权最小二乘可定义为:1()()()TQbXMSXM−=−−(12)其中s就是关于(X-M)的协方差阵,参数b的GMM估计就是使得Q(b)达到最小的b�。基于工具变量的广义矩估计如果模型的设定正确,则存在一些为0的条件矩。模型的广义矩估计的基本思想就是用矩条件估计模型参数。设定以下模型关系式,其中b是k*1待估参数向量:(,)1,......,iiiyhxbein=+=(13)如果解释变量与随机误差不相关、且随机误差项不存在异方差和序列相关,那么存在:101,2,,njiiixjkε===∑(14)等价于数说工作室((,))01,2,,njiiiixyhXjkβ=−==∑(15)这就是一组矩条件,由样本矩条件估计模型参数b,就是一种矩估计。当模型存在解释变量与随机误差相关时,有些矩条件就不存在了,那么需要找到一个工具变量z,使z与e无关:cov(,)0iize=(16)定义(,;)(;)1()(,;)(,;)iiiiTiiiiiieyxbyhxbmbzeyxbZeyxbn=−==∑(17)m(b)还可以写成11221()1()()......()1iiiiiikkiiizenmbzembmbnmbzen==∑∑∑(18)用矩条件m(b)=0得出的参数估计量的方法,就是工具变量法。同时方程组的解m(b)=0,就是m(b)Tm(b)极小化时的b�。工具变量法没有改变原模型,而是在原模型的参数估计过程中用工具变量替代了随机解释变量。③Anderson-Hsiao估计Anderson-Hsiao将基于工具变量的广义矩估计方法引入动态面板数据模型,其估计方法建立在式(7)一阶差分的基础上:𝐲𝐲𝐢𝐢𝐢𝐢−𝐲𝐲𝐢𝐢𝐢𝐢−𝟏𝟏=𝐚𝐚(𝐲𝐲𝐢𝐢𝐢𝐢−𝟏𝟏−𝐲𝐲𝐢𝐢𝐢𝐢−𝟐𝟐)+𝐛𝐛(𝐱𝐱𝐢𝐢𝐢𝐢−𝐱𝐱𝐢𝐢𝐢𝐢−𝟏𝟏)+𝛆𝛆𝐢𝐢𝐢𝐢−𝛆𝛆𝐢𝐢𝐢𝐢−𝟏𝟏(19)由于εit=ui+vit,故差分可以消除内生性造成的个体效应ui,但对等式右边yit−1−yit−2与随即误差εit−εit−1的相关性仍然无能为力。Anderson和Hsiao提出使用yit−2或差分的滞后项yit−2−yit−3作为工具变量,它们与yit−1−yit−2高度相关,但与随即误差项无关,从而消除了动态面板数据模型的偏倚问题。④Arellano-Bover估计Anderson和Hsiao提出了将模型差分并引入滞后的解释变量,以解决模型的数说工作室内生性问题。但当遇到非平衡面板数据时,即数据存在缺失时,一阶差分变换会损失很多数据,不能充分有效的利用信息。Arellano和Bover(1995)将“向前正交离差转换法”引入到动态面板数据模型的估计中,该方法不是用本期值减去上期值,从而将模型差分,而是用本期值减去未来s期观察值的平均值,即原模型变换为:112121111()()TTTTititmititnititktitpmnkpyyayybxxeeTTTT+−−−−====−=−−−+−∑∑∑∑(20)等价于:𝐲𝐲𝐢𝐢𝐢𝐢∀=𝐚𝐚𝐲𝐲𝐢𝐢𝐢𝐢−𝟏𝟏∀−𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢∀+𝐞𝐞𝐢𝐢𝐢�