§6.3固定效应面板数据计量经济学模型一、面板数据模型概述二、模型的设定检验三、固定效应变截距模型四、固定效应变系数模型说明•面板数据(PanelData)–也被翻译为平行数据、综列数据、时空数据–指在时间序列上取多个截面,在每个截面上同时选取相同的个体作为样本,由这些样本观测值所构成的数据。•面板数据计量经济学模型–近20多年来计量经济学模型理论方法的重要发展之一;–已经形成了与截面数据模型相对应的完整的模型体系;–具有很好的应用价值。–本节将它作为经典截面数据的一种扩展,介绍最简单、常用的固定效应面板数据模型(PanelDataModelswithFixed-Effects)。•面板数据模型的发展–20世纪60年代将PanelData引入计量经济学模型,只是将面板数据作为一组混合数据(PooledData)样本用以估计经典的计量经济学模型。–面板数据模型理论方法的发展和应用研究的开展主要发生在20世纪80-90年代。–进入21世纪,PanelData模型理论方法研究已经成为理论计量经济学最活跃的领域。–目前,PanelData模型已经成为应用最为广泛的计量经济学模型。•一般教科书包含的内容–对PanelData计量经济学模型进行总的概述,并讨论模型设定检验的原理和方法;–介绍变截距PanelData模型;–介绍变系数PanelData模型;–介绍动态PanelData模型。•PanelData计量经济学理论研究前沿领域–PanelData非线性模型研究,或者称为PanelData非经典计量经济学模型研究。例如PanelData离散选择模型、PanelData计数数据模型、PanelData选择性样本模型等。–PanelData单位根和协整检验理论方法研究。一、面板数据模型概述1、经济分析中的PanelData问题•只利用截面数据或者只利用时间序列数据不能满足分析目的的需要。–例如,如果分析生产成本问题–例如,分析外商直接投资对我国各个地区经济增长的影响2、计量经济学模型方法中的PanelData问题•充分利用尽可能多的样本信息,是任何一项计量经济学应用研究必须遵循的基本原则。–计量经济学模型方法的核心是依据样本信息估计总体参数.–采用PanelData比单纯采用横截面数据或时间序列数据会使得模型分析更加有效.–PanelData计量经济学模型理论正是基于样本信息的充分利用而发展的。•在具体模型方法方面,采用PanelData比单纯采用横截面数据或时间序列数据也有许多优势。–可以显著地增加自由度,使得统计推断更加有效;–可以降低变量之间的共线性,使得参数估计量更具有效性;–可以有助于从不同的经济理论出发建立的互相竞争的模型中识别出正确的模型;–可以减少甚至消除模型估计偏差;等等。⒊经典面板数据模型的类型•说明–仅指经典面板数据模型。–每种模型都包括固定效应和随机效应两种设定形式。•模型1:截面个体变系数模型,简称变系数模型。itiiitYitXβni,,1Tt,,11212(,,,)(,,,)ititKitiiKiXXXitiXβ该模型表示,在横截面个体之间,存在个体影响(变截距),也存在变化的经济结构,因而结构参数在不同横截面个体上是不同的。•模型2:截面个体变截距模型,简称变截距模型。itiitYitXβni,,1Tt,,11212(,,,)(,,,)ititKitKXXXitXβ该模型表示,在横截面个体之间,存在个体影响(变截距),不存在变化的经济结构,因而结构参数在不同横截面个体上是相同的。•模型3:截面个体截距、系数不变模型。ititYitXβni,,1Tt,,1该模型表示,在横截面个体之间,不存在个体影响(变截距),也不存在变化的经济结构,因而模型的截距和结构参数在不同横截面个体上是相同的。•模型4:截面个体不变截距、变系数模型。itiitYitXβni,,1Tt,,1该模型表示,在横截面个体之间,不存在个体影响,但是存在变化的经济结构,因而模型截距相同,而结构参数在不同横截面个体上是不同的。该模型在实际应用中很少出现,从经济行为方面看,如果在不同横截面个体上结构参数存在差异,那么模型截距一般肯定也存在差异。•模型5:时点变系数模型。itttitYitXβni,,1Tt,,1该模型表示,在不同的时点之间,存在个体影响(变截距),也存在变化的经济结构,因而结构参数在不同时点是不同的。该模型在实际应用中也很少出现,从经济行为方面看,不同个体之间的行为差异往往比同一个个体在不同时点上的行为差异更为明显。12(,,,)tttKtβ•模型6:截面个体和时点变截距模型。itititYitXβni,,1Tt,,1该模型表示,在横截面个体之间,存在个体影响,同时在不同的时点之间,存在个体影响,但是不存在变化的经济结构,因而结构参数在不同横截面个体上是相同的。这是一类在实际应用中常见的模型。从应用的角度,人们希望既控制截面个体影响,也控制时点影响,然后求得平均意义上的不变的结构参数。该模型的估计方法与模型2并无大的差别。三、经典面板数据模型的设定检验1、模型设定检验的目的•采用PanelData–由于可以构造比单独采用横截面数据或时间序列数据更现实的结构模型,计量经济学的经验研究大大地丰富了。–但PanelData包括两维的数据(横截面和时间),如果模型设定不正确,将造成较大的偏差,估计结果与实际将相差甚远。–所以,在建立PanelData模型时必须控制不可观察的个体和(或)时间的特征以避免模型设定的偏差并改进参数估计的有效性。•PanelData是来自经济活动的复杂过程。–若假设经济变量在每个时点上都是由参数化的概率分布函数生成的,实际上是不现实的。–忽视这种在横截面或时间上参数的本质上的差异可能会导致参数估计不是一致估计或估计出的参数值无意义。•建立PanelData模型的第一步是检验刻画被解释变量Y的参数是否在所有横截面个体上和时间上都是常数,即检验所研究的问题属于上述模型1、2、3中的哪一种,以确定模型的形式。2、F检验•经典模型中的约束检验:)1,(~)1/()/()(URUUURUURknkkFknRSSkkRSSRSSF•假设1:斜率在不同的横截面样本点上和时间上都相同,但截距不相同。(模型2)•假设2:截距和斜率在不同的横截面样本点和时间上都相同。(模型3)•首先检验假设2。如果接收了假设2,则没有必要进行进一步的检验。如果拒绝了假设2,就应该检验假设1,判断是否斜率都相等。如果假设1被拒绝,就应该采用模型1。•检验假设2的F统计量)]1(),1)(1[(~)]1(/[)]1)(1/[()(1132KTnKnFKnnTSKnSSF•从直观上看,如S3-S1很小,F2则很小,低于临界值,接受H2。S3为截距、系数都不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。•检验假设1的F统计量•从直观上看,如S2-S1很小,F1则很小,低于临界值,接受H1。S2为截距变化、系数不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。)]1(,)1[(~)]1(/[])1/[()(1121KTnKnFKnnTSKnSSF3、说明•存在问题–PanelData模型的设定检验是建立PanelData应用模型的第一步和不可缺少的步骤,但是在实际应用研究中,研究者经常根据研究目的的需要设定模型类型,这是目前PanelData模型应用研究中存在的一个突出问题。–例如,某经济研究类学术刊物2011年第1-6期共刊载研究论文68篇,其中采用PanelData的应用研究论文25篇,可见PanelData模型应用研究之广泛。在25篇论文中,13篇采用截面个体和时点变截距模型(模型6),6篇采用截面个体变截距模型(模型2),5篇采用截面个体截距、系数不变模型(模型3),1篇采用截面个体变系数模型(模型1),而且几乎全部没有进行严格的模型设定检验。•一种解释–采用面板数据,从应用的角度,人们经常希望在控制截面个体影响,或者既控制截面个体影响也控制时点影响的情况下,求得平均意义上的不变的结构参数,分析变量之间的结构关系,所以将模型设定为模型6或者模型2的形式,能够达到研究的目的。三、固定效应变截距模型•截面个体变截距PanelData模型又分固定效应(Fixed-Effects)和随机效应(Random-Effects)两类。–前者指模型的截距对于不同的截面个体存在实质上的差异;–后者指模型的截距对于不同的截面个体只存在随机扰动的差异。1、LSDV模型及其参数估计itiitityxiiiiyeX12[,,,,]nydddXLyDX1111TeM120000[,,,]00nnTneedddeLLLMMOMLT阶向量(T×n)阶向量•该模型通常被称为最小二乘虚拟变量(LSDV)模型。–如果n充分小,此模型可以当作具有(n+K)个参数的多元回归,参数可由普通最小二乘进行估计。1ˆˆαDXDXDXyβ–当n很大,甚至成千上万,OLS计算可能超过任何计算机的存储容量。可用分块回归的方法进行计算。–分块回归的思路是:首先设法消去参数αi,估计参数β;然后再在每个截面个体上利用变量的观测值和参数β的估计值,计算参数αi的估计量。•分块估计1TTQIee1TTIeeee0QeYDαXβμiiiiiiQyQeQXβQμQXβQμiiiiiiXQYXQXβXQμ()iiiiiiiiiXQYXQXβXQμ111ˆnnCViiiiiiβXQXXQye’e=Tβ的协方差估计是无偏的,且当n或T趋于无穷大时,为一致估计。它的协方差阵为:112)ˆ(niiiuCVQXXVarCViiiXyˆˆiCViuiXVarXTVar)ˆ()ˆ(2)/()ˆˆ(1122KnnTxysniTtCVitiit截距的估计是无偏估计,且仅当T趋于无穷大时为一致估计。随机项方差估计量2、演示:在Eviews中建立PanelData数据文件以及估计固定效应变截距模型•以我国城镇居民家庭人均年消费支出(XF)为被解释变量,以城镇居民家庭人均年可支配收入(SR)(其它因素经过检验表明不显著)为解释变量。采用北京、天津、河北、内蒙古、辽宁、吉林、上海、江苏、浙江、福建、山东、河南、湖北、湖南、广东、重庆、四川、云南、陕西、甘肃等20个地区2004~2013年共200组数据为样本,估计我国城镇居民消费模型。城镇居民家庭人均年消费性支出北京天津河北内蒙古辽宁吉林上海江苏浙江福建2004122008802581962196543606912631733210636816120051324496536700692973696795137738622122548794200614825105487343766779877353147629629133499808200715330120298235928194308560172551071514091110552008164601342290871082911231972919398119781515812501200917893148019679123701232510914209921315316684134512010199341656210318139951328011679232001435717858147502011219841842411609158781479013010251021678220347166