1静态面板数据模型及其运用一、面板数据定义面板数据,简言之是时间序列和截面数据的混合。面板数据的定义严格地讲是对一组个体(如居民、家庭、企业、行业、地区和国家等)连续观察多期得到的资料。所以很多时候我们也称其为“追踪资料”。1122iiiiyxx——截面数据回归1122ttttyxx——时间序列数据回归1122itititityxx——面板数据回归面板数据包括三个方面的信息:截面成员,时间和变量。回归分析时使用三维数据比较困难,一般要转换为二维数据,可以按照截面堆积和时间堆积的方式进行转换。近年来,由于面板数据资料的获得变得相对容易,使其应用范围也不断扩大。而关于面板数据的计量理论也几乎涉及到了以往截面分析和时间序列分析中所有可能出现的主题,如近年来发展出的面板向量自回归模型(PanelVAR)、面板单位根检验(PanelUnitRoottest)、面板协整分析(PanelCointegration)、门槛面板数据模型(PanelThreshold)等,都是在现有截面分析和时间序列分析中的热点主题的基础上发展起来的。使用面板数据建模的优点:第一,便于控制个体的异质性。面板数据表明个体、企业、地区或国家是存在异质性的,单纯的时间序列分析和横截面分析没有控制异质性,估计通常是有偏的。比如,我们在研究全国30个省份居民人均消费青岛啤酒的数量时,可以选取居民的收入、当地的啤酒价格、上一年的啤酒消费量等变量作为解释变量。但同时我们认为民族习惯、风俗文化、广告投放等因素也会显著地影响居民的啤酒消费量。对于特定的个体而言,前两种因素不会随时间的推移而有明显的的变化,通常称为个体效应。而广告的投放往往通过电视或广播,我们可以认为在不同的年份所有省份所接受的广告投放量是不同的,通常称为时间效应。这些因素往往因为难以获取数据或不易衡量而无法进入我们的模型,在截面或时间序列分析中往往会引起遗漏变量的问题。而面板数据模型的主要用途之一就在于处理这些不可观测的个体效应或时间效应。第二,面板数据包含的信息量更大,降低了变量间共线性的可能性,增加了自由度和估计的有效性。时间序列数据常常会带来变量间的共线性,例如前面提2到的啤酒需求,价格和收入的时间序列数据常常存在着多重共线性。但是在面板数据中,这种共线性就会小得多,因为横截面数据为价格和收入信息加入了许多变异性(异质性),从而使估计参数更有效。第三,便于分析动态调整过程。例如,在测度失业时,横截面数据可以估计在某一时点有多少人失业,但不能很好地解释失业的持续性问题。然而,面板数据可以估计出在某一期失业人群中到下一期继续保持失业状态的人群比例。面板数据还可以很好地研究工作转换、劳动力流动、居民消费和收入变动等问题。平衡面板数据:数据是完整的,每一个时期的观测个体相等。即每期的N相等,样本数为NT。非平衡面板数据:每一时期的观测个体不再相等,有些个体消失,没有数据可供观测,即1TttnNT。例如,在20年中,有些厂商倒闭了。二、静态面板数据模型的分类我们一般所说的静态面板数据模型,是指解释变量中不包含被解释变量的滞后项(通常为一阶滞后项)的情形。但严格地讲,随机干扰项服从某种序列相关的模型,如AR(1),AR(2),MA(1)等,也不是静态模型。动态和静态模型在处理方法上往往有较大的差异。用静态面板数据建立的模型通常有三种,即混合模型、固定效应模型和随机效应模型。基本模型:'ititiiityXz,1,2,...,;1,2,...,iNtT(1)其中itX可以随个体及时间而变,iz为不随时间而变的个体特征。iit为复合扰动项,其中,i为是不可观测的随机变量,代表个体异质性的截距项。it为随个体和时间而改变的扰动项。假设it独立同分布,且与i不相关。1.混合模型(PooledModel)如果一个面板数据模型定义为:ititityX,1,2,...,;1,2,...,iNtT(2)其中ity为被回归变量(标量),为截距项,itX为1k阶回归变量列向量(包括k个回归量),为1k阶回归系数列向量,it为误差项(标量)。则称此模型为混合模型。混合模型的特点是无论对任何个体和截面,回归系数和都相同。如果模型是正确设定的,则解释变量与误差项不相关,即(,)0ititCovX。那么无论是N,还是T,模型参数的混合最小二乘估计量都是一致估计量。批注[A1]:混合回归也被称为“总体平均估计量”,因为可以理解为个体效应都被平均掉了。由于面板数据的特点,虽然通常假设不同个体之间的扰动项相互独立,但是同一个体在不同时期的扰动项之间往往存在自相关,此时对标准差的估计应使用聚类稳健的标准差。3一个研究企业投资需求的例子。样本为包括五个企业和三个变量的22个年度(1935-1954)的面板数据。混合回归模型设定为:12ititititIMK。其中,I为总投资,M为企业前一年的市场价值(反映企业的预期利润),K为前一年末工厂存货和设备的价值(反映必要重置投资期望值)。EViwes估计方法:在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选NewObject功能,从而打开NewObject选择窗。在TypeofObject选择区选择Pool(混合数据库),点击OK键,从而打开Pool(混合数据)窗口。在窗口中输入20个行业标识。工具栏中点击Sheet键,从而打开SeriesList(列写序列名)窗口,定义变量I?M?K?点击OK键,Pool(混合或合并数据库)窗口显示面板数据。在Pool窗口的工具栏中点击Estimate键,打开PooledEstimation(混合估计)在DependentVariable(因变量)选择窗填入I?;在Commoncoefficients(系数相同)选择窗填入M?K?;Crosssectionspecificcoefficients(截面系数不同)和periodspecificcoefficients(时点系数不同)选择窗保持空白;在FixedandRandom选择窗中的cross-secti和period选项都选择none;在Weighting(权数)选择窗点击Noweighting。点击PooledEstimation(混合估计)窗口中的OK键。2.固定效应模型(fixedeffectsregressionmodel)根据未观测变量是否与解释变量相关,将面板数据模型分为固定效应模型和随机效应模型。固定效应模型的基本假设:假设1:[,]0iiiExa(误差项与解释变量的当期观察值、前期观察值以及未来观察值均不相关,也就是说模型中所有的解释变量都是严格外生的。)假设2:2[,]iiiVarxa(同方差假定)假设3:(,)0iitCovax(未观测变量与解释变量相关)根据未观测变量是否随截面或时间变化,固定效应模型分为三种类型,即个体固定效应、时点固定效应和个体时点双向固定效应。2.1个体固定效应模型(entityfixedeffectsmodel)个体固定效应模型定义为itiitityX,1,2,...,;1,2,...,iNtT(3)其中i是模型截距项,是随机变量,表示对于N个不同的截面有N个不同4的截距。i表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯、国家的社会制度等,我们一般称其为“个体效应”(individualeffects)。当个体效应的变化与itX有关时,应用固定效应模型进行估计;当个体效应的变化与itX无关时,应用随机效应模型进行估计。itX为1k阶回归变量列向量,为1k阶回归系数列向量,对于不同个体回归系数相同(我们主要讨论变截距不变系数模型),it为误差项(标量)。个体固定效应模型也可以表示为:1122...itNNitityDDDX,1,2,...,;1,2,...,iNtT(4)其中,1,1,2,...,0,iiiND如果属于第个个体,其他因为个体固定效应模型中,未观测变量i与解释变量之间是相关的,因此得到的OLS估计是非一致的。消除i的影响以保证在面板数据模型中估计的一致性就成为一种首选。消除个体i的影响的方法主要有两种:一是一阶差分法,二是组内估计法。当T2时,若it独立同分布,则组内估计量比一阶差分估计量更有效率,因此实践中多用组内估计法。组内估计法:组内估计法利用解释变量和被解释变量偏离其时间维度均值的信息,来反映变量随时间变化的信息。组内估计法的基本原理是,先用每个变量减其组内均值,把数据中心化(entity-demeaned),然后用变换的数据估计个体固定效应模型的回归系数(不包括截距项),最后利用组内均值等式计算截距项。例:个体效应模型'itiitityx(a)对(a)式两边按照时间维度求均值,得到:'...iiiiyx(b)(a)-(b)式,得到:''...()()itiitiitiyyxx从而消除了个体效应。以企业投资需求为例,个体固定效应模型设定为:012itiitititIMKEViwes估计方法:在PooledEstimation对话框中,在Commoncoefficients(系数相同)选择窗填入M?K?;Crosssectionspecificcoefficients(截面系数不同)中填入C,在periodspecificcoefficients(时点系数不同)选择窗保持空白;在FixedandRandom选择窗中的cross-secti选项选择fixed,在period选项选择none,其余选项同上。注意:当存在截面异方差时要选择截面加权法(cross-section批注[微软用户2]:FE也被称为最小二乘虚拟变量模型LSDV,这种方法的好处是可以得到对个体异质性的估计。批注[微软用户3]:固定效应估计量(或称组内估计量。要求:扰动项与各期解释变量均不相关,即解释变量严格外生。此外,fe的缺点是不能估计不随时间而变的变量。5weights)进行估计;当残差具有截面异方差和同步相关时,选择cross-sectionSUR进行估计。2.2个体时点固定效应模型(timeandentityfixedeffectsmodel)个体时点固定效应模型定义为:0itititityX,1,2,...,;1,2,...,iNtT(5)其中i是随机变量,表示对于N个不同的截面有N个不同的截距,且其变化与itX有关;t是随机变量,表示对于T个时点有T个不同的截距项,且其变化与itX有关;itX为1k阶回归变量列向量,为1k阶回归系数列向量,it为误差项(标量)。如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(5)进行OLS估计得到的全部参数估计量都是不一致的。对于个体和时点双向固定效应,通常可以进行离差化处理,利用..itityyyy对..ititxxxx进行回归,其中1.1TitityTy,1.1NittiyNy,111()NTitityNTy。另外一种办法是引入时间趋势项。则模型变为:0itiititytX,1,2,...,;1,2,...,iNtT(6)以企业投资需求为例,个体时点固定效应模型设定为:012itititititIMKEViwes估计方法:在PooledEstimation对话框中的FixedandRandom选择窗中的cross-secti选项和period选项都选择fixed,其余选项与混合模型相同。3.随机效应模型(RandomEffectRegressionModel)随机效应模型定义为:itiitityX,1,2,.