第九章面板数据模型第一节面板数据第二节面板数据回归模型概述第三节混合回归模型第四节变截距回归模型第五节变系数回归模型第六节效应检验与模型形式设定检验第七节面板数据的单位根检验和协整检验第八节案例分析面板数据(PanelData):也叫平行数据,指某一变量关于横截面和时间两个维度的数据,记为xit,其中,表示N个不同的对象(如国家、省、县、行业、企业、个人),,表示T个观测期。12,,,iN12,,tT第一节面板数据•平衡面板数据•非平衡面板数据•扩展的面板模型1.伪面板模型:如果按照某种属性(例如,年龄、职业和身份等)将各期调查对象分成不同的群;对于各个观测期,选择各群内观测数据的均值(中位数或分位数),即可构造以群为‘个体’单位的面板数据。我们把这种以群为个体而构造的人工面板数据为伪面板数据(PseudoPanelData)。2.轮换面板模型:同一个个体可能不愿被一次又一次的被回访,为了保持调查中个体数目相同,在第二期调查中退出的部分个体,被相同数目的新的个体所替代,这种允许研究者检验“抽样时间”偏倚效应(初次采访和随后的采访之间的回答有显著的改变)的存在性叫轮换面板。对于轮换面板,每批加到面板的新个体组提供了检验抽样时间偏倚效应的方法。3.空间面板模型:当考虑国家、地区、州、县等相关截面数据时,这些总量个体可能表现出必须处理的截面相关性。现在有大量运用空间数据的文献处理这种相关性。这种空间相依模型在区域科学和城市经济学中比较普遍。具体来说,这些模型使用经济距离测度设定了面板数据的空间自相关性和空间结构(空间异质性)。4.计数面板模型:被解释变量是计数面板数据的例子很多。例如,一段时间内一家公司的竟标次数、一个人去看医生的次数、每天吸烟者的数量及一个研发机构登记专利的数目。虽然可以运用传统面板回归模型对计数面板数据建模,但鉴于被解释变量具有0及非负离散取值的特征,运用泊松面板回归模型建模更为合适。第二节面板数据回归模型概述一、面板数据回归模型的一般形式其中,i=1,2,…,N表示个N个体;t=1,2,…,T表示T个时期;yit为被解释变量,表示第i个个体在t时期的观测值;xkit是解释变量,表示第k个解释变量对于个体i在时期t的观测值;是待估参数;uit是随机干扰项。1Kitikikititkyxuki111TKitikikititkyxuiNt,2,,,2,,11111111212111111112111112212121121211111121211111,1TKKKKTTTKKTTityxxxuyxxxuyxxxu,2,,111211TyyYy11111111Te111211111111221212121112111KKTTKTTxxxxxxxxXxxxx112111K111211TuuUu11111TYeXU11111111Te111211TyyYy11211112222212iiKiiiiKiiiiTiTKiTiTxxxxxxxxXxxxx111211111111221212121112111KKTTKTTxxxxxxxxXxxxx112111K111211TuuUu11111TYeXU1iiTiiiYeXUiN,2,,12iiiiTyyYyiiiTie12iiiiTuuUu12iiiKi二、面板数据回归模型的分类根据对截距项和解释变量系数的不同假设,面板数据回归模型常用:混合回归模型、变截距回归模型和变系数回归模型3种类型。1iiTiiiYeXUiN,2,,11,2,1,2,KitikikititkiNyxutT111222TTNTNNYeXUYeXUYeXUNN2121,混合回归模型的模型形式为(1)iTiiYeXUiN,2,,1iiTiiiYeXUiN,2,,第三节混合回归模型从截面上看,不同个体之间不存在显著性差异。11122211(1)(1)1TTNNTNYUeXYUeXYUZBYUeXNTNTNTKKYZBU一、混合回归模型假设假设1:随机干扰项向量U的期望为零向量。假设2:不同个体随机干扰项之间相互独立。假设3:随机误差项方差为常数。假设4:随机误差项与解释变量相互独立。假设5:解释变量之间不存在多重共线性。假设6:随机误差项向量服从正态分布,即2~(0)TUNI,二、混合回归模型参数估计混合回归模型与一般的回归模型无本质区别,只要模型满足假设1~6,可用OLS法估计参数,且估计量是线性、无偏、有效和一致的。1ˆ=()BZZZY若将假设3的同方差弱化为存在异方差,即21222000000000TTNTIII则混合回归模型的无偏有效估计量为111ˆ=()XXXY未知参数有一致估计为2i2211ˆ1TiitteNK是第i个个体的回归模型的OLS回归残差ite三、混合回归模型估计的Eviews操作第四节变截距回归模型变截距模型是面板数据模型中最常见的一种形式。该模型允许个体成员存在个体影响,并用截距项的差别来说明。截距项反应的是个体影响。如果个体影响是非随机的常量,该模型被称为个体固定效应变截距模型;如果个体影响是随机的,该模型被称为随机效应变截距模型。假定在截面个体成员上截距项不同,而模型的解释变量系数是相同的。变截距回归模型的模型形式为1iiTiiiYeXUiN,2,,1iiTiiYeXUiN,2,,12=K需要估计的参数个数:N+K个一、固定效应变截距回归模型固定效应变截距回归模型的模型形式为(1)iiTiiYeXUiN,2,,11122200000011TTNNNTYXUeYXUeYXUDYXUeNTNTKNTNTNYDXU12NDXUZDXB令=+ZBU=+YZBU最小二乘虚拟变量模型固定效应变截距回归模型估计(个体)=+YZBU如果随机干扰项、解释变量满足基本假定,则利用普通最小二乘法可以得到模型参数的无偏、有效一致估计量。(1)最小二乘虚拟变量(LSDV)估计如果随机干扰项不满足同方差或相互独立的基本假定,则需要利用广义最小二乘法(GLS)对模型进行估计。(2)固定效应变截距模型的广义最小二乘估计主要考虑4种基本的方差结构:个体成员截面异方差、时期异方差、同期相关协方差和时期间相关协方差。如果随机干扰项满足同方差且同期不相关,但随机干扰项与解释变量相关,这时,无论是OLS估计量还是GLS估计量都是有偏非一致估计量,此时需要采用二阶段最小二乘法(2SLS)对模型进行估计。(3)固定效应变截距模型的二阶段最小二乘估计二、随机效应变截距回归模型(个体)1(1,2,,1,2,,)KitikkititkyxuiNtTiiviv为截距中的常数项部分为截距中的随机变量部分1Kitikkititkyvxu1Kitikkititkyvxu模型进一步假设2222(1)(2)()()0(3)()0(,1,2,,)(4)()0(,)(5)()0()(6)(),()itiikititiitjitjsijuvvxEuEvEuvijNEuuijtsEvvijEuEv与不相关1Kitikkititkyvxu,itiitwvu令则有2222(1)(2)()0(3)()(4)()()ititkitituvitisvwxEwEwEwwts与不相关222222()()(2)itiitiitiituvEwEvuEvuvu22()()()()iitisiitiisiisiititisvEwwEvuvuEvvuvuuu模型存在的问题:同一个体成员、不同时期的随机干扰项之间存在一定的相关性。普通OLS估计虽然仍是无偏和一致估计,但其不再有效估计,因此,一般用广义最小二乘法(GLS)对随机效应模型进行估计。方差成分模型方差成分GLS法随机效应变截距模型的估计EViews按下列步骤估计随机效应变截距模型(个体)第五节变系数回归模型前面所介绍的变截距模型中,横截面成员的个体影响是用变化的截距来反映的,即用变化的截距来反映模型中忽略的反映个体差异的变量的影响。然而现实中变化的经济结构或不同的社会经济背景等因素有时会导致反映经济结构的参数随着横截面个体的变化而变化。因此,当现实数据不支持变截距模型时,便需要考虑这种系数随横截面个体的变化而改变的变系数模型。这种情形意味着模型在截面上既存在个体影响,又存在结构变化。我们又称该模型为无约束回归模型。类似于变截距模型,根据系数变化的不同形式,变系数模型又可分为固定效应变系数模型和随机效应变系数模型。变系数模型假定在截面个体成员上截距项和模型的解释变量系数都不同。1iiTiiiYeXUiN,2,,需要估计的参数个数:N(K+1)个EViews按下列步骤估计变系数模型:第六节效应检验与模型形式设定检验建立面板数据模型前的首要任务是确定被解释变量与截距项和系数的关系,截距项是否相同、系数是否一致,是固定效应还是随机效应模型,从而避免模型设定的偏差,改进参数估计的有效性。一、Hausman检验在实际应用中,究竟是采用固定效应模型还是采用随机效应模型,我们可以进行模型设定检验。豪斯曼Hausman(1978)提出了一种严格的统计检验方法——Hausman检验。固定效应模型LSDV估计量无偏;GLS估计量有偏随机效应模型LSDV和GLS估计量都无偏,但LSDV估计量有较大方差固定效应模型LSDV估计量和GLS估计量的估计结果有较大的差异随机效应模型LSDV估计量和GLS估计量的估计结果就比较接近Hausman检验的原理Hausman检验的原假设与被择假设H0:个体随机效应回归模型H1:个体固定效应回归模型设b,分别为回归系数的LSDV估计向量,GLS估计向量。ˆ如果真实模型是个体随机效应回归模型,那么b和二者差异应该比较小。如果真实模型是个体固定效应回归模型,那么b和二者差异应该比较大。ˆˆHausman证明在原假设下,统计量W服从自由度为K(模型中解释变量的个数)的分布,即构造Hausman检验的W统计量]ˆ[ˆ]ˆ[1bbWˆ]ˆ[ˆbVar212ˆˆˆ[][]~()WbbK为之差的方差,即ˆb、为了实现Hausman检验,必须首先估计一个随机效应模型。然后,选择View/Fixed/RandomEffectsTesting/CorrelatedRandomEffects-HausmanTest,EViews将自动估