第六章面板数据模型

a601292929
1 ℃
2020-05-13

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第六章面板数据模型引例.数据的分类与特点常见的数据类型包括:1.截面数据(同一时间不同个体构成的数据)特点:具有独立性和异质性2.时间序列数据(同一个体不同时间观测构成的数据)特点:具有同质性和相关性3.面板数据(不同个体在不同时间的观测构成的数据)特点:具有异质性和相关性例如：1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入（不变价格）数据见下表。数据是7年的，每一年都有15个数据，共105组观测值。1996-2002年中国15个省级地区的居民家庭人均消费数据（不变价格）1996-2002年中国15个省级地区的居民家庭人均收入数据（不变价格）图1面板数据示意图人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。用CP表示消费，IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。图215个省市人均消费序列（纵剖面）20004000600080001000012000140001996199719981999200020012002CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ图315个省市人均收入序列20004000600080001000012000140001996199719981999200020012002IPAHIPBJIPFJIPHBIPHLJIPJLIPJSIPJXIPLNIPNMGIPSDIPSHIPSXIPTJIPZJ图415个省市人均消费散点图(每条连线表示同一年度15个地区的消费值)图515个省市人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的收入值)15个地区7年人均消费对收入的面板数据散点图见图6和图7。图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图7中每一种符号代表一个年度的截面散点图（共7个截面）。相当于观察7个截面散点图的叠加。2000300040005000600070008000900010000110000400080001200016000IP(1996-2002)CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ图6用15个时间序列表示的人均消费对收入的面板数据图7用7个截面表示的人均消费对收入的面板数据（7个截面叠加）图8给出北京和内蒙古1996-2002年消费对收入散点图。图9给出15个省级地区1996和2002年的消费对收入散点图。图8北京和内蒙古1996-2002年消费对收入时序图图91996和2002年地区消费对收入散点图本章讨论以下问题一.面板数据模型的建立基本概念面板数据模型的类型面板模型系数的经济意义及预测二.面板数据模型的估计混合模型的估计固定效应模型的估计随机效应模型的估计三.面板数据模型的选择一.面板数据模型的建立1.基本概念面板数据（paneldata）也称也称平行数据，或时间序列截面数据（timeseriesandcrosssectiondata）或混合数据（pooldata），是指在时间序列上取多个截面，在这些截面上同时选取样本观测值所构成的样本数据。面板数据从横截面上看，是由若干个体在某一时刻构成的截面观测值，从纵剖面上看是一个时间序列。面板数据用双下标变量表示。例如N表示面板数据中含有N个个体。T表示时间序列的最大长度。(1,2,...,;1,2,...,)itYiNtT2.面板数据模型的类型设为被解释变量在横截面i和时间t上的数值，为第k个解释变量在横截面i和时间t上的数值，为横截面i和时间t上的随机误差项；代表第i截面上的不可观测的个体影响因素；解释变量数为k=l，2，…，K；截面数为i=1，2，…，N；时间长度为t=1，2，…，T。其中,N表示个体截面成员的个数，T表示每个截面成员的观测时期总数，K表示解释变量的个数。则单方程面板数据模型一般形式可写成：itYkitXit*iZ*1122,...,itiititKKititYZXXX在面板回归模型的一般形式中，由于个体因素无法观测，不能直接进行估计，因此我们考虑一下三种情况：(1)混合模型(poolmodel)1122,...,itititKKititYXXX这种情形意味着模型在横截面上无个体影响、无结构变化，可将模型简单地视为是横截面数据堆积的模型。这种模型与一般的回归模型无本质区别，只要随机扰动项服从经典基本假设条件，就可以采用OLS法进行估计（共有K+1个参数需要估计），该模型也被称为联合回归模型(pooledregressionmodel)。(2)随机效应模型(randomeffectsmodel)如果个体效应存在，但我们假设其与解释变量不相关，即，那么我们可以建立以下随机效应模型：其中：代表个体效应，并且*cov(,)0,1,2,...,ikitZXkK1122,...,itiititKKititYXXX*iiZcov(,)0,1,2,...,ikitXkK(3)固定效应模型(fixedeffectsmodel)如果个体效应存在，且其与某个解释变量相关，即那么我们可以建立以下固定效应模型：其中：代表个体效应，并且*cov(,)0ikitZX1122,...,itiititKKititYXXX*iiZcov(,)0ikitXkX3.面板模型系数的经济意义对于面板模型的一般形式：(1)混合模型对于混合模型，因此回归系数代表无个体效应下，解释变量X对被解释变量Y的条件期望的边际效应。*(|)(|)'ititiititEYXEZXX0(|)ititkkitEYXX(2)随机效应模型对于随机效应模型，因此回归系数代表对于任何个体，解释变量X对被解释变量Y的条件期望的边际效应。(|)ititkkitEYXXcov(,)0,1,2,...,ikitXkK(|)(|)'ititiititEYXEXX()'iitEX(3)固定效应模型对于固定效应模型，因此如不考虑个体效应，我们无法获得解释变量X对被解释变量Y的条件期望的边际效应。我们只能获得：即给定某个个体的前提下，解释变量X对被解释变量Y的条件期望的边际效应。(|)(|)ititiitkkkitkitEYXEXXXcov(,)0ikitX(|)(|)'ititiititEYXEXX(|,)'ititiiitEYXX(|,)ititikkitEYXX(|,)ititikkitEYXX对于固定效应模型：由于，那么当，解释变量被归入个体效应，因此回归系数将无法识别。也就是说：对于固定效应模型，不随时间发生变化的解释变量(例如个体属性)的系数是无法识别的。kitkiXXi4.面板数据模型的预测对于给定的解释变量，在对模型参数进行估计的基础上我们需要对被解释变量的条件期望进行估计，也就是(1)混合模型：FitXˆFitYˆˆˆ',,FFititYXit(2)随机效应模型：ˆˆˆ()',,FFitiitYEXit(2)固定效应模型：注意：固定效应模型是不能进行个体外样本外预测的ˆˆˆ',1,...,,FFitiitYXint二.面板数据模型的估计1.混合普通最小二乘估计(PoolOLS)PoolOLS是针对于混合模型的估计方法：对于混合模型直接使用OLS进行估计只要满足,则POLS获得一致的估计对于RE模型，POLS一致但非有效(扰动项存在自相关)；对于FE模型，POLS非一致。，因此2,11ˆˆ(,)argmin(('))NTitititYXcov(,)0ititX''()'itiitititiitititYXXXucov(,)0itiXcov(,)0ititXu2.组间估计(BetweenEstimator)在短面板（T很小）中，有时可以只考虑组间(个体)差异的信息来估计参数。对每个个体的时间序列取平均：其中：对以上方程进行最小二乘估计称为组间估计。组间估计将损失组内差异的信息，因此是非有效的。同样的，对于固定效应模型模型，BetweenEstimator是非一致的。'itiititYX'iiiiYX1TiittYY1TiittXX1Tiitt3.组内估计(WithinEstimator)相对于组间估计只考虑组间信息，我们也可以只考虑组内(时间)差异的信息来估计参数。对每个个体的时间序列取平均：两方程项减得到：对以上方程进行最小二乘估计称为组内估计。组间估计将损失组间差异的信息，因此是非有效的。但对于固定效应模型，WithinEstimator由于消掉了个体效应，因此是一致的。进一步的：'itiititYX'iiiiYX()'itiitiitiYYXXˆˆ'iiiYX4.一阶差分估计(FirstDifferenceEstimator)为了消除模型中的个体效应使得固定效应模型获得一致的估计，类似于组内估计的思想，我们可以考虑对模型进行一阶差分：进行一阶差分：对以上差分方程进行最小二乘估计称为一阶差分估计。一阶差分估计将损失一定信息，因此是非有效的。但对于固定效应模型，一阶差分估计由于消掉了个体效应，因此是一致的。进一步的：注意：组内估计和一阶差分估计都无法识别不随时间变化的解释变量的系数。'itiititYXˆˆ'iiiYX111()'ititititititYYXX5.最小二乘虚拟变量估计(LSDVEstimator)对于固定效应模型，由于个体效应与解释变量相关，因此无法放入扰动项中，我们可以考虑引入虚拟变量将其视为N个参数进行估计。设置N个虚拟变量：模型变为：对以上方程进行最小二乘估计称为LSDV估计。LSDV估计引入N个虚拟变量将损失大量的自由度，因此对估计解释变量的系数是非有效的。但对于固定效应模型是一致估计。'itiititYX(),1,2,...,jitDIijjN1122...'itititNNitititYDDDX6.随机效应广义最小二乘估计(RE-GLSEstimator)对于随机效应模型，虽然POLS是一致估计，但是由于扰动项存在自相关，因此非有效，因此我们试图寻找有效的估计：假设则我们希望通过广义差分将以上模型的自相关消除令，反解出'itiititYX22(,),(0,)iit'()'ititiitititYXXu2cov(,)(,)itisiitiisuu(1)()'itiitiitiYYXXuu()0itiVaruu221TRE-GLS估计的步骤：(1)获得的估计：因此我们只需获得和即可。分别对RE模型进行Between和Within估计分别获得其扰动项的方差估计和分别找出Between和Within估计扰动项的方差：Between估计：Within估计：22ˆˆ1ˆˆT2ˆ2ˆ/(1)BRSSNK/()WRSSNTK222()()/()/BiitVaruVaruTT22()()1()()/2cov(,/)WitiitiititititVa