第15章面板数据模型与应用.

平凡也开心
2 ℃
2019-12-20

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第15章面板数据模型与应用张晓峒（2009-8）南开大学数量经济研究所所长、博士生导师nkeviews@yahoo.com.cn（南开大学经济学院数量经济研究所）《面板数据的计量经济分析》，白仲林著，张晓峒主审，南开大学出版社，2008，书号ISBN978-7-310-02915-0。WooldridgeBaltagi第15章面板数据模型与应用第15章面板数据模型与应用15.1面板数据定义15.2面板数据模型分类15.3面板数据模型估计方法15.4面板数据模型的设定与检验15.5面板数据建模案例分析15.6面板数据模型的EViews操作15.7面板数据的单位根检验15.1面板数据定义时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据；截面数据是变量在固定时间的一组数据。面板数据是同时在时间和截面上取得的二维数据。所以，面板数据（paneldata）也称作时间序列与截面混合数据（pooledtimeseriesandcrosssectiondata）。面板数据是截面上个体在不同时间的重复观测数据。面板（panel）原指对一组固定调查对象的多次观测，近年来面板数据已经成为专业术语。19782005年中国各省级地区城镇家庭消费性支出占可支配收入比率值面板数据如图。其一个坐标表示时间，另一个坐标表示地区。面板数据从横截面（crosssection）看，是由若干个体（entity,unit,individual）在某一时间构成的截面观测值，从纵剖面（longitudinalsection）看每个个体都是一个时间序列。1．面板数据定义面板数据分两种特征：（1）个体数少，时间长。（2）个体数多，时间短。面板数据主要指后一种情形。面板数据用双下标变量表示。例如yit,i=1,2,…,N;t=1,2,…,Ti对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变，yi.,(i=1,2,…,N)是横截面上的N个随机变量；若固定i不变，y.t,(t=1,2,…,T)是纵剖面上的一个时间序列（个体）。利用面板数据建立模型的好处：（1）由于观测值的增多，可以增加估计量的抽样精度。（2）对于固定效应模型能得到参数的一致估计量，甚至有效估计量。（3）面板数据建模比单截面数据建模可以获得更多的动态信息。1．面板数据定义对于面板数据yit,i=1,2,…,N;t=1,2,…,T，如果每个个体在相同的时期内都有观测值记录，则称此面板数据为平衡面板数据（balancedpaneldata）。若面板数据中的个体在相同时期内缺失若干个观测值，则称此面板数据为非平衡面板数据（unbalancedpaneldata）。案例1（file:5panel02）：1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费（CP）和人均收入（IP）数据。数据是7年的，每一年都有15个数据，共105组观测值。人均消费和收入两个面板数据都是平衡面板数据，各有15个个体。安徽河北江苏内蒙古山西19961998200020020200040006000800010000120001996199719981999200020012002199619992002安徽河北江苏内蒙古山西020004000600080001000012000安徽北京福建河北黑龙江吉林江苏江西辽宁内蒙古山东上海山西天津浙江安徽河北江苏内蒙古山西1996199920020200040006000800010000120001400019961997199819992000200120021996199820002002安徽福建黑龙江江苏辽宁山东山西浙江02000400060008000100001200014000安徽北京福建河北黑龙江吉林江苏江西辽宁内蒙古山东上海山西天津浙江15个省级地区的人均收入序列1．面板数据定义用CP表示消费，IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。15个地区7年人均消费对收入的面板数据散点图见图6和图7。图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图7中每一种符号代表一个年度的截面散点图（共7个截面）。相当于观察7个截面散点图的叠加。1．面板数据定义用CP表示消费，IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。15个地区7年人均消费对收入的面板数据散点图见图6和图7。图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图7中每一种符号代表一个年度的截面散点图（共7个截面）。相当于观察7个截面散点图的叠加。2000300040005000600070008000900010000110002000400060008000100001200014000CP_IAHCP_IBJCP_IFJCP_IHBCP_IHLJCP_IJLCP_IJSCP_IJXCP_ILNCP_INMGCP_ISDCP_ISHCP_ISXCP_ITJCP_IZJIP_I2000300040005000600070008000900010000110002000400060008000100001200014000IPCROSSCP1996CP1997CP1998CP1999CP2000CP2001CP2002IP1．面板数据定义2000300040005000600070008000900010000110002000400060008000100001200014000IPCROSSCP1996CP1997CP1998CP1999CP2000CP2001CP2002IP图6对数的人均消费对收入的面板数据散点图7.88.08.28.48.68.89.09.29.48.08.28.48.68.89.09.29.49.6LOG(IPCROSS)LOG(CP1996)LOG(CP1997)LOG(CP1998)LOG(CP1999)LOG(CP2000)LOG(CP2001)LOG(CP2002)图7对数的人均消费对收入的面板数据散点图本例用对数研究更合理Filepanel02c面板数据模型与应用1．面板数据定义为了观察得更清楚，图8给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出，无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图9给出该15个省级地区1996和2002年的消费对收入散点图。6年之后15个地区的消费和收入都有了相应的提高。2000300040005000600070008000900010000110002000400060008000100001200014000cp_bjcp_nmgIP_I2000300040005000600070008000900010000110002000400060008000100001200014000CP_1996CP_2002IP_T15.2.1混合模型如果一个面板数据模型定义为，yit=+Xit'+uit,i=1,2,…,N;t=1,2,…,T(15-1)其中yit为被解释变量（标量），表示截距项，Xit为k1阶解释变量列向量（包括k个解释变量），为k1阶回归系数列向量（包括k个回归系数），uit为随机误差项（标量），其中i=1,2,…,N，N表示面板数据中的个体数。t=1,2,…,T，T表示面板数据中时间的长度。则称此模型为混合模型（Pooledmodel）。混合模型的特点是无论对任何个体和截面，回归系数和都是相同的。如果模型是正确设定的，解释变量Xit与误差项uit不相关，即Cov(Xit,uit)=0。那么无论是N，还是T，模型参数的混合最小二乘估计量（PooledOLS）都是一致估计量。15.2.2固定效应模型固定效应模型（fixedeffectsmodel）分为3种类型，即个体固定效应模型、时间固定效应模型和个体时间双固定效应模型。1．个体固定效应模型（entityfixedeffectsmodel）如果一个面板数据模型定义为，yit=i+Xit'+uit,i=1,2,…,N;t=1,2,…,T(15-2)其中yit为被解释变量（标量），Xit为k1阶解释变量列向量（包括k个回归量），i是随机变量，表示对于i个个体有i个不同的截距项，且其变化与Xit有关系；为k1阶回归系数列向量，对于不同个体回归系数相同，uit为随机误差项（标量），则称此模型为个体固定效应模型。个体固定效应模型（15-2）的强假定条件是，在给定每个个体的条件下随机误差项uit的期望为零。E(uiti,Xit)=0,i=1,2,…,N(15-3)i作为随机变量描述不同个体建立的回归函数间的差异。因为i是不可观测的，且与可观测的解释变量Xit的变化相联系，所以称式（15-2）为个体固定效应模型。2．面板数据模型分类2.2.1个体固定效应模型（entityfixedeffectsmodel）对于个体固定效应模型，个体效应i未知，E(iXit)随Xit而变化，但不知怎样与Xit变化，所以E(yitXit)不可识别。对于短期面板数据，个体固定效应模型是正确设定的，的混合OLS估计量不具有一致性。下面解释设定个体固定效应模型的原因。假定有面板数据模型yit=0+1xit+2zi+it,i=1,2,…,N;t=1,2,…,T(5)其中0为常数，不随时间、截面变化；zi表示随个体变化，但不随时间变化的难以观测的变量。对于个体固定效应模型，个体效应i未知，E(iXit)随Xit而变化，但不知怎样与Xit变化，所以E(yitXit)不可识别。对于短期面板数据，如果个体固定效应模型是正确设定的，那么的混合OLS估计量不具有一致性。相应解释见15.3.1节。但是对个体固定效应模型可以识别边际效应。=E(yiti,Xit)/Xit个体固定效应模型的估计方法有多种，首先设法除去i的影响，从而保证估计量的一致性。（详见第15.3节）下面解释设定个体固定效应模型的原因。假定有面板数据模型yit=0+1xit+2zi+uit,i=1,2,…,N;t=1,2,…,T(15-5)其中0为常数，不随时间、截面变化；zi表示随个体变化，但不随时间变化的难以观测的变量。以案例15-1为例，“省家庭平均人口数”就是符合这种要求的一个解释变量。对于短期面板来说，这是一个基本不随时间变化的量，但是对于不同的省份，这个变量的值是不同的。上述模型可以被解释为含有N个截距，即每个个体都对应一个不同截距的模型。令i=0+2zi，于是式（15-5）变为yit=i+1xit+uit,i=1,2,…,N;t=1,2,…,T(15-6)以案例1（file:5panel02）为例得到的个体固定效应模型估计结果如下：输出结果的方程形式是tLncp1=ˆ安徽+1ˆLnip1t=(0.6878–0.0039)+0.89Lnip1t(5.4)(60.6)tLncp2=ˆ北京+1ˆLnip2t=(0.6878+0.0821)+0.89Lnip2t(5.4)(60.6)。。。tLncp15=ˆ浙江+1ˆLnip15t=(0.6878+0.0434)+0.89Lnip15t(5.4)(60.6)R2=0.9937,SSEr=