中级计量经济学436第11章面板数据模型11.1面板数据模型概述11.1.1面板数据的含义面板数据(paneldata)也称平行数据,或时间序列截面数据(timeseriesandcrosssectiondata)或混合数据(pooldata),是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。面板数据从横截面上看,是由若干个体在某一时刻构成的截面观测值,从纵剖面上看是一个时间序列。面板数据用双下标变量表示。例如yit,i=1,2,…,N;t=1,2,…,T表示在横截面i时间t上取值。N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,yi.(i=1,2,…,N)是横截面上的N个个体截面数据序列;若固定i不变,y.t(t=1,2,…,T)是纵剖面上的一个时间序列(个体),如图11.1.1所示。图11.1.1面板数据示意图例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据yit,i=1,2,…,N;t=1,2,…,T来说,如果从横截面上看,每个变量都有观第11章面板数据模型437测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balancedpaneldata)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalancedpaneldata)。例11.1.11996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表11.1.1和表11.1.2。数据是7年的,每一年都有15个数据,共105组观测值。表11.1.11999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996199719981999200020012002CP-AH(安徽)3282.4663646.1503777.4103989.5814203.5554495.1744784.364CP-BJ(北京)5133.9786203.0486807.4517453.7578206.2718654.43310473.12CP-FJ(福建)4011.7754853.4415197.0415314.5215522.7626094.3366665.005CP-HB(河北)3197.3393868.3193896.7784104.2814361.5554457.4635120.485CP-HLJ(黑龙江)2904.6873077.9893289.9903596.8393890.5804159.0874493.535CP-JL(吉林)2833.3213286.4323477.5603736.4084077.9614281.5604998.874CP-JS(江苏)3712.2604457.7884918.9445076.9105317.8625488.8296091.331CP-JX(江西)2714.1243136.8733234.4653531.7753612.7223914.0804544.775CP-LN(辽宁)3237.2753608.0603918.1674046.5824360.4204654.4205402.063CP-NMG(内蒙古)2572.3422901.7223127.6333475.9423877.3454170.5964850.180CP-SD(山东)3440.6843930.5744168.9744546.8785011.9765159.5385635.770CP-SH(上海)6193.3336634.1836866.4108125.8038651.8939336.10010411.94CP-SX(山西)2813.3363131.6293314.0973507.0083793.9084131.2734787.561CP-TJ(天津)4293.2205047.6725498.5035916.6136145.6226904.3687220.843CP-ZJ(浙江)5342.2346002.0826236.6406600.7496950.7137968.3278792.210资料来源:《中国统计年鉴》1997-2003。表11.1.21999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格)地区人均收入1996199719981999200020012002IP-AH(安徽)4106.2514540.2474770.4705178.5285256.7535640.5976093.333IP-BJ(北京)6569.9017419.9058273.4189127.9929999.70011229.6612692.38IP-FJ(福建)4884.7316040.9446505.1456922.1097279.3938422.5739235.538中级计量经济学438IP-HB(河北)4148.2824790.9865167.3175468.9405678.1955955.0456747.152IP-HLJ(黑龙江)3518.4973918.3144251.4944747.0454997.8435382.8086143.565IP-JL(吉林)3549.9354041.0614240.5654571.4394878.2965271.9256291.618IP-JS(江苏)4744.5475668.8306054.1756624.3166793.4377316.5678243.589IP-JX(江西)3487.2693991.4904209.3274787.6065088.3155533.6886329.311IP-LN(辽宁)3899.1944382.2504649.7894968.1645363.1535797.0106597.088IP-NMG(内蒙古)3189.4143774.8044383.7064780.0905063.2285502.8736038.922IP-SD(山东)4461.9345049.4075412.5555849.9096477.0166975.5217668.036IP-SH(上海)7489.4518209.0378773.10010770.0911432.2012883.4613183.88IP-SX(山西)3431.5943869.9524156.9274360.0504546.7855401.8546335.732IP-TJ(天津)5474.9636409.6907146.2717734.9148173.1938852.4709375.060IP-ZJ(浙江)6446.5157158.2887860.3418530.3149187.28710485.6411822.00资料来源:《中国统计年鉴》1997-2003。人均消费和收入的面板数据从纵剖面观察分别见图11.1.2和图11.1.3。从横截面观察分别见图11.1.4和图11.1.5。用CP表示消费,IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。2000300040005000600070008000900010000110001996199719981999200020012002CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ20004000600080001000012000140001996199719981999200020012002IPAHIPBJIPFJIPHBIPHLJIPJLIPJSIPJXIPLNIPNMGIPSDIPSHIPSXIPTJIPZJ图11.1.215个省市人均消费序列(纵剖面)图11.1.315个省市人均收入序列第11章面板数据模型43920004000600080001000012000140002468101214CP1996CP1997CP1998CP1999CP2000CP2001CP200220004000600080001000012000140002468101214IP1996IP1997IP1998IP1999IP2000IP2001IP2002图11.1.415个省市人均消费散点图图11.1.515个省市人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的消费值)(每条连线表示同一年度15个地区的收入值)15个地区7年人均消费对收入的面板数据散点图见图11.1.6和图11.1.7。图11.1.6中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图11.1.7中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。2000300040005000600070008000900010000110000400080001200016000IP(1996-2002)CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ图11.1.6用15个时间序列表示的人均消费对收入的面板数据中级计量经济学440200040006000800010000120002000400060008000100001200014000IP(1996-2002)CP1996CP1997CP1998CP1999CP2000CP2001CP2002图11.1.7用7个截面表示的人均消费对收入的面板数据(7个截面叠加)图11.1.8给出北京和内蒙古1996-2002年消费对收入散点图。图11.1.9给出15个省级地2年的消费对收入散点图。区1996和200图11.1.8北京和内蒙古1996-2002年消费对收入时序图图11.1.91996和2002年地区消费对收入散点图11.1.2面板数据模型的基本类型我们把建立在面板数据基础上的计量经济模型称为面板数据模型。设yit为被解释变量在横截面jitit面i和时间t上的随机误差项;bji为第i截面上的第j个解释变量的模型参数;ai为常数项2,…,N;时间长度为t=1,2,…,T。其中,N表示个体截面成员的个数,T表示每个截面成员的观测时期总数,k表示解释变量的个数。则单方程面板数据模型的(分量)一般形式可i和时间t上的数值,x为第j个解释变量在横截面i和时间t上的数值,u为横截或截距项,代表第i横截面(第i个体的影响);解释变量数为j=l,2,…,k;截面数为i=1,写成:(Ni,,2,1L=;Tt,,2,1L=itkitkiitiitiiituxbxbxbay+++++=L2211)(11.1.1)若记:为itx=),,,(21kitititxxxLk×1为解释变量,为系数向量,为随机误差项,满足相互独立、零均值、同方差为的假设。式(11.1.1)为单方程面板ib=),,,(21′kiiibbbL1×kitu2uσ第11章面板数据模型441数据模型的一般形式。则上式也可写成:iitay=+iitbx+itu,NiL,1=,TtL,1=(11.1.2)进一步,若记第i截面样本数据为:⎠⎞⎜⎜⎜⎜⎝⎛iTiyyyM2,⎛kiTkikiiTiiiTixxxxxxxxxLLLLLLL2122212121,,并记:,,,,则面板数据模型的一般形式也可写为:iy=⎟⎟⎟⎟⎟⎜i1⎜i11ix=⎟⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎝=⎟⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎜⎝⎛iTiixxxM21iu=⎟⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎜⎝⎛iTiiuuuM21⎟⎟⎟⎟⎟⎠