•问题和动机–遗漏重要变量或有明确的非观测效应–动态效应•原理–离差消除不可观测效应–综合利用截面和时间序列信息•方法•例子第八章面板数据模型(PanelData)一.面板数据定义面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面上看,是由若干个体在某一时刻构成的截面观测值,从纵剖面上看是一个时间序列。面板数据用双下标变量表示。例如Yit,i=1,2,…,n;t=1,2,…,Tn表示面板数据中含有n个个体。T表示时间序列的最大长度。若固定t不变,Yi.,(i=1,2,…,n)是横截面上的n个随机变量;若固定i不变,Y.t是纵剖面上的一个时间序列。基本模型1,...n;1,...ititititTYX横截面对Y的干扰混合影响,itititiiiitititititiYXWYXW:截距项随机的模型可以改写为其中随机效应模型(RandomEffect)固定效应模型(FixedEffect或LSDV)(1)(2),ititiitiiittYX截距项模型模型非随机的由截距项体现个体差异二.固定效应模型(1)(2),ititiitiiittYX截距项模型模型非随机的对模型(1)***)()(itiitktkXXYEXEYX当时从不同的个体来看()()itktikEYEY不同个体的差异与t无关对同一个个体:()()0itisiiEYEY同一个体在不同时期没有差异。对模型(2)***)()(itiittktktXXYEXEYX当时从不同的个体来看()()itktikEYEY不同个体的差异与t无关对同一个体不同时期:()()itistsEYEY同一个体在不同时期有差异。()())()(itkskitsEYEY对不同个体不同时期:不同个体不同时期有差异。2()()(,)00aritititksikVECovts1.关于it2.对固定效应的模型(1)设定和估计ititiitYX(1)设定(不含截距项,引进n个虚拟变量)11...itititnitnitYDDX10itkikDik(2)估计①OLS,ML估计(只要满足古典假设)YD1D2…DnXOLS②分块估计(克服n太大)思路:先估计())(ititititititYXYXititiitYXiitititYX得..2.()()()ˆititiiititiitXYXYXX再估计i..ˆˆiiiYX方差的估计量为:2.2()(1)ˆitiitntnee(3)设定检验0121:...:nHH至少有一个不等基本模型固定影响模型线性约束检验(有n-1个约束方程)1(1)//nntneeeeFee基固固-=00(1,1),(1,1),nntnnntnFFHFFH若拒若接不选基本模型不拒基本模型注:对含截距项模型,设定时引进n-1个虚拟变量。22...itititnitnitYDDX+3.对固定效应的模型(2)设定和估计ititiittYX(1)设定(不含截距项,引进n+T-1个虚拟变量)1212......itititnititTitnitTYDDHHX10itkikDik10itstsHts含截距项,引进n+T-2个虚拟变量:2222......itititnnititTititTYDDHHX(2)估计①OLS,ML估计(只要满足古典假设)②分块估计(3)设定检验(不含截距项)012:...023...nTH若接受,则选基本模型说明:用模型(2)比较少。因为引进变量太多,参数估计太多,自由度减少。一般刻画时间上的差异时直接引进t。,itititiiiitititititiYXWYXW:截距项随机的模型可以改写为其中三.随机效应模型(RandomEffect)1.模型2.假定2()0()(,)()0iiikikiikEVarCovEX与回归量无关2()0()(,)()0iititksitksitikksEVarCovEX与回归量无关(,)0,ititiiCov无关222()02()(,)()0(,)()()itititksitksitisitisitikwEVarwEwCov关于wit的假定:不同个体无自相关;同一个个体有自相关。3.估计方法OLS,GLS,FGLS,ML等下面利用OLS介绍单位间估计和单位内估计Betweenestimator和withinestimator1.OLS估计量1)(bttXYXXSS()()tititXXSXXXX其中()()tititXYSXYXY11ititXnTX11ititYnTY2.分解(1)单位内估计1)(bitititiuYX...iiiiuYX...)()(ititiiiitXYYX用..()()wititXXiiSXXXX其中..()()wititXYiiSXXXY22.()ˆitinTnkee2.分解(续)(2)单位间估计itititiuYX...iiiiuYX用1)(bbbbXYXXSS..()()bXXiiiSTXXXX其中**2ˆnkee..()()bXYiiiSTXYXY(3)单位内估计和单位间估计的关系tWbXXXXXXSSStWbXYXYXYSSS()twbwbwbbbbFFFFI1()wbwwXXXXXXSSSF1()wbbbXXXXXXSSSF被解释变量:消费支出y单位:元解释变量:纯收入x单位:元一、模型设定例:模型形式:itititxyititiitxyititiitxuy二、样本选自中国农业统计年鉴。各地区农村居民平均每人年生活消费支出及纯收入调用数据库Paneldatatn地区支出合计C纯收入Y20011全国1741.092366.420012北京3552.075025.520013上海4753.235870.8720014浙江3479.174582.3420015天津2050.893947.7220016重庆1475.161971.1820017海南1357.432226.4720018广东2703.363769.7920019湖北1649.182352.16200110内蒙古1554.591973.37200111贵州1098.391411.73200112甘肃1127.371508.61200113青海1330.451557.32200114西藏1123.711404.0120031全国1943.32622.2420032北京4147.35601.5520033上海5669.576653.9220034浙江4285.135389.0420035天津2319.524566.0120036重庆1583.312214.5520037海南1644.792588.0620038广东2927.354054.5820039湖北1801.632566.76200310内蒙古1770.562267.65200311贵州1185.171564.66200312甘肃1336.851673.05200313青海1563.151794.13200314西藏1030.131690.76regcySource|SSdfMSNumberofobs=28-------------+------------------------------F(1,26)=334.40Model|39023851.2139023851.2ProbF=0.0000Residual|3034192.7226116699.72R-squared=0.9279-------------+------------------------------AdjR-squared=0.9251Total|42058043.9271557705.33RootMSE=341.61------------------------------------------------------------------------------c|Coef.Std.Err.tP|t|[95%Conf.Interval]-------------+----------------------------------------------------------------y|.7618886.04166418.290.000.676247.8475302_cons|-97.14473142.288-0.680.501-389.6219195.3325------------------------------------------------------------------------------3.模型结果展示:xtregcy,feFixed-effects(within)regressionNumberofobs=28Groupvariable(i):nNumberofgroups=14R-sq:within=0.8741Obspergroup:min=2between=0.9297avg=2.0overall=0.9279max=2F(1,13)=90.28corr(u_i,Xb)=-0.4641ProbF=0.0000------------------------------------------------------------------------------c|Coef.Std.Err.tP|t|[95%Conf.Interval]-------------+----------------------------------------------------------------y|.8705306.09161949.500.000.6725991.068462_cons|-427.7829279.5395-1.530.150-1031.691176.1256-------------+----------------------------------------------------------------sigma_u|376.41335sigma_e|105.18229rho|.92757256(fractionofvarianceduetou_i)------------------------------------------------------------------------------Ftestthatallu_i=0:F(13,13)=20.10ProbF=0.0000xtregcy,reRandom-effectsGLSregressionNumberofobs=28Groupvariable(i):nNumberofgroups=14R-sq:within=0.8741Obspergroup:min=2between=0.9297avg=2.0overall=0.9279max=2Randomeffectsu_i~Ga