面板数据模型.总结

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十讲经典面板数据模型一、面板数据(paneldata)一维数据:时间序列数据(crosssectiondata):变量在时间维度上的数据截面数据(timeseriesdata):变量在截面空间维度上的数据)。二维数据:面板数据(同时在时间和截面空间上取得的,也称时间序列截面数据(timeseriesandcrosssectiondata)或混合数据(pooldata)。面板数据=截面数据+时间序列数据。面板数据用双下标变量表示。例如yit,i=1,2,…,N;t=1,2,…,TN表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,yi.,(i=1,2,…,N)是随机变量在横截面上的N个数据;若固定i不变,y.t,(t=1,2,…,T)是纵剖面上的一个时间序列(个体)。平衡面板数据(balancedpaneldata)。非平衡面板数据(unbalancedpaneldata)。例1998-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。表1.中国部分省级地区的居民数据(不变价格,元)居民家庭人均消费(y)居民家庭人均收入(x)地区1998199920002001200219981999200020012002AH(安徽)3777399042044495478447705179525756416093BJ(北京)68077454820686541047382739128100001123012692FJ(福建)5197531555236094666565056922727984239236HB(河北)3897410443624457512051675469567859556747HLJ(黑龙江)3290359738914159449442514747499853836144JL(吉林)3478373640784282499942414571487852726292JS(江苏)4919507753185489609160546624679373178244JX(江西)3234353236133914454542094788508855346329LN(辽宁)3918404743604654540246504968536357976597NMG(内蒙古)3128347638774171485043844780506355036039SD(山东)4169454750125160563654135850647769767668SH(上海)686681268652933610412877310770114321288313184SX(山西)3314350737944131478841574360454754026336TJ(天津)5499591761466904722171467735817388529375ZJ(浙江)623766016951796887927860853091871048611822二、面板数据模型及其作用1.经典面板数据模型建立在古典假定基础上的线性面板数据模型.2.非经典面板数据模型(1)非平稳时间序列问题的面板数据模型(面板数据协整模型)(2)非线性面板数据模型(如面板数据logit模型,面板数据计数模型模型)(3)其他模型(如面板数据分位数回归模型)3.面板数据模型作用(1)描述个体行为差异。(2)PanelData能够提供更多信息、更多变化性、更少共线性、更多自由度和更高效率。反观时间序列经常受多重共线性的困扰。(3)PanelData能够更好地研究动态调节,横截面分布看上去相对稳定但却隐藏了许多变化,PanelData由于包含较长时间,能够弄清诸如经济政策变化对经济状况的影响等问题。(4)PanelData能更好地识别和度量纯时间序列和纯横截面数据所不能发现的影响因素。(5)相对于纯横截面和纯时间序列数据而言,PanelData能够构造和检验更复杂的行为模型。(6)通常,PanelData可以收集到更准确的微观单位(个人、企业、家庭)的情况。由此得到的总体数据可以消去测量误差的影响。尽管PanelData研究的理论和应用发展很快,但目前仍然存在一些问题需要解决。例如,变量设计和收集数据困难;存在测量误差;存在选择性困难;时间序列较短;等等。4.目前有关PanelData的学术专著主要有:1.Analysisofpaneldata/ChengHsiao.1986.2.Econometricanalysisofpaneldata/BadiH.Baltagi.1995.3.TheEconometricsofpaneldata:ahandbookofthetheorywithapplications/Matyas&Sevestre.1996.应用程序软件:stata、EViews。三、经典面板数据模型的参数估计不变系数模型:yit=α+βxit+uit变截距模型:yit=αi+βxit+uit(时间变截距模型?双变模型?)变系数模型:yit=αi+βixit+uit(时间变截距模型?双变模型?)(一)不变系数模型(混合估计模型)如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,即各回归系数不随个体或截面的变化而变化,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数,建立不变系数模型(混合估计模型)。yit=+xit+uit,i=1,2,…,N;t=1,2,…,T和不随i,t变化。称模型为混合估计模型。数据形式变为:地区年份YX安徽省199847703777199951793990200052574204200156414495200260934784…………………浙江省19987860623719998530660120009187695120011048679682002118228792例以表1中15个地区1996和2002年数据建立关于消费的混合估计模型,得结果如下:输出结果1DependentVariable:Y?Method:PooledLeastSquaresIncludedobservations:5Numberofcross-sectionsused:15Totalpanel(balanced)observations:75VariableCoefficientStd.Errort-StatisticProb.C73.8196084.483510.8737750.3851X?0.7614650.01171065.028950.0000R-squared0.983030Meandependentvar5291.773AdjustedR-squared0.982798S.D.dependentvar1745.640S.E.ofregression228.9535Sumsquaredresid3826637.F-statistic4228.764Durbin-Watsonstat0.864366Prob(F-statistic)0.000000ˆ73.820.76itityx15个省级地区的人均支出平均约占收入的76%,自发消费为73.82。(二)变截距模型(variableinterceptmodel)即自变量对因变量的效应(斜率)随个体或时间的变化而变化,而截距项却在不同的个体或时间上有所不同,此时可以建立变截距模型。按照样本数据性质的不同,具体分为固定效应模型和随机效应模型。1.固定效应模型(fixedeffectsregressionmodel)在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型。3种类型:1.个体固定效应模型2.时刻固定效应模型3.时刻个体固定效应模型下面只以个体固定效应模型为例进行介绍。个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型。012ititiityxzu其中,Zi是不随时间变化的潜在变量,不可观察,但与x相联系。上式可以变化为:012021()ititiitiititiitityxzuzxuxu由于i与每一个个体中一个确实存在(但不可观测)的变量有关,所以称为个体固定效应模型。等价于每一个个体有一个方程:y1t=α1+x1t+u1t,i=1(对于第1个个体,或时间序列),y2t=α2+x2t+u2t,i=2(对于第2个个体,或时间序列),…yNt=αN+xNt+uNt,i=N(对于第N个个体,或时间序列),t=1,2,…,T其中it,i=1,2,…,N;t=1,2,…,T,表示随机误差项。yit,xit,i=1,2,…,N;t=1,2,…,T分别表示被解释变量和解释变量。引入虚拟变量Wi=其他个个体如果属于第。,,0,...,2,1,1Nii写为:yit=1xit+α1W1+α2W2+…+αNWN+uit,(t=1,2,…,T)如果满足如下4个假定条件,上述面板数据模型可以用OLS方法估计:(1)E(uit|xi1,xi2,…,xiT,i)=0。以xi1,xi2,…,xiT,i为条件的uit的期望等于零。(2)xit,和uit不相关。(3)不同解释变量之间不存在完全共线性。(4)Cov(uit,uis|xit,xis,i)=0,ts。在固定效应模型中随机误差项uit在时间上是非自相关的。数据结构:地区年份YXDAH…DZJ安徽省199847703777100199951793990100200052574204100200156414495100200260934784100…………………000浙江省19987860623700119998530660100120009187695100120011048679680012002118228792001对模型进行OLS估计,全部参数估计量都是无偏的和一致的。模型的自由度是NT–N–K(k是解释变量个数)例:表1的固定效应模型EViews估计结果:输出结果2DependentVariable:Y?Method:PooledLeastSquaresDate:02/14/06Time:17:18Sample:19982002Includedobservations:5Numberofcross-sectionsused:15Totalpanel(balanced)observations:75VariableCoefficientStd.Errort-StatisticProb.X?0.7041200.01959835.928060.0000FixedEffectsAH--C456.2010BJ--C1091.289FJ--C356.0866HB--C301.8503HLJ--C291.9486JL--C558.2303JS--C445.4530JX--C113.4984LN--C621.1425NMG--C271.5059SD--C344.3550SH--C645.5164SX--C414.0827TJ--C524.0437ZJ--C566.4419R-squared0.993390Meandependentvar5291.773AdjustedR-squared0.991709S.D.dependentvar1745.640S.E.ofregression158.9451Sumsquaredresid1490550.Durbin-Watsonstat2.100731ty1ˆ=ˆ安徽+ˆx1t=456.2+0.704x1tty2ˆ=ˆ北京+ˆx2t=1091.3+0.704x2t……ty15ˆ=ˆ浙江+ˆ

1 / 52
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功