短面板数据分析的基本程序方红生浙江大学经济学院2013年秋参考书计量经济学导论第四版(伍德里奇)中文版或英文版用Stata学计量经济学高级计量经济学及stata应用(陈强)内容安排第1讲短面板数据分析第2讲长面板数据分析(PPT第3讲内生性与工具变量法第4讲动态面板数据模型第5讲双重差分模型及其应用第6讲基于DID的权威文献做对了吗?(学生报告与讨论)第7讲PSMDID第8讲如何识别核心变量的作用机制?短面板数据面板数据(paneldata)是同时在时间和截面上取得的二维数据,也称时间序列与截面混合数据(pooledtimeseriesandcrosssectiondata)。是在一段时间内跟踪同一组个体的数据。既有横截面的维度(n个个体),又有时间维度(T个时期)。Stata中面板数据结构companyyearinvestmvalue11951755.9483311952891.24924.9119531304.46241.7119541486.75593.621951588.22289.521952645.52159.4219536412031.321954459.32115.531951135.21819.431952157.32079.731953179.52371.631954189.62759.9regioncodeyearrgdpinflation北京12000北京12001北京12002北京12003北京12004北京12005北京12006北京12007北京12008天津22000天津22001短面板:NT;反之为长面板。平衡面板数据(balancedpaneldata):如果每个个体在相同的时间内都有观测值记录。Foranyi,thereareTobservations.非平衡面板数据(unbalancedpanel):Tmaydifferentoveri.Benefitsofpaneldataanalysisittiititititituperinckunratespirconsbeertaxatal43210fusetraffic.dtades第一步:构造计量模型面板数据模型非观测效应模型(unobservedeffectsmodel)固定效应模型(FixedEffectsModel,FE)随机效应模型(RandomEffectsModel,RE)混合回归模型(PooledRegressionModel)固定效应模型(FixedEffectsModel,FE)则为固定效应模型与某个解释变量相关,如果为不可观测的个体效应其中iiitiitTtniuxuu,...,1;,...1yit随机效应模型(RandomEffectsModel,RE),则为随机效应模型与所有解释变量不相关如果为不可观测的个体效应其中iiitiitTtniuxuu,...,1;,...1yit混合回归模型(PooledRegressionModel)Ttnixitit,...,1;,...1y,0uiti为混合回归模型:即不存在个体效应,则如果模型的估计固定效应模型固定效应变换(FixedEffectsTransformation)(组内变换)(WithinTransformation)LSDV(LeastSquareDummyVariable(式1)给定第i个个体,将(式1)两边对时间取平均可得,(式2)固定效应变换itiititXY1iiiiXY1(式1)–(式2)得:可以用OLS方法估计β,称为“固定效应估计量”(FixedEffectsEstimator),记为ˆFE由于主要使用了每个个体的组内离差信息,故也称为“组内估计量”(withinestimator)。ˆFE令,则Stata命令xtreg,fexi:xtregi.year,feLSDV(LeastSquareDummyVariable)基本思想:将不可观测的个体效应ai看做待估计的参数,ai就是第i个个体的截距。估计n个截距的方法就是引入n−1个虚拟变量(如果省略常数项,则引入n个虚拟变量)。例如:共有7个州,方程可以写成:01112233445566ititiYXDDDDDDu7个州的回归线斜率相同,但截距不同。第1个州的截距是:第2个州的截距是:第3个州的截距是:第4个州的截距是:10201302403Stata命令xi:regi.codexi:regi.codei.year随机效应模型估计GLSTheusualpooledOLScangiveconsistentestimators,butasitsstandarderrorsignorethepositiveserialcorrelationinthecompositeerrorterm,theywillbeincorrect.itiitstisit),/(),(Corr222Solution:GLStransformationtoeliminatetheserialcorrelation)()(...)()1(y1110itiitikitkkiitixxxxy:TheseestimatorscanbebasedonthepooledOLSorfixedeffectsresiduals.RandomEffectsEstimator:ThefeasibleGLSestimatorthatusesinplaceofRE,FEandPLSPooledOLS:FixedEffectsEstimator:(相对重要时)不重要时相对,FEREOLSEii,1)u(R001Stata命令xtreg,rexi:xtregi.year,re进一步的解释heteroscedasticityconsistentor“White”standarderrorsareobtainedbychoosingoptionvce(robust)whichisavailableformostestimationcommands.Stata’sestimationcommandswithoptionrobustalsocontainacluster()optionanditisthisoptionwhichallowsthecomputationofso-calledRogersorclusteredstandarderrors.ButWhileallthesetechniquesofestimatingthecovariancematrixarerobusttocertainviolationsoftheregressionmodelassumptions,theydonotconsidercross-sectionalcorrelation.However,duetosocialnormsandpsychologicalbehaviorpatterns,spatialdependencecanbeaproblematicfeatureofanymicroeconometricpaneldatasetevenifthecross-sectionalunits(e.g.individualsorfirms)havebeenrandomlyselected.**引入了时间虚拟变量导致exper消失第2步:描述性统计变量解释与变量的描述性统计usetraffic.dtaxtsetstateyearsumfatalbeertaxspirconsunrateperinck关键变量与被解释变量的散点图并画出回归直线twoway(scatterfatalbeertax)(lfitfatalbeertax)PLSorFEtabyear,gen(year)1.xtregfatalbeertaxspirconsunrateperinckyear2-year7,fe这里误差项可能存在自相关、异方差和截面相关问题,所以F检验显示的结果可能不可靠,所以严格的话,首先要检验是否存在截面相关问题,命令如下:xtcsd,pesxtcsd,frixtcsd,fre第3步:模型选择TestingforCross-sectionalDependencextcsd短面板xttest2长面板xtcsdisapostestimationcommandvalidforuseafterrunninganFEorREmodel.xtcsdcanalsoperformPesaran’sCDtestforunbalancedpanels.PLSorFE在使用命令“xtreg,fe”时,如果不加选项cluster(state),则输出结果还包含一个F检验,其原假设为“H0:allui=0”,即混合回归是可以接受的。2.xi:xtsccfatalbeertaxspirconsunrateperinckyear2-year7i.state对州虚拟变量做F检验如果不存在截面相关,则xi:regfatalbeertaxspirconsunrateperinckyear2-year7i.state,cluster(state)对州虚拟变量做F检验PLSorRExtregfatalbeertaxspirconsunrateperinckyear2-year7,rexttest0/xttest1(AR(1))PLSorREFEorREHausmantest1xtregfatalbeertaxspirconsunrateperinckyear2-year7,feeststoreFExtregfatalbeertaxspirconsunrateperinckyear2-year7,rehausmanFE,sigmamoreHausman检验:基本思想:如果,Fe和Re都是一致的,但Re更有效。如果,Fe仍然一致,但Re是有偏的。因此:如果原假设成立,则FE与RE估计量将共同收敛于真实的参数值,反之,两者的差距过大,则倾向于拒绝原假设,选择FE(,)0iitCovX(,)0iitCovXFEorRE解决办法:构造一个辅助回归继续基于随机效应估计的自相关检验xtserialfatalbeertaxspirconsunrateperinckyear2-year7Hausmantest2quietlyxtregfatalbeertaxspirconsunrateperinckyear2year3year4year5year6year7,rescalartheta=e(theta)globalyandxforhausmanfatalbeertaxspirconsunrateperinckyear2year3year4year5year6year7sortstateforeachxofvarlist$yandxforhausman{bystate:egenmean`x'=mean(`x')genmd`x'=`x'-mean`x'genred`x'=`x'-theta*mean`x'}quietlyregredfatalredbeertaxredspirconsredunrateredperinckredyear2redyear3redyear4redyear5redyear6redyear7mdbeertaxmdspirconsmdunratemdperinckmdyear2mdyear3mdyear4mdyear5mdyear6mdyear7,vce(clusterstate)testmdbeertaxmdspircons