用Stata做面板数据回归•Stata与其他计量软件比较•面板数据的设定•短面板•长面板•面板回归与空间计量目录Stata与其他计量软件比较•SPSS•SAS•Eviews•StataStata与其他计量软件比较•SPSS•界面人性化,基本如Excel,很容易上手•数据文件最多4096个变量•强于统计分析,如方差分析,没有稳健方法,弱于计量分析,缺乏调查数据分析•程序较大,属于统计软件而非真正的计量软件•大块头,小智慧!Stata与其他计量软件比较•SAS•功能强大,可编程,很受高级用户欢迎•可同时处理多个数据文件,处理变量多达32768个,可画出你想要的任何数据分析图•强于方差分析、混合模型分析和多变量分析,弱于有序和Logistic分析、稳健方法和调查数据分析(泊松等分布)•最难掌握!原因:(1)SAS需要自己编制程序来处理和分析数据(2)改正出错程序比较困难•程序占用磁盘非常大,一般2-3G•大块头,大智慧!Stata与其他计量软件比较•Eviews•界面不够人性化,使用前最好熟悉每个命令操作的程序语言•数据处理能力较弱•强于时间序列分析,但其它回归分析(如面板数据等)、数据处理、统计分析较弱•软件小,对内存要求也不高•小块头,小智慧!Stata与其他计量软件比较•Stata•简单易懂、界面像Excel,操作多样化(即可编程,也可鼠标操作)•数据管理能力弱于SAS,一次主要用于一个数据文件,可处理的单个数据文件受内存大小影响,可处理变量达32768个•强于回归分析、Logistic分析和调查数据分析,弱于方差分析和多变量分析•作图功能强大•程序所需磁盘空间小,一两百兆。还有免安装版本,使用极为方便•小块头,大智慧!Stata与其他计量软件比较软件SPSSSASEviewsStata操作难易程度界面人性化最难掌握界面不够人性化简单易懂数据处理能力数据处理能力较弱,最多处理4096个变量可同时处理多个数据文件,处理变量多达32768个,可画出你想要的任何数据分析图数据处理能力较弱主要用于一个数据文件,可处理变量达32768个,作图功能强大强项统计分析,如方差分析方差分析、混合模型分析和多变量分析强于时间序列分析回归分析、Logistic分析和调查数据分析弱项计量分析,调查数据分析有序和Logistic分析、稳健方法和调查数据分析回归分析(如面板数据等)、数据处理、统计分析方差分析和多变量分析程序大小程序较大程序占用磁盘非常大软件小程序所需磁盘空间小面板数据的设定•xtsetpvartvar#设定面板数据•encodex1,gen(x2)#将字符型变量编码为数字型变量•xtdes#显示面板数据结构•xtsum#显示组内、组间与整体的统计指标•xttabvar#显示组内、组间与整体的分布频率•xtlinevar(overlay)#显示每个个体的时序图短面板•混合回归•固定效应•随机效应•Hausman检验•短面板回归基本步骤短面板•短面板回归基本步骤•(1)导入并设定为面板数据。•(2)做固定效应模型,并报告聚类稳健标准误与普通标准误。•(3)做随机效应模型,并报告聚类稳健标准误与普通标准误。•(4)比较两个模型的聚类稳健标准误与普通标准误是否相差较大,并决定采取是否使用辅助回归的Hausman检验。若相差较大则采用辅助回归的Hausman检验,若相差不大则采用传统Hausman检验。•(5)通过Hausman检验,决定采用固定效应模型还是随机效应模型。•(6)报告并分析结果。短面板•混合回归•regyx1x2x3,vce(clusterid)#以“id”为聚类变量的聚类稳健标准误短面板•固定效应•(1)组内估计法(FE)•xtregyx1x2x3,fer#r表示聚类稳健标准误•(2)LSDV法•regyx1x2x3i.id,r#r表示聚类稳健标准误短面板•固定效应•(3)一阶差分法(FD)•xtserialfatalbeertaxspirconsunrateperinck,output•(4)双向固定效应(时间个体固定效应)•tabyear,gen(year)#定义年度虚拟变量•xtregfatalbeertaxspirconsunrateperinckyear2year3year4year5year6year7,fer•testyear2year3year4year5year6year7#检验年度虚拟变量联合显著性•xtregfatalbeertaxspirconsunrateperincki.year,fer#直接估计双向固定效应模型,不必生成时间序列。短面板•随机效应•xtregyx1x2x3,rertheta#随机效应FGLS,theta表示估计随机效应θ值•xtregyx1x2x3,mle#随机效应MLE•xttest0#LM检验,检验是否存在反应个体特性的随机扰动项ui短面板•Hausman检验•传统Hausman检验•xtregyx1x2x3,fe#(固定效应估计)•estimatesstoreFE#(储存结果)•xtregyx1x2x3,re#(随机效应估计)•estimatesstoreRE#(储存结果)•hausmanFERE,constantsigmamore#(Hausman检验)•如果聚类稳健标准误与普通标准误相差较大,则传统Hausman检验不适用。短面板•Hausman检验•辅助回归法•quietlyxtregyx1x2x3,re•scalartheta=e(theta)•globalyandxforhausmanyx1x2x3•sortid•byid:egenmeany=mean(y)•genmdy=y-meany•genredy=y-theta*meany•byid:egenmeanx1=mean(x1)•genmdx1=x1-meanx1•genredx1=x1-theta*meanx1•byid:egenmeanx2=mean(x2)•genmdx2=x2-meanx2•genredx2=x2-theta*meanx2•byid:egenmeanx3=mean(x3)•genmdx3=x3-meanx3•genredx3=x3-theta*meanx3•quietlyregredyredx1redx2redx3mdx1mdx2mdx3,vce(clusterid)•testmdx1mdx2mdx3短面板•Hausman检验•辅助回归法(非官方命令)•sscinstallxtoverid#下载安装xtoverid•quietlyxtregyx1x2x3,rer•xtoverid长面板•长面板的估计策略•面板校正标准误(PCSE)•仅解决组内自相关的FGLS•全面FGLS•组间异方差的检验•组内自相关的检验•组间同期相关的检验•变系数模型长面板•长面板的估计策略•(1)组间异方差:个体i的扰动项方差为σi2,若σi2≠σj2(i≠j),则εit存在“组间异方差”。•(2)组内自相关:若Cov(εit,εis)≠0(t≠s,∀i),则εit存在“组内自相关”。•(3)组间同期相关:若Cov(εit,εjt)≠0(i≠j,∀t),则εit存在“组间同期相关”或“截面相关”。比如,对于省级数据,相邻省份之间的同期经济活动可能通过贸易或投资等相互影响。•解决方法:•(1)使用LSDV估计系数,对标准误差进行校正。•(2)对异方差或自相关具体形式进行假设,然后使用可行广义最小二乘法(FGLS)进行估计。长面板•长面板的基本步骤•(1)检验面板数据是否存在组间异方差、组内自相关和组间同期相关问题•(2)结合检验结果考虑选用面板校正标准误(PCSE)模型、仅解决组内自相关的FGLS模型和全面FGLS模型三种模型的哪一种•(3)检验并判断是否采用变系数模型•(4)综合上述判断结果选择最终模型•(5)报告并分析结果。长面板•面板校正标准误(PCSE)•xtpcseyx1x2x3,hetonly•#hetonly表示存在组间异方差,但不存在组间同期相关;默认为既存在组间异方差,又存在组间同期相关。长面板•仅解决组内自相关的FGLS•xtpcseyx1x2x3,corr(ar1)corr(psar1)•#corr(ar1)对应ρi=ρ,适用于T并不比n大很多的情形;•#corr(psar1)允许每个面板有自己的ρi,适用于T比n大很多的情形。长面板•全面FGLS•全面FGLS同时考虑组间异方差、组内自相关和组间同期相关三个因素。•估计过程为:•(1)进行OLS回归•(2)用OLS回归残差eit来估计εit的协方差矩阵。•(3)进行FGLS估计。或者进行迭代FDLS估计,及使用FGLS的残差在竞选FGLS估计,不断迭代直至收敛。长面板•全面FGLS•xtglsyx1x2x3,panels(option)corr(option)igls•#panels(iid)假定不同个体的扰动项独立同分布•#panels(het)假定不同个体的扰动项相互独立但方差可以不同•#panels(cor)假定不同个体的扰动项同期相关且有不同的方差•#corr(ar1)对应ρi=ρ的组内自相关情形•#corr(psar1)允许每个面板有自己的自回归系数ρi•#igls表示使用迭代式FGLS•##“OLS+面板校正标准误差”最稳健,全面FGLS最有效率,进解决组内自相关的FGLS介于两者之间。使用何种FGLS估计,取决于对组间异方差、组内自相关与组间同期相关的检验。长面板•组间异方差的检验•沃尔德检验•sscinstallxttest3•quietlyxtregyx1x2x3,rfe#xtest3只能在“xtreg,fe”或“xtgls”之后才能使用•xttest3•quietlyxtglsyx1x2x3•xttest3长面板•组内自相关的检验•netinstallst0039或者finditxtserial#下载安装xtserial•xtserialyx1x2x3,output#output表示显示一阶差分回归结果长面板•组间同期相关的检验•LM检验(仅适用于长面板)•sscinstallxttest2•quietlyxtregyx1x2x3,fe#xtest3只能在“xtreg,fe”,“xtgls”或“ivreg2”之后才能使用•xttest2•xtcsd检验(长面板、短面板)•sscinstallxtcsd#只能在xtreg之后才能使用•xtcsd,pesaranabsshow#(Pesaran(2004)的检验,统计量服从标准正态分布)•xtcsd,friedmanabsshow#(Friedman(1937)的检验,统计量服从2分布)•xtcsd,freesabsshow#(Frees(1995,2004)的检验)•#show表示显示残差的相关系数矩阵•#abs表示显示该矩阵非主对角线元素的绝对值之平均长面板•变系数模型•变系数模型可分为将“可变系数”视为常数和随机变量两种。•(1)将可变系数视为常数•部分变系数模型:引入个体虚拟变量以及虚拟变量与变系数解释变量xit的交互项•regyx1x2x3i.idi.id#c.x1t,vce(clusterid)#(c表明x1为连续性变量)•(2)随机系数模型•xtrcyx1x2x3,betas#betas表示显示对每组系数的估计。同时提供了参数稳定性检验面板回归与空间计量•面板回归•相对于截面数据,面板数据考虑了截面数据的共性,又能分析截面数据个体异质性•面板数据通常建立混合模型、固定效应模型和随机效应模型,这三类模型均假设个体(地区或机构)之间相互独立,且不存在时间序列相关•如果模型变量之间存在空间效应,则模型就不服从普通面板计量分析的基本假定。此时需要进一步考虑空间效应•空间计量•在面板模型中引入空间滞后因子,即可建立空间面板模型的一般设定形式。•常见的空间面板模型:空间混合模型、空间个体效应模型、空间固定效应模型、空间随机效应模型、空间动态面板模型和空间似不相关