面板数据模型与stata软件的应用•一、什么是面板数据•二、面板数据模型的优势•三、面板模型的估计方法:FE和RE•四、stata软件简介•五、如何用stata估计面板模型:案例分析一、面板数据类型•时间维度+截面维度•如我们在分析中国各省份的经济增长时,共有31个截面,每个截面都取1979-1998共20年的数据,共有620个观察值,这是一个典型的平行面板数据•上市公司财务数据,研究一段时期内(1998-2008)上市公司股利的发放数额与股票账面价值之间的关系,共有20×11=220个观测值•强调经济理论基础、强调微观行为基础表11996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996199719981999200020012002CP-AH(安徽)3282.4663646.1503777.4103989.5814203.5554495.1744784.364CP-BJ(北京)5133.9786203.0486807.4517453.7578206.2718654.43310473.12CP-FJ(福建)4011.7754853.4415197.0415314.5215522.7626094.3366665.005CP-HB(河北)3197.3393868.3193896.7784104.2814361.5554457.4635120.485CP-HLJ(黑龙江)2904.6873077.9893289.9903596.8393890.5804159.0874493.535CP-JL(吉林)2833.3213286.4323477.5603736.4084077.9614281.5604998.874CP-JS(江苏)3712.2604457.7884918.9445076.9105317.8625488.8296091.331CP-JX(江西)2714.1243136.8733234.4653531.7753612.7223914.0804544.775CP-LN(辽宁)3237.2753608.0603918.1674046.5824360.4204654.4205402.063CP-NMG(内蒙古)2572.3422901.7223127.6333475.9423877.3454170.5964850.180CP-SD(山东)3440.6843930.5744168.9744546.8785011.9765159.5385635.770CP-SH(上海)6193.3336634.1836866.4108125.8038651.8939336.10010411.94CP-SX(山西)2813.3363131.6293314.0973507.0083793.9084131.2734787.561CP-TJ(天津)4293.2205047.6725498.5035916.6136145.6226904.3687220.843CP-ZJ(浙江)5342.2346002.0826236.6406600.7496950.7137968.3278792.210表2上市公司的投资与股票账面价值:N=20,T=4面板数据模型和stata软件应用•二、面板数据模型有以下几个优点:•第一,PanelData模型可以通过设置虚拟变量对个别差异(非观测效应)进行控制;•第二,PanelData模型通过对不同横截面单元不同时间观察值的结合,增加了自由度,减少了解释变量之间的共线性,从而改进了估计结果的有效性;•第三,PanelData模型是对同一截面单元集的重复观察,能更好地研究经济行为变化的动态性举例•交通死亡率与酒后驾车人数(一段时间内江苏省各市)•其他的非观测(潜在)因素:南京与苏州•汽车本身状况•道路质量•当地的饮酒文化•单位道路的车辆密度•非观测效应导致估计结果不准确,面板数据可以控制和估计非观测效应•面板数据模型形式:•其中,i=1,2,3...N,截面标示;t=1,2,...T,时间标示;xit为k×1解释变量,β为k×1系数列向量•对于特定的个体i而言,ai表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯、地区的经济结构,法律和产权制度等,一般称其为“个体效应”(individualeffects)itiitityxuiitu•面板数据模型的误差项由两部分组成:•一部分是与个体观察单位有关的,它概括了所有影响被解释变量,但不随时间变化的因素,因此,面板数据模型也常常被成为非观测效应模型;•另外一部分概括了随截面随时间而变化的不可观测因素,通常被成为特异性误差或特异扰动项北京江苏GDPX(Invest、edu)北京江苏省山西省山西基础设施更加完善,受教育程度较好、经济结构以服务业为主、法制更健全面板模型选择:固定效应还是随机效应•对“个体效应”的处理主要有两种方式:一种是视其为不随时间改变的固定性因素,相应的模型称为“固定效应”模型;另一种是视其为随机因素,相应的模型称为“随机效应”模型•固定效应模型中的个体差异反映在每个个体都有一个特定的截距项上;•随机效应模型则假设所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上•FE(FixedEffects)Model•RE(RandomEffects)Model•其中,是截距中的随机变量部分,代表个体的随机影响itiitityxu(Replacewithdummyvariables)ititiityxui固定效应模型•1、例如,在研究财政支出与经济增长的关系,运用全国的时间序列数据来检验财政支出与经济增长的关系可能存在设定误差并且受统计资料的制约,仅用时间序列资料不能够满足大样本的要求•同时,由于我国不同地区的体制变革和财政政策的不断调整,造成各个地区财政支出结构随时间而不断变化•面板数据(PanelData)从某种程度上克服了这一困难。考虑到中国各省份财政支出结构与经济增长的关系存在明显的地区差异,从时间序列的角度,考虑各省差异的动态性,是面板数据模型的优势•例如,在研究中国地区经济增长的过程中,以全国28个省区为研究对象,可以认为这28个省区几乎代表了整个总体•同时假设在样本区间内,各省区的•经济结构•人口素质•等不可观测的特质性因素是固定不变的,因此采用固定效应模型是比较合适的ititiityxu•2、而当我们研究某个县市居民的消费行为时,由于样本数相对于江苏省几千万人口是个很小的样本,此时,可以认为个体居民在个人能力、消费习惯等方面的差异是随机的,采用随机效应模型较为合适•随机效应模型:•RE认为个体的差异是随机的,其中•非观测的个体差异效应与随机扰动项一样都是随机变量i随机效应模型•总结:如果把非观测效应看做是各个截面或个体特有的可估计参数,并且不随时间而变化,则模型为固定效应模型;•如果把非观测效应看作随机变量,并且符合一个特定的分布,则模型为随机效应模型•3、在实证分析中,一般通过hausman检验判断:由于随机效应模型把个体效应设定为干扰项的一部分,所以就要求解释变量与个体效应不相关,而固定效应模型并不需要这个假设条件•因此,我们可以通过检验该假设条件是否满足,如果满足,那么就应该采用随机效应模型,反之,就需要采用固定效应模型•Hausman检验的基本思想是:在固定效应u_i和其他解释变数不相关的原假设下,用OLS估计的固定效应模型和用GLS估计的随机效应模型的参数估计都是一致的。反之,OLS是一致的,但GLS则不是•因此,在原假设下,二者的参数估计应该不会有系统的差异,我们可以基于二者参数估计的差异构造统计检验量。如果拒绝了原假设,我们就认为选择固定效应模型是比较合适的。四、stata软件简介•STATA软件估计与应用:•打开数据库:•useE:\ProgramFiles\Stata10.0绿色软件\Stata10\东部.dta“•或者重新输入数据:edit•相关系数:corgdpinvesteduscihealth•简单回归:regressgdpinvestculturesci•无常数:regressgdpinvestculturesci,noconstant估计结果_cons5.392943.442051912.200.0004.5227076.263179sci.5570057.051000710.920.000.4566044.6574071culture.7163308.061374111.670.000.595508.8371536invest-.1601206.0491087-3.260.001-.2567974-.0634438gdpCoef.Std.Err.tP|t|[95%Conf.Interval]Total321.6449042781.15699606RootMSE=.40069AdjR-squared=0.8612Residual44.1514867275.160550861R-squared=0.8627Model277.493418392.4978059ProbF=0.0000F(3,275)=576.13SourceSSdfMSNumberofobs=279回归诊断:•是否存在异方差:estathettest•怀特检验:estatimtest,white•回归信息检验:estatimtest•是否遗漏重要解释变量:estatovtest•拟合图:rvfplot•单一变量的相关图:cprplotinvest画图•菜单与命令结合•twoway(scattergdpinvest)•twoway(scattergdpinvest||lfitgdpinvest)14161820101112131415investgdpFittedvalues基本建设支出与GDP的相关关系图1112131415edu19982000200220042006tsheng=1/sheng=16/sheng=31sheng=2/sheng=17sheng=3/sheng=18sheng=4/sheng=19sheng=5/sheng=20sheng=6/sheng=21sheng=7/sheng=22sheng=8/sheng=23sheng=9/sheng=24sheng=10/sheng=25sheng=11/sheng=26sheng=12/sheng=27sheng=13/sheng=28sheng=14/sheng=29sheng=15/sheng=30各省教育支出的增长趋势:1998-2006•Durbin-Watson统计量:estatdwatson•序列相关检验:estatdurbinalt•滞后阶数选择:estatdurbinalt,lags(2)•条件异方差检验:estatarchlm,lags(2)•可选变量的异方差检验:estatszroetergdpinvestculturesci五、Stata对面板数据模型的估计Ftestthatallu_i=0:F(30,242)=84.32ProbF=0.0000rho.9665285(fractionofvarianceduetou_i)sigma_e.10968166sigma_u.58939133_cons7.803601.223706834.880.0007.362948.244262techno.1295416.0338613.830.000.0628417.1962414admin.1338125.04107463.260.001.0529032.2147218health.5850135.0630579.280.000.4608028.7092242sci-.1969175.0551996-3.570.000-.3056506-.0881845culture.0649198.03436451