面板数据的统计分析方法-冯国双

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

面板数据的统计分析方法冯国双主要内容1、面板数据简介2、面板数据的固定效应模型3、面板数据的随机效应模型4、动态面板数据模型5、空间面板数据模型面板数据横断面数据时间序列数据城市手足口报告发病率北京0.78上海6.82重庆2.50哈尔滨0.06郑州5.62广州14.22乌鲁木齐0.24月份手足口报告发病率1月0.782月0.763月6.144月24.715月53.776月67.737月47.268月19.379月15.2810月9.8811月9.1112月3.96面板数据城市1月2月3月4月5月6月7月8月9月10月11月12月北京0.780.766.1424.7153.7767.7347.2619.3715.289.889.113.96上海6.823.1315.4234.3740.9741.3929.948.9210.487.117.197.20重庆2.501.254.5514.2414.2110.505.911.242.063.865.014.52哈尔滨0.060.010.221.133.746.4810.123.701.630.980.520.39郑州5.623.7018.5515.0123.1718.1011.416.963.893.002.321.76广州14.225.1918.0551.1664.4950.3433.6117.1224.3225.578.766.32乌鲁木齐0.240.040.242.0513.5827.1622.519.016.187.325.632.44面板数据(paneldata)面板数据面板数据:同时含有横断面和时间序列的数据对一组固定个体的多次观测数据其它称谓:重复追踪数据纵贯调查数据…………面板数据微观面板数据:主要指个体的重复调查数据,一般个体数N较大,观察时间较短宏观面板数据通常涉及一段时间内国家、省等单位的重复调查数据,观察时间较长面板数据模型面板数据用双下标变量yit表示其中,i=1,2,…,N表示第i个个体,共N个个体t=1,2,…,T表示第t个观测时间,共观测T次yit表示第i个个体在第t时间点的观测值面板数据模型面板数据模型的一般形式αi是截距项i=1,2,…,N(N为个体数)t=1,2,…,T(T为每一个体的观察时点数)K为解释变量个数uit是随机误差项Kkitkitkiituxy1混合模型(一)混合模型(pooledmodel)α表示对所有个体都有一个相同的截距项。Kkitkitkituxy1混合模型城市城市代码月份手足口发病率气温北京110.78-4.8北京120.76-1北京136.144.1北京1424.7111.2北京1553.7721.7北京1667.7324.7上海216.825.3上海223.137.5上海2315.429.3上海2434.3712.8上海2540.9720.8上海2641.3923.8哈尔滨310.06-17.1哈尔滨320.01-15.5哈尔滨330.22-7.2哈尔滨341.134哈尔滨353.7416哈尔滨366.4825.5乌鲁木齐410.24-10.6乌鲁木齐420.04-12.4乌鲁木齐430.24-4.4乌鲁木齐442.058.7乌鲁木齐4513.5816.2乌鲁木齐4627.1622.5混合模型混合模型混合模型混合模型的参数估计:混合模型将所有数据混合在一起作为样本数据,可采用普通最小二乘法(ordinaryleastsquare,OLS)进行参数估计。混合模型混合模型的缺点:假定所有个体(如不同省、市、区县、家庭)都是同质的,没有区分不同个体,也无法说明是否不同个体之间存在差异。掩盖了个体间可能存在的异质性,把个体特征全部放到误差项中。混合模型针对混合模型缺点的解决方法:需要体现出个体的差异,主要基于两种方法:1、个体固定效应模型2、个体随机效应模型固定效应模型(二)个体固定效应模型(fixedeffectmodel)把各个个体的值设定为一套固定的参数,采用一定的方法估计出来个体固定效应模型根据不同情况还可分为:1、变截距的个体固定效应模型2、变斜率/系数的个体固定效应模型固定效应模型1、变截距的个体固定效应模型:αi反映了个体对总均值的偏离,表示不同个体有不同的截距项。Kkitkitkiituxy1固定效应模型变截距的固定效应模型固定效应模型变截距固定效应模型的参数估计:最小二乘虚拟变量(leastsquaredummyvariable,LSDV)利用虚拟变量的方式,估计出所有个体的截距值如个体固定效应模型可以表示为:共需估计N个虚拟变量系数和K个自变量系数KkitkitkNNituxDDDy12211固定效应模型2、变系数的个体固定效应模型也称似不相关回归(SeeminglyUnrelatedRegression)αi反映了个体对总均值的偏离,表示不同个体有不同的截距项。βi反映了个体对总斜率的偏离,表示不同个体有不同的斜率。Kkitkiitkiituxy1固定效应模型变系数的固定效应模型随机效应模型(三)个体随机效应模型(randomeffectmodel)把各个个体的值设为一套具有特定概率分布的随机变量,假定这些个体仅是从一个具有特定分布的总体中随机抽取出来的随机效应模型也可分为两大类:1、变截距的个体随机效应模型2、变斜率/系数的个体随机效应模型随机效应模型1、变截距的个体随机效应模型:2、变斜率的个体随机效应模型vi是独立于解释变量的一个具有特定概率分布的随机变量,反映了个体成员的随机影响。Kkitkitkiituxvy1Kkitkiitkiituxvy1随机效应模型个体随机效应模型的参数估计:由于个体之间可能存在一定的相关,普通的最小二乘法不再是最有效的估计通常采用可行广义最小二乘法(feasiblegeneralizedleastsquare,FGLS)。面板数据模型固定效应模型与随机效应模型:固定效应模型中,假定每一个体有自己(固定)的截距;模型允许未被观测到的变量与任何已观测的自变量之间存在相关。随机效应模型中,假定这些个体是从一个更大的总体中随机抽取的。未被观测到的变量与所有自变量之间不相关。面板数据模型如何选择混合、固定或随机效应模型1、约束的F检验(比较混合模型和固定效应模型)判断:如果P大于0.05,可以认为约束模型(混合模型)成立;否则认为应采用无约束模型(固定效应模型)4.面板数据模型检验与设定方法关于面板数据模型参数的约束检验介绍3个统计量。4.1面板数据模型中丢失变量或存在多余变量的F检验F=)1/(/)(kNTSSEmSSESSEuurFm,NT-k-1)其中SSEr表示施加约束条件后估计模型的残差平方和;SSEu表示未施加约束条件的估计模型的残差平方和;m表示约束条件个数;NT表示面板数据样本容量(N表示个体数,T表示个体长度);k表示非约束面板数据模型中被估参数的个数。判别规则是,若FF(m,NT-k-1),约束条件成立,若FF(m,NT-k-1),约束条件不成立。面板数据模型如何选择混合、固定或随机效应模型2、BP检验(拉格朗日乘数检验,比较混合模型和随机效应模型)原假设(H0)为:接受混合模型BP检验的统计量判断:如果P大于0.05,可以接受混合模型;P小于0.05,可认为应采用随机效应模型)1(~1ˆˆ)1(22222ititititTNTLM面板数据模型如何选择混合、固定或随机效应模型3、Hausman检验(比较随机效应模型和固定效应模型)原假设(H0)为:接受随机效应模型Hausman检验的统计量判断:如果P大于0.05,可以接受随机效应模型;P值小于0.05,可认为应采用固定效应模型)ˆˆ()ˆˆ(1GLSwGLSwW面板数据模型如何选择混合、固定或随机效应模型4、更实际的考虑流行病学中个体追踪随访数据通常考虑随机效应模型更为合适省、市、区等的观察可考虑固定效应模型结合实际研究目的而定面板数据分析案例citycitymonthhfmtemperature北京110.78-4.8北京120.76-1北京136.144.1北京1424.7111.2北京1553.7721.7北京1667.7324.7上海216.825.3上海223.137.5上海2315.429.3上海2434.3712.8上海2540.9720.8上海2641.3923.8哈尔滨310.06-17.1哈尔滨320.01-15.5哈尔滨330.22-7.2哈尔滨341.134哈尔滨353.7416哈尔滨366.4825.5乌鲁木齐410.24-10.6乌鲁木齐420.04-12.4乌鲁木齐430.24-4.4乌鲁木齐442.058.7乌鲁木齐4513.5816.2乌鲁木齐4627.1622.5例1:四个城市1-6月份手足口病报告发病率与气温的关系面板数据分析案例首先进行因变量的变换原变量对数变换面板数据分析案例混合模型(pooledmodel)的最小二乘估计:SAS程序:procreg;modellhfm=temp;run;面板数据分析案例最小二乘估计(pooledmodel)结果:面板数据分析案例自相关的Durbin-Watson检验:SAS程序:procreg;modellhfm=temp/dwdwprob;run;面板数据分析案例Durbin-Watson检验结果:提示:可能存在空间或时间自相关面板数据分析案例残差(Residual)分析:面板数据分析案例残差(Residual)分析面板数据分析案例各城市的变化趋势图面板数据分析案例个体固定效应模型(最小二乘虚拟变量回归)SAS程序procpanelprintfixed;idcitymonth;modellhfm=temp/fixone;run;面板数据分析案例虚拟变量及自变量的估计结果:StandardVariableDFEstimateErrortValuePr|t|LabelCS111.1236510.41152.730.0133CrossSectionalEffect1CS211.2101180.42182.870.0098CrossSectionalEffect2CS31-0.670970.4064-1.650.1151CrossSectionalEffect3Intercept1-0.40910.2893-1.410.1735Intercepttemp10.1504850.011712.81.0001面板数据分析案例各城市截距:乌鲁木齐:-0.4091哈尔滨:-0.4091-0.67097=-1.08007北京:-0.4091+1.123651=0.714551上海:-0.4091+1.210117=0.801017面板数据分析案例固定效应的约束F检验:模型拟合效果:与最小二乘回归相比,R2增加,MSE降低。FitStatisticsSSE9.3681DFE19MSE0.4931RootMSE0.7022R-Square0.9352FTestforNoFixedEffectsNumDFDenDFFValuePrF3198.810.0007面板数据分析案例固定效应模型的残差分析面板数据分析案例Pooled模型预测值固定效应模型预测值面板数据分析案例个体随机效应模型SAS程序procpanel;idcitymonth;modellhfm=temp/ranone;run;面板数据分析案例随机效应模型估计结果:随机效应模型的拟合结果Sta

1 / 69
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功