第11章面板数据模型

sira234
1 ℃
2020-02-14

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1第11章面板数据模型一、面板数据模型简介二、混合最小二乘回归三、固定效应模型四、随机效应模型五、模型设定检验六、动态面板数据模型2一、面板数据模型简介（一）何谓“面板数据(paneldata)”？时间维度+截面维度如在分析中国各省份经济增长的决定因素时，共有31个截面，每个截面都取1979-2008共30年的数据，则共有930个观察值，这就是一个典型的面板数据。上市公司财务数据，研究一段时期内（1998-2008）20家上市公司股利的发放数额与股票账面价值之间的关系，共有20×11=220个观测值。3表11996-2002年中国15个省的居民家庭人均消费数据（不变价格）地区人均消费1996199719981999200020012002CP-AH（安徽）3282.4663646.1503777.4103989.5814203.5554495.1744784.364CP-BJ（北京）5133.9786203.0486807.4517453.7578206.2718654.43310473.12CP-FJ（福建）4011.7754853.4415197.0415314.5215522.7626094.3366665.005CP-HB（河北）3197.3393868.3193896.7784104.2814361.5554457.4635120.485CP-HLJ（黑龙江）2904.6873077.9893289.9903596.8393890.5804159.0874493.535CP-JL（吉林）2833.3213286.4323477.5603736.4084077.9614281.5604998.874CP-JS（江苏）3712.2604457.7884918.9445076.9105317.8625488.8296091.331CP-JX（江西）2714.1243136.8733234.4653531.7753612.7223914.0804544.775CP-LN（辽宁）3237.2753608.0603918.1674046.5824360.4204654.4205402.063CP-NMG（内蒙古）2572.3422901.7223127.6333475.9423877.3454170.5964850.180CP-SD（山东）3440.6843930.5744168.9744546.8785011.9765159.5385635.770CP-SH（上海）6193.3336634.1836866.4108125.8038651.8939336.10010411.94CP-SX（山西）2813.3363131.6293314.0973507.0083793.9084131.2734787.561CP-TJ（天津）4293.2205047.6725498.5035916.6136145.6226904.3687220.843CP-ZJ（浙江）5342.2346002.0826236.6406600.7496950.7137968.3278792.2104表2上市公司的投资与股票账面价值5（二）面板数据模型的优点面板数据模型（paneldatamodel），即研究和分析面板数据的模型。它的变量取值都带有时间序列和横截面的两重性。一般线性模型只单独处理横截面数据或时间序列数据，而不能同时分析和对比它们。面板数据模型，相对于一般的线性回归模型，其长处在于它既考虑到了横截面数据存在的共性，又能分析模型中横截面因素的个体特殊效应。当然我们也可以将横截面数据简单堆积起来用OLS回归模型来处理，但这样做就丧失了分析个体特殊效应的机会。6面板数据模型的优点第一，PanelDataModel通过对不同横截面单元不同时间观察值的结合，增加了自由度，减少了解释变量之间的共线性，从而得到更为有效的估计量；第二，PanelDataModel是对同一截面单元集的重复观察，能更好地研究经济行为变化的动态性；第三，PanelDataModel可以通过设置虚拟变量对个别差异（非观测效应）进行控制；即面板数据模型可以用来有效处理遗漏变量（omittedvaraiable）的模型错误设定问题。遗漏变量使用面板数据的一个主要原因是，面板数据可以用来处理某些遗漏变量问题。例如，遗漏变量是不随时间而变化的表示个体异质性的一些变量，如国家的初始技术效率、城市的历史或个人的一些特征等。这些不可观测的不随时间变化的变量往往和模型的解释变量相关，从而产生内生性，导致OLS估计量有偏且不一致。面板数据对遗漏变量问题的解决得益于面板数据对同一个个体的重复观测。78何谓“非观测效应”？非观测效应(unobservedeffect)，是指在面板数据分析中，一个不可观测的、因截面个体而异、但不随时间变化的变量。非观测效应通常被解释为对截面个体特征的捕捉。比如研究：“交通死亡率与酒后驾车人数的关系”（样本为一段时间内浙江省11个地级市）非观测因素：汽车本身状况、道路质量、当地的饮酒文化、单位道路的车辆密度。非观测效应的存在导致OLS估计结果不准确，而面板数据可以控制和估计非观测效应。9（三）面板数据描述的Stata操作（1）设定截面变量和时间变量tssetpanelvartimevar（2）描述性统计sumvar1var2可得到变量的基本统计量xtsumvar1var2分组内(within)、组间(between)和样本整体(overall)计算各变量的基本统计量10（四）面板数据模型的一般描述11面板数据模型的一般描述(续1)12面板数据模型的一般描述(续2)面板数据模型的一般描述(续3)1314（五）面板数据的估计方法1、混合最小二乘回归（pooledOLS）2、固定效应模型（fixedeffectsmodel）3、随机效应模型（randomeffectsmodel）4、动态面板模型（dynamicpaneldata）15二、混合普通最小二乘回归Wooldridge第13章——使用混合横截面数据（pooledcrosssection，将混合在一起的数据看作是横截面数据）的一个理由是要加大样本容量，把在不同时点从同一总体中抽取的多个随机样本混合起来，可以获得更精密的估计量和更有效的检验统计量。回归所得截距项在不同时期可以有不同的值。可以进行带有时期(年份)虚拟变量多元线性回归。16例1：不同时期的妇女生育率FERTIL1.RAW1972年和1984年社会总调查（GeneralSocialSurvey）17例2：教育回报和工资中性别差异的变化跨越1978年（基年）和1985年[两期]的一个混合对数工资方程。CP78-85.RAW。18两时期面板数据分析比如有关个人、企业或城市、国家的横截面，现有两年的数据，称之为t=1，t=2。CRIME2.RAW包含1982和1987年若干城市的犯罪和失业的数据。如果用1987年为横截面数据做回归，得到可以得出增加失业率会降低犯罪率的结论吗？19两时期面板数据分析(续1)上述回归很可能存在遗漏变量问题。一个解决办法是，控制住更多的因素，如年龄、性别、教育、执法水平等。另一种方法是，把影响因变量的观测不到的因素分为两类：一类是恒常不变的；另一类则随时间而变。d2t表示当t=1时等于0而当t=2时等于1的一个虚拟变量，它不随i而变。ai概括了影响yit的全部观测不到的、在时间上恒定的因素，通常称作非观测效应，也称为固定效应，即ai在时间上是固定的。特质误差uit表示随时间变化的那些非观测因素。20两时期面板数据分析(续2)前述1982和1987年城市犯罪率的一个非观测效应模型是：ai代表了影响城市犯罪率的、不随时间而变的全部因素，诸如城市的地理位置、居民的某些人口特征（种族、教育）、城市居民对待犯罪的态度等。给定两年的面板数据，如何估计β1？21两时期面板数据分析(续3)一种方法，将两年的数据混合起来，然后用OLS。为使混合OLS得到β1的一致估计，就必须假定非观测效应ai与xit不相关。其中，称为复合误差(compositeerror)。这一结果与1987年数据的横截面OLS回归结果不一样。注意，使用混合OLS并不解决遗漏变量问题。22两时期面板数据分析(续4)另一种方法，考虑了非观测效应与解释变量相关性。（面板数据模型主要就是为了考虑非观测效应与解释变量相关性的情形）例如在犯罪方程中，让ai中的未测出的却影响着犯罪率的因素也与失业率相关。处理方法就是一阶差分（first-differenced）。非观测效应被差分掉了，方程已满足OLS假定。23两时期面板数据分析(续5)上述犯罪率模型用一阶差分方程估计结果：差分后的估计结果与前面不同。24三、固定效应估计法取一阶差分仅是消除固定效应ai的许多方法之一。更好的方法是固定效应变换。考虑仅有一个解释变量的模型：对每个i求方程在时间上的平均，得到两式相减，得到(是y的除去时间均值后的数据)25固定效应估计量固定效应变换，又称“组内变换(withintransformation)”，非观测效应ai已随之消失，可以用混合OLS进行估计。基于除去时间均值变量的混合OLS估计量就是固定效应估计量(fixedeffectedestimator)或组内估计量(withinestimator)。固定效应估计量=组内估计量26组间估计量对横截面方程使用OLS估计时，就得到了组间估计量(betweenestimator)。273个决定系数R2面板数据模型回归结果可得到3个决定系数：R2(overall)，表示混合OLS(pooledOLS)回归的R2R2(within)，表示组内估计(或固定效应变换)的R2R2(between)，表示组间估计的R228虚拟变量回归固定效应模型也可以理解为，每一个横截面个体i都有自己不随时间变化的非观测效应ai。在估计时，可以为每一个i安排一个虚拟变量，得到各自的截距项，这就是虚拟变量回归(dummyvariableregression)。29固定效应模型的虚拟变量回归其中，i=1,2,3...N，为截面标示；t=1,2,...T，为时间标示；xit为k×1解释变量，β为k×1系数列向量。对于特定的个体i而言，ai表示那些不随时间改变的影响因素，而这些因素在多数情况下都是无法直接观测或难以量化的，称为“个体效应”(individualeffects)。在固定效应模型中，解释变量的参数β对各经济主体都相同，属于共同部分，所以不同经济主体的差异完全体现在常数项参数ai的取值上。itiitityxu30图示北京江苏GDPX(Invest、edu)北京江苏省山西省山西基础设施更加完善，受教育程度较好、经济结构以服务业为主、法制更健全31固定效应模型的虚拟变量回归111222iiiiiiiiiinininyxuyxuyXUyxu11112222100010100mmmmyXUyXUyXU321代表元素都为1的n维列向量。进一步，可以将与常数项参数ai相关的mn×m维矩阵写成D，而将不包含常数项参数β相关的mn×k维矩阵写成X，则面板数据的固定效应模型又可以更简洁地表示为：由于上式的矩阵D的列向量可以理解为代表第i个经济主体的虚拟变量，通常也可将固定效应模型称为最小二乘虚拟变量模型(Leastsquaresdummyvariablemodel,LSDV)。YDXU固定效应模型的虚拟变量回归33固定效应模型的Stata操作（1）设定截面变量和时间变量tssetpanelvartimevar（2）固定

第11章 面板数据模型

第11章面板数据模型