第十三章面板数据的处理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第十三章面板数据的处理一、面板数据的定义、意义和种类面板数据是调查经历一段时间的同样的横截面数据,具有空间和时间的两种特性。它还有其他一些名称,诸如混合数据,纵列数据,平行数据等,这些名字都包含了横截面单元在一段时期的活动。面板数据的优点在于:1.提供了更有价值的数据,变量之间增加了多变性和减少了共线性,并且提高了自由度和有效性。2.能够更好地检测和度量单纯使用横截面数据或时间序列数据无法观测到的影响。3.能够对更复杂的行为模型进行研究。形如01122ititititYXXu其中,i表示第i个横截面单元,t表示第t年。一般,我们用i来表示横截面标识符,用t表示时间标识符。假设N个横截面单元的观测次数相同,我们称之为平衡面板,反之,称为非平衡面板。一般假设X是非随机的,误差项遵从经典假设。二、面板数据回归模型的类型与估计方法(一)面板数据回归模型的类型对于面板数据模型itiitiitYXu,可能的情形主要有如下几种。1.所有系数都不随时间和个体而变化在横截面上无个体影响、无结构变化,即ij,ij。则普通最小二乘估计给出了和的一致有效估计。相当于将多个时期的截面数据放在一起作为样本数据。itititYXu。2.变截距模型在横截面上个体影响不同,个体影响表现为在模型中被忽略的反映个体差异的影响,又分为固定效应和随机效应两种。itiititYXu3.变系数模型除了存在个体影响之外,在横截面上还存在变化的经济结构,因而结构参数在不同横截面单位是不同的。ij,ij。itiitiitYXu。看到面板数据之后,如何确定属于哪一种类型呢?用F检验假设1:斜率在不同的横截面样本点上和时间上都相同,但截距不相同,即情形2。假设2:截距和斜率在不同的横截面样本点和时间上都相同,即情形1。2如果接收了假设2,则没有必要进行进一步的检验。如果拒绝了假设2,就应该检验假设1,判断是否斜率都相等。如果假设1被拒绝,就应该采用情形3的模型。采用OLS分别估计变系数模型、变截距模型和经典模型,得到残差平方和分别为S1、S2、S3。检验假设2的F统计量从直观上看,如S3-S1很小,F2则很小,低于临界值,接受H2。S3为截距、系数都不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。检验假设1的F统计量从直观上看,如S2-S1很小,F1则很小,低于临界值,接受H1。S2为截距变化、系数不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。(二)面板数据的估计方法仅以变截距模型为例,itiititYXu。1.固定效应方法在变截距模型中,i代表了截面单元的个体特性,反映了模型中被遗漏的体现个体差异变量的影响。而itu代表了模型中被遗漏了的体现随截面与时序同时变化的因素的影响。当然,更一般的情况,模型中还应包括时期个体恒量t。所谓固定效应方法就是把时期特征t当作未知的确定常数。2.随机效应方法在变截距模型中,i代表了截面单元的个体特性,反映了模型中被遗漏的体现个体差异变量的影响。而itu代表了模型中被遗漏了的体现随截面与时序同时变化的因素的由此可以得到下列结论:1))]1([~/221KTnSu;2)在2H下,)]1([~/223KnTSu和)]1)(1[(~/)(2213KnSSu;3)213/)(uSS与21/uS独立。3121()/[(1)(1)]~[(1)(1),(1)]/[(1)]SSnKFFnKnTKSnTnK2111()/[(1)]~[(1),(1)]/[(1)]SSnKFFnKnTKSnTnK3影响。当然,更一般的情况,模型中还应包括时期个体恒量t。所谓随机效应方法是指把时期特征t视为同itu一样的随机变量。3.两种方法的比较在时间序列T长度很小而截面单元个数N较大时,两种估计方法差别较大。如果春研究者仅以样本自身效应为条件进行推论,宜使用固定效应模型;如果以样本对总体效应进行推论,则采用随机效应模型。这个原则对于变系数模型也是适用的。从理论上来说,若假定itu与X不相关,则用ECM可能合适一些,如果相关,用FEM可能更合适一些。贾奇对此作了一个小结。他认为:(1)若T较大而N较小,则ECM和FEM相差不多。(2)当N较大而T较小时,两种方法的估计值会有显著的差异。如果我们确信我们样本中个体或横截面单元不是从一个较大的样本中随机取出的,那么FEM是合适的。但如果样本中的横截面单元被看作是随机抽取的,则ECM是合适的。HAUSMAN于1978年提出了一个检验。它的原假设是FEM和ECM估计量是没有实质上的差异。统计量是一个渐近的卡方分布。若原假设被拒绝了,结论就是ECM不合适。三、一个实例建立我国市场经济体制确立以来的城镇居民消费函数合成数据模型。样本数据从1994到1999年,包括全国各省市自治区城镇居民年人均可支配收入(INC)和消费性支出(CONS),二者都经过相应地区的居民消费价格指数平减。详见易丹辉的书,第211页。四、要点与结论1.面板回归模型以面板数据为基础。面板数据由若干个个体单元在几个时间段上的观测组成。2.运用面板数据有几个好处。第一,它大大增加了样本大小。第二,更加适合研究变化的动态。第三,面板数据使我们能够研究更为复杂的行为模型。3.面板数据也提出了几个估计和推断的问题。由于面板数据涉及横截面和时间两个维度,因而困扰横截面数据和时间序列数据的问题就需要提及,还有一些其他问题,比如说在同一时点上个体单元的交叉相关。4.有几个估计的技巧来解决一个或多个这些问题。两个最为著名的是固定效应模型和随机效应模型。5.在FEM中,回归模型的截距允许在个体间存在差异。为了考虑不同的截距,可以使用虚拟变量。FEM中所使用的虚拟变量就是最小二乘虚拟变量模型即LSDV。FEM适用于个体的特定截距与一个或多个回归元相关的情形。6.ECM是FEM的一个替代物。ECM假定个体单元的截距是从一个有着不变均值的非常大的总体中随机抽取得到的。那么,单个截距可以表现为对这个不变均值的偏离。ECM相对FEM而言的一个优点就是在自由度上是经济的。ECM适用于每个横截面单元的随4机截面单元的随机截距与回归元不相关的情形。7.豪斯曼检验可以决定FEM和ECM的选择。

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功