1面板数据——PanelData2第2讲面板数据模型与应用1.面板数据定义2.面板数据模型分类3.面板数据模型估计方法4.面板数据模型检验与设定方法5.面板数据建模案例分析6.面板数据的单位根检验7.EViwes应用8.面板数据模型的协整检验31.面板数据模型简介面板数据(paneldata)也称作时间序列与截面混合数据(pooledtimeseriesandcrosssectiondata)。面板数据是截面上个体在不同时点的重复观测数据。N=30,T=50的面板数据示意图中国各省级地区消费性支出占可支配收入比例走势图4面板数据分两种特征:(1)个体数少,时间长。(2)个体数多,时间短。面板数据用双下标变量表示。yit,i=1,2,…,N;t=1,2,…,Ti对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。5yit,i=1,2,…,N;t=1,2,…,T若固定t不变,yi.,(i=1,2,…,N)是横截面上的N个随机变量;若固定i不变,y.t,(t=1,2,…,T)是纵剖面上的一个时间序列(个体)。6面板数据是不同个体和不同时期被观察的数据(LongitudinalorPanelData)1122iiiiyxx1122ttttyxx1122itititityxx横截面数据时间序列数据面板数据72.面板数据模型分类用面板数据建立的模型通常有3种,即混合模型、固定效应模型和随机效应模型。2.1混合模型(Pooledmodel)。如果一个面板数据模型定义为,yit=+Xit'+it,i=1,2,…,N;t=1,2,…,T其中yit为被回归变量(标量),表示截距项,Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,it为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数和都相同。如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,it)=0。那么无论是N,还是T,模型参数的混合最小二乘估计量(PooledOLS)都是一致估计量。82.2固定效应模型(fixedeffectsmodel)。固定效应模型分为3种类型,即个体固定效应模型、时点固定效应模型和个体时点双固定效应模型。下面分别介绍。2.2.1个体固定效应模型(entityfixedeffectsmodel)如果一个面板数据模型定义为,yit=i+Xit'+it,i=1,2,…,N;t=1,2,…,T其中i是随机变量,表示对于i个个体有i个不同的截距项,且其变化与Xit有关系;Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),it为误差项(标量),则称此模型为个体固定效应模型。92.2固定效应模型(fixedeffectsmodel)。个体固定效应模型的强假定条件是,E(iti,Xit)=0,i=1,2,…,Ni作为随机变量描述不同个体建立的模型间的差异。因为i是不可观测的,且与可观测的解释变量Xit的变化相联系,所以称为个体固定效应模型。注意:(1)在EViews输出结果中i是以一个不变的常数部分和随个体变化的部分相加而成。(2)在EViews5.0以上版本个体固定效应对话框中的回归因子选项中填不填c输出结果都会有固定常数项。(3)个体固定效应回归模型的估计方法有多种,首先设法除去i的影响,从而保证估计量的一致性。102.2固定效应模型(fixedeffectsmodel)。解释设定个体固定效应模型的原因。假定有面板数据模型yit=0+1xit+2zi+it,i=1,2,…,N;t=1,2,…,T其中0为常数,不随时间、截面变化;每个个体回归函数的斜率1相同;zi表示随个体变化,但不随时间变化的难以观测的变量。上述模型可以被解释为含有N个截距,即每个个体都对应一个不同截距的模型。令i=0+2zi,于是变为yit=i+1xit+it,i=1,2,…,N;t=1,2,…,T以家庭消费性支出与可支配收入关系为例,省家庭平均人口数就是这样的一个变量,即对于短期面板,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。因为zi是不随时间变化的量,所以当对个体固定效应模型中的变量进行差分时,可以剔除那些随个体变化,但不随时间变化的zi的影响。112.2.2时点固定效应模型(timefixedeffectsmodel)如果一个面板数据模型定义为,yit=t+Xit'+it,i=1,2,…,N其中t是模型截距项,随机变量,表示对于T个截面有T个不同的截距项,且其变化与Xit有关系;yit为被回归变量(标量),it为误差项(标量),满足通常假定条件。Xit为k1阶回归变量列向量(包括k个回归变量),为k1阶回归系数列向量,则称此模型为时点固定效应模型。122.2.2时点固定效应模型(timefixedeffectsmodel)设定时点固定效应模型的原因。假定有面板数据模型yit=0+1xit+2zt+it,i=1,2,…,N;t=1,2,…,T其中0为常数,不随时间、截面变化;对于T个截面有T个不同的截距项,zt表示随不同截面(时点)变化,但不随个体变化的难以观测的变量。令t=0+2zt,上式变为yit=t+1xit+it,i=1,2,…,N;t=1,2,…,T这正是时点固定效应模型形式。对于每个截面,回归函数的斜率相同(都是1),t却因截面(时点)不同而异。可见时点固定效应模型中的截距项t包括了那些随不同截面(时点)变化,但不随个体变化的难以观测的变量的影响。t是一个随机变量。以家庭消费性支出与可支配收入关系为例,“全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个变化的量,但是对于不同省份(个体),这是一个不变化的量。132.2.3个体时点固定效应模型如果一个面板数据模型定义为,yit=0+i+t+Xit'+it,i=1,2,…,N;t=1,2,…,T其中yit为被回归变量(标量);i是随机变量,表示对于N个个体有N个不同的截距项,且其变化与Xit有关系;t是随机变量,表示对于T个截面(时点)有T个不同的截距项,且其变化与Xit有关系;Xit为k1阶回归变量列向量(包括k个回归量);为k1阶回归系数列向量;it为误差项(标量)满足通常假定(itXit,i,t)=0;则称此模型为个体时点固定效应模型。如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型进行混合OLS估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方法也可以使个体时点双固定效应模型得到更有效的参数估计量。142.3随机效应模型对于面板数据模型yit=i+Xit'+it,i=1,2,…,N;t=1,2,…,T如果i为随机变量,其分布与Xit无关;Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),it为误差项(标量),这种模型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其假定条件是iiid(,2)itiid(0,2)都被假定为独立同分布,但并未限定何种分布。同理也可定义时点随机效应回归模型和个体时点随机效应回归模型,但个体随机效应回归模型最为常用。152.3随机效应模型对于个体随机效应模型,E(iXit)=,则有,E(yitxit)=+Xit',对yit可以识别。所以随机效应模型参数的混合OLS估计量具有一致性,但不具有有效性。注意:术语“随机效应模型”和“固定效应模型”用得并不十分恰当。其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应该称之为“非相关效应模型”。因为固定效应模型和随机效应模型中的i都是随机变量。163.面板数据模型估计方法•混合最小二乘(PooledOLS)估计(适用于混合模型)•平均数(between)OLS估计(适用于混合模型和个体随机效应模型)•离差变换(within)OLS估计(适用于个体固定效应回归模型)•一阶差分(firstdifference)OLS估计(适用于个体固定效应模型)•可行GLS(feasibleGLS)估计(适用于随机效应模型)173.面板数据模型估计方法面板数据模型中的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随设定固定效应模型是否正确而变化。3.1混合最小二乘(PooledOLS)估计混合OLS估计方法是在时间上和截面上把NT个观测值混合在一起,然后用OLS法估计模型参数。给定混合模型yit=+Xit'+it,i=1,2,…,N;t=1,2,…,T如果模型是正确设定的,且解释变量与误差项不相关,即Cov(Xit,it)=0。那么无论是N,还是T,模型参数的混合最小二乘估计量都具有一致性。对于经济序列每个个体i及其误差项来说通常是序列相关的。NT个相关观测值要比NT个相互独立的观测值包含的信息少。从而导致误差项的标准差常常被低估,估计量的精度被虚假夸大。183.面板数据模型估计方法3.1混合最小二乘(PooledOLS)估计如果模型存在个体固定效应,即i与Xit相关,那么对模型应用混合OLS估计方法,估计量不再具有一致性。假定模型实为个体固定效应模型yit=i+Xit'+it,但却当作混合模型来估计参数,则模型写为yit=+Xit'+(i-+it)=+Xit'+uit其中uit=(i-+it)。因为i与Xit相关,也即uit与Xit相关,所以个体固定效应模型的参数若采用混合OLS估计,估计量不具有一致性。193.2平均数(between)OLS估计平均数OLS估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N个平均数(估计值)。然后利用yit和Xit的N组观测值估计参数。以个体固定效应回归模型yit=i+Xit'+it为例,首先对面板中的每个个体求平均数,从而建立模型iy=i+iX'+i,i=1,2,…,N变换上式:iy=+iX'+(i-+i),i=1,2,…,N称作平均数模型。对上式应用OLS估计,则参数估计量称作平均数OLS估计量。此条件下的样本容量为N,(T=1)。如果iX与(i-+i)相互独立,和的平均数OLS估计量是一致估计量。平均数OLS估计法适用于短期面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于i和Xit相关,也即i和iX相关,所以,回归参数的平均数OLS估计量是非一致估计量。203.3离差变换(within)OLS估计对于短期面板数据,离差变换OLS估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离差观测值,然后利用离差变换数据估计模型参数。具体步骤是,对于个体固定效应回归模型yit=i+Xit'+it中的每个个体计算平均数,可得到如下模型,iy=i+iX'+i上两式相减,消去了i,得yit-iy=(Xit-iX)'+(it-i)此模型称作离差变换数据模型。对上式应用OLS估计,所得的估计量称作离差变换OLS估计量。对于个体固定效应回归模型,的离差变换OLS估计量是一致估计量。如果it还满足独立同分布条件,的离差变换OLS估计量不但具有一致性而且还具有有效性。213.3离差变换(within)OLS估计