117©陈强,《高级计量经济学及Stata应用》课件,第二版,2014年,高等教育出版社。第17章非线性面板17.1面板二值选择模型对于面板数据,如果被解释变量为虚拟变量,则为“面板二值选择模型”(binarychoicemodelforpaneldata)。二值选择行为可通过“潜变量”(latentvariable)来概括其净收益。净收益大于0,则选择做;否则,不做。2假设净收益为*(1,,;1,,)ititiityuintTxβ*ity不可观测,iu为个体效应,解释变量itx不含常数项。选择规则:**1000itititifyyify给定,,itiuxβ,则有3*P(1|,,)P(0|,,)P(0|,,)P(|,,)P(|,,)()ititiititiitiititiitiititiitiititiiityuyuuuuuuuFuxβxβxβxβxβxβxβxβxβ()F为it的cdf,并假设it的密度函数关于原点对称。如果~(0,1)N,则为Probit模型,P(1|,,)()ititiiityuuxβxβ4如果服从逻辑分布,则为Logit模型,P(1|,,)()1iitiituititiiitueyuuexβxβxβxβ面板二值模型的估计方法包括混合回归、随机效应估计与固定效应估计。如果12nuuu,则为混合回归(pooledprobit或pooledlogit),可作为截面数据处理,应使用以面板为聚类的聚类稳健标准误(cluster-robuststandarderrors)。517.2面板二值选择模型的随机效应估计更一般地,允许个体效应的存在,不同的个体拥有不同的iu。如果iu与所有解释变量itx均不相关,称为“随机效应模型”(RandomEffectsModel,简记RE)。如果iu与某个解释变量相关,则称为“固定效应模型”(FixedEffectsModel,简记FE)。但非线性面板不便使用FGLS,故使用MLE。6假设2~(0,)iuuN,记其密度函数为()igu。以Logit模型为例。给定iu,则个体i的条件分布为(推导过程参考第11章),1121(,,,|,,)()1()iiTyyiiiTitiiitiittfyyyuuuxβxβxβ但iu不可观测。记12(,,,,)iiiTiyyyu的联合密度为12(,,,,)iiiTifyyyu,并进行如下分解,1212(,,,,)(,,,|)()iiiTiiiiTiifyyyufyyyugu7在12(,,,,)iiiTiyyyu的联合密度中,将iu积分积掉,可得12(,,,)iiiTyyy的边缘密度,12121211(,,,)(,,,,)(,,,|)()()1()()iiiiiTiiiTiiiiiTiiiTyyiitiitiitfyyyfyyyudufyyyuguduuuguduxβxβ上式无解析解,ButlerandMoffitt(1982)提出使用“Gauss-Hermitequadrature”方法进行数值积分。8Stata的默认方法为在12个点上进行“adaptiveGauss-Hermitequadrature”计算。此积分的精度依赖于数值计算的点数,故Stata提供命令quadchk来检验积分的精度,即使用其他计算点数,比较结果的稳定性。昀大化此似然函数即得到对β的“随机效应Logit估计量”(RandomEffectLogit)。如果将逻辑分布()改为正态分布(),则为“随机效应Probit估计量”(RandomEffectProbit)。9在估计时已将iu积分掉,故得不到对个体效应iu的估计,也无法预测iy的发生概率或计算解释变量的边际效应。解决方法之一是假设iu=0。由于iu的存在,同一个体不同期的扰动项之间仍存在自相关,222Cov(,)uiitiisuiftsuuifts2u为iu的方差,2为it的方差。当ts时,其自相关系数为,222Corr(,)uiitiisuuu10越大,则复合扰动项()iitu中个体效应的部分()iu越重要。如果0,则20u,不存在个体随机效应,应选择混合回归。如果拒绝“0:0H”,则认为应采用随机效应模型;反之,则支持混合回归。17.3面板二值选择模型的固定效应估计在面板二值模型中,如果iu与itx相关,则为固定效应模型,P(1|,,)()ititiiityuFuxβxβ11其中,()F为()或()。随机效应模型或混合回归将不一致。对于线性面板,可通过组内变换()itiyy或一阶差分,1()itityy消去固定效应iu。对于非线性面板,这些变换不起作用。即使在模型中增加个体虚拟变量(LSDV法),仍得不到一致估计(除非T)。因为当n时,待估计的个体效应1niiu的个数也随之增加,这些1niiu称为“伴生参数”(incidentalparameters)。12每个iu只能由个体i的T个观测值来估计,而T并不增加。对于短面板,当n而T为有限值,对1niiu的估计不一致。对于iu的不一致估计还会“污染”对β的估计,导致对β的估计也不一致,称为“伴生参数问题”(incidentalparametersproblem)。在线性面板中,可通过组内变换或差分变换解决伴生参数问题。对于固定效应的面板Probit,无法解决此伴生参数问题。对于固定效应的面板Logit,可通过寻找iu的“充分统计量”(sufficientstatistic),然后在给定此充分统计量的条件下进行“条件昀大似然估计”(conditionalMLE)。13考虑总体参数与统计量W。如果统计量W包含了样本中所有可用来估计的信息,则称W为参数的充分统计量。换言之,给定W之后,任何根据样本计算的其他统计量都不可能提供关于的额外信息。样本数据在给定充分统计量W后的条件分布将不再依赖于;否则,控制了W之后的条件分布仍将包含的信息。Chamberlain(1980)提出使用1Tiittny作为iu的充分统计量,并计算在给定in情况下的条件似然函数(此条件似然函数不再依赖于iu),然后进行条件MLE估计。14由于逻辑函数的指数形式,故Logit模型存在iu的充分统计量。以两期模型为例,即T=2。对于个体i,只有三种可能,即12iiinyy0,1,或2。(1)120iiinyy。必然有120iiyy,即12P(0,0|0)1iiiyyn,其对数似然函数为ln10,对整个样本的对数似然函数没有贡献。由于此条件似然函数为常数,故此观测值不包含可用于估计β的信息,等于损失了此观测值。15(2)122iiinyy。必然有121iiyy,即12P(1,1|2)1iiiyyn。这些观测值不包含任何有助于估计β的信息,也可忽略。(3)121iiinyy。或者12(0,1)iiyy,或者12(1,0)iiyy。分别计算其条件概率如下。12121212P(0,1)P(0,1|1)P(0,1)(1,0)iiiiiiiiiyyyynyyPyy12121212P(1,0)P(1,0|1)P(0,1)(1,0)iiiiiiiiiyyyynyyPyy16假设在给定iu与itx的条件下,1iy与2iy相互独立,则212121P(0,111)bbbiiiiiiuiuuieyeyexxx112121P(1,0)11bbbiiiiiiiuiuuyyeeexxx代入方程可得,2122211221()21()12P(0,1|1)[(])1iiiiiiiiiiiiiiiiuuuiieeeeeeeyyenxβxβxβxβxxβxβxβxxβxxβ17上式分子与分母的iue同时消去。同理,222111P(1,0|1)[]1([)()]iiiiiiiyynxxβxxβ定义虚拟变量1id,如果12(0,1)iiyy;0id,如果12(1,0)iiyy。个体i的条件对数似然函数为:2121ln()ln[](1)ln{1[]()(}(1))iiiiiiiiLddnβxxβxxβ118小结:(1)给定in的条件似然函数不再依赖于iu(已在推导中消去);(2)此条件似然函数仍为Logit模型,只是解释变量变为21()iixx;(3)不随时间变化的变量将无法识别其系数,因为21()0iixx。固定效应的似然函数不含积分,无须进行数值积分。对于2T,可计算给定1in,2in,……,或1inT的条件似然函数。固定效应模型的缺点是,将损失所有0in或inT的观测值。19而且,无法估计个体效应iu(已被消去),故无法预测iy的发生概率或解释变量的边际效应。解决方法之一是假设iu=0。如何在固定效应模型与混合回归之间选择?可使用豪斯曼检验。原假设为不存在个体效应,即“0:iHuu”。如果原假设成立,则固定效应模型与混合回归都一致。反之,如果原假设不成立,则固定效应一致,而混合回归不一致。20如果二者的系数估计值相差较大(以二次型来衡量),则倾向于拒绝原假设,接受存在个体效应的替代假设。对于固定效应与随机效应之间的选择,也可进行豪斯曼检验。17.4面板二值选择模型的Stata实例2117.5面板泊松回归考虑被解释变量为计数变量的面板数据。例:若干企业在一段时间内每年获得专利的个数例:全国各省在几年内每年发生矿难的数目例:世界各国近几十年每年发生示威游行的次数例:一些病人在一段时间内的每期发病次数22对于个体i,时期t,记被解释变量为itY,假设ititYy的概率由参数为it的泊松分布所决定:eP(|)(0,1,2,)!itityititititititYyyyx0it为泊松到达率。为保证it非负,假设exp()exp()exp()exp()itiiitittiiuuvxxxitx不含常数项,而exp()iivu为乘积形式的个体效应(multiplicativeindividualeffects)。如果12nvvv,不存在个体效应,为混合泊松回归(pooled23Poisson),可作截面数据处理,须使用聚类稳健标准误。一般地,允许个体效应的存在,即不同个体拥有不同的iv。如果iv与所有解释变量itx均不相关,则为“随机效应模型”(RandomEffectsModel,简记RE)。如果iv与某个解释变量相关,则为“固定效应模型”(FixedEffectsModel,简记FE)。首先考虑随机效应模型,进行MLE估计。记iv的密度函数为()igv。24假设样本为iid,在给定iv情况下,个体i的条件分布为,exp()1211ee[exp()](,,,|)!!ititiitityvyTTitiiiiTittitttiivfyyyvyyxx但iv不可观测。记12(,,,,)iiiTiyyyv的联合密度为12(,,,,)iiiTifyyyv,并进行如下分解,1212(,,,,)(,,,|)()iiiTiiiiTiifyyyvfyyyvgv将iv积分积掉,可得到12(,,,)iiiTyyy的边缘密度,25121212(,,,)(,,,,)(,,,|)()iiiTiiiTiiiiiTiiifyyyfyyyvdvfyyyvgv