断点回归及其在经济学中的应用一引言2010年4月24日,该年度的约翰·贝茨·克拉克奖章(JohnBatesClarkMedal)——针对40岁以下年轻经济学者的最高荣誉,授予了麻省理工学院经济系的EstherDuflo教授以表彰其在随机实验普及和其在发展经济学中应用方面的卓越贡献。在因果关系分析的实证方法中,最优的选择应当为随机实验,但是随机实验的时间成本和经济成本都比较高,而在随机实验不可得的情况下,需要考虑使用其它方法。断点回归(RegressionDiscontinuity)便是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法。Lee(2008)认为在随机实验不可得的情况下,断点回归能够避免参数估计的内生性问题,从而真实反映出变量之间的因果关系。然而,断点回归也仅仅是在20世纪90年代末才被应用于处理经济学的问题。2001年,Hahn等人对断点回归模型的识别和估计的理论问题进行了严格细致的分析,此后,断点回归才在众多的经济学研究领域中崭露头角。时至今日,断点回归已经在劳动和教育经济学、政治经济学、环境经济学和发展经济学等领域取得了广泛的应用。然而,断点回归却鲜为中国经济学者所应用,正是基于断点回归在实证研究中的重要性和国内文献的缺乏,本文拟以此为背景,从断点回归的理论、发展历史、实证步骤和经济学中的应用几个方面阐述断点回归这一个新“拟随机试验”方法的兴起。二断点回归理论及发展历史断点回归是一种拟随机实验,此种随机实验定义了这样一个特征,即接受处置(Treatment)的概率是一个或者几个变量的间断函数。Hahnetal.(2001)提出了断点回归的首要假设,如果变量表示处置效应,表示决定处置的关键变量,那么和必须存在,并且。在使用断点回归的情况下,存在一个变量,如果该变量大于一个临界值时,个体接受处置,而在该变量小于临界值时,个体不接受处置。一般而言,个体在接受处置的情况下,无法观测到其没有接受处置的情况,而在断点回归中,小于临界值的个体可以作为一个很好的可控组(ControlGroup)来反映个体没有接受处置时的情况,尤其是在变量连续的情况下,临界值附近样本的差别可以很好的反映处置和经济变量之间的因果联系。断点回归可以分为两类,第一类,临界值是确定的(Sharp),即在临界值一侧的所有的观测点都接受了处置,反之,在临界值另一侧的所有观测点都没有接受处置。此时,接受处置的概率从临界值一侧的0跳转到另一侧的1;第二类,临界点是模糊的(Fussy),即在临界值附近,接受处置的概率是单调变化的。Hahnetal.(2001)在一定的假设下,证明了无论是哪一类型的断点回归,都可以利用临界值附近样本的系统性变化来研究处置和其它经济变量之间的因果关系。断点回归首先是由美国西北大学的心理学家Campbell于1958年首先发展设计出来的,从那时开始直到二十世纪80年代,Campbell和西北大学心理学系和统计学系的同事一直从事断点回归的设计和研究工作。Thistlethwaite和Campbell(1960)正式发表了第一篇关于断点回归的论文,他们提出断点回归是在非实验的情况下处理处置效应(TreatmentEffects)的一种有效的方法,主要应用于心理学和教育学领域。随后,Campbell和Stanley(1963)为断点回归提供了更加清晰化的概念,但是由于他们并没有给出断点回归统计上的证明。在他们看来,断点回归主要是为了解决选择性偏误(SelectionBias)问题,断点回归利用了一个取决于某连续变量的间断函数,这个间断函数完全决定了个体是否受到处置,这就使得样本选择的细节完全展示出来,使得我们知道样本选择的问题所在。此外,Campbell和Stanley还认为断点回归仅仅是在间断的临界值处类似于随机实验,其推论的有效性也仅仅局限于间断的临界值处。整个20世纪60年代,断点回归方法的应用还停留在一种直觉的推导,而缺乏统计上严密的证明。Goldberger(1972a,b)曾对断点回归的无偏因果推断进行了证明,可惜的是,他的论文并没有得到发表,这主要是因为他认为断点回归的适用环境是一个高度理想化的环境,其适用范围十分有限。相反,变量之间因果关系的推断还包括了工具变量法(IVApproach)和Heckman处理样本选择问题的模型,这两种方法的适用性更加广泛,从而使得人们忽视了断点回归方法的应用,也使得断点回归在很长一段时间内消失在人们的视野之中。随着Campbell等人所认为的断点回归适用性仅仅局限于临界值附近这一论断被证伪之后,断点回归才开始重新回到人们的视野之中。Rubin(1977)证明了在个体是否接受处置仅仅取决于一个关键变量的情况下,处置效应能够在关键变量的整个范围内得到无偏的因果推断。Sacks和Ylvisaker(1978)提出了断点回归的估计方法,并在理论上给予了较粗略的证明。他们将被解释变量分解为观察变量的线性组合再加上一个非随机的误差项,其估计方法类似于局部非参数回归(LocalNonparametricRegression),其有效性不仅仅是对于临界值附近的样本,而且可以扩展到关键变量的整个领域。断点回归在理论方面取得了新进展的同时,其它因果推断方法的不足之处也逐渐的被认识到。比如,工具变量法存在局限性,特别是排他性(Excludability)条件难以满足,即难以保证工具变量仅仅通过影响关键解释变量而影响到被解释变量,寻找合适的工具变量存在一定的困难。此外,Lalonde(1985)发现Heckman样本选择模型并不能产生和随机实验一样的结果。正因为因果关系的推断是经济学家所关注的最主要的问题,并且现有的因果推断方法都不能得出完全合理的因果关系,人们开始逐渐将目光转向了断点回归。Trochim(1984)继续了他老师Campbell的工作,Trochim综合了之前关于断点回归的理论和方法,并且将断点回归类型分为两类,第一类是确定型的断点回归(SharpRegressionDiscontinuity),即个体在临界值一边接受处置效应的概率为1,而在临界值另一边接受处置效应的概率为0;第二类是模糊型的断点回归(FuzzyRegressionDiscontinuity),即个体接受处置效应的概率均大于0小于1,个体在临界值一边接受处置的概率大于在临界值另一边接受处置的概率。Trochim特别对第二类断点回归问题进行了研究,并开始利用该方法进行实证研究。与Campbell观点不同,Trochim认为断点回归的应用性并非那么的狭隘,相反,其应用范围还十分的广泛。除此之外,他还强调了决定处置的关键变量不仅仅可以是一个单一变量,而且还可以是一个合成变量。随后,断点回归的优势逐渐被学界所认可,其应用也愈加广泛。具体而言,其优势包括两方面:第一,断点回归可以应用于出于对经济成本和伦理道德问题的考虑,随机实验不能进行的环境;第二,断点回归优越于所有其它已知的因果推断方法,其结果十分接近于随机实验结果,Lee和Lemieux(2010)也通过形象的例子展示了断点回归和随机实验的相似性。Hahnetal(2001)最终为断点回归的模型识别和模型估计进行了严格意义上的理论证明,并提出了相应的估计方法,由此,断点回归在经济学中的应用如雨后春笋般出现在重要经济学文献中。三断点回归的实施步骤(一)确定型断点回归运用图形来分析处置效应是否存在是断点回归分析的基础。图形分析在断点回归的实施中扮演着重要的角色,通过将样本点和决定处置的关键变量在坐标系中描述出来,便可以清楚的看到临界值附近的样本点是否存在跳跃。如果样本点存在跳跃,那么说明确实存在处置效应,相反,如果样本点没有出现相应的跳跃,那么说明断点回归的模型识别可能存在问题。当我们从图形分析中发现了临界值处存在处置效应,那么就应当做进一步更加细致的计量实证分析。为了使图形更为直观,需要根据决定处置的关键变量来划分箱体(Bin)和箱体的范围,并在该范围内计算变量的均值。一般而言,箱体的范围需要大到包含足够多的样本使其样本点在临界值两边都比较平滑,但又要小到一定程度使得样本点在临界值处的跳跃能够明显的显现出来。Lee和Lemieux(2010)提出两种方法来选择合适的箱体范围。第一种是根据对数据的观察决定使用个箱体;然后对个箱体的虚拟变量做回归;随后,将箱体范围缩小二分之一,使得箱体由个变为个,将个箱体的虚拟变量作为解释变量再做一次回归。由于使用个箱体虚拟变量的回归是内嵌于使用个箱体虚拟变量的回归之中的,因此,可以使用标准的F检验来比判断个箱体和个箱体的优劣。第二种方法是基于这样一个原理,如果箱体足够的小,那么被解释变量和决定处置的关键变量将不会出现系统的联系,因此,可以将被解释变量对箱体的虚拟变量以及该虚拟变量和决定处置的关键变量的乘积项做回归,并使用F检验来判断虚拟变量和关键变量的乘积项是否显著的为0。通过以上方法得到合适箱体范围后,便可以分别对临界值两边的样本进行估计,得到临界值两边的平滑曲线,具体实施步骤如下:第一步,构造箱体,,其中为临界值,为箱体的范围;其次,计算每一个箱体中的样本数量,,其中为决定处置的关键变量;再次,求出每个箱体的平均值,;最后,画出和二者之间的曲线关系。第二步,同时利用临界值两边的样本进行回归。这就好比在非参数回归中使用了rectangular的核,选取叶宽(bandwidth),将样本的估计局限在范围内。一般而言,可以使用非参数回归,但是如Hahnetal.(2001)指出的,非参数回归会产生高阶数的偏差,简单的非参数估计往往并不具有吸引力,所以对于样本的回归可以采取局部线性回归(LocalLinearRegression),即最小化下式:这其中存在叶宽选择的问题,Hahn等(2001)提出最优的叶宽与成比例。例如,样本增加32倍,那么为1/2,叶宽就可以减少一半,但是这并没有解决如何选择叶宽的问题。计量经济学和统计学的文献中有两种选择叶宽的方法:第一种方法是根据拇指规则(RuleofThumb)对整个样本的数据进行估计以求得最优叶宽。比如,对于rectangular的核,最优叶宽可以根据下式求出:其中是断点回归的标准差,表示断点回归方程的二阶导数,是断点回归方程估计时的范围,2.702是使用rectangular核估计的常数。另一种方法是交叉验证法(cross-validation),即首先对临界值两边的样本分别进行回归,得到:交叉验证准则即为选择合适的叶宽以最小化:此外,断点回归中也可以加入其它的控制变量,如此做的原因是消除小样本偏差,同时使得估计更为精确。具体而言:如果控制变量的以为条件的分布在临界值处是连续的,那么的加入对处置效应的估计几乎没有影响,因为是独立于处置效应的;同时,只要接近临界值,那么的加入并不会对估计的偏差产生任何影响,但是,实际应用中,样本的选择往往并不能保证足够接近于临界值,因此,在计量模型中加入控制变量可以消除这些由于这些额外变量造成的偏差,并且,如果与被解释变量有关,控制变量的加入还可以改进估计的精确性。第三步,对断点回归的结果进行稳健性检验。首先,需要检验其它控制变量在临界值处是否存在跳跃,如果其它的控制变量在临界值处存在显著的跳跃,那么被解释变量在临界值处的跳跃将不仅仅是由于处置效应所带来的,这使得断点回归不能进行有效的因果推断;其次,需要检验决定处置的关键变量的条件密度是否存在不连续的情况,如果条件密度发生了跳跃,那么说明存在个体操作关键变量的可能。为此,可以计算每个箱体中样本的数量,将其作为纵轴,将关键变量作为横轴,通过图形和回归分析来考察关键变量的分布在临界值处是否存在跳跃。如果存在跳跃,则个体可能存在操作处置的可能,从而使断点回归方法失效;再次,需要检验当临界值取其它值时,变量是否存在跳跃。如果变量不仅在临界值处存在跳跃,而且也在其他值处存在跳跃,那么变量的跳跃是由处置效应造成的这一推断就值得怀疑,可能还存在其它因素决定了变量在临界值处的跳跃;最后,需要在计量模型估计时,使