合成控制法经济学家常要评估某政策或事件的效应。此政策可能实施于某国家或地区(省、州或城市)。最简单(天真)的方法是考察政策实施前后的时间序列,看所关心的结果(outcomeofinterest)如何变化。但此结果还可能受其原有变化趋势的影响,或其他同时发生的混淆性事件(confounder)的作用。为此,常使用“鲁宾的反事实框架”(Rubin'scounterfactualframework),即假想该地区如未受政策干预将会怎样,并与事实上受到干预的实际数据进行对比,二者之差即为“处理效应”(treatmenteffect,借用医学术语)。困难之处在于,我们无法观测到“该地区如未受政策干预将会怎样”(反事实)。选择控制组是门艺术常用解决方法是,寻找适当的控制组(controlgroup),即在各方面都与受干预地区相似却未受干预的其他地区,以作为处理组(treatedgroup,即受到干预的地区)的反事实替身(counterfactuals)。但通常不易找到最理想的控制地区(controlregion),在各方面都接近于处理地区(treatedregion)。比如,要考察仅在北京实施的某政策效果,自然会想到以上海作为控制地区;但上海毕竟与北京不完全相同。或可用其他一线城市(上海、广州、深圳)构成北京的控制组,比较上海、广州、深圳与北京在政策实施前后的差别,此方法也称“比较案例研究”(comparativecasestudies)。但如何选择控制组通常存在主观随意性(ambiguity),而上海、广州、深圳与北京的相似度也不尽相同。为此,AbadieandGardeazabal(2003)提出“合成控制法”(SyntheticControlMethod)。其基本思想是,虽然无法找到北京的最佳控制地区,但通常可对中国的若干大城市进行适当的线性组合,以构造一个更为优秀的“合成控制地区”(syntheticcontrolregion),并将“真实北京”与“合成北京”进行对比,故名“合成控制法”。合成控制法的一大优势是,可以根据数据(data-driven)来选择线性组合的最优权重,避免了研究者主观选择控制组的随意性。(一)Abadie论文西班牙恐怖活动引发的计量方法AbadieandGardeazabal(2003)的初衷是以合成控制法研究西班牙巴斯克地区(Basquecountry)恐怖活动的经济成本。MIT经济系教授AlbertoAbadie(此前长期任教于哈佛大学肯尼迪学院),正是来自于巴斯克地区,一个毗邻法国的西班牙自治地区。巴斯克人长期居住于巴斯克地区,拥有独特的语言与文化,在历史上多次成功对抗强敌入侵。在1970年代初,巴斯克地区的人均GDP在西班牙17个地区中排第三。之后,由于民族独立的诉求未获满足,从1975年开始,巴斯克地区陷入有组织的恐怖活动之中。恐怖活动重创巴斯克经济,至1990年代末,巴斯克地区的人均GDP在西班牙排名降为第六。然而,70年代末至80年代初,西班牙整体经济也下行,故不易区分恐怖活动的单独效应。而且,巴斯克地区在恐怖活动之前的经济增长潜力显然与西班牙其他地区也不尽相同。为此,AbadieandGardeazabal(2003)使用西班牙其他地区的线性组合来构造合成的控制地区,并使得合成控制地区的经济特征与60年代末恐怖活动爆发前的巴斯克地区尽可能相似,然后把此后“合成巴斯克地区”(syntheticBasquescountry)的人均GDP演化与“真实巴斯克地区”(actualBasquecountry)进行对比。如何构造合成控制具体而言,假设共有(1+J)个地区,其中第1个地区为受到恐怖活动冲击的巴斯克地区,而其余J个西班牙地区未受冲击(在此J=16),构成潜在的控制组,称为“donorpool”(原意为“器官捐献库”,再次借用医学术语)。一个潜在假定是,恐怖活动仅影响巴斯克地区,而未波及西班牙的其他地区(事实上恐怖活动也主要集中于巴斯克地区)。将合成控制地区的权重记为以下J维列向量:其中,w2表示第2个地区在合成巴斯克地区所占的权重,以此类推;所有权重皆非负,且权重之和为1。w的不同取值即构成不同的合成控制地区,简称“合成控制”(syntheticcontrol)。在此研究中,被解释变量为人均GDP,记为y。影响y的解释变量或预测变量(predictors)包括投资率、人口密度、产业结构、人力资本等,详见下表。在巴斯克地区爆发恐怖活动之前,记其各预测变量的平均值为向量x1(K×1维列向量,下标1表示“treatedregion”),即上表第(1)列的数值(除了人均GDP)。将西班牙其他地区相应预测变量的平均值记为矩阵X0(K×J维矩阵,下标0表示“controlregion”),其中第j列为第j个地区的相应取值。显然,我们希望选择权重w,使得X0w尽可能地接近于x1,即经过加权之后,合成控制地区的经济特征应尽量接近处理地区。为度量此距离,可使用二次型(类似于欧几里得空间中两点之间的距离)。由于x1中的每个预测变量对于y的预测能力有大小之别,应在距离函数中享有不同的权重,故考虑以下有约束的最小化问题:其中,V为(K×K)维对角矩阵,其对角线元素均为非负权重,反映相应的预测变量对于人均GDP的相对重要性。此最小化问题的目标函数是二次函数,为“二次规划”(quadraticprogramming)问题,一般进行数值求解。记此约束最小化问题的最优解为w*(V);显然,它依赖于对角矩阵V。进一步,选择最优的V,使得在恐怖活动全面爆发之前,合成巴斯克地区的人均GDP与真实巴斯克地区尽量接近。具体而言,记z1为(10×1)维列向量,包含巴斯克地区在1960-1969年间的人均GDP;记Z0为(10×J)维矩阵,其中每列为相应控制地区在1960-1969年间的人均GDP。用Z0w*(V)来预测z1,然后选择V,以最小化“均方预测误差”(MeanSquaredPredictionError,简记MSPE),即将每期的预测误差平方后再求各期的平均:求解此最小化问题,可得构成合成巴斯克地区的最优权重,w*=w*(V*)。经过计算,AbadieandGardeazabal(2003)发现,只有两个地区的权重为正,即加泰罗尼亚(Catalonia,权重0.8508)与马德里(Madrid,权重0.1492),而其他地区的权重均为0。直观上,Catalonia与Madrid的经济特征也与巴斯克地区最为相似。合成控制法的“效果图得到合成巴斯克地区的权重之后,即可计算其人均GDP在样本期间的演化过程。记巴斯克地区在样本期间(假设为T期)的人均GDP为向量y1(T×1维列向量)。记其他地区在样本期间的人均GDP为矩阵Y0(T×J维矩阵),其中每列为相应地区的人均GDP。由此可得合成巴斯克地区的人均GDP序列y1*=Y0w*。最直观的方法是将y1与合成控制的y1*画时间趋势图,参见下图。从上图可知,在1975年大规模恐怖活动爆发之前,真实巴斯克(实线)与合成巴斯克(虚线)的人均GDP十分接近。二者在1975年后即开始分岔;而在1980与1990年代,真实巴斯克的人均GDP比合成巴斯克低约10%。换言之,巴斯克恐怖活动的经济成本是损失了约10%的人均GDP反事实的分析框架假设共有(1+J)个地区,其中第1个地区受到政策干预(如有多个地区受到干预,可合并为一个大地区;或分别进行估计),而其余J个地区未受冲击(构成donorpool)。记yit为地区i在第t期实际观测到的结果变量,其中i=1,...,J+1,而t=1,...,T。记yitN为地区i在第t期如果未受政策干预的结果变量(上标N表示未受干预)。记T0为政策干预开始之前(preintervention)的时期数,且1≤T0T。记yitI为地区i在第t期的结果变量(上标I表示Intervention),如果地区i在第(T0+1)至第T期持续地受到政策干预。假设政策在前T0期对于结果变量没有影响,即对于所有i与t≤T0,都有yit=yitN=yitI。如果政策在实施之前即产生影响(比如,通过预期效应),则可重新定义T0为政策实际开始产生影响之前的那个时期。一个潜在假定是各地区之间不会互相影响(nointerferencebetweenunits);特别地,控制地区的结果变量不受处理地区政策冲击的影响。我们关心当i=1而tT0时的处理效应:在上式中,只要估计y1tN即可。引入因子模型假设yitN由以下“因子模型”(factormodel)所决定:其中,上式右边第(1)项δt为时间固定效应(timefixedeffects)。第(2)项的zi为可观测的向量(不受政策干预影响,也不随时间而变;比如,干预之前的预测变量之平均值)。zi对于yitN的作用随时间而变,故zi的系数θt(未知参数)带时间下标t。第(3)项为不可观测的“互动固定效应”(InteractiveFixedEffects),即个体固定效应ui与时间固定效应λt的乘积(Bai,2009)。第(4)项ԑit为随机扰动项。根据“因子分析”(factoranalysis)的术语,称第(3)项中不可观测的λt为“共同因子”(commonfactors),可理解为不同地区所面临的共同冲击(commonshocks),比如它有两个分量,分别表示技术冲击(technologicalshocks)与金融危机(financialcrises);而各地区对于共同冲击λt的反应并不相同,以ui来表示,称为“因子载荷”(factorloading)。如果λt是一维且为常数,则上式简化为“双向固定效应模型”(two-wayfixedeffectsmodel),包含个体固定效应ui与时间固定效应δt。由此可知,上式是双向固定效应模型的推广,它允许不同个体对于共同冲击的异质性反应(heterogeneousimpacts)。合成控制的误差记构造合成控制的权重向量为:其中,w2表示第2个地区在合成控制所占的权重,以此类推;所有权重皆为非负,且权重之和为1。对于任意给定的w,可将合成控制地区的结果变量写为:将y1tN减去上式可得:显然,如果能找到w,使得上式右边的(1)式与(2)式均为0,则上式的期望为0,故合成控制为y1tN的无偏估计。但(2)式中的ui不可观测,故不可行。Abadieetal.(2010)证明,如果能找到w使得即根据可观测的经济特征与干预前结果变量所选择的合成控制w,也会使得合成控制的不可观测特征接近于处理地区。反之,如果无法找到w,使得合成控制能很好地复制(reproduce)处理地区的经济特征以及干预之前的结果变量,则不建议使用合成控制法。合成控制法的基本性质如果合成控制w*能很好地复制处理地区的经济特征与干预前的结果变量(关于如何计算w*,参见首篇《合成控制法(一)》),则可定义如下合成控制估计量(SyntheticControlEstimator):Abadieetal.(2010)证明,在一定的正则条件下,如果合成控制w*能完全地复制(perfectlyreproduce)处理地区的经济特征与干预前的结果变量,则当干预前期数T0趋向无穷大时,合成控制估计量是渐近无偏(asymptoticallyunbiased)。反之,如果合成控制w*只是不完全地复制(imperfectlyreproduce)处理地区的经济特征与干预前的结果变量(更为常见的情形),则合成控制估计量将是渐近有偏的。此偏差被称为“内插偏差”(interpolationbias),因为使用内插法构造的合成控制并不是处理地区的完美的反事实替身。因此,在使用合成控制法时,一个重要的模型设定检验就是,考察合成控制的经济特征与干预前的结果变量是否与处理地区足够接近。合成控制法的Stata命令Abadieetal.(2010)还提供了合成控制法的Stata程序synth,使得估计十分方便。打开Stata后,可输入以下命令:.sscinstallsynt