118©陈强,《高级计量经济学及Stata应用》课件,第二版,2014年,高等教育出版社。第18章随机实验与自然实验18.1实验数据假设研究1x是否导致y。假定12,,,Kxxx包含所有影响y的因素。不同学科采用不同的实验方法,大致分为以下几类。(1)控制实验(controlledexperiment):在理想的物理实验中,控制2,,Kxx全部不变,单独让1x变化,观察y的变化。(2)随机(控制)实验(randomizedcontrolledexperiment):2【例】医学上对新药1x疗效的实验。由于参加实验者的体质与生活方式不同,不可能完全控制所有其他因素2,,Kxx。随机实验将实验人群(或个体)随机地分为两组,其中“实验组”或“处理组”(treatmentgroup)服用真药,而“控制组”(controlgroup,也称“对照组”)服用“安慰药”(placebo)。被试者不知道自己分在哪一组,避免心理干扰。有时科研人员也不知道被试者在哪一组,称为“双盲法”(doubleblind)。【例】农学中将地块随机地分成三组(很难找到土壤条件完全一样的地块),分别给予不同的施肥量,然后考察施肥的效果。3(3)自然实验或准实验(naturalexperimentorquasiexperiment):由于某些并非为了实验目的而发生的外部突发事件,使得当事人仿佛被随机地分在了实验组或控制组。【例】一个州通过某法律,但相邻州未通过此法律。两州民众事先不知道哪个州会通过此法律,故无法自我选择住在哪个州。从考察法律的效果而言,可近似认为民众随机选择住在哪个州,或被随机分为实验组(通过法律)与控制组(没通过法律)。(4)思想实验(thoughtexperiment):MiltonFriedman曾设想在小岛上通过空投货币,考察该岛的宏观经济的变化。418.2理想的随机实验在理想的随机实验(idealrandomizedexperiment)中,实验组与控制组的成员决定完全随机,比如,通过抛硬币或电脑随机数来决定。个体究竟分在哪一组或得到多大的实验“处理水平”(treatmentlevel),与个体的特征或其他可能影响实验结果的因素完全独立。解释变量“处理水平”与被遗漏的扰动项不相关,可避免遗漏变量偏差(omittedvariablebias)或内生变量偏差(endogeneitybias)。考虑以下回归模型:iiiyx5ix完全随机地决定。由于ix与i相互独立,故Cov(,)0iix,无论遗漏多少变量,OLS都一致。由于ix与i相互独立,故1E(|,,)0inxx,也满足小样本理论的严格外生性假定,故OLS无偏。在理想的随机实验中,X对y的因果效应(causaleffect)表现在条件期望的差别,即E(|)E(|0)yXxyX称为“处理效应”(treatmenteffect)。6例ix为服用药量,比如,0,1,2ix,而iy为病情康复情况。例0,1ix表示是否参加过某一就业培训项目(jobtrainingprogram),iy为未来的就业状态。如果0,1ix为虚拟变量,则方程的OLS估计量为OLStreatcontrolˆyytreaty为实验组的样本均值,controly为控制组的样本均值。在回归方程中加入虚拟变量的效果就相当于给予实验组与控制组不同的截距项。而当iy对常数项回归,系数估计值就是y。因此,7OLScontrolˆy,OLSOLStreatˆˆy由于OLSˆ等于实验组均值与控制组均值之差,故称为“差分估计量”(differencesestimator)。例班级规模是否影响学习成绩?美国田纳西州进行了为期四年的随机实验,将幼儿园至小学三年级的学生随机分为三组。第一组为普通班,每班22-25名学生;第二组为小班,每班13-17名学生;第三组也为小班,但配备一名教学助理。教师也随机分到这三类班级。818.3引入更多的解释变量在理想的随机实验条件下,OLS(即差分估计量)一致且无偏,但由于遗漏较多变量,i的方差可能较大,OLS可能效率不高。引入某些遗漏变量,可改善此问题;也提供了检验ix是否完全随机的机会。假设引入的其他解释变量为1,,iiKzz,11iiiKiKiyxzz如果ix完全随机,则1,,iiKzz应对ix没有解释力。可把ix对91,,iiKzz回归,并检验此方程的整体显著性。例家中有电脑能否改善教育效果(educationaloutcome)?FairlieandLondon(2012)在美国一个社区学院的286名新生中进行了随机实验。这些学生被随机分成两组,一组(实验组)得到免费电脑,而另一组为控制组;问卷跟踪调查两年,并从学院获取相关信息。18.4随机实验执行过程中可能出现的问题在随机实验的执行过程中,可能出现的问题包括,“内部有效性问题”(internalvalidity)与“外部有效性问题”(externalvalidity)。101.内部有效性问题(1)未能完全随机分组(failuretorandomize):比如,以姓氏字母在字母表的前半部或后半部来决定谁进入就业培训项目。但姓氏与种族有关,而种族又与就业机会有关。可把ix对个体特征1,,iiKzz回归,并检验该回归方程的整体显著性。(2)未能完全遵从实验设计(partialcompliance):比如,被指定参加就业培训者却因故没来,而未被指定参加者却自行来参加。可使用工具变量法来解决ix的内生性问题,以“设计处理水平”(assignedtreatmentlevel,记为iw)作为“实际处理水平”(actual11treatmentlevel,记为ix)的工具变量。(3)中途退出实验(attrition):比如,参加就业培训的优秀者可能在项目进行过程中就找到工作而退出项目,造成选择性偏差。如果退出原因与实验无关(比如,去照顾家人),则不会造成选择性偏差。(4)实验效应或霍桑效应(experimentaleffect或Hawthorneeffect):参加实验本身可能改变个体的心理或行为,从而影响实验结果。对于药物疗效实验,可以通过使用双盲法来避免这种效应,称为“霍桑效应”。(5)样本过小:由于实验成本高,实验的样本容量可能较小。122.外部有效性问题(1)样本的代表性不足(non-representativesample):让即将获释的囚犯参与就业培训,其结论可能难以推广到普通人群。又比如,项目参加者为自愿报名的义工,而义工的素质通常高于普通人。(2)小型实验的条件与大规模推广时的现实条件不同:经济学家在肯尼亚进行实验,旨在推广蚊帐防止疟疾。一种观点认为,免费发放蚊帐能够最快地推广蚊帐。另一种观点认为,人们不会珍惜免费蚊帐,且免费发放使得蚊帐的长期供给变得困难。经济学家随机地对一些村庄提供免费蚊帐,对另外一些村庄有偿提供。13实验结果证明,免费提供蚊帐更为有效。但实验结果如果大规模推广仍然有效吗?反驳者指出,在那个实验地区,蚊帐的价值已广为人知;在实验过程中,蚊帐供给也有保证;这两点在大规模推广时未必成立。(3)一般均衡效应(generalequilibriumeffect):一个小型的就业培训项目可能不会改变社会上雇主的行为。大面积推广后,雇主可能减少由企业自行提供的员工培训,使得该项目的社会净福利减少。(4)自我选择效应:在随机实验中,数据可能显示该项目并不有效。但在现实社会中,14预期收益最大的人们将最有积极性参加此项目。因此,这个项目可能在实际上有效。18.5自然实验随机实验通常成本较高。而自然实验为自然发生(非为实验目的而发生),几乎没有成本。自然实验可分为两类。在第一类自然实验中,个体的分组或处理水平完全由自然实验所决定,可直接用OLS估计因果效应。在第二类自然实验中,个体的分组或处理水平只是部分地由自然实验所决定,此时应以自然实验所带来的随机变动作为工具变量进行估计。15例(第一类自然实验)最低工资对就业的影响。提高法定最低工资(minimumwage)在多大程度上会影响对低技能工人的需求?1992年美国新泽西州通过法律提高最低工资,但相邻的宾夕法尼亚州最低工资却保持不变。两个州的雇主仿佛被随机地分配到实验组(新泽西州)与控制组(宾夕法尼亚州)。例(第二类自然实验)服兵役是否影响退役后的长期收入?Angrist(1990)考察了越战期间的参军者,当时美国对全国年轻男子以生日抽签方式进行征兵。抽签结果完全随机,但是否参军还取决于体检结果,而且有些人得到豁免,另一些人却自愿参军。16例(第二类自然实验)经济增长对内战的影响。是否经济增长慢导致内战概率上升?但内战也会拖累经济增长,故存在内生性。Migueletal(2004)使用外生的降雨量变化(rainfallvariation)作为自然实验,考察41个非洲国家在1981-1999年间,经济增长对内战概率的因果作用。非洲国家的经济比较依赖于自然降雨的农业,故经济增长与降雨量有关,但并不完全取决于降雨量。Migueletal(2004)使用降雨量变化作为经济增长的IV,发现经济低增长显著增加内战概率。例京杭大运河流经省份的人均GDP平均而言高于其他省份。这是否可以归功于京杭大运河对区域经济增长的促进作用?1718.6双重差分法实验效果常需要一段时间才能显现。考虑以下两期面板数据:(1,,;1,2)ittitiityDxuinttD为实验期虚拟变量(tD=1,如果2t,实验后;tD=0,如果1t,实验前),iu为不可观测的个体特征。政策虚拟变量(policydummy)1,20,若实验组,且其他ititx当1t时,实验组与控制组并未受到任何不同对待,itx都等于0。18当2t时,实验组1itx,而控制组itx依然为0。如果实验未能完全随机化(比如,观测数据),则itx可能与iu相关,导致OLS不一致。由于是面板数据,可对原方程进行一阶差分,以消掉iu,2iiiyx用OLS估计上式,可得一致估计。根据与差分估计量同样的推理:OLStreatcontroltreat,2treat,1control,2control,1ˆ()()yyyyyy此法称为“双重差分估计量”(Difference-in-Differencesestimator,19简记DD),记为DDˆ。双重差分估计量已剔除实验组与控制组“实验前差异”(pretreatmentdifferences)的影响。图18.1双重差分估计量示意图20对于双重差分估计量,也可引入其他解释变量1,,iiKzz:211iiiKiKiyxzz以iy为被解释变量的双重差分法不适用于多期的数据。回到以ity为被解释变量的面板模型,暂时忽略其他解释变量,仍假设两期数据。则原方程与以下两期面板模型等价:012(1,,;1,2)itititityGDGDint其中,iG为实验组虚拟变量(iG=1,个体i属于实验组;iG=0,个体i属于控制组);tD为实验期虚拟变量(tD=1,如果t=2;tD=0,如果t=1),互动项ititGDx(取值为1,2若实验组,且it;反21之,取值为0)。分组虚拟变量iG刻画实验组与控制组本身的差异(即使不进行实验,也存在此差异)。时间虚拟变量tD刻画实验前后两期本身的差异(即使不进行实验,也存在此时间趋势)。互动项itGD才真正度量实验组的政策效应。如有其他解释变量1,,iiKzz,可直接放入方程。22当t=1时,方程可以写为1021iiiyG当t=2时,方程可以写为201222iiiiyGDG两方程相减可得:122112()iiiiiiyGDx此方程与差分方程