“自然实验”估计因果效应产生偏差的原因在经济学科中涉及人类活动的实验长期以来都被认为是十分昂贵,并且受到诸多限制,实际上,我们愈发的意识到许多我们所感兴趣的参量,诸如,教育或工作经验对于收入的影响,在众多对收入产生影响的变量中有些我们无法察觉的变量会对我们所感兴趣的参量产生一个非正交的影响。这些没有被测量或说无法测量的因素可能包括随个体不同而事先存在的基本技术,个人偏好等等。这些属性特征中可能存在的异质性,意味着几乎所有的估计在基于这些特性的个人选择上都存在许多备选的解释,如测定教育的回报,个人将不能被认为是在不同教育水平上的随机分配。换句话说,受教育程度越高的人将拥有更高的收入可能反映的是有更好能力的个人会偏好于受更多的教育或说面临更低的教育机会成本。经济学家用的经过随机化处理的实验来评估他们存在异质性时的影响。这些问题当中,一些最为突出的实验是研究负所得税对劳动力供给的影响;班级规模对学生测试成绩的影响;职业培训课程对收入的影响。然而,这些人造的“实验”被广泛批评为没有共性,最为重要的是他们常常不能遵循处理组“随机性”这一要求。经济学很长一段历史中应对“识别因果关系”或“处理效应”最为广泛的方法是工具变量技术。这种方法实质上是假定一些非实验组成部分的数据是随机的,也就是说,它假定一些变量或时间满足“随机性”的原则。由于去寻找或筹措一个近似完美的随机的经济实验非常困难,导致在回答一些重要问题时所运用的标准工具变量的假设也并非那么可信。于是,经济学家和其他领域的一些研究者就寻找到了“自然实验”,从而意外收获到了对于随机效应的处理。但是在大多数关于“自然实验”的文章或摘要中,由于研究规则的改变而具备的自然特性使得大多数研究关于“行为表现”并未能轻易的给出可归纳概括的结果,如同许多“随机实验”的文献一样,这些研究存在的主要问题依旧是关于随机性假设可信与否的问题。近些年来,经济学家意识到关于一些重要的变量,“自然”为我们提供了近乎完美的随机性。应该善于寻找和合理的利用一些自然的随机事件作为工具变量,这些出于自然之手的“自然实验”受到大量的关注和青睐,不仅是它可以作为一种工具而且是因为它确实处理了经济学中一些重要的问题。现如今,由生物、气候机制引起的五个主要随机结果已被广泛作为一种工具运用,他们分别是,双胞胎出生数、人类克隆(同卵双胞胎)、出生日期、性别和天气事件。这些自然结果考虑到至少关于人类总体“异质性”的两个主要来源:品味和能力,从而被看做是似真随机的。除此之外,一些政策的实施、法律法规的颁布,因为有着与自然事件异曲同工的随机性,也被大量运用于政策效应评估的研究中。二、国内外文献回顾㈠、国内研究综述国内关于运用此类随机实验或自然实验的起步比较晚,研究成果也较少,已有的研究大多数建立在对国外类似问题研究的基础之上。张世伟等人(2008)将2005年个人所得税制度改革作为一个自然实验,运用双重差分法,实证分析了已婚女性和已婚男性受税收改革影响群体的劳动力供给效应。李树森,张世伟(2010)将对西部农民参加新农村合作医疗的财政扶持政策的实施作为一个自然实验,应用微观计量的方法分析了财政扶持政策对西部农民参加新农村合作医疗的影响,结果显示,此项政策的实施对西部农民参加新农合的效果显著,与2004年相比,2006年参加率增加了96.4%;何浩然(2012)以我国2008年6月执行的强制全国所有商品零售商对塑料购物袋收费的政策为契机,运用自然实验研究方法,在政策执行前后分别进行大规模调查对比研究,实证分析限塑令对消费者行为的影响。王飞(2014)将广西兴边富民行动看做一个实验,其实验对象是边境县(市、区)而与其毗邻的县(市、区)是天然的对照组,广西兴边富民行动的实施效果进行定量分析,回归结果表明,广西兴边富民行动对其边境县(市、区)经济发展确实起到了显著的促进作用;赖永剑(2013)认为加入WTO作为我国扩大经济开放的重要事件,其可以被视为一次准自然实验,使用准倍差法研究了这一事件对中国地区经济增长的影响。研究结果表明,加入WTO对中国地区经济增长有显著的促进作用,而且表现出地区差异性,对开放程度较高地区的经济增长产生了更大的影响;贾朋,张世伟(2013)以2005年和2006年之间中国各省市最低工资的提升作为一项自然实验,使用就业方程和工作时间方程控制个体异质性,应用“双重差分法”分析了最低工资提升的劳动供给效应。研究结果表明:最低工资提升对女性就业产生了显著的负面影响,对男性周工作时间产生了显著的正面影响;随着最低工资提升幅度的逐渐增大,其对女性就业的负面影响越来越大,对男性工作时间的正面影响也越来越大。㈡、国外研究综述国外关于应用自然实验研究经济及社会问题的起步较早,也产出了大量优秀的科研成果。HongbinLi,JunjianYi(2011)通过把中国独生子女政策的实施当做一项自然实验,考虑到该政策之针对中国的汉族人,而在少数民族却不施行这一政策,据此设定实验组和对照组,并且考虑到中国文化背景下的男孩偏好所导致的性别选择技术的进步(主要指B超技术)下的选择性流产。通过对1990-2005年间几次人口普查数据的双重差分分析,在消除种族差异和社会经济发展等因素的影响后,最终得出中国的独生子女政策导致在1991-2005年间的出生队列中,每出生10个女孩,将会额外多出生7个男孩。由于独生子女政策使得在1991-2000以及2001-2005年间出生队列的性别比例中,男孩分别占到57%和54%;NancyQian(2008)延续Schultz(1985)在研究瑞典19世纪后期生育率变化时,采用变化中的世界谷物的价格作为女性与男性工资比例变化的工具变量这一思路,结合在中国农村,女性在采茶劳动中具有比较优势,而男性在果园劳动中具有比较优势这一似真的经验性事实。茶叶的相对价值提高既增加了茶农家庭的总收入,也增加了女性的相对收入。与此相反,果园的相对价值提高增加了果农家庭的总收入,但却使家庭内女性的相对收入下降。通过估计茶叶相对价格提高对性别比的影响。作者先估计了在男性收入不变的条件下,成年女性收入提高对性别比的影响。接着,通过估计果园相对价值的提高对性别比的影响,又估计了在成年女性收入不变的前提下,成年男性收入提高对性别比的影响。然后,在不改变家庭内男女成员相对收入比例的条件下,通过估计一些性别中性的经济作物相对价值提高对性别比的影响,揭示家庭总收入增加的影响。将这三种估计方法结合起来,能够在家庭总收入提高的条件下,把特定性别的(相对)收入增加效应区分出来。最后,通过采用同样的方法来估计受教育状况,能够将总收入增加与相对收入增加分别对男孩与女孩接受教育的影响估计出来。结果显示,成年女性的相对收入增加对提高女孩的存活率有着直接的、正的影响。在20世纪80年代早期的中国农村,如果男性收入保持不变,成年女性收入每提高7.7美元(相当于农村家庭平均收入的10%)将会使女孩的存活率提高1个百分点,并且使男孩与女孩的受教育程度同时提高。与此相反,在女性收入不变的条件下,提高男性收入则降低了女孩的存活率和受教育水平,但对男孩的受教育水平却无显著影响。单独提高家庭总收入对女孩的存活率和受教育水平都没有影响。从而得出与特定性别有关的收入和男女性别失衡之间的因果效应关系;NathanNunnandDiegoPuga(2012)认为地理环境通过其对历史的影响,进而可对现如今的经济发展产生重大的影响。作者从“非洲国家地形的险峻度”这一随机的自然现象入手,集中分析险峻的地理环境和非洲奴隶贸易之间的关系。得出虽然崎岖的地形会阻碍贸易和大多数的生产活动,对全球的收入有一个消极的影响。但是在奴隶贸易时期的非洲,崎岖的地形却可以为那些试图被强行抓去贩卖的奴隶提供一个庇护。经验上来看,崎岖地形对经济发展有不利的影响,但是作者通过对世界范围内一些国家的研究,估计出了对非洲国家的人均收入不同的影响效应,并且经实证证明这种影响效应不光在统计上显著而且在经济上也显著。同时作者也指出,由于历史上奴隶贸易的缘故,这种影响效应是非洲国家独有的;Bianhchim,GudmundsonBandZonega.G(2001)研究了冰岛税制改革对劳动力供给的影响,其实验组与对照组运用的也是税制改革法令颁布前后的劳动力供给市场;关于对估计人类能力投资(教育和工作经验)的回报,一个重要的条件就是找出一个能够引起学校学识变化却与个人天生能力无关的自然实验,用以消除在估计教育回报时个人天生能力产生的偏差。JoshuaAngristandAlanKrueger(1991),用孩子的出生日期作为自然实验,KristinButcherandAnneCase(1994),使用的是孩子的性别作为随机的自然实验,JohnJ.DonohueⅢandStevenD.Levitt(2001)以堕胎合法化这一法规的出台作为一项自然实验,分别观察大约18年后,通过这项法律的州和当时没有通过这项法律的州的犯罪情况。作者通过实证分析得出,1970年允许堕胎的5个州相比于其他州经历了更早的犯罪率的下降,以1973年罗诉韦德案(RoeV.Wade)为契机而促成堕胎合法化的在70年代和80年代具有高堕胎率的州在90年代经历了更大程度的犯罪率的下降。最终得出堕胎的合法化使犯罪率下降近50%;NathanNunnandNancyQian(2011)利用适合种植土豆的地区差异加上由于将土豆从美洲引入旧世界的时间变化性,作者也是根据已经发生的历史事件作为一项自然实验,将土豆引入前后的旧世界作为对照组和实验组,以总的适宜种植土豆的土地数量的自然对数作为变量来估计土豆对旧世界人口和城市化的影响。结果显示,土豆的引入对18世纪和19世纪人口和城市化有着明显的促进作用,根据保守估计,土豆的引入使1700年到1900年间的旧世界的人口和城市化大约增加0.25个百分点。现有的研究对于如何寻找和合理的地运用一些自然的随机事件作为工具变量进而解决处理组遵循“随机性这一要求,有着很好的启示意义。然而,部分研究者在一味的追求“自然实验”所带来的近乎完美的随机性的同时,却往往忽略了他们运用自然事件的介入所构造的处理组和对照组之间的可比性问题,这就导致研究者进行了错误的分组间的比较,进而使研究偏离了研究者一直追求的因果关系。另外,研究者常常会忽略当一个政策干预所提供的自然实验要想达到研究者所合意的分组,需要一系列附加的假设,或是难以意识到其研究所能回答的已不再是起初所想要回答的因果关系问题。基于此,本文将提供一个分析框架,通过在同一个框架中构造不同的分组间的比较,来探讨和分析运用“自然实验”研究变量间因果关系可能存在的问题,不但有助于深化现有理论,加强对“自然实验”的理解,同时也给予后来研究者以提醒,具有理论意义。三、运用自然实验可能存在的问题㈠、“自然实验”估计因果效应产生偏差的原因自然实验可以帮助研究者克服面对社会科学研究时某些因果关系推断方面的阻碍,然而,即便自然事件的介入是一个随机分配的过程,仍旧有一些产生于自然实验的处理组与控制组的比较是无效的。文章余下部分将会提供一个框架来厘清当中存在的那些细微且经常被忽略的问题,本文将通过一个实例来阐明在不同情况下,“自然介入”的随机分配并不足以证明一个因果效应的无偏估计,常常需要许多附加的假设。自然实验与随机实验有许多相似的特点,其关键不同点是引起经常被忽略的推理和概念上的问题。在这种类型的实验中,我们常常不能立即明显的给出哪些分组间是具有可比性的,这就导致研究者经常错误的进行分组间的比较。更进一步的,有效的分组间的比较可能估计的并非是研究者所感兴趣的因果关系。虽说这样的问题在任何研究设计中都可能存在,,但在运用自然实验的研究中显得尤为明显。就如后文所讨论的那样,任意一个时间或政策干预因为其提供有用的变量来源而被应用于研究之中,但是达到研究者想要的那种分组比较通常需要一系列附加的假设。研究者常常不能意识到这类问题的存在,并且找不到明确的规定和附加的假设为他们的实质性问题提供最好的设计,或是意识到他们所回答的