图片来源:作者手绘原文信息:NathanNunnandLeonardWantchekon,TheSlaveTradeandtheOriginsofMistrustinAfrica.AmericanEconomicReview,2011,Vol101,No7,pp.3221-3252.引言实证研究面临的最大问题莫过于内生性,而解决该问题的一个重要手段就是IV。但是我们知道IV的两个前提条件—强相关和严外生,对于前者我们很容易直观上得到检验,最棘手的就是后者外生性,也就是我们通常说所的排他性约束,内生变量只通过工具变量影响影响因变量,这个在理论上是无法直接验证的,只有靠argue。诸如出生时间这样在当时看起来非常完美的IV,随着时间推移和研究深入,也变得不是那么完美。即便作者能言善辩能举出很多理由说明自己的IV是多么外生,但是后来的读者总能找到一些其他不可观测因素来攻击这个排他性。与其陷入这场无休止的口水战,我们不妨转变思路,由于IV估计仍然是有偏的,只是在大样本下具有一致性,那么作者虽然承认IV不是那么外生(plausibleexogeneous),但是只要IV对y的直接影响不那么大,我们这时不是为了要准确估计那个弹性系数,这个时候IV虽然不完全满足排他性约束,但是也不会使内生变量系数的符号和显著性发生变化,结果仍然是稳健的。今天给大家带来的哈佛大学Nunn教授的这个文章就给我们讲述了该方法的应用,他和nancyqian合作的不少论文我之前也推送过,这个论文除了工具变量排他性约束的argue,以及对遗漏变量检验和机制识别也有很多可取的地方,堪称应用微观计量的一个经典文献。中心思想本文想要识别的是非洲历史上有更多奴隶贸易的地区的人们,在现在会变得更加不信任这两者之间的因果关系,作者进一步发现这中间的主要传导机制是内部的文化准则、信念和价值观,其解释力至少是外部的政治和法律环境变化影响的两倍。本文的研究对经济发展、国际贸易和企业发展领域信任的重要性有了新的认识,有助于人们更好了解信任在文化、制度、信念中对个人决策的影响。识别策略1.数据当前信任数据样本来源于2005年非洲17个国家的民意调查,每个国家随机抽取了1200或者2400个具有投票年龄的公民,最后得到有效样本21702个。该问卷调查了每个国家内同一种族或者其他种族对亲戚、邻居和政府的信任度,信任程度从低到高依次是一点也不信任、一点点信任、一般信任、非常信任,分别记为0、1、2、3,其中一点也不信任和一点点信任的比例分别为7%和18%。历史上的奴隶贸易贸易数据来源于Nunn(2008)的论文,他把原来国家层面的奴隶贸易数据进一步分解到1400-1900年间与大西洋和印度洋奴隶交易的国家—种族层面,最后得到与大西洋有奴隶贸易的来自229个种族的80656个样本,与印度洋有奴隶贸易的来自80个种族的21048个样本。2.模型设定下标表示:第c个国家第d个地区第e个种族的第i个人,虽然y有四个下标,其实除了个人外的其他三个都可以去掉,写上只是为了更方便理解,该样本本质就是一个普通的截面数据,由于这里的四个维度并不是类似地区、行业和时间之间的平行关系,他们之间是层层嵌套关系,所以这里并没有控制两两甚至三三的联合固定效应,只控制了最上层国家固定效应αc。其他控制变量都是分别在个人、地区和种族维度变化。3.因果关系识别上面简单的OLS回归很可能由于遗漏变量,只是反映的相关关系,比如历史上缺乏信任的地方有着更多的奴隶贸易,这种不信任因为跟奴隶贸易和随后的不信任相关的历史事件而持续到现在。为了确定其中的因果关系作者又做了如下几个方面工作:(1)selectiononobservable上面这个翻译不一定准确,主要是为了与后面的selectiononunobservable相对,为了控制奴隶贸易后欧洲正式殖民规则的影响,作者又控制了前殖民地时代的种族特征,如最开始的经济和政治发展状况,发现加入这两个控制变量后,结果仍然保持不变。(2)selectiononunobservable作者采用JosephGAltonjietal(2005)的方法来测算不可观测因素影响,结果如表四所示:上表四中每列报告的系数是,其中βF是控制所有解释变量的核心变量的系数,βR是控制部分解释变量的核心变量的系数,计量理论告诉我们再控制了最主要的控制变量之后,进一步引入控制变量不会对核心变量的系数发生多大变化,这个时候βF和βR应该很接近,那么这个比例应该非常大,此时遗漏变量的风险也就非常小了。从表四可知,所有比例系数都大于1,中位数在4.1左右,作者认为selectiononunobservable的效应是selectiononobservable的四倍,此时遗漏变量的风险已经很小了。(3)IV估计为了进一步解决内生性,作者采用历史上有奴隶贸易的种族地区到最近海岸线的距离作为工具变量,虽然作者认为在与大西洋和印度洋的奴隶贸易之前,非洲地区没有其他的海外贸易,从而排除了到海岸线的距离可能会通过海外贸易影响最初的经济发展,从而对现在的信任产生直接影响的渠道,论证了工具变量的排他性。作者仍然觉得因为某些原因可能会使排他性约束不满足:第一,与海岸线的距离可能会跟与欧洲的其他形式联系(如殖民规则)相关,所以后面作者用IV估计时控制了种族层面的与殖民相关变量;第二,与海岸线的距离可能跟渔业相关,尽管对渔业如何影响信任作者并不清楚,同样作者在IV估计中也控制了种族层面的渔业变量;第三,与海岸线的距离可能与古代的撒哈拉沙漠的贸易网络有关,因此作者IV估计中又控制了到最近撒哈拉沙漠贸易城市的距离。结果如下表六所示:虽然对本文绝大部分样本国家在1400年与大西洋和印度洋的奴隶贸易之前,没有其他的海外贸易。但是对于某些非洲国家1400年前却有与印度洋和海外贸易,从而到海岸线的距离就会对现在的信任产生直接影响,从而可能会导致IV的排他性约束产生影响。为此作者进行了一个falsificationtest为自己正名,如果到海岸线的距离确实是只通过历史上奴隶贸易影响如今的信任,那么在历史上没有奴隶交易的亚洲地区,用海岸线距离对信任进行reduce-form估计应该不显著。结果如下表七所示,非洲的itt结果显著,亚洲的不显著。如果此时还有人怀疑IV不够外生,作者还有办法解决这个问题,个人认为这是本文最出彩的地方,作者又引入了Conleyetal(2008)(正式论文发表在2012年小RES)的一个plausiblyexogeneous方法:其中β是我们感兴趣的内生变量x真实系数,γ是工具变量z对因变量的直接效应,π是第一阶段工具变量估计系数。当IV不完全满足排他性约束时,对y有一定的直接效应γ时,估计有偏。那么如果工具变量z对y的直接影响γ大于某个系数时,很可能导致β的系数不显著甚至变号,从而导致结果不可靠。为此他们提出了一个unionofconfidenceintervals的方法,通过用Z做工具变量IV估计y-γ0*Z=β0+β1*X+ξ,通过估计出β1并构造出对称的1-α置信区间,即:运用该方法的关键在于对于γ的取值和分布事先有一定了解,特别是在Conleyetal(2012)以及作者本人为此方法编写的plausexog的stata命令中,要求事先给定γ的均值和方差,方法比较复杂。这里Nunn对其进行了一定简化,只是对γ按照不同符号进行了分类讨论。如果γ0,根据(2)式,由于π0,导致被低估,那么真实的β应该是负的更多,从而进一步增强我们的结论;如果γ0,给定90%的置信区间,经过计算发现只有当γ56*10^(-6),是原文表四第四列基准情形时7*10^(-6)(只是表四第四列报告的不同控制变量情形时内生变量系数比例,并没有包含工具变量,这个系数我猜想可能是把工具变量替换掉内生变量直接进行reduceform估计结果,希望有读者对此可以跟我探讨)的八倍,真实的β才会开始变得不显著,所以作者有理由相信即便这是个plausibleexogeneous,仍然不会影响本文的基本结论。关于IV偏误的敏感性测试,ShulamitkahnandMegenJ.Macgarvie(2016,小RES)也提供了一个方法,本人愚钝,即便拿到了do文档也没有搞明白其中原理,欢迎对这方面有研究的朋友给本人答疑解惑。机制分析作者认为过去的奴隶贸易影响现在的信任感主要有两个机制:一个是内部的,奴隶贸易改变了种族内的文化准则,使人们变得更加不信任;另一个是外部的,奴隶贸易导致了长期的制度和政治环境恶化,奴隶贸易越多的地区人们互相欺骗更容易,周围的人们更不值得被信任。为了识别这2个机制,作者又引入了一个新的奴隶贸易量测度:个人今天生活地区在历史上的奴隶贸易量(location-based)。其背后逻辑在于当个人发生迁移时,内部因素如个人的信念和价值观也会随人的居住地变化而带走了,外部因素如政治和法律制度和社会结构却留了下来。所以如果奴隶贸易主要是通过内部因素影响信任感,那主要是借助影响祖先居住地过去的奴隶贸易量。反之如果通过外部因素,则是借助现在居住地的过去奴隶贸易量。由于现在的人有45%左右跟过去祖先的居住地发生了变化,因此这为我们识别机制提供了来源。结果如下表十所示。这时新加入反应外部因素的现在居住地过去的贸易量显著为负,而原来反应内部因素的祖先居住地过去的贸易量仍然显著为负,只是系数下降了10-15%,说明两者都是导致如今社会不信任的主要因素,由于后者系数是前者的至少2倍(应该看标准化系数才对),所以作者认为内部因素是更主要的传导机制。小结以前作者只要被审稿人问到工具变量不够外生,那就是仿佛蛇被打住了七寸,很多情况下作者是很难申辩的。因为总有些“莫须有”的理由,会让人质疑总有其他什么渠道会使得工具变量对因变量产生直接影响,然后作者和审稿人就要围绕着这些问题,产生一场最终很可能是没有结果的拉锯战,实际上这是在浪费大家宝贵的时间。今天这个推文为我们解决这个实证研究中的头号难题,无疑提供了一个新的解决思路,那就是作者承认IV可能不大外生,但是通过一系列回归和检验告诉读者,即便不外生不排他,但是这个问题在绝大多数情况下都不会影响文章的基本结论。与其进一步争论不休,不如退一步海阔天空,既满足了审稿人的好奇心,也解决了作者的实际问题,皆大欢喜。因此个人认为这个由Conleyetal(2012)提出并经过NunnandWantchekon(2011)改进的plausibleexogeneous方法,是目前解决IV不外生问题的最有利武器,值得广大实证研究者好好学习。Abstract:WeshowthatcurrentdifferencesintrustlevelswithinAfricacanbetracedbacktothetransatlanticandIndianOceanslavetrades.Combiningcontemporaryindividual-levelsurveydatawithhistoricaldataonslaveshipmentsbyethnicgroup,wefindthatindividualswhoseancestorswereheavilyraidedduringtheslavetradearelesstrustingtoday.Evidencefromavarietyofidentificationstrategiessuggeststhattherelationshipiscausal.Examiningcausalmechanisms,weshowthatmostoftheimpactoftheslavetradeisthroughfactorsthatareinternaltotheindividual,suchasculturalnorms,beliefs,andvalues.