语言距离的测度及其在经济学中的应用摘要:语言距离是指不同语言的差异程度,理论界采取了语言考试测评以及编辑距离的方法测来度语言距离,前者较为流行。把语言距离应用到经济学研究主要有三个指向:语言距离与国际贸易的相关性研究,语言距离与国际贸易流量成反比;语言距离对收入分配产生影响,语言距离是影响移民地选择以及移民工资收入差距的重要因素;语言距离与语言规划关系密切,语言距离对于少数民族双语教育、外语教育改革、语言产业战略的构建以及汉语言的国际推广有重要的理论价值和实践意义。关键词:语言距离;贸易流量;收入分配理论;语言规划中图分类号:F069文献标识码:A文章编号:1003-854X(2015)03-0005-06一、引言伴随经济快速发展、现代科技进步、信息交流频繁,语言的作用凸显,其实现路径主要依赖于信息传递与交换效率。信息传递效率高,编码与解码的速度快,交易能够顺利完成。相反,交易则可能迟滞,延缓经济的发展。使用通用语言可以降低交易成本,不仅能促进微观个体收益,更能促进国际贸易顺利完成,增加双边贸易流量。然而,世界各国语言不同,从微观上看,语言差异可以影响到该国移民的语言熟练度,影响移民与土著的收入分配效率。从宏观上讲,首先,语言差异要求两国选择某种语言以降低交易成本来提高贸易效率。传统的国际贸易理论研究以引力模型为基础,其主要命题是国际贸易流量与地理距离成反比,与两国的经济总量成正比。显然这一理论假设由于控制变量太少而解释力不足,应该考虑其他控制变量的影响因素,语言就是其一。其次,语言差异影响到一国语言的推广策略,进而影响一国的语言规划。就我国来讲,语言差异与少数民族的双语教育、汉语言的国际推广及孔子学院全球分布策略都有密切的关系。因此如何测度语言差异并把它引入到经济学模型中来已成为重要的理论问题,恰恰是语言与经济学的学科特性以及研究内容促成了两者有力牵手:语言是交际的媒介,而经济理论又是研究人类选择行为,既然涉及到选择行为,就离不开互动,互动最常规性的工具就是语言。鲜有学者对以上理论问题进行梳理评析,这显然不利于语言与经济关系的深入研究。本文研究的重要意义表现在以下三个方面。其一,引进语言距离概念以表示语言差异,评介语言距离的测度方法,并梳理评析其在经济学中的应用,突出语言对收入分配的重要作用。其二,扩充语言经济学理论内涵,深化语言经济学的研究主题。语言与国际贸易的相关性研究已成为本世纪初语言经济学研究的时髦话题,其研究成果也能凸显语言的人力资本属性。其三,本研究的重要政策启示在于为制定国家语言战略提供指导,比如雅思以及托福等英语准入考试,正是语言与收入分配关系理论的政策内涵;呼吁编制语言距离数据库。从客观上为我国外语教育改革提供方法。另外,‘测度汉语与少数民族语言的语言距离,尤其是语言、语法以及词汇方面的差异,可以帮助少数民族更好地学习通用语言,促进少数民族经济的发展。当然,语言距离的深入研究也为构建与发展我国语言产业战略,实现文化大繁荣提供理论基础。二、语言距离的涵义及测度方法1.语言距离的涵义“距离”是物理学的术语,不少学者把“距离”引介到本学科中来隐喻相关概念,比如遗传距离以及制度距离等。经济学者Chiswiek采用了类似的方法,把语言差异隐喻为语言距离,但是如此定义还远不能触及语言距离的内核。语言距离的涵义应该包括定性与定量两个方面。从定性的角度,我们采取Isphording和Otten的观点认为语言距离指不同语言的差异程度,主要从词汇、语法、语音以及拼写规则体现出来。仅仅这样的定性还不够精确,也很难把它应用到经济学的研究中来,既然语言距离涉及“度”的概念,必须对之定量估计才能有实际意义和应用价值,学者们采取了不同的方法进行测度。2.作为虚拟变量的测度早期的经济学研究或忽视语言对经济的作用:或限于语言变量的测度难度,一般都把语言变量作为虚拟变量,把语言距离单一设置为0或者1,比如两国使用相同母语或者两国母语相似度极高,可以认为两国的语言距离为零,反之两国母语不同,则语言距离视为1。不可否认,经济学者用虚拟变量测量语言距离,已开始注意到语言的人力资本属性,承认了语言与经济的强相关性,这也使语言经济学的研究初露端倪。但是如此单一的方法还没有真正把语言距离测度出来,即使引入经济学模型中,也不能充分解释语言距离对经济的作用,其局限性主要表现在:测度方法比较简单,比如日语、汉语以及英语是三种不同语言,在研究语言与经济的相关性时,往往把日语与汉语的语言距离和日语与英语的语言距离设定为1,但是日语与汉语两种语言的表意性与英语的表音性决定了日语与汉语的差异程度远比日语与英语的要小,因此计量模型虚拟变量系数就存在失真,需要修正。Lohmann在研究语言与国际贸易关系时,引入了语言障碍指数用以衡量语言距离。语言障碍指数的区间是(0-1),零意味着两种语言完全通用,1代表两种语言没有相似性,可以根据WALS数据库测度出语言障碍指数。WALS数据收录了40名学者关于2950种语言的139种语言特点的研究成果。在计算语言障碍指数时,对语言的不同特点进行赋值,这种方法可以测度不同语言之间的距离,较虚拟变量有了较大的进步。3.语言培训考试测评目前,用考试的方法测评语言距离流行于经济学界,但是不同学者采取了不同类型的考试分数来表示语言距离。Hart-GonzalezandLindemann选取说英语的美国人对他们进行16-24周的语言培训,之后进行测试评分,列出了国际上43种语言与英语距离的评分,分数越低者与英语的距离就越远,如下表1。他们的实验结果为语言与国际贸易的后续研究提供了有效数据。ChiswickandMiller根据上述方法测度语言距离,并尝试用语言距离的相关理论研究经济问题。KuandZussman采用TOEFL的成绩测度各国语言与英语的语言距离,用以研究英语作为世界通用语言在国际贸易中的作用。苏剑、葛加国采用他们的方法,根据某校留学生的数据,测度各国语言尤其是非洲各国与汉语的语言距离,并把它们应用到国际贸易理论中来,这是把语言距离引入到中国的初次尝试。综上,我们发现,语言学上的谱系树模型和语言距离有些类似,但是其内涵有不同之处:谱系树模型把语言是否来自于同源划分为不同的语系与语族,属于定性研究;而语言距离是语言经济学的概念,是把语言之间的差异进行定量测度。从下表1可以看出,此种方法对语言距离的测评也验证了语言学的谱系树模型:与英语同属印欧语系的语种,其与英语的语言距离较小,汉藏语系与英语的语言距离较远。采取考试评分从微观视角测度了不同语言的差异,进而为研究语言的经济作用提供数据支撑与方法,但是这种方法也有局限性。其一,用考试测评语言的差异程度具有较强的主观性,必须假定人力资本的同质性,这可能与现实相悖。尤其是把托福考试的成绩作为两国的语言距离,就忽视了学习语言的性别、年龄、师资以及时间成本的因素。其二,这种测度方法较为单一,基本上都是测度他国语言与英语的语言距离,其假设条件是非英语国家的人学习英语和英美国家的人使用他国语言具有对称性,否则,英语与他语的语言距离就与他语与英语语言距离不一致。人力资本的异质性可能会导致这种假设与现实不吻合,比如,汉语与英语的语言距离与英语与汉语的语言距离不同,恰恰是由于两国人学习语言的能力不同,也与目标国家的语言内部结构要素有很大的关系。其三,测度他国语言与英语的语言距离,很难换算出其他语种之间的语言距离。尽管有较多的局限性,语言距离的考试测评法较虚拟变量有较大的进步与理论扩展,也易于操作,因此许多经济学家都采取该种方法测度语言距离。进而引入经济学模型中来。4.编辑距离法Bakker使用LD方法测评了语言距离。所谓LD亦可称为编辑距离,它是由两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离在语言学的应用应该关注美国语言学家莫里斯?斯迪士(MorrisSwadesh)早期关于核心词汇的研究成果。他从统计学的角度研究了印欧语言,认为所有语言中都基本上有200多个核心词汇列表,掌握这200多个核心词汇列表就可以进行简单的交流。Bakker从200个核心词汇中抽出40个较为稳定的词汇,如表2。与Chiswick测评方法不同,编辑距离测度语言差异更具有客观性,IsphordingandOtten认为这种方法更具有精确性,同时这种方法也得到了许多经济学者和语言学者的关注与改进。经济学从开始关注语言的作用到语言距离的测度,大约有半个世纪的历史,其趋势由简到繁。目前来看,采取考试测评的方法测度语言距离是较为主流的方法,可操作性强。但是近两年来,编辑距离法得到经济学者的青睐,其方法的客观性以及全面性为经济学研究提供了更为精确的数据,但是限于这种方法的复杂性,测度成本较高,需要多学科的融合,尤其需要计算机编码知识,因此该方法尚不能流行于经济学界。语言距离的含义及测评对经济学的研究具有重要的意义,相关数据被广泛应用于收入分配理论和国际贸易理论,突出显示语言或者语言行为对经济活动的作用。语言距离的测评对语言的国际推广与传播以及语言产业战略构建具有重要的指导意义,我们将在IsphordingandOtten的基础上分三个层次梳理语言距离在经济学中的应用,以期得到启示。三、语言距离与收入分配理论经济学家一直就很关注收入分配问题,从古典经济学到新古典经济学以及到现代的收入分配理论,都在试图解决收入分配中的公平与效率以及收入分配与经济增长的相关性问题。语言距离的引入扩充了收入分配理论的研究广度与深度。该项研究主要围绕某国居民与移民的收入差距,以实证研究为主,具有较强的应用价值,主要涉及以下三个问题:首先,语言距离增加了某种语言的学习成本,降低某种语言的学习效率,在多大程度上影响个体对目的地的移民选择。通常认为,个人倾向选择与本国母语相近的国家移民,AdseraandPvtlikova通过实证研究深化了这一研究结果,认为对非英语国家与英语国家的目的地选择中语言距离对前者影响较深,语言距离并不是影响选择移居英语国家的主要因素,这可能与其他因素有关,尤其是经济因素。同时他们的实证结果显示,目的国语言多样化指数越高(多极化)将会降低向本国移居的吸引力,语言单极化倾向明显的国家更受移民的青睐。其次,语言距离如何与语言熟练度相关,进而影响收入分配。该项研究始于Chiswick,他构建了影响语言熟练度的模型进而研究语言熟练度与工资收入分配的关系,计量结果显示语言的熟练度与经济激励(economicincentives)、移民与居民的接触程度(exposure)有正相关关系。随后的研究又修正了起初的理论模型,认为移民对当地语言的熟练度与目的地定居时间(durationindestination)成正比,与移民的年龄(ageatmigration)、教育水平成正比(education)。他们的理论模型已经触及到了语言距离的概念,ChiswickandMiller认为语言距离是影响语言熟练度的重要因素。IsphordingandOtten使用编辑距离法测度语言距离,通过实证研究得出三个重要的结论:(1)更高的语言距离与移民更低的语言熟练度相对应;(2)语言距离是移民后二语获得的重要影响因素;(3)语言距离每增加1%,将会使语言熟练度降低3.6到4.6个百分点。再次,语言距离与最优移民时机。此项研究与语言学“关键期假说”相类似,一般认为,人们年龄越小越容易学习目的国语言,移民的工资收入水平与当地居民无差异。B1eakleyandChin得出了14岁之前是移民的最佳时机的研究结论。选择最佳时机移民,两国的语言距离并不会影响移民的语言熟练度以及工资收入差距。语言距离与收入分配相关性研究,对一国的语言规划与微观个体的移民具有重要的意义。第一,较大的语言距离增大了学习土著语言的成本,其降低了对土著语言的熟练度,是造成收入差距的重要原因,有碍于社会稳定,因此制定语言准入考试政策尤为重要,比如英语国家设定的英语准入考试(GRE、TOFEL)就是该理论下的语言政策之