1《中国语文》1995(4):291-299指人名词组合语序的功能解释----从形式描写到功能解释的一个个案-----陆丙甫(南昌大学)提要:本文对陆俭明(1985)关于指人名词组合的语序描写加以功能上的解释,指出其语序完全受可别度(有定性、指称性)大小的制约。具体地说,指人名词的可别度从大到小的顺序是:人称代词,全名(“姓+名”或“姓/名+称呼”),其余各种指人名词。它们组合时的顺序也是如此。本文也对陆俭明提出的指人名词组合的内部层次规则从自然语言处理的角度作了解释。关键词:形式描写功能解释可别度层次分析自然语言处理一从描写到内部解释结构主义强调客观描写。朱德熙、陆俭明两位先生可以说是结构主义在我国的代表。他们对大量汉语事实进行了深入细致的描写。“知其然”然后才能“知其所以然”;描写是解释的基础。两位先生对汉语的细致描写,为进一步解释汉语语法的机制原理提供了坚实的基础。当然,结构主义也不是完全不讲解释,但其解释大多是内部的解释,例如,用层次分析说明某些歧义现象。象“咬死了猎人的狗”的歧义,可以通过层次结构的分化加以说明:一个意思是“咬死了|猎人的狗”,另一个意思是“咬死了猎人的|狗”。之所以说这样的解释是内部解释,因为结构和语义从根本上说是统一的,结构层次本来就直接代表了语义结合的层次性,它们是一个现象的两个方面。用层次构造说明歧义,实际上是用结构分歧来“表达”歧义,使之形象化。没有进行层次分析前,一般人对歧义虽然能够觉察,但是说不清楚。用了层次分析,我们对歧义的直觉就能清晰化。这正是形式化的工具性的表现。借助于形式化可以使我们本来模糊的直觉清晰化。所以,严格地说,这种内部解释仍然是一种描写,不过是更形式化、形象化,并且更精确的描写;但仍不是真正意义上的解释。内部解释适用的范围是有限的,许多现象无法如此解释。下面我们举一个例子。二指人名词组合规则的描写简化陆俭明的《由指人的名词自相组合造成的偏正结构》(1985),对“王科长的秘书的弟弟的爱人”这类结构的语序规则和内部结构层次进行了穷尽式的详细描写,可以说是尽结构主义描写之能的一篇代表作。俗话说,“把一件事情讲清楚了也就解决了一半”。用于语言描写,说“描写清楚就解释了一半”实不为过。让我们看看,我们能够在陆俭明先生所作描写的基础上,能够做出什么解释。下面先在陆文描写的基础上把问题简单介绍一下。本文初稿在第十三次现代汉语语法学术讨论会(福州,2004/11/9-12)上宣读,修改时听取了一些与会学者的意见。陆俭明先生及中国语文审稿编辑也提供了重要的修改意见。此外,王彬、傅思泉、王玉婷几位先生也对初稿提出不少具体建议。一并致以谢忱。当然,失误之处,当由本人负责。2首先,陆文将指人名词分成如下四大类,六小类:I.姓名,下分两组:A.王刚、周老师(带姓的姓名、称呼)B.志刚、小宝(名字,包括小名)II.能用来专指人的职务名称,也下分两组:C.主席、厂长(论职位的职务名称)D.打字员、司机(不论职位的职务名称)III.表示亲属、师友等关系的称谓:E.爸爸、徒弟IV.人称代词:F.我、他我们不妨把这六类分别以一个简单的词语去称呼。A:全名,B:半名,C:职位,D:职业,E:关系。F:代词。陆俭明先生把指人名词分成六类后,对这六类名词的组合规则进行了描写。就两项式来说,他认为有20种可能,总结如下(名1、名2……分别代表组合中的第一个、第二个……名词)。如果名1(左边第一项名词)为F(代词),则名2(第二个名词)可以是从A到E任何一类(陆文的“规则二”)。如果名1是A到E中任何一类,则名2就只能在B、D、E中选择(规则三)。我们把上述两个表述结合在一起,就得出如下一个指人名词组合的语序总格局:(1)两项指人名词的排列顺序(/表示“或者”):F(代词)A(全名)/C(职位)Q(其余)B(半名)D(职业)E(关系)我们用Q来表示代词和全名之外的“其余”。这个顺序图首先表示:组合的顺序必须符合这个三分顺序,即左边的名词类别必须在右边名词的前面。其次,需要做如下规定:第一列F和第二列A/C各自内部的成员不能重叠,即排除FF和AA、CC、AC、CA这类组合;而Q(其余)内部的小类(B、D、E)的名词,一起出现时顺序没有限制,如BD(小宝的打字员)、DB(打字员的小宝)都可以;并且可以同类重叠,如BB(志刚的玲玲)、EE(叔叔的岳父)。这样,可以得到如下20种组合。(2)两项指人名词的排列顺序数目(X、Y分别为Q中的不同小类):F当头的5种(FA、FB、FC、FD、FE)A当头的3种(AB、AD、AE)C当头的3种(CB、CD、CE)3XX3种(BB、DD、EE)XY6种(BD、BE;DB、DE;EB、ED;三个元素任取两个的排列3x2=6)____________________总和20种其中XX表示Q中同类名词的重叠,如EE(岳父的叔叔);XY表示Q中不同类名词的组合,如ED(叔叔的打字员),DE(打字员的叔叔)。这样,两项式就可以得到20种组合。如把XX和XY合并,那么可以直接得到QQ有3x3=9。上述计算可以更简单地表述如下:(3)两项组合的可能2(FA/C)+3(FQ)+6(A/CQ)+9(QQ)=20种具体可能。按照同样的办法推算,不难得出三项、四项、五项指人名词的排列可能分别是60、180、540种。陆俭明先生总结出,组合的成分每增加一项,组合的可能就增加到三倍。这是一个非常概括的描写。但是从另一个角度来看,陆文的描写又显得不必要地复杂。朱德熙(1981:81)曾指出,“凡是得不到形式上验证的语义分析对语法研究来说是没有价值的”。陆文将指人名词分成六类,是纯粹根据意义划分的结果,其中某些小类的划分,缺乏形式根据。根据陆文的描写,A、C和B、D、E分别可合并成一类,因为每类内不同成员的分布形式完全相同。这样,我们可以把六类指人名词分成三类,不妨分别以F、Z、Q表示:(4)指人名词的重新归类F(代词),W(全名/职位,A或C。W为“唯一性”的简写,后面会解释),Q(其它,B、D、E)那么,根据只有Q类可以重复的规律,指人名词两项、三项、四项、五项组合的可能都只有四种:分别为(FW、FQ、WQ、QQ),(FWQ、FQQ、WQQ、QQQ),(FWQQ、FQQQ、WQQQ、QQQQ),(FWQQQ、FQQQQ、WQQQQ、QQQQQ)。在消除跟语法分析无关的语义分析后,计算结果也可以大大简化。缺乏形式区分的意义分析,在研究的初始阶段是完全必要的。但是,作为描写的结果,应该把那些与语法无关的描写都消除,把能够合并的尽量合并。这样才便于看出语法形式和意义之间的对应关系。下面我们就来分析这种对应关系。三指人名词组合规则的功能解释为什么F、W、Q这三类的顺序是固定的呢?我们这里尝试做一解释。上述语序规则,看来是由指别性,或者说“可别度”(identifiability)所决定的。具体地说,由“可别度领前原理”(陆丙甫2004)决定的。这条原理的大意是,“如果其他一切条件相等的话,可别度高的单位总是前置于可别度低的单位”1。这实际上是“有定前置,无定后置”这一常识的理想化延伸。指人名词的排1语法学界广泛承认定指性成分比不定指成分更容易出现在前。我们把这个倾向理想化为“可别度领前原理”。“可别度”(identifiability)这个术语基本上跟“定指性”(definiteness)和“指称性”(referentiality)同义。细微的差别在于范围的大小。我们之所以采用“可别度”这个概念,主要有两个原因。一是它更突出了人的主观认知4列规律也反映了这条语言共性。刘宁生(1994)指出汉语对空间关系的表达遵循“参照物”到“目的物”的顺序,并提出两者的特征分别包括对立的“较大、固定、持久、复杂、已知”和“较小、移动、暂时、简单、未知”。稍后他又把这一顺序规律扩展到偏正结构,指出汉语偏正结构也按照“(修饰语)参照物+中心语(目的物”的顺序排列(刘宁生1995)。很明显,参照物的特点中,除复杂度之外,“较大、固定、持久、已知”都跟可别度成正比,也可纳入可别度的内容。因此刘宁生的偏正结构顺序原则可以归入“可别度领前原理”。刘宁生关于汉语偏正结构的语序原则也完全适用于指人名词的组合,虽然在指人名词的组合的偏正结构中,区别参照物和目的物的各项区别性特征,只有“已知-未知”的对立在起作用。F类(人称代词)的可别度是最高的,这在文献中都是如此处理的,不必多说。至于作为专名的A类,其可别度比作为普通名词的D(职业)、E(关系)类高,也很容易理解。但是同样作为专名的A类全名(姓+名/称呼)和B类半名(名/小名)之间的差别,不那么直观。陆俭明先生指出两者的语法分布位置的不同,这一点非常重要。据笔者所知,这一点前人从未明确指出过,是首创性的发现,极有价值。此外,陆文对这类看似平凡的结构加以精心描写,也体现了“从平凡现象中发现新规律”或者说“用新的眼光去看待平凡旧现象”的敏锐性。陆文这一描写启示我们,全名和半名间可能也有可别度的差别;具体地说,全名的可别度比半名要大。而这个推测不难解释。全名具有更丰富的信息,因此可别度也更大。同名的人很多,而同姓又同名的人就少得多。同样的差别存在于C类(职位:主席、厂长)和D类(职业:打字员、司机)之间。首先,在具体语境下,C类所指的可能往往比比D类小。换言之,前者往往具有唯一性,而后者具有唯一性的可能性相对来说比较小。其次,“主席、厂长”的凸现度也显然比“打字员、司机”要高:一个职工可能不知道自己工厂的打字员、司机,但不大可能不知道厂长。对于这种区分,“可别度”这个术语比“定指性”更管用。这样,我们就把三类指人名词的语义特征加以如下的理想化描述2。(5)三类指人名词特征区别F.人称代词[+唯一性,+旧]W.全名/职位[+唯一性,±旧]Q.其他[-唯一性,±旧]人称代词不仅是语境中唯一的所指,而且必然是旧信息。全名虽然是语境唯一的,但未必是语因素。二是它最能反映分布形式和功能的一致性。它概括了生命度、信息的新旧、有界性、可推导(inferable)、可获得(accessibility)的程度,数量的大小等这些跟语序位置密切相关的因素。例如,生命度跟指称性具有密切正相关的联系,指称性大的成分和生命度高的成分的分布基本相同。又如,指称性与信息的新旧密切相关。如“台上坐着主席团”“对门终日坐着个杨二嫂”中的“主席团”和“杨二嫂”,虽然是有定的,但因为是新信息,其分布就类似于不定指成分。有界的所指往往比无界的所指指别性高。此外,象“来了一部分/少数学生”和“*来了全部/多数学生”的对比,以及“(有)一部分/少数学生没有出席”跟“(*有)全部/多数学生没有出席”之间的对比,则显示了“多数、少数”的对立也跟定指、不定指有类似的分布。“可别度”这个术语可以把种种分布倾向相同的因素都概括进去。不妨说,“可别度”是一个以定指性、指称性为核心成员的原型概念。2其实,这三类分别用类名的汉语拼音首字母D(代词Daici)、Q(全名Quanming)、B(别的Biede)更好,或者至少是英语术语的首字母P(Pronoun)、F(Fullname)、O(others)。形式化也要尽量提供更多的启示性信息才好。这也可以说是一个认知语言学的应用性小问题。5境中的旧信息。例如“对门坐着个张三”中的张三因为是新信息,所以也能出现在存现动词后面。至于其他指人名词,因为本身更不确定,成为新信息的可能更大。这样,我们可以得到如下的结论:指人名词组成的序列中,必须按照可别度从高到低的顺序排列。可别度相等的指人名词之间,顺序可以自由。这是又一个“可别度领前原理”的表现。下一个问题是,为什么人称代词和全名/职位各自不能重复?这也可以用它们的唯一性去解释。既然所指已经明确,何必再用另一个领属语去限制其外延。可是,为什么具有唯一性的人称代词可以跟同样具有唯一性的全名同现呢?一个可能的解答是:这样说的时候,如“他的王志刚”,那个语境下恰好有两个同名同姓的“王志刚”因而失去唯一性。另一个可能的解答是:这种情况下的定语不再是限制性、区