关于语言本质问题的一些思考--人机对话的启示1.0前言哲学的基本问题是思维对存在的关系问题。语言哲学的基本问题、或者说最高问题应当是关于语言的本质、语言的精神性与物质性的关系问题,也就是怎样看待语言的内部形态(跟思维密切相关的内在语言)与外部存在(语言的物质外壳,尤其是它的声音外壳)之间的关系及其相互转换的问题。而这也正是语言学探索的根本目的。例如,一个人想要表达的某个意思,怎样从头脑中的概念,编码为言语中枢的发音指令,通过动觉神经去驱动发音器官的动作,从而说出话来,产生言语声波;相反,说话人发出的言语声波传到听话人的耳朵里,又怎样转换为神经冲动,通过听觉神经传到大脑,在那里又是怎样解码为相应的词和概念的?前者属于言语产生的问题,后者属于言语感知的问题。这些问题的核心就是要弄清楚人类言语智能的运行机制。它不仅仅涉及语音,也涉及语法、语义、词汇以及语用等各个方面。不管过去还是现在,语言学研究的一切语言现象看起来十分具体,各不相同,但实质上都离不开这个根本点。说到人机对话,人们常常会提出这样的问题,即:人和电脑,谁是主人?人脑和电脑,谁更历害?技术和理论、计算机和语言学究竟谁跟不上趟?表面上看,这是人和机器或计算机和语言学的关系问题,实质上,却是个极富哲理的语言观问题。所谓人机对话,本质上是人与人对话的延伸,根本上是计算机对人的言语智能的模拟和仿生。就目前的人机对话来看,基本上是对于语言功能的模拟,还不是对言语智能的真正的仿生。其根本的原因就在于人对自身言语过程的认识还不十分清楚。这就对语言学提出了挑战,语言学必须加强探索。这里涉及语言的功能和它的运行机制,涉及语言作为交际工具和作为思维手段的关系,涉及语言的物质形态与精神形态之间的关系。而这一切又都隐藏在纷繁复杂的语言现象背后,需要我们通过系统地观察分析,不断提高对人类自身言语过程的认识,逐步揭示和逼近语言的本质。2.0关于语言本质的一般范畴问题普通语言学理论认为,语言是一个符号体系。语音作为标记语义的符号,同它所标记的语义之间的联系具有任意性。我认为,对于这种任意性应当辨证地看待,而不应该机械地看待。在我看来,它既是任意的,又不是任意的。不过我想,要弄清楚这一点,也许得从语言与思维的关系说起,从语言作为交际工具和作为思维手段的本质说起。2.1语言与思维的关系语言与思维的关系问题是语言学理论上的经典问题。说到语言与思维的关系,必然涉及语言的内部形态与外部存在之间的关系。大家常常提到,语言是交际工具和思维工具,注意了它的功能。然而,它是怎样实现这些功能的呢?都经历了什么样的过程呢?人机对话的核心就是要模仿这个过程。所以,这也正是人机对话迫切需要了解的根本问题。2.1.1作为交际工具的语言和作为思维工具的语言语言作为交际的工具,其前提是说话的人在内心里把想要别人明白的意思用一定的语言形式组织起来,并通过动觉神经命令发音器官表达出来;相反,听话人通过感觉神经接受到的感觉信号,明白了说话人通过这一定的语言形式所要表达的意思。在这个过程中,无论是说还是听,都涉及语言的内部形态与外部形态的转换。迄今为止,我们虽然尚不清楚这种转换的全过程。但是,有一点可以肯定,那就是,语言作为交际工具的功能,是离不开它作为思维手段或载体这个前提的,二者是相互依存、密切相关的。作为思维载体的是语言的内部形态,作为交际工具的是语言的外部形态。语言与思维的关系,就体现在这两种形态的相互依存和相互转换之中。对于外部表达出来的语言大家都很熟悉,内部语言究竟是怎么回事呢?它与外部语言有什么本质的联系和区别?或许,从这个角度讨论语言与思维的关系,才能真正弄清楚问题的本质。2.1.2作为思维手段和载体的内部语言就一般常人而言,似乎不难理解他的思维离不开语言,尽管也许并没有理会用于思维的语言究竟是怎么回事。有一些现象似乎很难解释,但却发人深思。例如,看看我们中间的哑巴,也许会得到某种启示。我们发现,哑巴常常是特别聪明,意志坚强,他们的思维非常活跃。他们虽然说不出话来,但肯定也是借助于跟我们的语言相关的某种形式进行思维的,否则,他们怎么能跟我们沟通呢?此外,虽然十聋九哑,但有的哑巴并不聋,能听懂我们的语言,可见他一定也是采用这种语言的相关内部形态进行思维的。这一点正好说明,外部的有声语言并非是一刻不可少的,而内心用以思维的内部语言却是不可或缺的。从这个意义上说,语言的内部形态是更为原始的东西,它是跟思维共生的,是思维赖于进行的载体。另一个有趣的事实是幼儿的言语习得过程的启示。种种迹象表明,幼儿在学会说话之前,同样具有丰富的思维活动,显然,他们的思维活动一定也有赖于某种语言的内部形态,而这种内部形态,必定是建立在跟他们所接触的周围人的外部语言体系的基础上的。这个事实说明,内部语言虽然更为原始,但也是后天习得的,而且是跟外部语言不可分割的。由于思维是一种内心的精神活动,用以思维的语言是以精神形态存在的,我们看不见摸不着它,所以很难理会它究竟是什么。索绪尔在《一般语言学教程》中说过,“语言符号连接的不是事物和名称,而是概念和音响印象。后者不是物质的声音,纯粹物理的东西,而是这声音的心理印迹”。显然,这里所说的“音响印象”和“心里印迹”,是指语言的物质声音形态在大脑意识中的反映,就是外部语言的内部存在形态。既然它是作为外部语言物质声音的心理印迹,必然跟外部语言具有同样的系统特点。它们在与客观事物的指称关系上必定具有同一性。此外,转换生成语法(如乔姆斯基和哈利的SPE)把语言的结构分为底层和表层,语音就是底层语言结构的表层表达形式;现代语音学的动作理论(例如,佛拉,“协同发音和外部时域协调论”,见美国《语音学杂志》1980年第八期;贝克曼,“语音学理论”,见《剑桥语言学概述》,1988年)把语音的生成分为头脑中的计划和口头上的实施两个阶段,并认为这两个阶段的语音在时域协调上是一致的。这里所说的语言的底层结构或头脑中的语音计划也都是指语言的内部形态,而它的表层表达或口头实施就是语言的外部形态。2.1.3语言和思维的同一性问题思维是人的意识活动,它必须借助内部语言的词对反映客观事物和关系的概念进行分类、概括和推理,否则,思维就无法进行。同时,思维活动的结果,又必须借助外部语言手段才能表达出来,否则,交际就无法进行。所以,思维离不开语言。同样,语言也离不开思维,如果没有思维,没有思维活动的结果,语言就是一片空白,就会失去交际的功能,也就没有存在的价值和必要。由此可见,语言和思维是相互依存的,具有同一性。然而,语言跟思维又不是一回事,词义不等于概念。方光焘先生(“词义与概念”,1959年,见《方光焘语言学论文集》,商务印书馆,北京,1997年)早就指出,词和概念的关系不是一对一的关系;黄景欣先生在论述词义和概念的关系时也指出,概念是“事物、现象或关系在意识中的一定反映”,而“词义就是词和意识到的某种现象的联系”(《黄景欣语言研究论文集》,江苏教育出版社,1995年)。这就是说,词是用来代表意识中的概念的,是工具,是载体;而概念则是被代表的对象,是被运载的东西,两者不是一回事。从这个意义上说,语言和思维又不是同一的。同样,从人机对话的角度,可以进一步认识语言和思维既同一又不同一的辩证关系。众所周知,人可以赋予计算机逻辑推理的功能,让它具有一定的思维能力。而且,它的思维一定也得遵循人类思维的共同规律,同时,也要借助一定的语言才能进行。例如,形式逻辑的矛盾律,是人类思维的一条基本规律。计算机在进行逻辑推理时,必定也不能违反这条规律;然而,和人一样,同样的判断和推理的思维过程可以借助不同的民族语言形式来进行,计算机究竟采用那种民族语言来“思维”,则完全取决于人的需要。人教给它汉语,它就用汉语来“思维”,人教给它英语,它就用英语来“思维”。这也充分说明,语言与思维既有同一性,又不是一回事。2.2语言符号的任意性问题2.2.1既任意又不完全任意从语言的民族特性和地域特性,我们可以看到,同样的事物和概念可以采用不同的民族语言符号来代表,采用具有不同自然特性的语音来标记;而具有相同自然特性的音,在不同的语言里又可以用来标记代表不同事物和概念的语义。这就充分说明,语言同它所标记的事物或概念之间并没有必然的联系。从这个角度看,语言符号是任意的。此外,从具体的人来看,他的思维不一定只能跟某一种语言相联系,尤其在今天,一个人往往需要、并且可能学会一种或几种外语。这正好说明,一个人可以交替使用不同的语言进行思维,至于他用哪种具体语言来思维,则完全取决于语言环境的需要。这也说明,语言符号同它所代表的事物或概念之间的联系不是天生注定的,而是后天习得的,在一定条件下是可以改变的。从思维与具体语言的联系可以改变这个角度看,语言符号的确具有任意性。然而,人一旦生下来,并从周围环境获得某种语言以后,他的思维就离不开那种语言了。这表明语言符号的任意性是有条件的,有限的。一方面,在一定的语言社会集团内部,某种语言形式与事物和概念的指称关系一经约定,任何个人只能服从它,而无权任意改变它。否则你就无法在这个语言社会内与其他人交际。因为作为代表客观事物及其关系的语言符号一是有区别性,二是有体系性。就某个语言而言,最初的音义结合也许并不都具有理据,但这个语言内部的各种音义结合体之间具有有机的联系,它首先表现为不同的音义结合体要能区别不同的事物与概念;其次,要能反映不同的客观事物之间的相互关系。你若任意改变其中的指称关系,就必然会破坏原有的有机联系,等于搞乱了事物之间的客观关系。这样,就无法实现它作为思维和交际工具的作用。这是从个人与整个语言社会的关系看,从语言作为交际工具的角度看。此外,就个人的思维与语言的关系来看,例如,一个人学习外语时,常常会受母语的干扰,这也可以说明,在他的头脑中,某个事物或概念一经与某种语言约定联系以后,就成了一种习惯,就具有一定的稳定性。因此,在学习另一种语言时,原来的那种语言跟思维之间的既定关系就免不了出来干扰。所以,老师常常说,学习外语时不要用母语思维,这就是让你暂时忘掉或解除你已经习惯的那种语言跟事物或概念之间的既定关系,以便建立新的语言形式跟那些事物或概念的新的联系。凡是学外语的人都有这样的经验,这是一个相当困难的过程。由此可见,某种语言跟思维的联系一经建立起来,就不是轻易可以解除的。这就从另一个角度表明语言符号的任意性并不是无条件的。2.2.2从人机对话看语言符号的任意性问题人机对话的最终目标,就是要实现人与机器的自由对话,就像人与人之间自由对话那样。实现这个目标的基本任务,就是要教会计算机像人一样地能说会听。这有点像教人学习另一种语言,本质上是把那种语言跟客观事物和概念的约定俗成关系教给计算机,让它学会用那种语言进行“思维”。显然,如果我们教给它的是甲语言跟客观事物的约定关系,那么它就只会用甲语言思维,只能跟说甲语言的人进对话;假如想让它跟说乙语言、或别的什么语言的人对话,那就必须让它学会那种语言跟客观事物之间的约定关系。当然,理想的人机对话,还应当包括计算机自动翻译。所谓机器翻译,本质上是对人的翻译过程的模拟。人之所以能把甲语言翻译为乙语言,根本上是由于客观事物是共同认识的对象,反映客观事物及其相互关系的思维也是共同的,而他既能用甲语言进行思维,掌握了甲语言跟客观事物的约定关系,又能用乙语言进行思维,掌握了乙语言跟客观事物的约定关系,于是,通过客观事物或概念这根共同的杠杆,就把两个语言的对应关系建立起来了。其实,机器翻译也是这个道理。正是由于语言符号既是任意的,又不完全是任意的,才给计算机学会不同的语言或进行自动翻译提供了可能。3.0从语流音变和动态叠加看言语产生的机理3.1语音的变与不变在从事人机对话研究的时候,语言现象、特别是语音现象的多变性常常使人们无所适从。因为这些变化很复杂,很讨厌,不易掌握;可是,不理它又不行。例如,在语音合成的时候,在建立人机对话的模式时,需要教给计算机关于自然语言变化的规则。然而,要获得这些规则却并不容易。不少人本来以为,在自然语音处理方面,汉语有优越性,因为汉语是“音节语言”(这里暂且不去讨论汉语是不是音