ReportofPhoneticResearch200840语音的变化:生成机制和交际意义曹剑芬中国社会科学院语言研究所jianfencao@163.com摘要本文从音段和超音段两个方面,探讨语音变化的生成机制和交际意义。全文由三个主要方面组成:一,概述语音变化的种种现象及变化的不同层次;二,重点考察语音为什么变和怎样变,通过分析语音变化的原因,探讨变化的生成机制,揭示变化的方式和规律;三,分析语音变化的交际意义,说明变化的实质。1引言在自然话语里,语音的实际存在形态、或者说具体的发音实现(realization)会发生各种各样自然产生的随机(stochastic)变化。国内外许多相关研究指出,语音的变化跟言语产生和感知的自然机制具有千丝万缕的关系。因此,加强对语音变化现象的考察和研究,不但可以提高对语音变化规律的认识,而且有望进一步地揭示自然言语运行的深层机制,提高和丰富语音学的理论宝库。另一方面,当今语音合成、尤其是语音识别中面临的巨大困难,就是难以掌握和处理自然口语中的语音音段和超音段特征相对于规范形式的巨大变异。因此,加强对口语中语音变化规律的研究和变化模式的归纳已经成为当务之急。在2007年的国际语音科学会议上,一个题为“语音学细节与交谈结构”的主题报告,更是呼吁人们把语音学细节和语音的变化作为互动会话的事项、特别是话语形成话轮系列结构的首要事项加以分析和认识[1]。语音的变化,包括音段和超音段两大方面。音段变化的现象多种多样,诸如同化、异化、清化、浊化、央化、喉化,等等。不同文献所用的术语不完全一致,同一术语所指也不完全相同。近来,人们又越来越关注另一类语音变化,那就是增强(strengthening)与减缩(reduction)。事实上,由于变化的原因错综复杂,这些术语反映的现象可能属于不同的层次。例如,协同发音与同化常常并提,而事实上,协同发音是因,而同化是果[2]。又如增强和减缩跟清化、浊化、央化、喉化等等也属于不同的层次,增强和减缩是自然话语中发音精确性或饱满度调节的基本手段,而清化、浊化、央化、喉化等等则是增强和减缩导致的语音强化或弱化的具体表现。音段的语音变化,绝大部分是由发音的增强或减缩引发的种种音色变异。例如,元音发音的增强可能导致舌位特征的典型化以及零声母情况下起始元音段的摩擦化或喉塞化,摩擦化多半发生在高元音情况下,喉塞化多半发生在较低元音情况下;而元音发音减缩的结果一般是央化。辅音发音的增强一般表现为相关舌腭接触部位的典型化和接触程度的加强[3],导致声谱上表现出更强的摩擦或除阻破裂等特点;而辅音发音的减缩一般表现为相关舌腭接触部位的中和化和接触程度的减弱,导致清辅音的浊化、鼻韵尾的脱落而代之以前邻元音的鼻化,等等。超音段的语音变化,既有协同发音引起的,又有声调、重音、节奏、语调等韵律因素引起的音高、时长、音强等各种超音段特征的变化。在实际话语里,超音段的语音变化非常突出。相关研究表明,对于语音的知觉来说,韵律因素变化引起的音节知觉差异比起由协同发音引起的音节知觉差异要大得多,这说明超音段的变化比音段的变化可能具有更加重要的影响[4]。本文试图以普通话语流中音节的音高变化作为考察对象,重点讨论由协同发音引起的相对微观的变化以及由话语结构制约导致的较为宏观的适应性调节变化,探讨语音变化的生成机制和交际意义。2语音变化的生成机制导致语音变化的原因错综复杂,既有内在的,又有外部的。但是,最根本的还是来源于言语产生的自然机制和它的交际(communication)职能。2.1产生语音变化的一般机制就语音产生的自然机制而言,又有两个方面的因素会引起语音的变化:第一,协同发音机制决定的不同音段姿态间的交叠必然产生相互干扰,因而导致各个语音的变化,包括过渡音的产生和目标段的不到位[5]。第二,人的发音生理局限必然导致对实际发音精确度的调节。根据相关的语音时域结构模型[6]:言语的所有成分都是通过发音来编码的,而发音器官实现发音目标的时间和速度都是有限的。发音的这种生物学局限决定了不可能所有语音目标都能充分实现,因此,它们在语流中的实际发音饱满程度,必然会随着语境的实际需要和可能而调节变化。就语音的交际/通讯功能而言,交际/通讯双方的基ReportofPhoneticResearch200841本要求是,说话人总是力求尽可能省力地说,也就是以尽可能少的发音资源(即低能耗地)正确地传达尽可能多的有效信息;而听话人总是希望尽可能省力地听辨和理解,也就是以尽可能少的听觉感知资源(即低能耗地)准确清晰地接受尽可能多的有效信息。这就需要发出的语音不但提供基本的词汇信息,更要提供各种更高层次的话语信息,包括节奏边界、语义焦点、语气语调、情感态度,等等,以便实现最高效的交际/通讯。这是交际双方的主观需求。可是,在客观上,除了上述发音生理局限以外,听觉感知方面也存在一定的生理和心理局限。例如,短时记忆板块跨度的局限,决定了听觉感知过程中每次处理组块的长度有限,这就要求说出的语音流能够提供相应的组块分界和连接的信息。为了克服上述主、客观之间的矛盾,每个语音成分的实际发音力度就必须适当调整、有张有弛,以便既承载低层次(例如词汇)的信息,又承载高层次的(包括短语、句子、段落和篇章结构)信息。在这个过程中,音段和超音段的调整是同时并存、有机统一的。语流中的音高变化便是超音段变化的一个重要方面。2.2语流中音高变化的生成机制2.2.1协同发音导致的音高微观变化在中国语音学界,吴宗济先生首开汉语协同发音研究的先河,通过对汉语音节内和音节间的协同发音现象的系统而全面的分析,探讨了音段的同化和异化等语音变化的生成机制,极大地推动了语音学相关领域的研究。更重要的是,早在上个世纪80年代初,吴先生就展开了语句中声调变化的研究,在系统地归纳出二字组、三字组和四字组的相对稳定的连读变调模式的基础上,进一步揭示了语句中相邻声调边界上音高的微观变化现象[7,8]。例如,三字组的中字怎样跟前字调尾和后字调头的音高特征“顺势相连”、“平滑过渡”。尤其对三字组的中字阳平的变化,吴先生发展了赵元任先生的理论[9],首先发现,在首字为阴平或阳平时,中字的阳平除了会变成阴平以外,还会变为类似去声的高降调。条件是:在双单格结构中,后字为阴平或去声(即高起的声调)时,中字阳平会变成高平,而当后字为阳平或上声(即低起的声调)时,则会变成高降。吴先生的这个发现,不但充分揭示了普通话语流中阳平调型表现不太稳定的根源,而且为进一步探索话语音高变化的规律打下了坚实的基础,启发我们进一步审视相邻音节边界上音高“顺势相连”、“平滑过渡”的背后,究竟包含着怎样的产生和变化过程。根据许毅[10]的目标逐渐逼近理论,每个声调都会在音节的范围内逐渐接近它的音高目标,到音节末尾最终实现,而在声调环境中存在着遗留的和提前的变化特性,具体如图1所示。根据这个图示,我们可以窥见相邻音节边界附近声调音高变化的产生过程。那就是,由于前邻声调收尾目标音高的不同而产生的顺向作用,不但会改变后接声调的起始音高实现,而且会影响其向着自己的起始目标过渡的状态;而前邻声调的收尾目标的具体音高实现,同样会因为后接声调不同的起点音高的逆异化效应而产生微妙的变化。这种变化实质上取决于后接声调不同的起始目标:当后音节起始目标特征为低或较低的声调(上声、阳平)时,前音节的收尾目标的音高实现就被提升,而当后音节起始目标特征为高的声调(阴平、去声)时,前音节收尾目标的音高实现就被压低了。图1声调的语境变化特性(引自Xu,Y.2007)同时,根据此图显示的情况,某个音节声调的大约前1/3基本上是个过渡段,主要是逐渐摆脱前邻调尾顺向的遗留效应、而向着本身的起始目标逐渐趋近的过程;而后2/3才是调形段,是从它本身的起始目标逐渐向着收尾目标趋近的过程,同时,这个部分也是通过逆向效应而承载后接声调起始目标音高信息的过程。因此,从这个意义上说,前、后音节的声调之间实际上也是“瞻前顾后”、彼此交叠的协同产生过程。从这个过程中,不但可以更好地理解吴先生所说的“顺势相连”、“平滑过渡”的实质,而且进一步加深了我们对相邻声调边界附近音高变化的生成机制的认识。2.2.2韵律结构和话语篇章信息制约导致的较为宏观的音高调整这部分的研究仅以双音节韵律词前后音节在语流中的音高实现作为考察目标,通过分析其高、低音点以及音高水平方面的系统差异,探讨语句更大跨度范围内音高变化的生成机制。表1归纳了语句中不同位置上双音节韵律词内音节音高水平的实现情况,数据来自对CASS朗读语篇语音库中4个发音人的语音分析结果。其中PP和PW分别为语流中非终端位置的韵律短语和韵律词,音ReportofPhoneticResearch200842高水平是指各个音节在语流中所处的自然高度,通过各自具体的高、低音点计算获得。表1不同位置双音节韵律词内音节音高水平比较双音词位置前音节后音节语句均值170.2154.9句首187.9183.3句尾153.4115.4PP首188.3174.4PP尾154.1144.1非终端PW167.3157.7从表1数据可以看出,双音节韵律词内各个音节的音高水平在语流中存在着非常系统的变化。这种系统变化充分反映了它们在语句结构中扮演的多重身分和作用。实质上,每个音节的音高实现除了体现低层的区别词义的信息以外,至少还载荷着以下几方面的高层结构信息:一是韵律层级结构信息,二是语调信息,三是重音信息。首先,句子首、尾之间和韵律短语首、尾之间的系统差异,不但充分体现了语调短语内部和韵律短语内部的音高下倾特征,而且反映出语调短语边界上和韵律短语边界上不同程度的音高重置,提供了不同层次的韵律边界信息。其次,句尾韵律词的后音节跟韵律短语尾的后音节音高之间的系统差异,同样显示出语调短语跟韵律短语不同的边界调特征对比,即语调短语末尾的低L%特征跟韵律短语末尾的不低性NON-Low特征之间韵律层级高低的对比。第三,相对于语句首尾而言,非终端位置上的音节往往会出现发音的减缩,按理说,这时的音高水平应该明显低于语句的平均水准;可是,实际上却非常接近平均水准,尤其是后音节的音高甚至还略高于语句的平均水平。出现这种现象的最大可能是语句重音因素的作用。为此,我们调查了语句重音在非终端位置上的分布情况,发现果然有20%左右的语句重读音节出现在这个位置的韵律词内。显然,正是这部分重读音节音高水平的提升,拉高了非终端位置上音节的整体音高水平。由此可见,非终端韵律词内音节的音高特点局部地载带了语句的重音信息。图2前重韵律词与后重韵律词内前、后音节的高、低音点及音高水平比较通常,携带重音的词或音节总是具有音高凸显,为了更好地认识具体的凸显方式,这里又通过对听感上明显的前重词与明显的后重词在音高实现方面的差异,进一步分析了不同类型重读词内部的音高变化特点,结果如图2所示。图2的情况显示,无论是高音点还是低音点以及音高水平,在前重型词内,凸显出现在前音节上,在后重型词内,凸显出现在后音节上;而前重型词的后音节和后重型词的前音节的音高实现,则都接近于非终端韵律词前、后音节的均值。这种情况说明,体现重音信息的音高凸显在重读词内并非平均分配,而是根据相关韵律词的重音类型的不同而落实在其中的某个音节上,其余音节的音高则会相对减缩。以上研究结果说明,语流中的音高变化跟音色变化一样,虽然看起来只是一个个局部音节的语音特点,但无一不与它们在话语总体中的身份与地位息息相关,无一不是由不同层次的语言学制约影响的并存叠加和共同作用而产生的。综上所述,语流中的音高变化涉及两个大的方面,一个方面是发生在毗邻声调间的、基本上由言语产生的协同发音机制决定的适应性调节变化,这种变化主要表现在相邻声调的前尾与后头的‘顺势相连’和‘平滑过渡’等微观调节现象。另一方面是发生在较高层次上,受语言学结构层面上运行机制控制的适应性调节变化,这种变化主要表现为对音节在语流中的自然音高水平的宏观调节。这两种调节变化的具体方式虽然不一样,但是,都受言语产生过程中的提前规划机制的控制。3语音变化的交际意义3.1语音变化与言语产生和