关于词汇大纲语言单位取向问题的思考279780———兼议《新汉语水平考试大纲》“重大轻小”的收录取向张博提要《新汉语水平考试大纲》词表收录了某些词组,却没有(或没有完全)收录构成这些词组的常用词;收录了某些复合词而未收作为其构成成分又可自由使用的单音节词。这种“重大轻小”的取向可能来自“语块”教学法影响或以“复”赅“单”的期许。本文提出,词汇大纲应持“重小兼大”的语言单位取向,收录原则是:(1)坚持“词”本位,兼收语义不透明的常用语块;(2)在单语素词与复合词常用度相当的情况下,优先收录单语素词。关键词新HSK;词汇大纲;收词取向语言单位有语素、词、词组、句子等不同层级,词汇大纲应当收取哪一层级的语言成分,这本是一个不言而喻的问题。然而,新近面世的《新汉语水平考试大纲》(国家汉办/孔子学院总部2010,以下简称《新HSK大纲》)词表却在相当程度上收录“词组”而不收“词”,与此相关的,是较多收录复合词而未收作为其构成成分又可自由使用的单音节词。本文在描述这种“重大轻小”取向的基础上,尝试对其背后的观念误区进行解析,并对词汇大纲应持何种语言单位取向提出一些建议。一《新汉语水平考试大纲》“重大轻小”取向的表现“新汉语水平考试”(笔试)共分6级,每级都有词汇量指标。《新HSK大纲》将各水平等级及其词汇量与《国际汉语能力标准》、《欧洲语言共同参考框架(CEF)》的对应关系表示如下:新HSK词汇量国际汉语能力标准欧洲语言框架(CEF)HSK(六级)5000及以上HSK(五级)2500五级C2C1HSK(四级)1200四级B2HSK(三级)600三级B1HSK(二级)300二级A2HSK(一级)150一级A1为观察新HSK词汇量指标有何特点,我们选取与之相关的3种词汇量指标进行比较分析。这3种词汇量指标分别来自《(汉语水平)词汇等级大纲》(1992)(以下简称《词汇大纲》)、1*本研究得到教育部人文社会科学重点研究基地重大项目“不同母语背景的汉语学习者词语混淆分布特征及其成因研究”(项目批准号:2009JJD740005)经费支持,特此致谢。《汉语国际教育用音节汉字词汇等级划分》(2010)(以下简称《等级划分》)和《德语区汉语教学协会对新汉语水平考试的几项说明》①(2010)(以下简称《说明》)。表1新HSK词汇量指标与相关词汇量指标对比新HSK一级150二级300三级600四级1200五级2500六级5000及以上词汇大纲甲级1033乙级3051②丙级5253丁级8822等级划分普及化水平(入门级)505普及化水平2245中级水平5456高级水平9631高级“附录”11092说明A1600A21200B12500B25000C1?C2?通过对比可以看出,《新HSK大纲》词汇量指标有三个特点。1.起点低。《新HSK大纲》一级词汇量门槛极低,分别占《词汇大纲》甲级词的14.5%、《等级划分》普及化水平(入门级)的29.7%、《说明》A1级词的25%。2.最高级词汇量指标为不定量。《新HSK大纲》六级的词汇量为“5000及以上”,这是一个以5000为下限而“上不封顶”的不定量。这种表述在数量指标体系中极少见到。因为水准性数量指标的含义是“按规定至少要达到的某一数量”或“不少于某一数量”,也就是说,任何一个水准性数量指标,自身就隐含着以它为下限可向上延展的不定性,因此,标注“以上”是没有意义的。3.总量偏低。新HSK词汇量远低于国内两种相关词表,其最高级词汇量(即总量)分别只占《词汇大纲》的56.7%、《等级划分》的45.1%。从它与《欧洲语言共同参考框架》(以下简称《框架》)的实际对应关系来看,差距也很大,因为,“迄今为止,《欧洲语言共同参考框架》对所有外语在词汇量方面的要求都是:A1级约500个,A2级约1000个,B1级约2000个”。③因此,《说明》并不认可《新HSK大纲》各水平等级及其词汇量与《框架》的对应关系,建议将新汉语水平考试与《框架》的等级对应做如下调整:新HSK等级词汇量(新HSK文献所认定的《框架》等级)德语区汉语教学协会认定的《框架》等级新汉语水平考试一级词汇量150个(只需汉语拼音)(A1)无新汉语水平考试二级词汇量300个(只需汉语拼音)(A2)A1.1(不含汉字)新汉语水平考试三级词汇量600个(B1)A1新汉语水平考试四级词汇量1200个(B2)A2新汉语水平考试五级词汇量2500个(C1)B1新汉语水平考试六级词汇量5000个以上(C2)B2这表明,德语区汉语教学协会认为5000的词汇量并不能真正对应《框架》C2级的词汇量,只能对应《框架》B2级的词汇量。虽然《说明》未列出《框架》C1和C2级的词汇量,但从A1—B2级的词汇量增长幅度来看,C2级词汇量应当在10000以上。在词汇量如此有限的情况下,新HSK词表在收词方面又有哪些特点呢?我们发现,与2《词汇大纲》相比,除了增收部分新常用词(如“堵车、短信”等)和学习者日常交际所需要的词语(如“母语、填空”)外,最突出的特点在于有一种“重大轻小”的取向。表现在以下三个方面。第一,收录一批词组,却没有(或没有完全)收录构成词组的常用词,或者没有收录与词组构成成分同义的常用词。表2列举的是相关实例。表2新HSK收录词组与未收录词的对照表所收词组未收录的词所收词组未收录的词所收词组未收录的词凹凸凹、凸系领带系、领带上进心上进、心波涛汹涌波涛、汹涌见多识广见识、广深情厚谊深情、深厚、情谊唱歌唱、歌健身房健身、房涮火锅涮、火锅称心如意称心、如意锦绣前程锦绣、前程素食主义素食、主义打电话打、电话空前绝后空前、绝、后塑料袋塑料、袋打篮球打、篮球苦尽甘来苦、甘、尽踢足球踢、足球弹钢琴弹、钢琴垃圾桶垃圾、桶统筹兼顾统筹、兼、顾登机牌登机、牌连续剧连续、剧无理取闹无理、取闹电子邮件电子、邮件流泪流、泪/眼泪无穷无尽无穷、尽放暑假暑假聋哑聋、哑物美价廉物价、廉价高速公路高速、公路名胜古迹名胜、古迹想方设法设法公共汽车公共、汽车难能可贵可贵行李箱行李、箱国庆节国庆爬山爬、山元宵节元宵火车站火车牛奶牛、奶招投标招标、投标鸡蛋鸡、蛋迄今为止迄今、止砖瓦砖、瓦急于求成急于、求、成青少年青年、少年做生意生意表2中的词组绝大部分是自由词组,且绝大部分并非其组成成分的强势组合,从新HSK词表所收词组与其同类组合或组成成分单用的频次对比可以看出这一点。例如,在北京大学中国语言学研究中心(CCL)现代汉语语料库中,新HSK词表收录的“打篮球”出现139次④,而未收录的“打球”862次;“涮火锅”5次,未收录的“涮羊肉”75次,“吃火锅”51次;“行李箱”108次,未收录的“行李”2834次,“箱”17612次;“空前绝后”129次,未收录的“空前”3833次;“无穷无尽”477次,未收录的“无穷”3322次,“无尽”1387次。第二,收录较多复合词,却没有收录作为其语素的可以自由使用的常用词。例如:收“开幕式”,未收“开幕”;收“充电器”,未收“充电”;收“钢铁”,未收“钢、铁”;收“碧玉”,未收“玉”;收“咀嚼”,未收“嚼”;收“停泊、停顿、停、停滞”,未收“停”;收“出租车、堵车、救护车、车厢、卡车、摩托车、刹车、自行车”,未收“车”。这种收词取向导致新HSK词表失收很多常用单音节词。例如,下面这些词单用的频度都很高,在《现代汉语常用词表》(2008)(以下简称《常用词表》)中频序排位均在1000之前,甚至有9个词的频次位列前100,而收词量为5000的新HSK词表却未予收录(词后数字表示频序):笔735边441变264唱876城611打409飞850海647后43话195活675级929记822加543见219建670靠354力814流868毛980美193面378名102女329排857跑528偏858期515其68起72气596前83强286清686情811权792全159区664入394山461神849生398声399时33市356事137手289受189说15天74停990同99头254土968图400晚787未276文775线729心270性652学239眼896因163于59语956原421早328占820战885制622中5343周509抓474总174主881子676自182总174作134第三,新HSK词表所收词语的平均词长长于相关词表。上述两种“重大轻小”的做法,使新HSK词表所收双音节及多音节词的比重高于相关词表,而单音节词的比重则低于相关词表。下表是新HSK词表与《现代汉语频率词典》(1986)(以下简称《频率词典》)和《常用词表》前5000词的词长对比⑤。表3新HSK收录词语与两种频率词表前5000词的词长对照表(比重:%)单音节词双音节词3-6音节词词数比重词数比重词数比重词均音节新HSK69913.98403780.742645.281.94频率词典178235.64311662.321022.041.67常用词表146329.26335267.041853.71.76任何一个词汇大纲都会把词语的常用度作为最重要的收词标准,新HSK词表收录了为数众多的复合词甚至自由词组,却没有收录作为其构成成分且能自由使用的常用词,在词频统计如此便捷且有数种权威统计数据可以参考的当今时代,我们推测,这恐怕不是由于疏忽导致的“收大遗小”,而应当是陷入某些观念误区的有意识的“收大弃小”。二解析“重大轻小”取向的观念误区2.1误区之一:收录词组符合“语块”教学法以往人们以为,语言的生成就是把一个个词按照语法规则进行组合的结果。后来Becker(1975)发现,语言表达实际上是一个词汇短语(lexicalphrase)组合的过程,即,我们根据自己想要传达的信息或想要表达的看法,从短语库(phrasallexicon)中提取一些能反映主要表达内容的词汇短语,然后把这些短语按语法粗略地加以联缀,再填入一些细节信息或根据需要对短语加以细微修订。Becker所说的lexicalphrases后来也被称为“语块”(chunk),被认为是人类语言记忆与生成的最小单位,因而也是第二语言教学的理想单位。在Nattinger&DeCarrico(1992)、Lewis(1993、1997)等的大力倡导下,语块教学法(lexicalapproach,或译作“词汇法”)逐渐成为一种较有影响的教学法流派。近年我国英语教学界有学者通过语块教学法的实验研究,发现“学生语言表达的流利性、准确性、地道性和用词多样性方面均明显好于对照班学生”(于秀莲2008)。在对外汉语教学领域,不少教材常将词组列入生词表,原《词汇大纲》(1992)和新出的《等级划分》(2010)也收录了少量大于词的语块,这些迹象表明,对外汉语教学中的词汇输入实际上也早就不再恪守“词”单位了。尽管学者们对词汇大纲收取大于词的成分意见不一,有些学者不赞成(赵金铭等2003;马清华2008),也有学者在充分理解的前提下提出一些问题和改进建议(孙菁2013),不过,语块在对外汉语教学中的价值和作用却得到广泛认可,多有学者指出,语块训练法有助于学习者生成地道的表达,减少母语给汉语学习带来的负迁移影响,避免语用失误,提高语用水平(周健2007;亓文香2008等)。大概正是由于语块教学法理论的深刻影响,使新HSK比起此前和同期的词汇大纲来,表现出更为鲜明的“重大轻小”取向。然而,任何一种好的理论都有它的适用范围,超出其适用范围生硬套用,往往会适得其反。拿一个简单的例子来说,当教学中出现“弹钢琴”这个短语时,教师采用语块策略,把它作为一个整体教给学生,而不是分成“弹”和“钢琴”两个生词来教,这确实是明智之举:一来可以为学4生日后流利顺畅的表达提供一个理想的语言单位,二来可以避免学生从“弹钢琴”的母语表达(例如英语的playthepiano)出发,基于先前学过的“打篮球”(playbasketball)、“打排球”(playvolleyball)等,把“弹钢琴”说成“打钢琴”。然而,新HSK词表把“弹钢琴”作为一个单位收录,却没有收录“弹”和“钢琴”,这