````````高中英语书面表达词汇丰富性的表征与分析*张惠娥[1]黄远振[2][摘要]采用定量和定性相结合方法,从四个维度分析高中英语书面表达第二至第五档文本词汇的丰富性,研究发现:高分档文本长度均值高于低分档,第五档词汇丰富性四个维度与其它各档差异性最为显著;词汇变化性和词汇密度在各分数档间不存在显著差异;1000-2000高频常用词在高中英语写作水平中最具区分度,高水平学习者重要标志是掌握了通用学术常用词;词汇独特性对高分档和中低分档有区分度,但不能区分相邻的中低分档及高分档。[关键词]高中英语;书面表达;词汇丰富性;教学启示1.引言通过写作评估习作者产出性词汇是一个较新的领域,研究者往往采用词汇量化指标或测量手段,考察词汇变化性(lexicalvariance)、词汇密度(lexicaldensity)、词汇复杂性(lexicalsophistication)和词汇独特性(lexicaloriginality,),这些指标统称为词汇的丰富性(lexicalrichness)(Laufer&Nation,1995)。国内词汇丰富性的研究大多针对大学生作文,对高中生书面表达少有涉及。本文以高中英语书面表达为样本,探究词汇丰富性四维指标在不同层次的书面表达中所表现的发展趋势,采用定量和定性分析方法,试图从词汇丰富性角度剖析影响书面表达质量的相关因素,寻求可量化依据,为高中英语词汇教学提供建议。2.研究设计和数据分析2.1.研究样本研究样本来自福建省某高三英语考试书面表达部分150个随机抽查样本,该考试总时长两小时,书面表达约20-35分钟。试题给出题目和文本首句,通过图片设置情景、提出话题,字数要求120左右、体裁叙议结合。由于该考试是评价学业水平,学生高度重视;由于该试题情景设置简约精练,写作方向明确,开放空间较大,考生有话可写;也由于中文提示较少,避免了逐字逐句翻译,因而试题样本能真实反映高中生英语词汇的产出能力。样本评价借鉴福建省近年高考通用的评分原则,先根据文章内容和语言初步确定所属档次,然后以该档次的要求来衡量、确定或调整档次,最后给分。第一档(1—5分)未完成试*本文为福建省教育科学“十二五”规划2011年度规划课题《英语课程词汇难度分级研究》阶段性研究成果,立项编号:FJCGJJ11-103。[1]福建省泉州市第七中学高级教师·硕士,从事英语教学研究。[2]福建师范大学外国语学院教授·博士,研究方向:英语语言学及外语教学。````````题规定的任务;第二档(6—10分)未恰当完成试题规定的任务;第三档(11—15分)基本完成试题规定的任务;第四档(16—20分)较全面地完成试题规定的任务;第五档(21—25分)全部完成试题规定的任务。为鼓励考生大胆表达,拓宽思维,对教学产生正反拨效应,超字数文本未扣分。评分过程公正客观:受试样本先由两位阅卷人独立阅卷,误差值在3分以内的取二者平均分,超过3分误差的样本转由第三位阅卷人评分,并取误差在3分内的两个分值的平均分,若第三位阅卷人的给分与前两位阅卷人的任一给分误差仍然超过3分,则由第四位阅卷人仲裁评分。2.2研究工具本研究主要采用Range软件评估学习者的产出性词汇使用情况(Nation&Coxhead,2005)。由于150个样本平均分呈正态分布(见表1),数据采用SPSS19.0进行方差分析。RANGE使用的原始数据包含3个词频表,分别命名为BASEWRD1.txt,BASEWRD2.txt和BASEWRD3.txt。BASEWRD1.txt包括最常用的约1,000个英语词族(wordfamily)(实际为999个词族),BASEWRD2.txt包括次常用的约1,000个英语词族(实际为987个词族),BASEWRD3.txt(AWL)包括前两个词频表之外的高中和大学各科教材中最常用的学术词汇(academicwords)570个英语词族。表1各得分档书面表达基本数据得分档次样本篇数平均长度最长样本最短样本平均分长度标准偏差1(1-5分)1879.1789222.029435.7712(6-10分)470.00125385.438.1843(11-15分)34113.621609213.94115.6154(16-20分)78127.141766917.3718.6055(21-25分)16142.7517810821.4120.551表1显示,书面表达文本长度总体随写作水平的提高而提高,第二档到第三档平均长度增长最快(单词数由70快速增长为113.62),第三到第五档则平稳递增(基本保持在14个单词左右),但第一档书面表达平均长度略高低于第二档。标准偏差数据表明,第二档书面表达长度的差异性最大(标准偏差为38.184),其次为第一档;第三至第五档长度差异远小于第一和第二档(标准偏差由15.615逐步过渡到18.605和20.551)。分析表明,第一档相当多的书面表达词汇堆砌,内容与主题无关。第二档试图完成写作任务,但内容单薄,词汇有限,不能很好地表情达意,仅完成些许写作任务,文本长度因完成任务不同各有差异。第三档试图完成任务,个别词句表达出了必要的意思,较好的文本能包括部分要求,有一些句子能够表情达意,但遗漏一些要点,字数相对不足。第四档能涉及````````写作要求和要点,尽力用所学词汇结构完成任务,足以表达意思,但语言有错误,内容不够丰满,立意不是很高。第五档内容要点到位,语言能表情达意,也使用了一些复杂结构,有些许单词错误,但句子结构清晰,语义清楚,段落主题明确。第四和第五档写作水平相对较高,能针对主题拓展内容,文本长度最长,但由于题目要求的基础词数为120,拓展程度各异。第一和第二档书面表达标准偏差和平均长度与其它三档的较大差异,反映了考生语言产出能力的较大缺陷。2.2.数据分析本节分别报告和讨论书面表达词汇丰富性四个纬度的差异性,由于第一档相当多的作品内容与写作任务无关,词汇堆砌,未写出要点,重点分析第二至第五档的词汇丰富性。2.2.1词汇变化性在各分数档间的差异词汇变化度为最常用的一种衡量词汇丰富性方法,它是词型(type)与词标(token)的比率。词型为文章中不同的单词,词标则为文章中的单词总数。图1词汇变化性的均值发展曲线图1显示,词汇变化均值由第四档到第五档有显著增长,第二档到第四档各档间词汇变化性均值明显下降。单因素方差分析显示(表2),各档文本词汇变化性并无显著差异(P0.05),但第四档和第五档的组间差异显著性最大,第二档和第四档的组间差异性高于第二和第三档,第三档和第四档及第五档组间无显著性差异(P=1.000)。分析表明,文本长度增加会导致衔接词汇及主题内容相关词汇的复现不断增加,可能导致词汇变化均值下降,差异显著性增强。低分档文本也有词汇变化性,但在内容要点、文本结构、思维逻辑和语言运用方面表````````现较差。第五档文本长度最长,词汇变化性均值仍高于第三和第四档,在主题呈现、语篇衔接及内容丰富性上均表现出较高的水平。表2各档书面表达词汇变化性差异比较(I)档次(J)档次均值差(I-J)标准误显著性95%置信区间下限上限23.04497.02881.726-.0322.12224.05362.02794.343-.0213.12855.02470.030471.000-.0570.106432-.04497.02881.726-.1222.03224.00865.011201.000-.0214.03875-.02026.016521.000-.0645.024042-.05362.02794.343-.1285.02133-.00865.011201.000-.0387.02145-.02892.01496.333-.0690.011252-.02470.030471.000-.1064.05703.02026.016521.000-.0240.06454.02892.01496.333-.0112.0690*.均值差的显著性水平为0.05。2.2.2词汇密度在各分数档间的差异词汇密度测量实词在整篇文本中的比率,考查文本的信息含量。本研究将不同屈折形式视作不同的词型,但排除相同词型,减少信息重复。根据“抓大放小,适度容忍”的评分原则,未排除考生的错误拼写。图2词汇密度的均值发展曲线图2显示,第五档词汇密度均值最高,第四档到第五档词汇密度均值增长显著,第二档````````到第四档词汇密度均值明显下降。单因素方差分析显示(表3),第四和第五档词汇密度差异相对显著(P值为.428),第二档与其它各档词汇密度无显著性差异(P=1.000)。得分越高,主题意识越明显,语言衔接和语义过渡越好,主题相关实词复现也越高,文本长度的增加会导致词汇密度均值下降。低分档文本词汇密度虽高,但内容要点、文本结构、思维逻辑和语言运用方面的缺陷影响写作质量。第五档词汇密度均值未受文本长度影响,因而语义最为连贯,文本内容最为丰满,有层次性,写作质量最高。表3各分数档词汇密度差异比较(排除相同词型)(I)档次(J)档次均值差(I-J)标准误显著性95%置信区间下限上限23.01630.023461.000-.0466.07924.02079.022751.000-.0402.08185-.00136.024811.000-.0678.065132-.01630.023461.000-.0792.04664.00449.009121.000-.0200.02895-.01766.013451.000-.0537.018442-.02079.022751.000-.0818.04023-.00449.009121.000-.0289.02005-.02214.01218.428-.0548.010552.00136.024811.000-.0651.06783.01766.013451.000-.0184.05374.02214.01218.428-.0105.0548*.均值差的显著性水平为0.05。2.2.3词汇复杂性在各分数档间的差异词汇复杂性体现为文本中低频词类型总数与文本总长度的比率。相对于词汇量小的学习者,词汇量大的学习者能根据主题和写作风格的需要,不受高频常用词限制而使用更多的低频词。低频词汇不是学习者在某个水平阶段熟练掌握的词汇,低频词使用比率可反映学习者产出性词汇量的相对大小或不同写作阶段词汇量的发展状况(鲍贵,2009)。由于高中生各学科课业负担重,学习词汇能力受到限制,且课标7级目标词汇量定为2512,本研究测量学习者1000高频词以上词汇及2000高频词以上词汇使用比率(排除错误词型)。图3各分数档1000高频词以上常用词的均值发展曲线````````图4各分数档2000高频词以上常用词的均值发展曲线图3和图4表明,词汇复杂性与写作水平相一致。1000高频常用词以上词汇量均值由第二至第五档呈线性增长,但在第三到第四档增速减缓;2000高频常用词以上词汇均值由第二到第三档、第四到第五档呈增长趋势,但在第三到第四档略有下降。显然,第四档考生比第三档掌握了更多的1000-2000的高频常用词。Range统计分析表明,第三和第四档文本1000-2000词型所占比例分别为10.35%和11.15%(见表6)。单因素方差分析表明,1000高频常用词以上词汇量在各分数档间的差异显著性随写作质量的提高逐步增强,第五档与其它各档均具有显著性差异(P值.005,分别为.012,.004,.002)(见表4)。2000高频常用词以上词汇量在第二档至第四档的组间差异并不明著,但第五档与其它各档差异相对显著,与第二档和第四档有显著性差异(P.05,分别为.040,.024)(见表5)。据此,1000-2000高频常用词的运用能力是高中阶段区分不同水平组词汇复杂性最重````````要的指标,但第五档考生词汇产出量最大,能够不受高频词限制使用更多的低频词。作为二语习得者,高中生课业负担重,输入量和输出量的不足会导致2000高频常用词以上词汇