基于语料库的工科学生英语写作词汇分析
2015-10-14王竞秀田建国
王竞秀 田建国
摘 要 本文利用批改网收集西北工业大学一年级部分学院的工科学生就“Travelling Abroad”主题提交的作文144 篇,根据批改网共性分析人工统计出高频用词(尤其是实词),然后将前10位的实词作为检索词放入对照语料库CLEC ST3 ST4子库中进行检索,通过对比研究工科学生在写作中的实词使用情况、常用形容词的搭配掌握情况。本文采用定量与定性相结合的方法,发现工科学生写作呈现产出性词汇小、重复使用高频词汇;形容词搭配上呈现选词不确切,多义词语义混淆特征。
关键词 语料库 写作词汇 教学
中图分类号:G642 文献标识码:A DOI:10.16400/j.cnki.kjdks.2015.08.015
The Analysis of Writing Vocabulary of Engineering
Students from the Perspective of Corpus
WANG Jingxiu, TIAN Jianguo
(School of Foreign Languages, Northwestern Polytechnical University, Xi'an, Shaanxi 710129)
Abstract The research utilize pigai website to collect essays "Traveling Abroad" from some engineering schools from Northwestern Polytechnical University. The author selects the vocabulary with high frequency in pigai website and then put them into CLEC corpus to retrieve. Through the combination of quantitative and qualitative analysis, the research finds that engineering students' writings present feature including limited productive vocabularies, repeated words and inaccurate choice of adjectives.
Key words corpora; writing vocabulary; teaching
1 理论背景
词语搭配是语言学研究的重要领域。自从Firth提出其著名论断“You should know a word by the word it keeps” 以来对搭配的研究日益受到重。Halliday 将搭配界定为“体现词语在某种显著的临近范围内组合关系的线性共现”(转引自孙海燕,2004)。卫乃兴(2002:100)则认为词语搭配是“在文本中实现的一定的非成语意义并以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现”。
2 研究方法
2.1 研究问题
本研究力图回答以下问题:(1)工科学生在写作中的实词使用情况如何?(2)工科学生对常用形容词的搭配使用是否正确?
2.2 研究对象
本文选择的受试对象来自西北工业大学非英语专业(理工科)的144名大一学生。研究材料为144名学生的非限时英语写作样本。作文题目为“Travelling Abroad”。
2.3 研究工具
批改网:北京词网科技有限公司开发的句酷批改网(简称批改网)。它是基于语料库和云计算的英语作文自动批改在线服务,通过计算学生作文和标准语料库之间的距离,即时生成学生作文得分和评语及内容分析结果,帮助学生通过自助练习提升写作能力
CLEC: Chinese Learner of English Corpus(中国学习者语料库)ST3 ST4 子库。
PowerConc: 由北京外国语大学开发的通用索引工具。
2.4 研究方法
本次研究采用定量分析和定性分析相结合的研究方法。首先根据批改网给出的共性分析找出144篇论文中出现的高频实词,将其作为检索词利用索引软件PowerConc在CLEC中检索,最后以每万词为单位的标准化频数报告对检索词在批改网和中国学习者语料库中的检索结果并进行对比分析,本研究采用卡方检验验证西北工业大学一年级工科学生和中国低年级英语学习者在特定动词的使用上是否具有显著差异性。然后,本研究采用定性分析的方法分析工科学生作文中呈现的词汇特征,以便教师在词汇教学中为学生提供有针对性的指导,也能帮助学生反思自己英语写作中存在的问题,提高遣词造句水平、减少词语误用现象。
3 数据与分析
根据批改网提供的共性分析可知,144篇作文包含的形符数为23279,即学生文本从头到尾所含词形的总数;经人工统计得出文本包含的类符数为2106个,即学生就“Travelling Abroad”这个主题写作时一共使用了2106个不同词形(word forms),平均句长16.99个单词。本研究采用标准形次比,即将文本按照1000个词进行分割,依次计算第一个1000词,第二个1000词知道文本的结尾所剩余的形次比,然后求取他们的平均值。统计结果显示批改网学生作文的标准形次比为37.73%,这与蒲建忠统计的中国学习者语料库ST3 ST4子库的标准形次比为62%有很大的差距(杨慧中 桂诗春 杨达复,2005)。
3.1 学生使用实词情况分析
本研究借鉴刘向红、王家义、夏艳萍、杨源对实词的定义,将实词界定为“描述事物、性质、状态和行为的有具体意义的名词、动词、形容词和副词”(刘向红、王家义、夏艳萍、杨源,2009)。实词能够表达具象意义,实词的恰当使用能够使描写更加细腻、生动、得体。
对数据进行人工统计可得,144名学生就Travelling Abroad主题的写作中共使用了2016个不同的词,即学生的产出性词汇(Productive Word)为2016。在这些词汇中,出现频次为5次或5次以上的词有591个,词汇频数在4次及4次以下的为1425个。在出现频率较高的591个词中有452个(76.48%)为实词,其中动词144个(31.86%),名词157个(34.73%),形容词80个(17.70%),副词71个(15.71%)。从统计数据可以看出:学生的产出性词汇量小、用词重复性大、写作时灵活更换词语的能力较差;大多数学生写作时重复使用某些词汇,文章的词语丰富度差。
然而,根据教育部大学英语教学改革思路和全国大学外语教学指导委员会制定的《大学英语课程教学要求》及结合试点院校大纲协作组制定的《大学英语教学大纲》对大学生英语词汇量的预备(最低层次)要求规定:学生“应领会式掌握2400~3000个单词和400~500个习惯用语或固定词组,其中复用式积极词汇为800~1000个,并具备基本的构词法知识”。近些年各院校践行大纲要求注重大学生英语词汇量的提高,但学生只注重对词汇的记忆和理解,忽视将其转化为积极词汇在写作时进行有效输出。
3.2 学生对形容词搭配的使用情况
形容词是仅次于名词和动词的第三大词类,在语法和语义上的重要性不言而喻。学生写作时正确使用形容词能够使文章更加生动、对事物的描述更加准确。另外,从批改网提供的数据可知,144位同学就“Travelling Abroad” 提交的作文中,“形容词+名词”的搭配共出现1399次,位列所有词性搭配之首,在词性搭配中占据31.66%的比重。因此,根据统计出来的索引行,我们分析学生对good, big这两个形容词的搭配使用情况。
在批改网语料中,good后搭配的名词仅有10个;habit, impression, manner, thing, reputation, example, behavior, time, way。本研究将good作为节点词放入CLEC ST3 ST4子库中检索,由于此处关注的是good一词的作为形容词与名词的右搭配情况,本研究将跨距设为左0右1,并人工剔除右搭配非名词的情况,得到结果为CLEC ST3 ST4子库中共有253个名词构成good的右搭配,搭配的丰富程度远超工科学生一年级写作中的词语搭配丰富程度(该种情况可能是由于CLEC子库中收录的作文题目数量多,而批改网中只有Travelling Abroad一个题目导致。对CLEC ST3 ST4子库进一步检索可发现,如图1所示在批改网中出现的10个与good搭配的名词中有9个在CLEC子库中也被使用,且除behavior一词外,good后搭配的名词在CLEC子库中也均与good构成强搭配(MI≥2),这说明工科一年级学生基本掌握能与good构成搭配的名词。但是学生倾向用good这一高度概括的高频词替代更丰富精准的形容词使用good impression/reputation/atmosphere,而在CLEC子库中更常用的表达为deep impression, high reputation。
本研究按照同样的方法对形容词Big进行研究。根据批改网数据,形容词Big后搭配的名词有10个,而在CLEC ST3 ST4子库中共有61个名词构成big的右搭配。对CLEC ST3 ST4子库进一步检索可发现,在批改网中出现的5个与big搭配的名词中仅有problem, country2个在CLEC子库中也被使用。学生依然倾向用big这一高度概括的高频词,无论是与抽象名词issue, damage, change,还是具体名词country, problem搭配,而在CLEC子库中以change为例,对change的左搭配进行检索,基于中文“巨大、显著的改变”学生们更常用的表达为prominent/substantial/ profound/great change. 学生使用不确切的形容词主要是受母语干扰的影响,如汉语中常说“变化很大、大变化”,学生将其直接翻译为“big change”,而没有考虑词语在英语中的典型搭配问题。
从对上述两个常用形容词的分析可以得出,学生倾向于使用高概括性的形容词如good, big描绘事物,无论是描绘抽象名词还是具体名词,写作时不会灵活选用更具体、准确的形容词。除此之外,学生对英语中典型搭配的问题考虑不足。
4 结论与教学启示
统计和分析显示,工科学生写作中能够使用的产出性词汇较少,掌握的实词少。大部分学生只会使用特定的最基本的实词,而且对基本实词的搭配掌握也存在问题。使用形容词描绘事物的特征或状态时,工科学生倾向于使用概括性强的形容词而非更具体、更细致的形容词。形容词与名词的搭配受母语影响较大,对英语中典型搭配情况考虑不周。
虽然近些年《大学英语课程教学要求》和《大学英语教学大纲》对大学生应掌握的词汇数目要求呈现增长趋势,各大高校、各个学院也很关注大学生英语词汇量的丰富和扩大,但是学生们只注重对单词的死记硬背,这仅仅是消极词汇的增加。学生对积极词汇的正确掌握能力较差,因为写作时出现无法灵活自由地选择词语,频繁重复常用词语的现象。因此,在英语词汇教学过程中,教师不仅要注意监督学生背诵、记忆单词,也要关注学生对单词的灵活使用情况。教师应促进学生把消极词汇转化为积极词汇,这样在写作时学生才能输出更多的积极词汇,增加文章用词的丰富程度、描写的生动程度、表达的准确程度。针对学生不能准确使用形容词这一现象,教师可以进行专项训练,多给学生布置描写类作文,如描写校园春景、描写教学楼等,在反复训练中练习准确使用形容词。
搭配知识对于产出自然地道的英语至关重要,因此在教学中教师可以借助索引工具(如AntConc, PowerConc),教师教学中引入索引工具能让工科学生接触真实的语料,利用工科学生强大的归纳能力遵循(观察-假设-试验)的模式,归纳常用词语的典型搭配。更多的利用“数据驱动学习”(data-driven learning)的模式,减少传统教学“讲解-练习-产出”(present-practice-produce)的模式。最后,教师应该多为学生提供高质量的输入材料。只有输入的信息足够,学生在写作这一输出过程才能得心应手。工科学生课余时间阅读量小,输入不够也是导致他们英语写作积极词汇匮乏的重要原因。因此,教师在教学中应该仔细甄别选用教学材料的质量。尽量使用地道、纯正、高水平的材料。教师也可为学生提供英语课外阅读书单,通过输入的增加促进输出质量的提高。
作者为西北工业大学航空航天语料库研究小组成员。现参与项目“英汉对应词语单位的语义趋向和语义韵对比研究”,此项目受西北工业大学基金资助,基金编号为Z2015181,此文为基金成果一部分
参考文献
[1] 卫乃兴.基于语料库的学生英语形容词搭配语义特征探究[M].上海:上海交通大学出版社,2002.
[2] 孙海燕.基于语料库的学生英语形容词搭配语义特征探究[J].现代外语,2004(4).
[3] 桂师春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003.
[4] 梁茂成,李文中,许家金.语料库应用教程[M].上海:外语教学与研究出版社,2013.
[5] 刘向红,王家义,夏艳萍,杨源.基于语料库的工科学生英语写作用词特点透视[J].外语学刊,2009(2).