国内10年来基于语料库的英语词汇研究述评
2016-01-13李旭奎,韩慧
国内10年来基于语料库的英语词汇研究述评
李旭奎韩慧
(中国海洋大学 外国语学院,山东 青岛 266100)
摘要:通过对10年来(2004-2013年)发表于国内10种CSSCI外语类来源期刊上的相关文章进行检索、分类与统计分析,我们发现:(1)国内基于语料库的英语词汇研究总量呈明显上升趋势;2004-2007年为起步阶段,研究数量增长迅速;2008-2013年研究数量基本上呈高数值上升。(2)研究不仅涵盖实义词和功能词等微观方面,同时也辐射词块搭配、词汇综合特征、词汇教学等宏观方面。(3)10年来基于语料库的英语词汇研究取得了丰硕成果,但也存在不足。本文最后从研究内容、研究对象、研究材料、研究视角等方面对该领域的研究前景进行思考和展望,以期推动国内基于语料库的词汇研究的发展。
关键词:语料库;英语词汇研究;CSSCI
收稿日期:*2015-02-21
作者简介:李旭奎(1971-),女,山东莱西人,中国海洋大学外国语学院副教授,主要从事二语习得、应用语言学与外语教学方面的研究。
中图分类号:H313
文献标识码:A
文章编号:1672-335X(2015)05-0112-05
Abstract:This paper reviews the status quo of corpus-based research on English vocabulary in the recent ten years (2004-2013) in China, aiming to promote further development of this field. The classification and analysis of the studies show that during the past ten years, the number of corpus-based studies has increased greatly. The years from 2004 to 2007 mark the beginning stage, which witnessed a rapid increase in the number of studies; the years between 2008 and 2013 also saw a very rapid development. It is also found that the studies in the past ten years include not only research on content words and grammatical words, but also research on lexical chunks, collocations, lexical comprehensive features, and vocabulary teaching. However, in spite of the afore-mentioned achievements, there are limitations concerned with the content, corpus data, subjects, methods, and perspectives of these studies. Therefore, future studies can take these factors into consideration to ultimately improve English vocabulary teaching and learning in China.
一、引言
词汇学习作为外语学习过程中非常重要的组成部分,地位举足轻重。郑仲春[1]对本世纪初国内英语词汇研究进行梳理,[1]发现国内关于英语词汇教学与习得的研究最多,其次为英语词汇理论知识的研究;同时发现研究内容存在元词汇知识研究有限、微观词汇知识不够全面、验证性研究稀缺等不足,研究方法有待深化。语料库的诞生和发展为英语词汇研究提供了新的方法和视角,突破了传统研究中研究对象不足的局限,提高了英语词汇研究的广度和深度。
为探讨最近10年来(2004-2013年)国内基于语料库的英语词汇研究现状及发展趋势,笔者统计分析了CSSCI外语类来源刊刊登的相关文章,对英语词汇研究进行回顾和展望,找出不足,以推动英语词汇研究的发展,为更好地服务词汇教学提供理论依据。据此,笔者筛选出《外语教学与研究》、《外国语》、《外语界》、《外语教学》、《外语学刊》、《外语电化教学》、《外语与外语教学》、《现代外语》、《中国外语》、《外语教学理论与实践》10种期刊为检索对象。通过刊内输入关键词搜索并系统阅读后,剔除述评等非实证研究文章及与研究主题不相符的文章(如“基于日语语料库的词汇研究”),最终选定文章89篇。
本研究拟回答以下问题:(1)国内10年来基于语料库的英语词汇研究的基本概况如何?(2)国内10年来基于语料库的英语词汇研究有什么特点?(3)基于语料库的英语词汇研究现状对未来研究有哪些启示?
二、10年来研究的基本概况
国内10年来基于语料库的英语词汇研究的基本概况见图1。
图1 10年来基于语料库的英语词汇研究基本概况
由图1可看出,10年来国内基于语料库的英语词汇研究总量呈明显上升趋势。从总体上看,其发展大致可分为两个阶段,第一阶段(2004-2007年)为起步阶段,该阶段的研究增长迅速,由2004年的3篇增长为2007年的11篇,涨幅达到2.67倍。原因可能有以下两点:首先,随着语料库的发展,国内涌现出一批代表性强、研究价值高的语料库,吸引了学者对英语词汇的研究(如:大学生英语语料库;CLEC;SWECCL等)。2004-2007年,60.87%的研究以CLEC,SWECCL为研究对象。[2][3][4][5][6][7]此外,一些学者自建小型语料库对英语词汇的特殊现象进行研究。如以研究生为调查对象的研究生作文语料库,[8]调查新闻报刊中的词汇现象的中国英语新闻语料库。[9]亦有研究以英语本族语语料库如BNC、COBULD[10]、LOB等为研究对象。[11]其次,20世纪90年代,Tom Johns提出数据驱动的学习方法,提倡语言不是通过教师教授某些特点而习得,强调通过呈现大量的权威数据、给予线索暗示,学习者就能从文本中发现答案,归纳习得。[12](P184)此理论引起学者的关注,推动了基于语料库的词汇研究。
第二阶段(2008-2013年)为快速发展阶段。此阶段的论文总数为66篇,占总数的74.16%。2008-2011年,研究数量呈现高数值直线上升,2011年达到顶峰。此阶段平均值高于总平均值19.09%。再者,此阶段的研究广度不断扩展,研究深度不断增加,研究对象多样化,这些特点催生了研究成果的急剧上升。相比第一阶段,此阶段的研究不再局限于某一词条或词性的简单检索,更多的是多角度分析。朱慧敏通过自建英语专业1-4年级同话题写作语料库,[13]运用纵贯研究方法探讨了英语写作中词汇丰富性的历时发展变化,发现英语写作中的词汇变化呈非线性发展趋势,学生在大四出现了词汇高原现象;在英语水平提高过程中,学生写作词汇的丰富性不同维度的习得规律和发展轨迹不尽相同。
上述发展特点或许是因为:首先,越来越多的学者意识到,语料库的发展前景及其强大的应用力解决了以往词汇教与学过程中的难点。词汇学习不再是生硬地背诵短语和句子,语料库将词汇搭配、词簇、语义韵等概念带入词汇学习中,提高了学习者听说读写等语言技能。[14][15][16][17][18]同时,在此阶段,除前文提到的语料库外,更多的研究者根据研究目的,自建相符合的语料库,使得语料库的覆盖面积扩大,并结合前人的普遍性结论,验证在特定领域是否存在特殊性规律。[19][20][21]在研究学习者语料库的同时,学者也关注运用语料库研究各阶段教材中词汇的分布特征,[22][23][24]以提高教材在教学过程中的使用度。
三、研究特点
本文借鉴高一虹等对研究方法的分类,[25]根据所收集文献的研究特点,从微观和宏观角度探讨10年来国内基于语料库的词汇研究特点。
表1 10年来基于语料库的词汇研究特点
微观角度以词性和词类为核心,辐射名词、动词、形容词等具有特定语义的实义词,以及连接词、代词、情态动词、程度副词、冠词、指示词等主要参与词组、小句甚至语篇构建的功能词。宏观角度主要包含词块与搭配、词汇综合特征及词汇教学等方面的研究。
(一)实义词研究
动词、名词、形容词作为实义词的重要组成部分,在语篇研究中的地位举足轻重。在基于语料库的实义词研究中,动词研究占50%,名词与形容词研究分别占27.27%和22.73%。动词研究中,大部分语料为大学生写作语料库,研究发现,与本族语者相比,中国英语学习者存在过度使用、结构冗赘等现象。[26][27][28][29]
与动词研究相比,名词和形容词的研究数量虽然较少,但研究材料多元化明显。除常用的CLEC、SWECCL等外,还涉及COCA、中国新闻英语语料库、中国商务英语语料库、研究生学术英语语料库等。俞希基于中国新闻语料库,[9]研究新闻常用词foreign的使用情况,发现对该词的使用基本符合本族语人的用法,具有较高的可理解性,折射出中国新闻人的思维方式和对国际交往积极开放的态度。邵斌从认知语义学的角度,研究由carbon构成的“碳族复合词”,并对英语新词新义背后的认知机制做了深入分析。[30]
(二)功能词研究
功能词作为语言体系的框架和粘合剂,其研究有助于学习者更清楚地了解语言的系统和结构。功能词在语言学习的较早阶段出现,出现频率比实义词高得多,在词汇使用频率中占1/3。[31][32]基于语料库的功能词研究*根据Bolinger(1981)功能词分类,此处所指的功能词为副词连词,如besides,instead,nevertheless等。中,57.69%为连接词研究,情态动词、人称代词和程度副词研究各占11.5%,指示词有2篇。
连接词研究中以笔语研究居多(80%),研究对象多为大学生和研究生,少量涉及高中生,初中生及小学生未曾涉及。常以写作语料库和学术论文语料库为研究材料,普遍发现中国英语学习者同时存在过度使用和回避使用现象。[33][8][19]同时,也有学者探讨在口语语料中连接词的使用是否存在同样现象。陈新仁研究因果类话语标记语so,therefore等在口语中的使用情况,指出中国学习者总体上能恰当使用此类词,但学习者个体之间存在明显差异。[4]
情态动词作为英语语法中的重要项目,是中国英语学习者的难点。马刚和程晓堂[5]指出中国英语学习者对情态动词总体存在过度使用和过少使用的情况,[6]但较高水平的英语学习者使用情况更接近本族语者。
程度副词与指示词的研究结果与情态动词相似,同时存在多用和少用现象。[34][35]基于语料库的人称代词研究,皆从翻译角度出发。黄立波探讨英汉翻译中人称代词主语的显化现象,或以英译本中的人称代词为例探讨翻译文体学。[36]
(三)词块与搭配
基于语料库的词块与搭配研究数量为全部研究的20.22%。词块是在特定语体中,经常以三个或三个以上的词共现的词汇组合,[37]是交际中高频率出现的大于单词的语言现象,融合了语法、语义和语境优势,对其进行深入研究引起了学者们的高度重视。[38][39]张霞从宏观和微观两个角度发现中国高级英语学习者和本族语者在使用不同功能性的词块及其功能方面存在显著差别。[40]杨元媛对科技英语论文进行检索,[41]发现在结构方面,带有of-结构的名词短语、介词短语和被动态动词短语构成的词簇应用最多;就功能而言,提供指示框架的词簇最多,且都与自然科学的主题相关。
运用语料库的词汇搭配辨析同义词也是搭配研究的热点,避免了以往学习中直觉和经验的主观性,有助于学习者准确习得语言特征。例如,陆军指出学习者英语的近义词使用特征和发展模式与按照汉语意思逐词翻译密切相关,不同类型的学习者在近义词的使用特征和发展模式上有明显差异。[16]
(四)词汇综合特征
基于语料库的词汇综合研究比例为22.23%,笔者将其分为横向研究和纵向研究。横向研究涵盖词汇丰富性、复杂性、重复性、词汇效度、词汇错误等,纵向研究一般为词汇发展模式、词汇深度的研究。罗卫华调查发现教学语篇间的词汇重复率很小,是学生不能将学过的词汇转变为积极词汇的因素之一。[42]穆惠峰研究大学英语四级考试的完形填空,发现其测试的内容覆盖面、内容关联性符合考试大纲的要求。[43]吴瑾发现中国学生的词汇知识深度有一定局限性:学生往往使用不地道的学术词汇搭配,较常使用词汇带有专业性质的意义,较少使用表示作者态度的搭配词。[44]
(五)词汇教学
语料库以其直观、可靠的数据为词汇教学提供了可靠的依据。越来越多的学者开始关注语料库指导下的词汇教学的实证研究,以期提高词汇教学效果。俞燕明研究发现,[45]基于语料库的数据驱动学习模式对学生词汇水平提高大有裨益,同时培养了学生的自主学习能力和研究性思维。孔蕾从微观层面探讨了利用语料库组织英语专业词汇教学的方式和方法。[46]
四、研究存在的不足及对未来研究的展望
从过去的10年来看,基于语料库的英语词汇研究和应用得到了稳步发展,取得了丰硕成果,但仍存在一些不足。探讨研究中存在的问题,可为将来的词汇研究提供启示。
(一)研究内容仍需丰富。10年来基于语料库的词汇研究大都集中于名词、动词、形容词、连词的搭配或语块研究,以及与上述词相关的特殊语言现象研究。从微观角度看,首先,对于小品词、冠词、介词、代词等的研究较少,然而这几类词通常是中国英语学习者学习的难点,容易混淆,[36][47]因此,基于中国英语学习者语料库对这几类词进行研究,并基于英语本族语者语料库发现本族语者对这几类词的使用情况或规律,将两者对比,发现中国英语学习者使用这几类词时存在的问题,就可在以后开展有针对性的英语教学,提高我国英语学习者对这几类词的习得水平。其次,10年来对于词汇的语音和语法方面的研究也亟待丰富。[1]从宏观角度看,基于语料库的语义韵研究相对较少。词汇的语义韵研究不仅可揭示词项结伴行为的语义特征,而且能揭示人们凭借搭配范式表达态度、评价事件的语用功能特征。因此,基于语料库从语义韵视角观察和研究我国英语学习者中介语的输出,可以发现以往研究方法难以发现的问题和特征,[48]发现我国英语学习者此方面的不足,对以后的英语教学有重要意义。
(二)研究材料过于集中。10年来的英语词汇研究大都基于笔语语料库。然而,口语语料库、特殊用途语料库(ESP)以及特定专业领域语料库(如海洋科技领域,石油化工领域,机械制造领域等),以其特定场合的需求,对学习者的词汇要求更高,更能反映出学习者的语言使用水平,因此未来基于语料库的词汇研究可在上述几方面开展。
(三)研究对象亟需扩大。10年来基于语料库的英语词汇研究的对象基本上以大学生和研究生为主,高中生较少,初中生和小学生未曾涉及。然而,基于现阶段英语学习者基本上从小学阶段即开始接触到英语这一事实,初中生和高中生已掌握了一定的词汇量和句法知识,对其进行早期研究将对英语词汇教学更有引导和启发作用。
(四)研究方法相对单一。基于语料库的词汇研究多运用定量分析方法,通过语料库得到数据,并以此来分析研究某类词的特定现象,分析其产生原因。然而,在整个研究过程中,由于没有被试的直接参与,在分析现象产生的原因时,往往容易掺杂研究者自身的主观性。因此,笔者认为,今后的研究可以考虑在运用大型语料库的基础上,通过研究者自建相似的小型语料库,并结合其他研究方法,如访谈法、问卷法等,以便对后期基于大型语料库的结果分析有帮助作用,避免研究者的主观猜测。
(五)研究视角有待扩展。以往基于语料库的英语词汇研究,大都从基础语言学出发,研究某类词的词法和句法,国内交叉学科基于语料库的英语词汇研究仍然停留在起步阶段,亟待发展。然而随着英语词汇学的不断发展和英语词汇教学需求的日渐提高,该领域的研究可以跨学科、多维度、多视角进行,融合认知语言学、心理语言学、神经语言学、语言类型学、社会学及人类学等交叉学科,拓展研究的思路和视角,其研究结果对词汇教学的借鉴性和参考价值也会进一步提高。
(六)研究与教学结合尚需加强。国内从英语词汇教学角度出发,基于语料库的研究大都以理论研究为主,实证研究不足。词汇研究最终要服务于教学,因此基于语料库的理论研究成果对词汇教学实践的指导作用应该更加具体化、实用化和明确化,为词汇教学提供借鉴性和参考性。
五、结语
词汇是语言习得的重要模块,直接影响语言的运用水平。本文对10年来国内基于语料库的英语词汇研究进行梳理、总结,发现研究总量呈明显上升趋势,研究不仅涵盖实义词和功能词等微观方面,同时也辐射词块搭配、词汇综合特征、词汇教学等宏观方面。总之,10年来国内基于语料库的英语词汇研究取得了丰硕成果,但在研究内容、研究材料、研究对象、研究方法、研究视角等方面还存在不足,因此未来的研究可在上述几方面开展,以推动国内基于语料库的词汇研究的发展,提高国内英语词汇教学水平。
(致谢:感谢中国海洋大学人文社会科学培育专项(201415014)的资助)
参考文献:
[1] 郑仲春.本世纪初国内英语词汇研究综述[J].山东外语教学,2007,(6):38-44.
[2] 李晓红.基于语料库的EFFECT搭配行为对比研究[J].外语教学,2004,(6):21-25.
[3] 莫俊华.中国生在议论文写作中使用因果连接词的语料库研究[J].外语教学,2005,(5):45-50.
[4] 陈新仁,吴钰.中国英语学习者对因果类话语标记语的使用情况[J].国外外语教学,2006,(3):38-41.
[5] 程晓堂,裘晶.中国学生英语作文词汇量级高频词目研究[J].外语电化教学,2007,(6):9-15.
[6] 马刚,吕晓娟.基于中国英语学习者英语语料库的情态动词研究[J].外语电化教学,2007,(6):58-62.
[7]卫乃兴.形容词性修饰语的非词语化特征研究[J].外语教学与研究,2007,(3):217-223.
[8] 潘璠.非英语专业研究生写作中连接词用法的语料库调查[J].现代外语,2004,(2):157-165.
[9] 俞希.“Foreign”一词在中国英语新闻中的用法[J].外语教学,2006,(6):23-26.
[10] 杨节之.语料库搭配检索与英语同义词辨析[J].外语电化教学,2007,(4),41-46.
[11] 孙海燕.基于语料库的学生英语形容词搭配语义特征研究[J].现代外语,2004,(4),410-510.
[12] Huston, S. Corpora in Applied Linguistics[M]. Cambridge: Cambridge University Press, 2002.
[13] 朱慧敏.英语写作的词汇丰富性发展特征[J].外语界,2013,(6):77-87.
[14] 方娣.基于语料库的动名搭配教学的实证研究[J].外语电化教学,2008,(6),22-27.
[15] 徐捷.中国英语学习者话语标记语you know习得实证研究[J].外语教学理论与实践,2009,(3):28-34.
[16] 陆军.基于语料库的学习者英语近义词搭配行为与语义韵研究[J].现代外语,(8):276-289.
[17] 李莉华.情态动词will和may在英语学术论文写作和新闻语体中的使用[J].外语教学,2011,(6):38-44.
单因素方分析的自变量包括:儿童性别、母亲职业、居住时问、家庭收入、乙肝免疫接种知晓情况等。以五苗是否全程合格接种为因变量,Logisfic回归分析显示流动儿童五苗全程接种的影响因素为儿童性别、家庭收入、免疫接种知晓情况、家长对儿童接种疫苗的态度。见表1。
[18] 徐昉.中国学习者英语学术词块的使用及发展特征研究[J].中国外语,2010,(4):51-57.
[19] 初良龙.工科院校学生英语论文写作中转折连接词的使用研究[J].外语界,2011,(5):9-16.
[20] 李德超.汉英同传中词汇模式的考察[J].现代外语,2012,(4):409-417.
[21] 王立非.商务英语词汇名化的语料库考查及批评分析[J].外语电化教学,2012,(5):3-9.
[22] 谢家成.中学英语教材词汇语料库分析[J].外语教学理论与实践,2010,(1):55-61.
[23] 陈潇潇.大学英语教材课文词汇分布特征实证研究[J].外语电化教学,2011,(3):9-17.
[24] 王同顺,许莹莹.大学英语教材中的词族分布研究[J].外语电化教学,2013,(5):10-15.
[25] 高一虹.中西应用语言学研究方法发展趋势[J].外语教学与研究,1999,(2):8-17.
[26] 王立非,张岩.大学生英语议论文中高频用词使用的语料库研究[J].外语教学与研究,2007,(2):110-116.
[28] 张莎.高频动词经验类型及其搭配形式的语料库研究[J].外语学刊,2011,(3):36-42.
[29] 马拯.基于语料库的HAPPEN语义韵的对比研究[J].外语教学理论与实践,2010,(4):20-27.
[30] 邵斌.基于语料库的英语新词认知语义研究[J].外语理论教学与实践,2012,(4):21-27.
[31] Bolinger, D. & Donald, A. Aspects of Language[M]. Harcourt Brace Jovanovich, Inc,1981.
[32] 高彦梅.20世纪以来的功能词研究[J].外语与外语教学,2001,(5),20-22.
[33] 谭晓晨.中国学生使用英语对比性标记情况的原型理论分析.国外外语教学,2003,(4):13-18.
[34] 杨晓军.英语中动结构式中副词使用的语料库考察[J].外语教学与研究,2007,(4):287-293.
[35] 张岩.基于语料库的中国大学生议论文中的指示词研究[J].外语与外语教学,2006,(6):26-19.
[36] 黄立波.基于双语平行语料库的翻译文体学探讨—以《骆驼祥子》两个英译本中人称代词主语和叙事视角转换为例[J].中国外语,2011,(6):100-106.
[37] Biber, D.Longman grammar of spoken and written English[M]. London: Longman, 1999.
[38] 王海华.中国英语学习者动名词搭配行为的发展特点研究[J].外语学刊,2009,(6):59-63.
[39] 武光军,王克非.基于英语类比语料库的翻译文本中的搭配特征研究[J].中国外语,2011,(5):40-47.
[40] 张霞.基于语料库的中国高级英语学习者词块使用的研究[J].外语界,2011,(5):48-58.
[41] 杨元媛.基于语料库的科技英语论文四词词簇特点研究[J].外语教学理论与实践,2013,(4):42-52.
[42] 罗卫华.基于BNC语料库的英语篇际词汇重复模式研究[J].外语教学与研究,2009,(3):224-230.
[43] 穆惠峰.基于语料库的大学英语四级完型填空测试内容效度验证研究[J].外语电化教学,2011,(4):66-70.
[44] 吴瑾.中国研究生产出性学术词汇知识深度的语料库研究[J].外语教学,2011,(2):52-56.
[45] 俞燕明.数据驱动词汇教学[J].外语电化教学,2009,(2):58-62.
[46] 孔蕾,秦洪武.语料库在词汇教学中的应用:词汇分层和教学设计[J].外语教学理论与实践,2013,(4):58-63.
[47] 何安平.中国大学生英语口语Small Words的研究[J].外语教学与研究,2003,(6):446-454.
[48] 卫乃兴.基于语料库学生英语中的语义韵对比研究[J].外语学刊,2006,(5):50-55.
A Review of Corpus-based English Vocabulary Research
in China in the Last Decade
Li XukuiHanhui
(College of Foreign Languages, Ocean University of China, Qingdao 266100, China)
Key words: corpus; English vocabulary research; CSSCI
责任编辑:周延云