APP下载

国内基于语料库的语义韵研究现状评述

2019-10-06陈贝贝

现代语文 2019年6期

陈贝贝

摘 要:以CNKI中国期刊全文数据库为文献来源,运用文献计量内容分析法,对2000~2018年期间刊发的所有国内期刊论文进行统计分析,发现国内语义韵研究大致经历了三个阶段:萌芽阶段、发展阶段和成熟阶段。总结了基于语料库下语义韵研究的特点、存在的问题及提出的建议,旨在为今后的语义韵和语料库语言学研究提供帮助。

关键词:语义韵;语料库语言学;研究评述

语料库方法是指创建或利用语料库进行相关问题研究的方法。当前语料库方法主要应用于计算机领域,即通过计算机对语料进行记录、分类、存储、标注、检索、统计及分析。近些年来,随着语料库的发展,基于语料库(corpus-based approach)的词汇搭配研究也成了语言研究领域的热门话题之一,Firth(1957)提出的词项结伴说和类连接概念,为基于语料库的词语搭配研究提供了重要的理论基础[1](P12)。在词项搭配中,当具有相同语义特点的词项与关键词词项同时出现时,后者就会被“传染”上相关的语义特征,或因搭配环境的不同产生语义变体,这就是语义韵(Semantic Prosody)[2][3]。Stubbs(1996)从功能的角度,将语义韵分为积极(positive)、中性(neutral)和消极(negative)语义韵三类[4]。在积极语义韵中,关键词吸引的都是具有积极语义特点的词项,如:provide,provide a positive rationale/provide the highest quality;在消极语义韵里,关键词吸引的词项大多是具有鲜明的消极语义特点,如:cause,cause greater harm/cause serious bodily injury;在中性语义韵里,关键词后有时跟的是积极语义词项、有时是消极语义词项,由此形成一种错综的语义氛围,所以中性语义韵又被称作错综语义韵(Mixed Prosody)。

一、文献计量内容分析

卫乃兴是最早将语义韵概念介绍到国内的学者之一[5],自2000年以后,国内学界掀起了一股研究语义韵的热潮,因此,笔者把文献检索的时间范围限定在2000~2018年之间。本文在语义韵和语料库语言学框架内,从时空分布和内容层次两个维度,对CNKI中国期刊全文数据库中收录的所有符合检索条件的论文进行文献计量与内容分析。

所谓“文献计量内容分析法”,是由邱均平等学者首先提出来的。把文献计量分析法与内容分析法结合,形成一种新的文献分析研究方法,就是文献计量内容分析法(详见《文献计量内容分析法》,国家图书馆出版社,2008年)。本文借鉴这一方法,对基于语料库的语义韵研究论文进行统计和分析。具体操作步骤如下:

在CNKI中,首先打开“高级检索”,以“期刊”为检索项,然后输入关键词“语义韵”,将时间定为2000~2018,来源类别为“全部期刊”,随即进行“检索”。接着,对自动检索结果进行数据剔除与合并,整理出语料库方法用于语义韵的相关文献。最后,利用EXCEL表格整合文献检索结果,并形成数据库。

二、基于语料库的语义韵研究综述

(一)研究历程简述

经统计,2000~2018年期间刊发的基于语料库的语义韵研究论文共有378篇,具体分布情况如图1所示:

根据图1的统计结果,可以发现,2000~2018年国内语义韵研究大致经历了三个阶段:萌芽阶段、发展阶段和成熟阶段。

1.2000~2006年,是语料库方法应用于语义韵研究的萌芽阶段,论文数量大体呈上升趋势。在这一阶段,国内的语义韵研究主要集中在定义、方法和对象方面,少部分是基于语料库对比同义词、近义词搭配的类连接研究,并逐渐出现基于数据的实证研究。纪玉华、吴建平首次提出基于现代信息技术的语料库手段的语义韵研究,该理论实现了词汇搭配语义的检索,对描述语义韵的联想意义进行了量化[6],但并未明确划分语义韵的类型。卫乃兴从语义传染的角度,论述了语义韵是一群具有相同语义倾向的词项与语篇关键词形成的一种语义共线,把语义韵分为三种:积极、消极和中性,弥补了早期研究的不足。在研究方法方面,详细论述了基于语料库语义韵研究的三个可行路径:第一,提取高频词,建立关键词项的类连接,利用概率统计,描写词项的语义韵特征;第二, 提取、检索节点词的显著搭配行为,利用数据驱动方法研究语义韵;第三,结合數据与数据驱动方法,即先提取高频词索引,然后根据建立节点词的类联接,描写词项的语义共现特征[7]。

2.2007~2011年,基于语料库的语义韵研究进入稳健发展阶段,研究成果数量逐年上升,研究内容和方法也有所深入。在这一时期,语义韵的研究扩展到中介语、同/近义词的词汇辨析和二语习得的研究等方面,研究方法由基于数据的统计分析转向数据驱动的语义韵研究手段,实证研究成为语义韵研究的主要方法。就中介语的研究而言,主要体现在英语词汇语义韵在外语教学中的应用。通过语料库的方法研究语义韵,可以提高学生对同/近义词的辨析能力,对相应的教学法和课程设计也起到了积极地促进作用。王春燕利用语料库的方法,分析了“real”和“true”这一组近义词在语法结构层面、搭配语义韵和非词语化使用发面的差异;通过比较这组近义词,证明了语料库可以为研究提供大量真实语料,从而使研究结果更加真实、可靠[8]。从2010年开始,陆续有学者将语义韵研究引入到翻译文本和翻译实践中,秦平新利用“全国公示语语料库”的资源平台,对“禁止”一词的翻译作个案研究,对基于语料库的调查结果进行观察、分析,从语义韵和词语搭配两方面进行讨论,为公示语的翻译提供了一个新的视角[9]。

3.2012~2018年,基于语料库的语义韵研究逐渐进入成熟发展阶段。它不再是语料库语言学单一的研究,而是逐渐涉及到词典学、描写翻译学、话语语篇分析、专门用途英语(ESP)等其他领域的跨学科研究,数据与数据驱动相结合的研究手段也得到越来越多的应用,语料库类型也逐步深入到双语语义韵构式研究中。崔维霞将语义韵信息引入到学习型词典,重点分析了语义韵的标注对象、信息分类、标注方法三个方面,探索出一套系统、规范的词典语义韵信息处理方法[10]。周惠、刘永兵以学术立场语块为例,以语义韵研究为切入点,探析了中国英语学习者与本族语者在学术写作语料库中学术语块的总体使用差异及高频语块的语篇评价意义[11]。李晓红、卫乃兴以平行语料库为基础,通过研究初似对等的内涵义和语义韵的对应,发现不论初似对等的内涵义是否对应,只有在二者的语义趋向相似并构筑同质语义韵常模时,才能确立为跨语言对应单位[12]。随着专门用途语料库的建立,基于专门用途词汇语义韵研究成了新的研究热点,目前的研究已经涉及到法律、生命科学、医学、经济学等领域。

(二)研究主题简述

笔者对378篇论文逐一阅读并对其内容进行分析,发现语料库方法用于语义韵的研究主要表现在四个方面:一是理论综述类研究(主要围绕语义韵的定义,理论框架,研究价值、意义和方法等方面展开);二是语义韵的实证研究(主要利用语料库来研究语义韵,如:词汇搭配的语义特征、类连接等;三是(语义韵的语域扩展(主要研究一些专业文本、文学语篇、新闻语篇、商务英语等的语义韵研究);四是语义韵的实际应用(主要体现在翻译、英语教学、词典编撰、认知语学等方面)。这些论文的主题分布情况如表1所示:

从表1可以看出,语料库方法用于语义韵的研究主要集中在实证方面。2005年,发表了第一篇基于语料库的语义韵的实证研究,从此之后,相关主题的论文就如雨后春笋般纷纷涌现,且发展态势一路攀升,成为语义韵研究的主流方向。2007年以后,语义韵的实际应用研究也逐渐发展起来,虽然数量不是很多,但一直呈稳步增长的态势。语义韵的理论综述类研究的发展较为曲折,2000~2012年,发展较快且占比较高;2012年以后逐渐呈下降趋势,其中,2014~2016年有小幅增长,2017年后又呈下降趋势。总的来说,综述类方面的研究大体上是出现了下降状态的。

(三)语料库使用简述

2000~2018年期间,刊发的基于语料库的语义韵研究论文中,主题为实证研究的有195篇,我们还对这些论文使用语料库的情况进行了频数统计,并按照总数降序进行排列。其中,排在前5位的学习者语料库、本族语语料库及其使用情况如表2、表3所示:

总体上来说,在对基于语料库的语义韵进行研究时,作者选用的语料库是很科学、很严格的。从表2可以看出,学习者使用最多的是中国英语学习者语料库(CLEC),该语料库容纳了各个阶段的中国英语学习者的学习情况,内容丰富,覆盖范围较广;其次为北京大学中国语言学研究中心语料库(CCL)、中国学生英语口笔语语料库(WECCL),这些语料库的内容也比较丰富,具有一定权威性。从表3可以看出,本族语语料库使用最多的是英国国家语料库(BNC),该语料库由牛津大学出版社出版,是英国目前最大、最具权威的语料库;紧随其后的是美国当代语料库(COCA)和布朗家族语料库(Brown),它们也都是内容较为丰富、覆盖面较广、语料较为权威的国家语料库。

由表2可知,在学习者语料库中,自建语料库的应用频次也较为突出。在统计时,我们把自建语料库限定为不能被其他研究者所重复利用的语料库。自建语料库大多来自语义韵的实证研究,语料的选择具有较强的针对性。自建语料库的来源大体可以分为:新闻报道材料、政府工作报告文本和演说、口译资料,“其他”则包括研究生论文、词典和戏剧文本。其中,新闻报道材料是自建库语料的主要来源。自建语料库的来源,具体如图2所示:

基于语料库的语义韵研究建议

从上文的分析可以发现,近18年来语料库方法与语义韵的研究呈现出初步繁荣的发展态势,论文刊发量逐渐增加,研究内容正步步深入,涉及的领域也越来越广。然而,在相关研究中也存在着一些问题与不足,下面将针对出现的问题提出几点具体建议:

(一)语料库及其方法的局限

由表2、表3可知,目前国内研究者使用较多的学习者语料库,其语料来源大多是大学英语四六级、专业英语四八级和口笔语考试。这不仅容易导致词汇使用频率不均衡,还限制了学习者使用词汇的广度和深度[13]。一方面,限时考试获取的语料不利于反应学生的真实情形,从而影响语料质量;另一方面,考生的年龄大多集中在18~24岁之间,相应的关键期学习者及成人学习者语料则严重匮乏。与此同时,语料库方法仅注重显性的文本信息,讲话者的心理或说话语气等信息则有所不足,因此,现有的语料仅适合描述语义韵的现象,却不利于揭示其内在的本质。

(二)研究领域应更宽更广

我们知道,理论应用于实践方能发挥更大的价值。从表1的统计结果可以看出,语料库方法应用于语义韵的研究主要集中在实证研究方面,而且大多是针对于实词、中介语对比或词汇搭配方面,在实际应用方面的研究较少,比如:英语词汇教学、中英文本翻译、词典的编撰和二语习得等。除此之外,理论探讨方面有所停滞,从表1可以看出,理论综述类的研究正呈现逐年下降的趋势,理论是实践的支撑,语义韵的研究要想深入发展,自身的理论建构是必不可少的[14]。语域扩展方面的研究也有待提高,如文学、戏剧、商务英语等,研究领域越广越能体现它的价值所在。个人建议应该大力拓宽语义韵的研究领域,充分发挥其应用价值。

(三)进一步提高研究质量

我们对378篇相关期刊论文进行了核心期刊筛选,近18年来语料库方法与语义韵研究相关核心期刊发表情况,如图3所示:

从图3可以看出,08~10年、11~12年核心期刊上发表的论文呈激增态势。在这期间,王春艳运用语料库的方法,从语义韵和非词化方面区分了“true”和“real”这对近义词[8];胡显耀、曾佳基于语料库,考察了现代汉语翻译小说中“被”字句的使用频率和结构,并分析其语义韵的构成[15];李晓红、卫乃兴从平行语料库出发,分析了汉英对等的语义趋向和语义韵的错综对应关系[16],等。2012年是这18年来发表核心期刊論文数量最多的一年,自此以后,核心期刊发表论文的数量总体呈逐渐下降趋势。核心期刊的量化指数承载着评估学术能力、质量、价值和水平的功能,对于学术的研究具有重要的指导作用。因此,今后的语义韵研究还需继续努力,进一步提高研究质量。

(四)增强批判性、创新性研究

“只有具有批判性研究,一门学科,一种理论才会有新的突破”[17]。批判和反批判是促进学术发展的重要动力。创新则是一个民族进步的源泉,也是学术研究不断深入的保障。从语义韵诞生至今,国内外关于语义韵的研究越来越多,但由于国内外学者研究方法不同,对语义韵的理解不同,许多新的理论大多是由国外学者提出的,国内学者只是对其进行尝试性的探索。国外已有学者提出用批判性思维来看待语义韵,如Stewart《对语义韵的批判性思考》主张要用质疑和批评的眼光来对待语义韵的研究[18],此外,还有 Whitsitt[19]、Hunston[20]等。国内学者对这方面的研究却很少,迄今为止只两篇相关论文[21][22]。因此,今后语义韵的发展应多一些批判性的研究,解决其中存在的局限与分歧,更好地促进语义韵研究健康发展。

本文在前人的基础上,总结了2000~2018年国内语料库方法用于语义韵研究的现状,并指出了目前存在的问题,希望能对以后的语义韵研究提供帮助。语料库方法是目前语义韵研究最为热门的方法之一,它不仅可以提供丰富真实的语言材料、便捷的语料处理技术,更能提供一种客观、理性的语义韵研究思维方法。当然,语料库方法也存在一些不足,国内研究者在进行自建语料库时应充分考虑语料的来源,确保语料的代表性和真实性,这样才能扩宽语义韵研究的视野,保证研究的有效性。

参考文献:

[1]Firth,J.R.Papers in Linguistics 1934-1951[M].London:Oxford University Press,1957.

[2] Louw,B.Irony in the Text or Insincerity in the Writer?——The diagnostic potential of semantic prosodiesIn[A].M.Bakere,al.(eds.).Text and Technology:In Honour of John Sinclair Amsterdam:John Benjamins Publishing Company,1993.

[3]Sinclair,J.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.

[4]Stubbs,M.Text and Corpus Analysis[M].Oxford: Blackwell Publishers,1996.

[5]翟红华,方红秀.国内语义韵研究综述[J].山东外语教学,2009,(2).

[6]纪玉华,吴建平.语义韵研究:对象、方法及应用[J].厦门大学学报(哲学社会科学版),2000,(3).

[7]卫乃兴.语义韵研究的一般方法[J].外语教学与研究,2002,(4).

[8]王春艳.基于语料库的中国学习者英语近义词区分探讨[J].外语与外语教学,2009,(6).

[9]秦平新.基于平行语料库的公示语翻译个案调查[J].新疆师范大学学报(哲学社会科学版),2011,(4).

[10]崔维霞.学习型词典语义韵信息标注研究[J].西安外国语大学学报,2018,(1).

[11]周惠,刘永兵.中国英语学习者学术语块使用的语篇评价意义研究——以学术立场语块的语义韵为例[J].外语界,2015,(6).

[12]李晓红,卫乃兴.双语视角下词语内涵义与语义韵探究[J].现代外语,2012,(1).

[13]于善志,苏佳佳.语料库方法与二语习得研究现状述评[J].宁波大学学报(教育科学版),2011,(3).

[14]韩存新.语义韵研究在中国的成长发展与趋势[J].外语教育(年刊),2011.

[15]胡显耀,曾佳.翻译小说“被”字句的频率、结构及语义韵研究[J].外国语(上海外国语大学学报),2010,(3).

[16]李晓红,卫乃兴.汉英对应词语单位的语义趋向及语义韵对比研究[J].外语教学与研究,2012,(1).

[17]胡壮麟,朱永生,张德禄,李战子.系统功能语言学概论(修订版)[M].北京:北京大学出版社,2012.

[18]Stewart,D.Semantic Prosody:A Critical Evaluation [M].London:Routledge,2010.

[19]Whitsitt,S.A critique of the concept of semantic prosody[J].International Journal of Corpus Linguistics,2005,(3).

[20]Hunston,S.Semantic prosody revisited[J].International Journal of Corpus Linguistics, 2007,(2).

[21]樊斌,韓存新.语义韵研究的问题与对策[J].哈尔滨学院学报,2012,(12).

[22]韩存新.语义韵研究之批评及未来走向[J].大连海事大学学报(社会科学版),2014,(3).