基于语料库和数据驱动的英语同义词的构式语法研究
2015-03-21施应凤周荣春林思思
赵 勇,施应凤,罗 瑞,周荣春,林思思
基于语料库和数据驱动的英语同义词的构式语法研究
赵勇,施应凤,罗瑞,周荣春,林思思
(文山学院 外国语学院,云南 文山 663000)
结合语料库方法和构式语法研究同义词,必须考虑其逻辑意义、语体意义、情感意义、搭配意义、语法意义和修辞意义。同义词取名于“同”,使用时强调“异”。根据显性义项逻辑意义异同把同义词分为两类,同义词的本质是“同中必有异”,与其共现的构式“造就”或“突显”了同中之异。
语料库;构式语法;逻辑意义;同义词
在中国知网(CNKI)检索从1990年至2012年间与“英语同义词”相关的论文,有218篇。据此,先学的英语同义词研究方法分为两类:定性研究,占97%,如吴秀琼[1]和刘明明[2]等;基于语料库和数据驱动的定性加定量研究,占3%,如潘璠[3]和卢晓娟[4]等。他们的研究主要聚焦于同义词分类及辨析问题,尤其是借助语料库并应用统计手段对同义词进行辨析。然而,这些研究缺乏对同义词本质及其分类标准的宏观认识,落后于语言理论的发展。
20世纪初兴起的语料库语言学基于实证主义,注重实证研究方法。20世纪末兴起的构式语法[5-7]的分析思路主要基于“所见即所得”(what-yousee-is-what-you-get)和“基于用法的模型”(usagebased model)。因此,语料库方法和构式语法都重视语言的真实使用,把两者结合起来定性和定量地研究同义词,可以更好地研究同义词的本质、分类及辨析问题。
一、英语同义词范畴的定性认知
首先,同义词的定义。同义词指同一语言中具有相同意义的词,但是其引申和联想义常常不同(word with the sam e m eaning as another in the sam e language but often with different im plications and associations)[8] 1174。英语同义词虽然数量庞大,和任何语言的同义词一样,绝对的同义词几乎是不存在的[9] 3。
其次,同义词范畴的认定问题。英语同义词的认定涉及语义范畴、语法范畴和修辞范畴。因此,认定同义词要同时考虑逻辑意义、语体意义、情感意义、搭配意义、语法意义和修辞意义。
二、先前英语同义词分类的语料库分析
依据“同的程度”分为绝对同义词和相对同义词[10],依据“异”分为5类,方言同义词、风格同义词、评价同义词、搭配同义词以及细微差别同义词[11] 100-103。本文把绝对同义词作为一类,把“异”的5类归入相对同义词,把修辞同义词归入相对同义词。
(一)绝对同义词的研究
像 “U-boat”和“submarine”这样的词语无论是在逻辑意义、色彩意义上,还是在语法上都是等同的,在实际应用中可以互换,这类词语叫做绝对同义词(absolute synonyms)或曰“等义词”[12]。通过语料库研究发现同义词不管是在语域上还是在搭配强度上都有明显不同,绝对同义词的存在值得商榷。下文以“Motherland/fatherland/homeland”为例说明。
语料库检索设置为[Chart],分别检索“Motherland”、“fatherland”和“homeland”在BNC和COCA不同域中的使用频率。数据显示它们在不同语域(register)中的使用频率不同,而且它们在BNC和COCA中的使用频率也有差别。“fatherland”总频率比是0.91/0.59,说明“fatherland”在英国英语中使用频率高;“motherland ”总频率比是0.72/0.72,说明“motherland”在BNC 和COCA中使用频率相等;“homeland”总频率比是4.21/15.48,说明“homeland”在美国英语中使用频率远远大于BNC。
节点词“fatherland”、“m otherland”和“hom eland”的数据驱动方法研究。数据驱动的方法不建立类连接,节点词的搭配行为不是参照传统的语法框架来研究,而是根据与之在一定物理环境内共现的显著搭配词项进行研究[13]。检索关键词分别设置为“fatherland”“m otherland”和“hom eland”,搭配设置为所有的形容词(adj.all),“fatherland”和“hom eland”的左跨距和右跨距均为“4”,“m otherland”的左跨距和右跨距设为“9”,分类(sorting)设为相关(relevance)。检索的数据显示节点词“fatherland”、“m otherland”和“hom eland”的共现搭配词差异较大。表现在三个方面:
(1)在BNC 和COCA中,与它们搭配强度最强的词不同,如在COCA中与“motherland”搭配频率最高的是“true”,在BNC中最高的是“independent”。在COCA中与“fatherland”搭配频率最高的是“new”,在BNC中最高的是“independent”。
(2)在不同的语料库中,同一个词与“fatherland”“motherland”和“homeland”的搭配频率不同,如“independent”在BNC中与“fatherland”的共现次数是“10”,在COCA中次数是“0”。
(3)在同一语料库中,同一个词与“fatherland”“motherland”和“homeland” 的搭配频率不同。在BNC中“adopted”与“fatherland”的搭配频率是“5”,与“homeland”的搭配频率是“3”;在COCA中,前者的搭配频率是“0”,后者是“26”;不与“motherland”搭配。
(二)相对同义词的研究
相对同义词指在逻辑意义、色彩意义或用法上有着这样或那样差别的词,一般不能互换使用,因它们彼此大约相等,或者说意义相近,所以称之为相对同义词(Relative synonyms)。
1. 方言同义词
周振[12]把“Fall”和“Autumn”归入绝对同义词,何兆熊和梅德明[11] 100-103把其归入方言同义词,本文把它们归入方言同义词。下文以美国英语“Truck”和英国英语“Lorry”为例说明。
从英国国家语料库(BNC)及其子库美国当代英语(COCA)检索并对比分析其搭配频率。设置搭配(Collocation)为所有形容词(adj.all),左跨距和右跨距均为1,筛选(sorting)设相关(relevance)。检索的数据显示“Lorry”和“truck”在COCA中的发生频率远大于BNC,它们的搭配词也不同。这些搭配词在COCA和BNC中的每百万词共现频率差别很大,而且同一个搭配词与它们共现的频率差别也很大,比如在COCA中“big truck”的使用频率几乎是“big lorry”的4倍,在BNC中“big truck”的使用频率几乎是“big lorry”的十六分之一。 因此,可以说“lorry”和“truck”因与其共现的词和词频不同而不同。
2. 语体同义词
有些词的逻辑意义相同,因在不同域的发生频率不同而不同,这些词就是语体同义词。下文以“start”“begin”和“commence”为例,分析其域表。数据显示“Commence”“Begin”和“Start”总频率比是440/7232/22813,“Commence”发生的频率最低,“Start”发生的频率最高,“Begin”发生的频率居中。
比较三个词在不同语域发生的频率。首先,比较口语(Spoken)和学术(ACAD)域,因为这两个语域位于正式和非正式的两极。“Commence”在“ACAD”域的发生频率与其在“Spoken”域的发生频率比是94/21=4.48,“Begin”在“ACAD”域的发生频率与其在Spoken域的发生频率比是1225/347=3.53,“Start”在“ACAD”域的发生频率与其在Spoken域的发生频率比是1636/4525=0.36,因此,“Commence”是最正式的用语,“Begin”次之,“Start”正式程度最低。
其次,比较三个词在书面语和非书面语的频率。取小说(Fiction),杂志(Magazine),报纸(Newspaper),非学术(Non-CAD)和学术(CAD)的频率和为书面语的发生频率,口语(Spoken)作为非书面语的频率,“Commence”在书面语域的发生频率和与其在口语域的发生频率比为(36+21+19+72+94)÷21=11.52,“Begin”在书面语域的发生频率与其在“Spoken”域的发生频率比为(1101+550+660+1646+1225)÷347=43.46,“Start”在书面语域的发生频率与其在Spoken域的发生频率比为(3274+2399+3385+2904+1636)÷22813=0.596,数据说明“Commence”的书面语程度最高,“Begin”次之,“Start”最低。
3. 评价同义词
评价同义词指那些逻辑意义不相同,表达了说话者的不同情感,显示出说话者对所谈论事情的态度或偏见的词,它们因语义韵的不同而不同。以“Praise”为例,在Sketch engine中检索到“Praise”的同义词60个,其中与“Praise”最相近的同义词是“admiration”,最不相近的是“compliment”,这说明了它的语义色彩。
4. 搭配同义词
搭配同义词指那些逻辑意义相同,但使用时搭配不同的词。使用sketch engine的差别速写(Sketchdiff)功能来检索搭配同义词的类连接,并以此来说明搭配同义词之间的区别。下文以“charge”与“accuse”为例来说明。检索 “Charge”和“accuse”在“pp-with-p”(带with短语的过去分词)中的右搭配词频,数据显示“charge”的右搭配全部为“with”,没有一例与“accuse”搭配。检索“Charge”和“Accuse”在“pp-of-p”(带of短语的过去分词)中的右搭配词频,数据显示“accuse”的右搭配全部为“of”,没有一例与“charge”连用。
5. 意义细微差别同义词
逻辑意义之间有细微差别的词叫做意义细微差别同义词。本文利用sketch engine的同类语(Thesaurus)功能来辨析这类同义词。以同义词“peculiar”“particular”和“special”为例,通过“同类语”功能来考察它们突显的义项差别。“peculiar”的同义词显著值显示其突出“奇特”(odd or strange)的意义。“Particular”的同义词显著值显示其突出“从众多事例中选出一个‘个别的’和‘具体的’”语义。“Special”的同义词显著值显示其突出“特别的、特殊的和特别的”意义。
6. 修辞同义词
修辞同义词本身逻辑意义不同,由于言语表达的需要,为了突出同一事物的不同方面或为了更加细腻地表达情感而突出言语的雅兴而采用的一种语言策略。
在BNC中参数设置为[=die] 检索die的同义词,取7例说明。其中 “expire”“perish”“croak”和“decease”有“死亡”的意义。“expire”是旧的用法,“perish”是正式用法,“croak”是俚语,“decease”是法律或正式用法,这些都与语体有密切关系,它们与“die”的语义关系可以归于语体同义词。
“stop”“fail”和“crash”并没有“死亡”的意义,而在BNC中它们被视为“Die”的同义词,它们在表示“死亡”意义时,并不是被动地避免单调的重复或无意义的同义词替换,而是积极地突出同一概念的不同方面,属于潜性同义词,如“His heart has stopped.”(他的心脏停止了跳动)突出心脏跳动的“停止”;“The patient's heart failed.”(病人的心脏衰竭了)突出“衰竭而死”;“His heart crashed last night.”(昨晚他的心脏突然停止工作了)突出心脏停止跳动的“突然性”。
三、英语同义词的重新分类及其本质
依据上文,绝对和相对同义的划分显然缺少理据,因为绝对的“同”不存在,其本质是“同中必有异”, 与其共现的构式“造就”或“突显”了同中之异。如果同义词的分类以整体模糊的“异”为标准,那就只有一大类:近义词。为了明晰起见,根据显性义项“逻辑意义”把同义词分为逻辑意义相同和逻辑意义不同两类,逻辑意义相同的包括方言、语体和搭配同义词,逻辑意义不同的包括评价、细微差别和修辞同义词。
四、结语
英语同义词辨析一直是教学的难点,本研究为同义词辨析提供了新的理论视角和实践路径,明晰了同义词概念,丰富了同义词辨析的手段,以期促进同义词的教学。
[1] 吴秀琼. 理解与应用英语同义词的原则 [J]. 中州大学学报, 2005(4):62-63.
[2] 刘明明. 英语同义词的差别 [J]. 安徽工业大学学报:社会科学版,2007(2):125-128.
[3] 潘璠,冯跃进. 基于语料库的同义词差异性特征调查 [J].山东外语教学, 2000(4):8-12.
[4] 卢小娟,高盈盈. 基于语料库的begin和start用法对比研究 [J]. 华中师范大学学报,2011(3):110-113.
[5] Goldberg, Adele E. Construction: a construction grammar approach to argument structure [M]. Chicago: University of Chicago Press,1995.
[6] Croft, William. Radical construction grammar: syntactic theory in typological perspective [M]. Oxford: Oxford University Press,2001.
[7] Croft, William. Logical and typological arguments for radical construction grammar [A]. in stman and fried(eds). Construction grammars: cognitive grounding and theoretical extensions [C]. Amsterdam: Philadelphia: John Benjamins, 2005.
[8] 牛津现代高级英汉双解词典 [Z]. 北京:商务印书馆(牛津大学出版社),1988.
[9] 郭兴家. 实用英语同义词词典 [Z]. 北京:学苑出版社,1991.
[10]蒋磊. 英语同义词探微[J]. 解放军外语学院学报,1998 (3):27-31.
[11]何兆熊,梅德明. 现代语言学[M]. 北京:外语教学与研究出版社,1999.
[12]周振. 论英语同义词的实质[J]. 外语教学,1990 (2):43-47.
[13]卫乃兴. 语义韵研究的一般方法 [J]. 外语教学与研究,2002 (2): 300-307.
(责任编辑 田景春)
Construction Grammar Study of English Synonyms Based on the Corpus and Data-driven Approaches
ZHAO Yong, SHI Ying-feng, LUO Rui, ZHOU Rong-chun, LIN Si-si
(School of Foreign Languages, Wenshan University, Wenshan 663000, China)
Based on corpus method and construction grammar, the study of English synonyms must take the meanings of logic, style, emotion, collocation, grammar and rhetoric into consideration. The naming of synonyms profi les "sameness", but the use profi les "difference". The paper classifi es synonyms into two groups based on logic meaning. The essence of synonyms is the difference in the sameness, and constructs co-occurring with them make or profi le the difference in the sameness.
corpus; construction grammar; logical meaning; synonyms
H085
A
1674-9200(2015)01-0075-04
2014 - 07 - 26
文山学院科研基金项目“基于语料库和语料库驱动的英语同义词的构式语法研究”(13WSY01)的阶段性成果。
赵 勇,文山学院外国语学院讲师,硕士。