基于语料库的本族语者与中国英语学习者形容词行为特征差异研究
2023-03-04李明鑫周佳玲
李明鑫 周佳玲
摘要:基于烈温本族语作文语料库(LOCNESS)和中国学习者英语语料库(CLEC),该文对比分析了本族语者和中国英语学习者使用different的特点。研究结果表明,英语学习者存在过度使用different修饰名词的现象,且修饰的名词不够丰富,对修饰名词的单复数形式把握不准。另外,学习者使用different+noun呈现积极语义的情况较本族语者偏多,句法分布情况相近的同时存在混淆different与difference的问题。二者之间有差异的原因多源于二语习得者词汇量匮乏、受母语习惯影响等因素。该文使用行为特征分析法及构式搭配分析法,有助于形容词的系统化分析,为形容词教学及词典编纂提供新的视角与启示。
关键词:different;LOCNESS语料库;CLEC语料库;行为特征分析法;构式搭配分析法
中图分类号:H31 文献标识码:A 文章编号:2096-4110(2023)03(a)-0045-04
Corpus-Based Study on Contrastive Analysis of Behavioral Profiles of English Adjectives
—A Case Study of "Different"
LI Mingxin, ZHOU Jialing
(School of Foreign Languages, Dalian Maritime University, Dalian Liaoning, 116000, China)
Abstract: Based on LOCNESS(Louvain Corpus of Native English Essays) and CLEC(Chinese Learner English Corpus), this paper conducts a comparative analysis between native speakers and Chinese English learners in terms of the characteristics of using "different". The results show that learners overuse "different" and the construction "different+noun", and the types are not rich enough. Learners make mistakes in choosing singular or plural form of the modified nouns. In addition, learners tend to use different+noun to present positive semantics more often than native speakers. Besides, learners sometimes take "difference" for "different", though the syntax distribution of "different" in the two corpora is similar. The above differences are mainly due to the lack of vocabulary of second language learners and the influence of their mother tongue. In this study, behavioral profile analysis and collostructional analysis are used, which contributes to the systematic analysis of adjectives and provides a new perspective and inspiration for teaching and lexicography.
Key words: Different; LOCNESS; CLEC; Behavioral profile analysis; Collostructional analysis
基于语料库的研究方法是研究词汇频率、词语搭配、类链接、语义韵等方面的有效方法,可以揭示词的内在特征。随着时代的发展,越来越多的研究者采用语料库数据观察统计的方法对形容词搭配用法进行了研究。Gries[1]提出了基于语料库的行为特征分析法,这种分析方法将基于语料库的研究方法与认知语言学理论相结合,为形容词研究提供了详细完整的途径。认知语言学与传统的结构语言学和形式语言学不同,将语言视作意义构建的重要载体和实现手段。
1 文献综述
Goldberg[2]认为构式是“形式与意义的配对”,是语言的基本单位。构式搭配分析法是探究各种构式中心语义及词位与构式之间语义关联和互动关系的有效途径。构式搭配分析法最早由Stefanowitsch、Cries[3]提出,目的是探索词与构式之间的联系,以及进一步得出构式的意义。近年来,越來越多的学者关注形容词构式相关研究,例如“形容词强化语使用型式研究”[4],“‘come/go+形容词构式搭配关联强度及构式范畴化关系研究”[5],“形容词+名词搭配能力研究”[6]等。也有部分学者以近义形容词为例,研究某一类形容词的搭配行为。然而国内外关于different构式搭配的研究极少,闫长红[7]探究了学习者和本族语者对different的搭配能力运用的异同,但是分析得不够深入。
2 研究问题
AntConc的单词列表(Word list)功能可以将语料中出现的所有单词按照实际出现频次排序。在将LOCNESS语料库和CLEC语料库中的形容词进行排序后,笔者发现different在两个语料库中的频率均较高,故本研究对比分析本族语者和学习者在different一词使用上的差异。主要研究问题如下:
(1)二者在different的整体使用特征上有无差异?
(2)二者在different的语义搭配形式上有无差异?
(3)二者在different的句法结构上有无差异?
3 研究方法
为确定different在两个语料库中的整体频数是否有显著性差异,首先本研究在对数似然值计算器中输入两个语料库的总体频数及different在两个语料库中的观察频数,计算出的显著性p值小于0.001,说明本族语者和中国英语学习者使用different一词时确有差异,可进一步开展研究。其次,本研究主要利用AntConc的检索功能完成对different及其与名词搭配频数的检索,又通过AntConc的搭配词功能对different修饰的高频名词进行语义分类及语义韵分析。为进一步判断different与不同名词在构式之中的关系,本研究使用R程序下的Collostructional Analysis 3.5计算different+noun中两者之间的吸引或排斥程度。最后,研究通过人工标注由AntConc导出的different索引行,再检索标注后作不同句法成分的different的频数,分析两个语料库在different句法结构上的异同。
4 结果与讨论
本研究對比分析LOCNESS语料库与CLEC语料库中的different的用法,包括整体使用频数、语义搭配和句法结构等方面。
4.1 整体使用频数
由于两个语料库的大小不同,先利用AntConc的检索功能得出different在两个语料库中的观察频数,随后转化为标准化频率进行比较。LOCNESS语料库中different的标准化频率约为0.6,CLEC语料库中约为0.8,本族语者使用different的频率明显低于中国英语学习者的使用频率,说明中国英语学习者存在过度使用different的现象。观察可知different多作定语,本研究又检索出different+noun在CLEC语料库中的标准化频率为0.573,在LOCNESS语料库中为0.438。此外,通过AntConc的词丛功能,可以得出different+noun的形符数和类符数,进而求出LOCNESS语料库中该搭配的类符和形符之比约为68.50%,CLEC语料库中约为37.00%。这说明虽然学习者使用different+noun偏多,但是本族语者使用different搭配的名词种类更丰富。
4.2 语义搭配
分别选取两个语料库中与different搭配频数最高的20个名词并用AntConc检索出这些名词在库中的原始频数。结果显示,本族语者和中国英语学习者使用different修饰的名词有重合,如cultures,people,views等。但是这些名词与different共现频数的高低同在库中出现的总频数存在差异,说明部分名词与different之间存在某种联系。
4.2.1 搭配强度
“有不少学者使用构式搭配分析法对比分析中国学习者与英语本族语者在某一构式使用上的异同”[8],通过分析共现词聚焦某类词的使用特征。本研究运用共现词素分析法,分析different与名词搭配时的特征。要进行共现词素分析,首先需要分别检索出different搭配名词的4个频数:a,b,c,d,如表1所示。
表1中a为noun在构式中出现的频数,b为noun在该构式外出现的频数,c为除noun外其他词项在该构式中的频数,d为所有其他构式出现的频数。different+noun是以形容词different为中心的构式,所以所有构式出现的总频数W为语料库中所有做定语的形容词的频数。本研究利用AntConc检索出与different搭配频数最高的20个名词,将这些名词的a值、a+b值、a+c值和语料库总频率输入基于R语言开发出Coll.analysis 3.2a软件,计算出构式搭配强度。由于在LOCNESS语料库中,上述20个名词里部分名词与形容词的实际搭配频数值偏低,故只列出了两库中分别与different搭配强度值最高的10个名词(见表2)。
结合统计学理论可知,当p值“落于0到0.05区间时,在统计学上才具有意义”,且“当p值越趋近于0值,其统计学上的构式搭配强度越显著”[9]。当p值小于0.001时,对应的构式搭配强度大于关键值3,说明搭配词与构式之间有显著吸引力。根据表2中的数据,LOCNESS语料库和CLEC语料库中搭配强度最高的10个名词与构式之间的搭配强度值均大于3,说明这些名词搭配词与构式之间呈现显著的搭配作用。此外,对比搭配频数和搭配强度两列数据可以发现,名词与different搭配的实际频数和二者之间的搭配强度不是正相关,例如LOCNESS语料库中groups与different的搭配频数较低,但搭配强度较高;而CLEC语料库中的view与different的搭配频数较高,但搭配强度偏低。
4.2.2 语义类别
根据Biber等[10]和Liu D[11]的研究,本研究重新划分了名词的语义类别,分别将两语料库中与different共现频数最高的20个名词进一步分为具体名词、抽象名词、地点名词和方式名词四类。分析发现,学习者使用different修饰抽象名词和方式名词时,存在较多误用情况。different在牛津词典中的释义为“not the same as another or each other”,即“不同的,相异的”。根据夸克语法,无冠词修饰的可数名词与different搭配应为复数形式,而学习者使用的view、kind和way为单数形式。学习者之所以存在上述问题,与汉语表达习惯有关。例如汉语中“不同观点”“不同方式”等表达并未体现名词的单复数形式。
随后,本研究把different+noun看作整体,放在语境中分析其语用意义。杨惠中[12]指出,由于构式的语义韵主要依赖于特定的语境,所以单词背后的意义是积极、消极还是中立取决于它们多样的搭配和形式。因此,different+noun的语义韵应该放在整个语境中分析。鉴于两个语料库较大,本研究仅分析与different共现频数最高的20个名词所在构式的语义韵。研究结果表明,绝大多数情况下英语本族语者和中国英语学习者使用different+noun构式表达的语义韵都是中立的,占比分别为95.00%和90.91%。二者使用该构式表达消极语义的情况极少,但是different+noun在CLEC中表达积极语义的情况有21例,比例略高。
4.3 句法結构
在句法形式中,形容词通常被用作定语或表语。该文主要研究different在两个语料库中的句子成分。经手动标记统计,different在LOCNESS语料库中作定语的情况最多,占different总频数的73.20%,少部分作表语,极小部分作宾语补足语等其他成分。而在CLEC语料库中,different的句法分布比例与LOCNESS语料库相近。但是,本族语者将different用作其他句法形式时基本上均作宾语补足语,而学习者语料库中存在很多different与difference混淆不清的现象,究其原因可能是受到母语语言习惯的影响。例如,在汉语中“不同”既可以是“我们没有什么不同”中的名词,也可以在“我们生来不同”中作形容词。
5 结语
本研究借助语料库帮助学习者深入了解different的搭配形式、语义特征和句法结构。整体来看,中国英语学习者过度使用different且搭配形式不及源语者丰富,这与学习者的语言环境和词汇量不足有关。虽然两语料库中different+noun基本呈现中立语义,但是CLEC语料库里呈现积极语义的情况较多。关于句法形式,两语料库中different在句法功能分布方面无明显差异,大部分做定语,小部分做表语,极小部分做宾语补足语等其他成分。而且在对含有different的检索行进行手动标注时发现中国英语学习者经常混淆different与difference,这与汉语表达习惯有关。
两个语料库中different+noun构式的使用也有相似之处。例如,与different搭配频数较高的名词与构式之间均具有显著的搭配作用,且搭配频数与搭配强度之间没有呈现正相关的关系。从语义层面来看,两语料库中与different搭配的20个高频名词均可以被归为具体名词、抽象名词、地点、方式四大类,其中people、cultures、areas等词也有重合,但学习者对名词单复数形式的运用不够准确。
本研究的结果进一步证实了行为特征分析法及构式搭配分析法的可行性,不仅使学习者对different一词的用法有了整体了解,也帮助其规避了写作中容易出现误用该词的一些问题。同时,在统计工具的帮助下,数据的收集和整理使得本研究的结果更加省时准确。
参考文献
[1] GRIES S. Ten Lectures on Quantitative Approaches in Cognitive Linguistics[M]. Beijing: Foreign Language Tea ching and Research Press,2016.
[2] GOLDBERG A.Constructions: A Construction Grammar Approach to Argument Structure[M].Chicago: The University of Chicago Press,1995.
[3] STEFANOWITSCH A, CRIES S T.Collostructions: Investigating the interaction between words and constructions[J].International Journal of Corpus Linguistics,2003,8(2):209-243.
[4] 刘静,甘国莹.中国英语专业学习者议论文写作中形容词强化语使用型式研究——基于语料库的考察[J].辽宁师范大学学报(社会科学版),2020,43(3):138-146.
[5] 陈佳.基于语料库的“COME/GO+形容词”构式搭配关联强度与构式范畴化关系研究[J].解放军外国语学院学报,2015,38(3):23-30.
[6] 潘崇堃.基于语料库的我国高校英语专业学生的形容词+名词搭配能力研究[J].北京化工大学学报(社会科学版),2011(2):63,64-67.
[7] 闫长红.基于语料库的高频形容词different词汇知识研究[J].西昌学院学报(社会科学版),2015,27(3):58-60.
[8] 韦小庭.基于语料库的“become/get/go/turn+adj.”构式搭配关联强度及形容词语义聚类研究[J].宿州学院学报,2018,33(10):51-57.
[9] 王欢,林正军.构式搭配分析法:用法·优势·意义——以英语way构式为例[J].西安外国语大学学报,2019, 27(2):26-31.
[10]BIRBER D,CONRAD S, REPPEN R. Corpus Linguistics: Investigating Language Structure and Use[M].Cambridge: Cambridge University Press,1998.
[11]LIU D. Is it a chief,main,major,primary or principle concern? A corpus-based behavioral profile study of the near-synonyms[J].International Journal of Corpus Linguistics,2010,15(1):56-87.
[12]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.
作者简介:李明鑫(1999-),女,河北邯郸人,硕士(研究生)在读,研究方向:外国语言学及应用语言学。