APP下载

“-ly副词+speaking”构式语义的语料库研究

2019-11-28胡永近

安顺学院学报 2019年5期
关键词:本族语构式语料

谢 冰 胡永近

(1.宿州学院外国语学院,安徽 宿州234000)(2.宿州学院外国语学院,安徽 宿州234000)

在认知语言学中,构式可以是任何语法信息(包括句法、语义、语用等)的习惯搭配[1]。Goldberg曾指出,语域(register)等也是语义的重要信息之一[2]。本科毕业论文以写作的形式集中体现了学习者对所学专业的认识和见解。不同于口语交流,毕业论文中含有大量的书面语和学术语言,因此往往需要更高的语域设定。作为议论文的一种具体形式,毕业论文写作需要对科学研究不同阶段中的现象和原因进行评论和说明,而作为对整个句子进行说明和解释的语法手段,评注性状语表明说话人对话语的看法或态度[3][4]。作为典型的评注性状语,“-ly副词+speaking” 构式在对句子进行评述时,也行使了语言的元语言功能[5]。Lakoff[6]认为包含 “-ly副词+speaking” 构式的句子是带有对该句部分或整体评论的句子,这种结构被Lakoff定义为模糊限制句(hedged sentence)。杨才英和鲁熙莹[7]基于不同语料库从系统功能语法的角度分析了“副词+speaking”结构,研究发现英汉两门语言在“副词+speaking”结构中存在句法以及词类搭配的不同。胡梦莹[8]基于AntConc中的相关功能和卡方检验对本族语语料库和二语语料库中立场副词的搭配进行研究,该研究重点考察了中国高中学生对该搭配类型的频率以及词汇语法特征。研究发现,相较于本族语者,中国高中学生对于立场副词的用法呈现出过度或过少使用的情况。此外,当前对于副词的研究多聚焦于副词的搭配类型研究或基于某一理论的定性研究,且对词汇的语域信息没有给予足够的重视。在理想的英语教学(ELT)环境中,教师的教学活动应为基于使用的(usage-based)教学材料,而实际情况有可能是无论是教师的表述还是教材的内容都有可能不是惯用的表达方式[9]10,因此学生的语言习得也完全有可能只是基于直觉(intuition)的表达方式。本文对比研究“-ly副词+speaking”构式在母语和本族语语料库的异同,探究其原因,并提出对中国英语学习者的启示和建议。

一、研究方法综述

(一)理论基础

Jones和Waller认为说话者通过使用某一构式可以折射出其对某一事件的态度[9]72。多数语料库在线网站及语料分析软件均以频率作为最基本的检索方式。Widdowson曾指出,在语言研究中,频率有时并不能完全反映以及结构的典型性和相对认知凸显[10]。本研究基于此进行了进一步思考,并尝试在词汇搭配频率与语义之间寻求一种更为科学的量化方法。互信息值(mutual information,缩写为MI值)也是语料库语言学中一种较为常见的计算词汇搭配强度的方法。一般来说,MI 值越大,说明搭配强度越大。在实际操作中以 MI 值 3 为临界值,MI 值大于 3 的搭配词可视作显著搭配词[11][12]。一些在线语料库及语料分析软件均提供此方法。而互信息值最大的不足就是对临界特征的概率比较敏感,且它没有考虑特征在文本中发生的频度,因而此方法经常倾向于选择稀有特征[13]。通过采用简单的互信息值计算,工作语料库中的一些低频数据确实获得了更多的关注,而这并不是实验设计的初衷。结合本试验工作语料库的数据特点,为了更为科学地论证和探索“-ly副词+speaking”构式的语义特征以及其在二语学习者中的运用,本研究选用对数似然比(Log Likelihood Ratio)的计算方法对语料数据进行重新评估。首先,与互信息算法相比,该方法在处理低频单词时,其对分类的贡献没有过分放大且低频单词对分类的贡献计算更为准确。其次,该算法在考虑低频单词对分类结果产生正面影响的同时,能较好地控制其对分类产生的负面影响[14]。本研究中的对数似然比计算由Gries(2014)[15]的搭配构式分析(collostructional analyses)实现。该分析方法基于R语言(3.4.1版本),具有三个子程序,分别为共现词素分析(collexeme analysis)、区别共现词素分析(distinctive collexeme analysis)以及共变共现词素分析(co-varying collexeme analysis)。本研究所采用的是共现词素分析。该子程序需要研究者提供(a)工作语料库的总容量、(b)工作构式在该语料库中的总频率、(c)语料库中检索到的“-ly副词+speaking”构式类别以及(d)在“-ly副词+speaking”构式中出现的每一个副词在语料库中的使用频率。该程序通过对数似然比计算出工作构式的搭配强度并将计算结果按照搭配构式强度(collostruction strength)的大小进行排序,该数值越大,则表明对应的单词与“-ly副词+speaking”构式的语义关联越密切。以表1为例,若词X在构式Y中出现的频率为A, 而其在语料库中其他地方出现的频率为B,那么则有:

表1 搭配构式分析中词X和构式Y共现频率示意图

表1中的不同频率将和假设词X和构式Y间不存在关系时的期待频率进行比较,两种频率间的差异将被量化[16],其量化结果即为词X和构式Y的搭配强度值。

(二)工作语料库

本研究基于本族语和二语语料库对中国英语专业学生学术语言中“-ly副词+speaking”构式的搭配及特点予以对比分析,并对其现象和特征予以解释,这也是自建语料库的意义之一[9]9。其中本族语语料库选取了美国当代英语语料库(COCA (corpus of contemporary American English))和英国学术写作语料库(BAWE (British academic written English)),二语语料库为作者自建的英语专业毕业论文语料库。通过对“-ly副词+speaking”构式进行跨库检索并对比频率以及对其搭配强度(collostructional strength)的研究,对最终数据予以分析说明。在本研究的三个工作语料库中,COCA语料库包含了五种不同的组成来源(口语、杂志、小说、报纸和学术),因为该语料库的五个组成部分具有等量关系,为了确保研究工具的针对性和研究对象在量化上的均衡,因此本研究只选取该语料库中的学术语料部分,其容量约为1.1亿词。BAWE语料库容量约为6百万词, 包含了2700余篇英语为母语且对其熟练掌握的本科学生的写作,单篇字数从500-5000不等,内容选自社会科学、自然科学、生命科学和艺术等共计35个学科领域。自建语料库选自宿州学院外国语学院2015-2018年间四届本科共计647名毕业生的毕业论文定稿,共计约3百万词,该语料库为同质的(mono-modal),所有论文的工作语言均为英语,论文的研究方向主要包含英语语言学、英美文学、翻译、跨文化交际及商务英语五个方向。为了配合本研究的需要,这些论文文本只保留正文部分(所有论文均删除了封面、致谢、摘要、目录、参考文献及附录等非正文部分),编辑之后的单篇平均长度为4800词。

(三)研究工具

本文选用了语料分析软件AntConc 3.5.7[17]对BAWE和自建语料库中的语料进行初步检索。COCA的语料检索部分由该语料库网站的在线分析功能完成。然后本研究将对三个语料库中“-ly副词+speaking”构式进行搭配强度分析,此部分研究选用了Gries[15]的基于R(3.4.1版本)的搭配构式分析(collostructional analyses)。

二、“-ly副词+speaking”构式搭配强度的跨库研究

(一)“-ly副词+speaking”构式搭配强度特征概述

表2呈现的是基于该算法三个语料库中搭配构式语义强度排在前九位的搭配词汇。Gries[15]认为搭配构式强度大于1.20103时具有统计学意义(p<.05),而上表中的所有搭配词汇均符合此标准,即其与“-ly副词+speaking”构式的搭配均呈显著水平。从表2可以看出,虽然三个语料库的容量不同,基于搭配构式强度的排序依然可以反映出“-ly副词+speaking”构式在各自语料库中使用者的使用习惯和语义特征。

表2 “-ly副词+speaking”搭配构式强度排序

具体来说,strictly、generally、broadly同时出现在三个语料库搭配强度排序的前四位,表明本族语者和二语习得者对此类搭配选择具有一致性。其中,COCA语料库中排序前两位的为strictly和generally,两者之间的搭配构式强度差异并不大(strictly:1857.93,generally:1716.61),远远大于排名第三的broadly(760.1535)及其后的搭配构式强度。而搭配强度排在BAWE语料库前两位的分别为generally和broadly,其二者的搭配强度(分别为240.3499和132.7883)则显著大于其后词汇的搭配强度。在自建语料库中,搭配构式强度最大的是generally和strictly,搭配强度分别为2603.074和138.4117,虽然二者均极具统计学上的显著性,不过二者间的搭配强度相差较大,甚至搭配强度排名二至九位的八个词汇的搭配强度之和亦未达到generally单个词汇搭配构式强度值的半数,因此可以推论:中国英语学生本科毕业论文中generally占据了“-ly副词+speaking”构式的主导意义。

其次,仅同时出现在两个英语为母语的语料库中的高强度搭配词汇有practically、simply、roughly、metaphorically。此点研究发现的意义在于:若某词在两个不同国家的本族语语料库中均以较高的搭配构式强度出现,则可以说明在英式英语和美式英语中,这些词汇均与工作构式间语义关系密切。以metaphorically为例,它是唯一一个在两个本族语语料库中搭配强度位列前十却在自建语料库中无此用法的单词。

例1 … the image works because he is, metaphorically speaking, a slave of love. (BAWE语料库)

例2 Metaphorically speaking, conventions in dramatic performance are like a generator of meanings. (BAWE语料库)

例3 She concludes: “Metaphorically?speaking, woman was the original mask”.(COCA语料库)

例1-3中均含有metaphorically speaking,Lakoff[18]认为隐喻是人类普遍的认知方式。而在人际交流包括论文的阐释中,隐喻的手段也在一定程度上可以将一些相对复杂的信息简单化、具体化,从而提高信息传递的有效性。

第三,在两个本族语语料库中,一些表示学科视角的词汇与“-ly副词+speaking”呈现出了较强的语义关联。例如anthropologically、evolutionarily、mathematically、historiographically、etymologically、epistemologically、anatomically、ontologically等,相比之下,此类用法在自建语料库中出现的频率为0,所以其搭配强度也为0。

最后,在排名前九的搭配构式中,frankly、comparatively和relatively仅出现在了自建的二语语料库中。

(二)原因分析

首先,“generally speaking”成为所有语料库中的最强搭配构式之一的主要原因是:由于学术研究通过论证从而实现开拓和创新[19],这要求学术研究须具备一定的普遍性,因此,无论在佐证、分析和结论部分,对研究进行概括性的描述是必不可少的,而“generally speaking”表述意为“一般来说”“普遍来说”,其与speaking的搭配构式语义具有普遍意义,这些构式语义均可对论文的某一方面或者整体进行评述,用途较为普遍,这也是评价性副词的主要功能之一。例4-6分别列举了三个语料库中“generally speaking”的用法,例4中对语法知识的描述、例5对工业发展规律的阐释以及例6中对美国人文地理的叙述在一定程度上都具有普遍性,这也体现了学术研究对规律探索的本质特征。

例4 Generally speaking, a word for English attributive mostly located before the center word. (自建语料库)

例5 Generally speaking, an industry adjusts its level of barriers with time.(BAWE)

例6 Generally?speaking, residents in Mississippi were poor.(COCA)

其次,自建语料库中未见metaphorically与工作构式的搭配则可能是由于二语学习者的隐喻产出能力一般低于本族语者[20],因此对于中国的英语学习者来说,使用英语文化中的隐喻语言表述并不常见。

第三,学科视角类词汇与speaking组成的评论性副词短语可以体现出研究较强的专业性,同时也可以在写作中起到点名信息身份和来源的作用。虽然自建语料库中的语料来源均为英语专业本科毕业论文,但是作为一种学术研究的书面形式,英语学科的专业性和相应的学科划分理应出现在写作中。自建语料库的这一特征一定程度上反映了中国英语专业学生在进行毕业论文写作或在进行相对应的科学研究时,缺乏更为专业或精确的表述。

最后,在自建语料库中,frankly与工作构式间搭配的显著强度源于学生对单词语域的不恰当理解而产生的误用,相同的搭配在另外两个本族语语料库中的搭配则屈指可数。究其原因,笔者以COCA语料库为例进行了相关检索。结果详见表3和表4。

表3 frankly speaking在COCA语料库中的频率检索情况

表4 frankly在COCA语料库中的频率检索情况

例7 I mean,frankly speaking, there are people who would love to be back in New Orleans who are not. (COCA(选自其口语语言部分))

例8 Frankly speaking, if you're looking for good nutrition in a hot dog, you’re barking up the wrong tree. (COCA(选自其口语语言部分)

例9 Frankly speaking, the language transfer in English teaching is not only unavoidable but also beneficial. (自建语料库)

通过对COCA语料库的数据检索发现,frankly speaking在该语料库中共出现41次,其在该语料库中五个组成部分(口语、杂志、小说、报纸和学术)的分布具有显著的倾斜性,分别为口语19次、小说6次、杂志3次、报纸11次,而在学术语言中仅出现2次。本研究通过对单词frankly在该语料库中的出现频率进行检索发现了更为显著的分布特征:该词在COCA语料库的总频率为12666次,其中有8275次出现在了口语的部分,占总频率的65%,而该词在小说、杂志以及报纸中的使用频率分别为1297、1176和1474。在学术领域中该词的频率仅为444次,该词在学术语体中的使用频率仅占该语料库中出现总频率的3%,结合上述数据,该词具有显著的口语化特征。例7和例8均选自COCA语料库中frankly占比最高的口语用法,而例9则选自自建语料库中中国学生的学术写作。通过对比可发现前两例的句中含有话语标记语 I mean、第一和第二人称的使用,以及单词的缩写形式等典型的口语特征。而考虑到此二例语料选自母语为英语的本族语者,且该用法在语料库中所选自的口语组成部分具有统计学上的显著性,例9中中国学生的用法虽无语法规则层面的错误,但其搭配对比本族语者的搭配在语域层面具有显著差异,因此可以得出结论:frankly speaking 在学术领域中的使用并不符合该表达的语义和语用特征。类似的语用失误还出现在自建语料库中briefly speaking等搭配的使用中,该表达在语料总量最小的自建语料库中反而使用频率最高,而由表5可见,BAWE语料库中对briefly speaking的检索结果甚至为零。

表5 briefly speaking在COCA语料库中的频率检索情况

例10 Briefly speaking it is a domestic issue. (COCA)

例11 Briefly speaking, free translation pays less attention to the alternations of the original pattern and the sentence structure. (自建语料库)

通过上文中对frankly等词实际用法的例证发现,同一单词在本族语和二语语料库中的语用差异可能是非常显著的。究其原因,主要是二语习得者在语言使用过程中只遵循了语法或者句法规则,而忽略了其语用特征。

comparatively和relatively二词虽然也在COCA和BAWE语料库中与speaking搭配出现,但其搭配强度远低于其在自建语料库中的排名。这二词在语义上相近,均含有“相对”和“比较”之意,如例12和例13所示,在例12中甚至同时出现了relatively和comparatively。二者同时出现在搭配构式强度的前六位,一定程度上可以反映出中国英语习得者在进行学术写作时具有将比较行为以语言的形式予以显化。

例12 From the interview we discovered, comparatively speaking, extrinsic motivation has greater impact. (自建语料库)

例13 Relatively speaking, the kinship terms of husband and wife department is comparatively simple. (自建语料库)

(三)建议与启示

上述分析说明词汇的搭配语法知识包含了除去语法结构之外的语用及语域等知识,中国二语习得者在“-ly副词+speaking”构式的搭配使用中有时忽略了其除去语法结构之外的信息从而造成了误用或使用不足。因此,二语习得者一定程度上可以通过在二语语料库和本族语语料库的对比学习中获得新的语域知识,提高语言表达的精确度和专业度,进而提升自身的专业能力。

本研究所使用的搭配构式分析的意义还体现在:一些在语料库中出现频率较高的搭配词汇例如typically、precisely、increasingly、clearly等在搭配构式强度分析的结果却显示其与“-ly副词+speaking”构式间在语义上互相排斥(repulsion),这是由于该类词汇虽然在“-ly副词+speaking”构式中出现的绝对频率较高,但其在语料库中整体的频率远高于其在“-ly副词+speaking”构式中出现的频率。基于搭配构式强度对于数量关系的考量更为全面的特点,上述几词与“-ly副词+speaking”构式的语义关系极其微弱。这在一定程度上解释了频率和意义之间并非总是对等的。

三、结论

本研究通过跨库检索,对“-ly副词+speaking”构式的搭配进行了量化研究。在基于对数似然比的搭配构式分析中发现:1,在所有工作语料库中, generally、strictly和broadly与工作构式间具有较高的搭配强度,说明了此三词构成了该构式的核心语义来源,一定程度上也说明了中国学生对此的成功习得。2,相较于两个本族语语料库,中国英语专业学生毕业论文中缺乏“学科”类词汇以及metaphorically等具有典型文化特征的词汇所构成的“-ly副词+speaking”构式,而此用法在两个本族语语料库中较强的搭配体现出其在学术写作中的语义地位和必要性。3,相较于两个本族语语料库,有些搭配(frankly等)仅出现在中国英语专业学生毕业论文中。出现这些现象和语言用法的原因可能是语言习得者对于单词的语域及语用知识并不了解。相反,有些搭配则为本族语语料库所独有,这一定程度上体现了母语知识对语言搭配的积极影响,并对二语习得者起到了积极的启示和示范作用。4,搭配构式分析作为一种基于对数似然比算法的量化统计方法,相较于传统的词频统计更为科学,可以挖掘出词频背后的深层关系,在规模性统计分析中更有优势。在研究方法上,除去搭配构式分析,后续的研究可以从数据的离散程度(dispersion)等方面进一步考察构式语义的典型性等信息。本研究自建语料库部分仅涵盖了一所高校的英语专业毕业论文,未来的研究可以建设更具规模的二语语料库。

猜你喜欢

本族语构式语料
“不可推导性”作为标准的虚妄:兼评“修辞构式观”
基于语料调查的“连……都(也)……”出现的语义背景分析
“要多X有多X”的构式分析
《本族语和非本族语科技写作中的词块:语料库方法在语言教学中的应用》述评
从语法构式到修辞构式再到语法构式
《苗防备览》中的湘西语料
“XV的(不)是Y”构式探微
国内外语用学实证研究比较:语料类型与收集方法
Reliability assessment consideringdependent competing failure process and shifting-threshold
从迁移理论看研究生英语视听说课中学生的偏误