《通过语料库方法对语言分析进行三角论证》述评
2022-04-12梁悦怡 王德亮
Jesse Egbert amp; Paul Baker (eds.). 2020. Using Corpus Methods to Triangulate Linguistic Analysis. New York: Routledge. xiv+286pp.
近年来,随着语料库研究方法的发展和进步,基于语料库的实证研究也得到了广泛应用(Baker amp; Egbert 2016)。2020年,Jesse Egbert 和 Paul Baker共同编写了《通过语料库方法对语言分析进行三角论证》一书。混合方法的研究经常会提到“三角论证”(Triangulation)这一概念,它是指使用两种或以上的研究方法或研究视角解决一项研究中提出的一个或多个问题。本书收录了九项具有代表性的、结合语料库三角论证研究方法的实证研究,集中反映了这个领域的创新性进展。
1 内容简介
本书共十一章,具体按领域可划分为三大部分(除引言和结论章节外)。首先,第二至四章应用了语篇分析的研究方法;其次,第五至七章结合了应用语言学的研究方法;最后,第八至十章借鉴了心理学实验的研究方法。这九章都属于实证研究的范畴,旨在提高人们对语料库语言学研究方法中效度的重视,每一章都对语料库中的数据进行三角论证分析,横跨了三个语言学主流领域。
在第一章引言部分,编者讨论了语料库研究结合三角论证方法的巨大潜力,阐明了两者的互补性。二人首先明确了本书使用三角论证研究的标准。“三角论证” 一词的定义众说纷纭,与多方法/多领域研究之间的界限较为模糊,本书采用的规则是范围较广的定义,即三角论证研究是指“应用了两种或以上独立方法来回答一个研究问题的研究”(Egbert amp; Baker 2020:6)。接着,编者介绍了语料库语言学和三角论证的特点,说明语料库研究结合三角论证方法会更具有说服力,由此突出本书的目的和重要性。正如引言所述,Egbert和Baker二人邀请了各个领域的专家比较典型地使用语料库进行三角论证,突出其研究设计思路,结合不同领域的研究方法回答研究问题,形成了该书收录的九篇文章。
第二到第四章属于话语分析范畴。第二章为Schnur和Csomay探索学术讲座话语的结构功能,旨在寻求为学术讲座语篇进行断句编码的最佳方法。他们对比 “人工编码”(MTurk软件)和“电脑编码”(TextTiler软件)两种方法,结果显示两种方法分析的侧重点不同。他们认为混合型方法最为理想,人工分析能深入地揭示构成文本结构的功能模式,电脑分析则能综合性地概括文本结构的衔接特点。
第三章中,McEnery、Baker和Dayrell三人尝试用历时语料揭示英国19世纪干旱天气的面貌。他们提出了一个引人深省的问题,即历时语料库能否反映过去的历史现实。为了回应此问题,他们选取了8个英国本地报刊,自建了一个超过50亿词的历时语料库,然后结合文本分析和地理信息系统分析方法,统计19世纪英国干旱天气出现的频率和在时空上的分布。通过语料库研究发现:英国的干旱天气发生时间比官方记录的更长、更频繁。
Paul Baker在第四章同样使用报刊语料分析英国媒体对“过度肥胖”一词的态度。Baker选取2012—2016年《每日邮报》(Daily Mail)对 “过度肥胖” 的多篇新闻报道,采用搭配分析法和对文本进行编码分类的分析方法。在处理语料数据时,利用ProtAnt快速归纳关键词,选择最合适的语料文本,以减少庞大的数据处理量。两种方法的研究均发现,“过度肥胖”一词在英国报刊媒体中常被看作是一个尚待解决的问题,而且报刊多使用程度更深的词汇,如guzzle and gorge,隐含“放纵、贪婪和缺乏自制力”等负面含义。
第五章至第七章属于应用语言学范畴。第五章中Laflair、Staples和Xun Yan三人使用英语能力测试的语料库对测试者的语料进行分析。第一次分析他们首先按测试者的程度对语料进行分类,然后用语料库方法对测试者英语写作能力评估中的41个因素进行多维分析,最后得出5个最能反映语言能力的因素。同理,第二次分析使用了测试者口语语料,发现了3个最强的主效应。在经过语料库分析后,发现测试量规与本研究的发现不匹配,意味着语言测试研究者需要考虑更多维度的语言特征。
第六章中Dana Gablasova结合心理语言学实验法和语料库分析方法探究双语者如何通过词汇联想习得第一和第二语言的新词汇。研究过程分为两步:第一步是设计词汇联想实验,让参与者一边收听朗读音频,一边阅读包含线索词的文章,最后提供线索词让参与者联想与其相关的词;第二步是利用语料库进一步分析参与者联想的词汇在语料库中出现的频率。研究发现:参与者联想的词汇是在语料库中出现的高频词,这意味着在双语者新词汇习得机制中,词频是一个很重要的因素。
第七章中Egbert和Davies探究英语名词+名词结构(NNs)中意义关系类型和历时语义的变化,并对语料的编码处理提出了有效建议。作者对COHA语料库中1500个NNs结构语料进行编码分类和统计分析。研究发现:NNs结构随着时间推移在英语写作中使用越来越频繁,并正在从具体意义转向抽象意义。最后作者指出使用语料库对语料进行编码时,研究者需细心考虑如何增加人工编码的效度,必要时要进行多次预试验。
第八至第十章属于心理语言学范畴。第八章中Hughes和Hardie结合语料库和脑科学实验的脑电图技术(EEG)研究词汇共现的心理机制。他们试图从脑科学中寻求词汇启动理论的实证证据,探究人们加工固定词组和非固定词组时脑电图的差异。首先,作者通过BNC语料库检索形容词+名词的词组搭配,提取出现频率最高的词组。然后,让16个参与者阅读屏幕上的固定词组和非固定词组,对脑内激活区域进行定位,最后比较参与者的脑电图结果。脑科学研究结果证实了人们加工固定词组和非固定词组时大脑机制是有差异的。
第九章中,Gries使用构式搭配分析法探究英语学习者和英语母语者在双宾语和与格结构中动词使用的偏好。首先,从BNC语料库中提取英语母语者语料,使用构式搭配分析法找出母语者在这两种结构中的动词偏好。然后通过实验法招募德国英语学习者完成句子填空,找出学习者在两种结构中的动词偏好。最后通过对比发现德国英语学习者和英语母语者在双宾语和与格结构中偏好使用的动词没有显著差异,说明英语母语者和英语学习者均受到结构图式的强烈影响。
第十章中,Ellis结合心理语言学和语料库语言学的研究方法探究人们如何加工抽象的动词论元构式(VACs)。首先,他提出一种双向统计分析方法“ΔP(delta P)”对BNC语料进行分析,发现某些动词偏好出现在某种动词论元构式中,反之亦然。之后,他利用实验法探究同样的研究问题,提出的假设是高频词比低频词阅读速度更快,并招募28名大学生参与命名实验。实验结果发现:参与者偏好先阅读动词,这意味着语言使用者可能具备对动词论元构式图式的隐性知识,与语料库分析结果一致。
第十一章是本书的结论部分。Egbert和Baker 二人总结了第二至第十章的研究问题和方法,重申三角论证的优缺点和未来巨大的发展潜力。二人得出的结论是虽然三角论证的研究更费时费力,而且对研究者的要求更高,但使用这种方法能够更有效和更确切地解决研究问题,为此付出更多劳力绝对是值得的。
2 简评
结合语料库研究,利用三角论证,进一步验证各种语言现象是本书的最大亮点。语料库的研制逐步成熟,能够为人们提供大量真实的自然语料,基于语料库的研究也逐渐增多,但语料库本质上并不是一种理论或方法,而是数据和语料的来源,我们必须融合其他领域的方法或理论才能找出零散语料中的语言规律(Gries 2016),本书正是弥补了这方面的不足。首先,它成功地为语言学研究者们提供了清晰可行的混合型研究路径和方法,能有效增加研究的效度,研究结果有较强的说服力。例如本书第七章,Egbert和Davies二人在研究名词+名词结构的历时性变化时,结合了量化和质性研究的方法,在分析数据前先进行人工编码,但发现这种方法出现了较大误差并提出质疑,于是他们重新设计分类列表并进行了3次预试验,最终不仅发现了该结构的3个规律,还为语料编码的过程提供了有效的新建议,这种严谨的精神给研究者们做了很好的示范。其次,本书也做到了兼顾各个领域的需求,涉及到语篇分析(第二至四章)、应用语言学(第五至七章)和心理语言学(第八至十章)领域,既适合语料库研究者使用,也适合对语料库感兴趣但无从入手的初学者翻阅,尤其对混合型研究者有很高的参考价值。例如在第九章,Gries把语料库搭配研究和心理语言学实验研究很好地结合起来,利用实验法拓展了原先的构式搭配研究,补充了之前研究的缺口,增强了“启动效应”的说服力。再次,本书具有很强的实用性,可以作为三角论证研究的样板。它为我们清晰细致地展现了每一步的研究过程和设计思路,指引研究者如何(how)和何时(when)进行三角论证。值得一提的是,与其他论文集类型的书籍不同,本书不是以研究领域为标准选择论文,而是按研究方法收录论文。重点突出研究者选择了哪些研究方法,为什么选择这些方法,三角论证是如何帮助他们回答研究问题等,对研究方法和步骤有非常清晰的描述。例如在第三章,McEnery、Baker和Dayrell精妙地展示了他们是如何一步步解决研究过程中发现的问题。他们试图从语料库中找出19世纪英国干旱天气的历史证据,但发现官方数据不足以解决问题,于是他们决定从报刊中寻找证据,自建语料库;过程中又发现研究范围太广,于是把研究重心集中在英国本地;为确保质量,又对语料进行人工筛选;质疑媒体报道的真实性,于是查找了所有水文学家对英国干旱天气的记录并参考了地理信息系统,整个研究设计严谨,逻辑性强。最后,本书优势在于一窥语料库语言学的前沿发展,展现了9个语料库研究的最新学术成果,创新性地运用语料库提供了新的研究视角,有助于研究人员从跨学科中受益,减少单一方法的局限性。
本书也有不足之处。第一,本书对三角论证采用了较为广泛的定义。事实上,混合型研究和采用两种或以上研究方法的研究有很多,编者未能明确地提供他们挑选文章的标准,对于初学者和新手研究人员来说难以判断编者选择的文章为什么具有代表性。第二,本书提到三角论证在使用不同的研究方法时可能会导致矛盾的研究结果,但书中的研究并没有体现这一点,也许编者在挑选文章时也有偏颇,对这个尚未解决的问题选择避而不谈。不过,尽管有这些局限,这本书还是十分值得推荐的。语料库与其他语言学方法之间的三角论证将成为语料库语言学未来发展的关键一步(McEnery amp; Hardie 2012)。本书的典型性研究为语言学研究者提供了宝贵指导,推动了语料库与其他语言学方法之间的整合趋势,为结合语料库与不同的研究方法提供了新思路。
参考文献
BAKER P, EGBERT J. Triangulating methodological approaches in corpus linguistic research [M]. London: Routledge, 2016.
GRIES S. Ten lectures on quantitative approaches in cognitive linguistics (Version 2) [M]. Amsterdam: Brill, 2016.
MCENERY T, HARDIE A. Corpus linguistics: method, theory and practice [M]. Cambridge: Cambridge University Press, 2012.
通信地址: 100875 北京市 北京师范大学外国语言文学学院