《数据与方法多元互证在语料库翻译研究中的应用》述评

2020-02-24齐金鑫

翻译界 2020年1期

齐金鑫

中山大学

1.引言

语料库与翻译研究的结合始于20 世纪80 年代中期，时至今日已经取得长足的发展，业已成为翻译学中的一个重要研究范式。国内、国外已出版多套语料库翻译研究丛书。如上海交通大学出版社推出的语料库翻译学文库代表了国内该领域研究的最新成就，话题涵盖翻译共性、译者风格、翻译问题研究、搭配及翻译教学等。Routledge 出版社出版的Routledge Advances in Corpus Linguistics和Routledge Studies in Empirical Translation系列从书中都有论及语料库翻译的专著。

量化分析和质化分析相结合是语料库翻译研究的一个重要特点。如果每个方法都得出了不同的结论，那么单个方法则不能反映某一现象的全部特征，因此多种研究方法需要结合起来，实现“多元互证”（triangulation）。“多元互证”最初应用于社会学研究，可以分为：数据互证、调查者互证、理论互证和方法互证（Denzin，1978：295）。

语料库翻译研究虽然认识到综合多种研究方法对得出的数据或结果进行多元互证的重要性，但是以此为基础，不同类型语料库数据和不同方法相结合的研究凤毛麟角。《数据与方法多元互证在语料库翻译研究中的应用》（Corpus Triangulation: Combining Data and Methods in Corpus-Based Translation Studies）一书应运而生，作者马拉马蒂（Sofia Malamatidou）系英国伯明翰大学翻译研究讲师，发表论文多篇，涉及基于可比语料库的翻译研究（Malamatidou，2013）以及翻译与语言接触的关系（Malamatidou，2016、2017a）。

2.内容简介

该书结合各类型语料库（平行语料库、可比语料库、历时语料库以及共时语料库等）数据与不同的量化方法、质化方法，研究与翻译相关的现象，作者称其为“语料库多元互证模式”（corpus triangulation）。

该书在结构上分为两大部分，每个部分为四个章节。第一部分主要为理论及模式构建，介绍了语料库翻译研究中多元互证模式的框架。第二部分为实证研究，作者基于上述框架，分析了翻译语言的特点以及翻译和语言变化之间的关系。

第一部分包括第一章至第四章。第一章简要回顾了语料库翻译研究中多元互证的使用现状及存在的不足，多元互证方法在翻译研究中也有所论及（如Hansen, 2010; Saldanha & O’Brien, 2014）。但是这些研究并非真正的“多元互证”，而是不同数据和方法的临时性结合，有诸多缺点与不足。作者认为现有翻译研究中的多元互证可以分为两类：一类是将各类型语料库中所获得的数据相结合，另一类是量化分析和质化分析相结合。

第二章对多元互证研究法进行了定义，并介绍了如何将其应用于语料库翻译研究。多元互证法来源于社会科学研究，现已被越来越多的学科所采用，包括社会学、医学、教育学以及应用语言学和翻译学。多元互证应该避免漫无目的地为了互证而互证，采用前应对该方法给研究带来的好处有清楚的认识。多元互证不等于不同方法和视角的简单叠加，其重要特征就是“融合”（integration），不同类型语料库所获数据的融合、不同方法的融合，这也是多元互证的目的所在。不同方法的融合并不意味着各自失去本身的特点，为的是解决同一个研究问题。这与现有很多研究存在差异：虽然使用了不同的方法，但每个方法解决的并非是同一研究问题，不同结论也鲜有讨论，遮蔽了结论间相互冲突和不一致的地方。作者将这些概念引入到语料库翻译研究中，提出了“语料库多元互证模式”，并将其分为两类：语料库数据互证和语料库方法互证。当不同来源的数据有着同样的研究焦点时，这些数据可以融合在一起，以获得对同一现象的不同观点，实现数据互证。数据互证可以进一步划分为三类：时间、空间和人。研究结论取决于获得数据的时间、场景以及过程中涉及的人。数据互证不仅是为了寻求数据的一致，更重要的是寻求数据所展现出的差异。数据互证的目的是为了理解数据所呈现出的差异并提出合理的解释。方法互证则指的是用不同方法分析同样的数据，每一个方法可以揭示研究对象的不同方面和维度。方法互证中需要一个占主导地位的研究方法，以确保研究结论的合理性，其他方法应该是进一步强化该研究。作者指出语料库翻译研究中的方法互证，量化研究应该是占主导地位的研究方法。研究问题在多元互证中起着中心的作用，研究问题的提出方式决定了语料库的类型、如何设计语料库以及如何展开分析。使用语料库多元互证时，需要对要研究的语言特征有一个清晰的工作定义，否则从语料库中获得的数据可能会大相径庭。特别是使用不同类型的语料库时，相同的语言特征在不同的语言中可能会有不同的表现形式。与使用单一语料库或方法相比，语料库多元互证可以提供详尽的数据，可以减少偏见，提高研究者对于结论的信心。但是需要注意的是，信心的提高并非意味着数据的万无一失，而是因为多元互证法会产生丰富的数据信息。多元互证所带来的可能的数据冲突需要研究者对结果更加深入的解释。

第三章详细介绍了各种语料库类型和数据。作者在总结了语料库翻译研究中所使用的语料库类型后，提出了“变量—值—属性语料库”（variables, values and attributes topology，即VVA）。所谓变量（variables）指的是语料库类型、语言或时间等泛称。变量可以被进一步赋予具体的值（values），比如可将语料库类型细分为平行、可比语料库等，语言可细分为单语、双语等，时间可细分为历时、共时。值也可以进一步被划分为具体的属性（attributes），比如具体的语言、具体的时间。按照此类型，如果一个语料库被称作comparable German-Russian corpus，出于完整和清晰的考虑，应该称之为comparable bilingual (German-Russian) corpus，属性可以放到括号里面，又如parallel bilingual (Italian-English) synchronic (2002-2003) corpus (news articles)。因此语料库数据的互证可以通过将多种值和（或）多种属性相结合来得已实现。这是一种全新的语料库类型，既覆盖全面，又具有很大灵活性，可以实现多种不同的组合，同时又能让人对该语料库的性质有直观感受，是语料库多元互证的基础。语料库翻译研究如采用多元互证，研究质量和严谨性都会提升，结论的准确性和客观性都会有所保证。

第四章详细讨论了语料库研究方法多元互证，该方法可划分为方法内多元互证（within-method）和方法间多元互证（between-method）。方法内多元互证指的是同一研究范式内部不同方法的结合，如不同的量化研究方法相结合或不同的质化研究方法相结合。方法间多元互证指的是不同研究范式的组合，如量化研究和质化研究相结合。语料库翻译研究中量化方法和质化方法相结合是惯例，因为在语料库研究中，不可能只有质化方法。不同的量化方法在语料库翻译研究中鲜有结合，因此作者着重分析了量化方法如何在研究中相互补充。通过使用不同的统计方法详细分析语料库数据，可以实现语料库方法的多元互证。语料库数据的分析可以分为两类：描述性数据分析（descriptive statistical analyses）和推断性数据分析（inferential statistical analyses）。描述性数据是语料库分析的基本部分，比如词频表、形符类符比等。推断性数据则更进一步，可以检验不同数据的差异以及差异的显著性。推断性数据对于不同语料库之间的相互对比是至关重要的。语料库多元互证的一个重要特点就是两种多元互证方法并不彼此排斥，方法内多元互证加上质化分析即可实现两种方法的结合。

第二部分包括第五章至第八章。第五章、第六章是作者运用语料库多元互证模式所进行的第一个实证研究。该研究使用900 万词的俄语原创文本、俄语翻译文本和英语原创文本语料库，基于语料库多元互证模式考查了翻译语言，特别是影响翻译中转折连接词分布的因素，包括文本的体裁（小说、儿童小说和非小说），面向的读者群（成人、儿童），目的语语言规范的影响以及来自原文的影响。第五章介绍了研究背景，考查了转折连接词在英语以及俄语中的使用情况。第六章介绍了语料库的设计以及研究方法，重点讨论了在研究中如何应用多元互证模式以及研究的发现。该研究首先将不同类型语料库所获数据相结合，实现语料库数据的多元互证。其次详细介绍了该研究中所使用的分析方法，以及如何将这些方法结合以实现语料库方法的多元互证。研究结果表明，转折连接词的使用是一系列因素相互作用的结果，这些因素包括：目的语语言规范、原语干扰，以及基于文本体裁所作出的考量。

第七章、第八章是运用语料库多元互证模式所进行的第二个实证研究，考查了翻译与语言变化之间存在的关系。所使用的语料库为80 万词的希腊语原创科普文本和英语原创科普文本语料库，以及希腊语翻译科普文本和其对应的英语原语文本语料库。作者试图厘清希腊语文本中分裂式（cleft）和假拟分裂式（pseudo-cleft）的使用频率和模式的变化，是否受到翻译英语文本的影响。第七章总结了选取分裂式和假拟分裂式结构的原因、研究目的，以及它们在希腊语和英语中的主要特征。前人有关翻译和语言接触关系的研究结果往往前后矛盾，影响了这些研究的可复制性（replicability）和可比性（comparability）。第八章介绍了语料库的设计、研究方法和主要发现。使用的语料库既有平行语料库、可比语料库和参照语料库，又有历时语料库和共时语料库，实现了语料库数据来源的多元互证。通过使用Wordsmith Tools 7.0 版本获得描述性数据，如关键词表、句子数、频率等。对于推断性数据，差异显著性检验使用的是对数似然比检验（log-likelihood test），其检验结果可以确认差异是否属于偶然现象。效应量（effect size）检验使用对数似然比效应量检验（effect size for loglikelihood test）。效应量是指由于因素引起的差别，是衡量处理效应大小的指标。与显著性检验不同，这些指标不受样本容量影响。它表示不同处理下的总体均值之间差异的大小，可以在不同研究之间进行比较。通过计算贝叶斯因子（Bayes Factor），可以检验差异属于偶然现象的概率。通过以上分析方法的结合即实现了方法内多元互证。量化分析用来检验变化的频率以及显著性，质化分析则用来观察使用模式的变化以及解释影响差异的因素，因此量化、质化分析相结合实现方法间多元互证，共同构筑起多元互证模式。研究结果表明，原创希腊语科普文本中分裂式、假拟分裂式的使用频率并没有因为受到英语的影响而增高。研究结果也未发现英语和希腊语在使用该句式上存在显著差异，翻译希腊语科普文本跟英语原文文本和希腊语原创文本在该句式的使用上也无显著差异。但是通过质化分析作者发现，希腊语中分裂式、假拟分裂式的使用模式发生了历时性的变化，这些变化是由于跟英语的接触，即通过翻译而产生的。

3.简评

3.1 主要特色

总体而言，该书具有以下特点。

第一，多元互证模式的提出为语料库翻译研究提供了新的研究视角。多元互证运用于翻译研究早已有之，Triangulating Translation（Alves, 2003）一书主要对翻译过程研究采用了多元互证法，通过将有声思维、按键记录等数据收集方法相结合，增强研究结果的可信度。多元互证在语料库语言学中也得以应用。Triangulating Methodological Approaches in Corpus-Linguistic Research（Baker & Jesse, 2016）一书主要讨论不同语料库方法之间的多元互证，不同学者分别采用不同的方法，如多维度分析、主题词分析、多因素分析等，就同一问题展开研究，然后对研究结果进行对比分析，并对研究结果不一致之处进行可能的解释。而多元互证模式应用于语料库翻译研究尚不多见。书中所提出的模式可以调查不同的翻译现象，回答翻译研究中业已存在的问题和新出现的问题，推动翻译研究的发展，为未来翻译文本以及翻译语言和源语关系的研究提供了一个全新的方法。

第二，该书既有理论构建，又有实证研究，理论与实践有机结合，更为重要的是该研究模式具有可复制性，可以应用于其他诸多研究领域。该书作者提出了全新的语料库类型（VVA），融合了可比语料库、平行语料库、参照语料库和共时语料库、历时语料库，并且可以任意组合，不再局限于单一类型语料库。黄立波、王克非（2011：920）在谈到语料库翻译研究趋势时指出，未来的研究“从单语类比或单语类比加双语平行的综合研究模式，转变为根据实际研究需要建立多重的复合对比模式，并由对比模式向过程和因果模式过渡”，而这正是该书作者所提出的论述。作者对该模式的创建及使用提出了清晰的指导原则，为有志于采用该模式的研究者提供了明确的框架，保证了该模式的可复制性。

第三，研究方法与结论更加可靠。多元互证模式按照一定的原则建立，实现了语料库不同数据、不同方法的融合。该模式中的多元互证既有同一研究范式内不同方法的互证，又有不同研究范式间方法的互证，保证了研究过程的科学性，使得研究结果更加具有可靠性和说服力。语料库方法的多元互证以及描述性、推断性数据分析的使用，可以同时得出相同或相反的结论，对研究结果的描述分析会更加全面。如果研究中所得的数据相一致，则研究结果的可靠性进一步提高；如果研究中所得数据相冲突，则需要对不一致的原因进行深入的解释，因此该模式可以对同一现象进行不同角度的认识。只有将数据和方法的多元互证模式相结合，才能真正检验各种因素是如何相互作用的。一方面，语料库数据多元互证可以确定每个分析阶段需要考查的语料库。另一方面，语料库方法多元互证可以明确每个因素所起的作用。

3.2 不足

然而本书也有以下不足。

第一，所用语料库规模过小，影响了结论的有效性。语料库多元互证模式的使用，受语料库库容、代表性和平衡性的影响。特别是第二个实证研究，所用语料库大小为80 万词，虽然语料库研究的规模取决于研究问题，并没有一个明确的规定，但是对于调查希腊语文本中分裂式和假拟分裂式使用频率和模式的变化是否受到英语句子的影响这样的问题，涉及某一语言对另外一个语言的接触及影响问题，显然库容过小。如国内学者在翻译与现代汉语互动研究中所使用的英汉翻译历时平行语料库和汉语原创可比文本库库容分别为1000 多万字/词和370 万词（秦洪武、夏云，2017），而且使用的语料仅仅局限于科普文章，这使得结论缺少说服力。

第二，过多强调多种量化分析方法的结合，而与质化分析的结合不够。虽然该书副标题为数据与方法互证，但是对于获得的不同数据、不同的方法所得出的结果，结合其他语言学、社会学、文化学等理论进行质化分析，实现理论多元互证，应该同样占有重要的位置。但是该书的质化分析，特别是对于相互冲突的数据和结论的分析，显得有些薄弱。

4.结语

语料库翻译研究虽然声称量化研究应与质化研究相结合，但大部分结合缺少清晰的逻辑及理论基础，鲜少谈及结合的目的及益处，不同的量化方法也鲜有结合。多元互证模式可以应用于翻译研究，特别是语料库翻译研究。多元互证在翻译研究中的重要性已毋庸赘述。萨尔达尼亚和奥布赖恩（Saldanha & O’Brien，2014：5）提到“方法上的多元互证应该是可靠的和高质量研究的支柱”。胡开宝、毛鹏飞（2012：391）认为，“语料库翻译学研究应运用复杂的量化分析，如卡方检验和统计量测试等，以切实提高译学研究的科学性”。本书作者采用了相对复杂的量化分析，如对数似然比效应量检验、贝叶斯因子等方法相互验证，使得结果更具科学性，但是还应加强语料库翻译研究和其他研究领域的合作，实现真正的量化分析和质化分析的结合。语料库翻译研究的跨学科属性要求其应该与其他语言学理论、文化研究、话语分析等领域相结合，切实提高研究的深度。