语料库翻译学发展基础回顾
2020-12-08
(江西理工大学外国语学院,江西 赣州 341000)
一、引言
自20 世纪90 年代以来,以语料库语言学和描写性译学为基础,语料库翻译学作为一种新的研究范式在译学界兴起。而后,国内外相继建立不同规模和语种的语料库,产出大量研究成果。本文梳理语料库翻译学形成之前学界的实践和理论成果,回顾语料库同翻译学相结合的发展基础,以增进对语料库翻译学的理解。
二、语料库
语料库是真实语言材料的集合。在形式上,语料库经历了不同时代背景下的变化。在计算机技术飞速发展之前,语料文字以卡片形式记载于纸质实体。制作过程繁琐,占用空间大,查询速度慢,衬托出后来计算机语料库占用空间小、存储容量大、检索语料便捷的优势。
计算机语料库的优势促成它在语言教学、词典编纂、语言特征研究等领域的重要角色。20世纪60年代,美国布朗大学建立Brown Corpus,库容百万词,语料由1961 年各类出版物中的美式英语构成,该库后来被用于计算语言学研究。20 世纪70 年代,以Brown 语料库为参照,LOB 语料库的创建在英国启动。与美式英语Brown 语料库相对应,LOB 语料库以英国英语语料为来源,语料规模和题材类别同Brown 语料库大体一致,涵盖15 个文本类型的材料,两库区别在于编码系统不同。LOB 语料库以英国英语为特色,它与Brown 语料库构成英语两大变体语料的庞大资源库,使得英美式英语间更深层次的研究成为可能。
此外,语料库庞大的真实语料资源,提升了词典的编纂质量。1980 年,英国伯明翰大学启动一项词典编纂项目,在词典市场激烈的竞争环境下,语料库帮助他们开辟一条新路。最初计划建立700 万词的语料库,后来扩充到2000 万词。词典编者放弃传统的人工翻阅、自编例句的方法,转而从库中快速检索语言材料提取例句,分析词汇搭配、文篇句法、语用特点等规律,在词条释义中增补语境、色彩等信息。另外,该库语料多取自当时英国出版的畅销书、BBC 录音材料等,客观真实地反映了当代英语的使用现象,这些因素促成词典的成功编纂。1987 年,经伯明翰大学和柯林斯出版公司共同努力,柯林斯(Collins)词典出版,获得语言学界和语言学习者的认可。
计算机语料库的诞生让语言学家、词典编者有了得力工具,不仅提高了研究工作效率,也极大扩展了研究工作的创新空间。
三、语料库语言学
在信息和知识爆炸的时代,大量涌现的信息流让人们意识到传统语言处理工具和方法的局限性,借助计算机处理大规模语言文字的方式应运而生,自动分词、词性标注、话语分析相继实现。
计算语言学的发展催生了语料库语言学的形成,语言学界开始研究建立语料库,对大规模语料进行加工、检索、分析。一般认为,语料规模越大,词句数量越多,基于这些材料统计出来的数据越能排除偶然性,说服力越高。随着计算机技术进步和研究热点不断出现,已建和在建的语料库容量越来越大。20 世纪60、70 年代建立的Brown 语料库和LOB 语料库仅有100 万词的规模,现今分别收录美国英语和英国英语的COCA 语料库和BNC 语料库容量达到10 亿词和1 亿词。
用于语言研究的语料必须通过加工,附加上语言特征信息,才能对后续的研究统计提供数据支撑。通过词性赋码、句法分析,原始语料具备更高研究价值。针对英语语料的加工,英国Lancaster 大学在20 世纪80 年代组建研究中心UCREL,开发CLAWS 词性赋码系统及句法分析系统。80 年代,上海交通大学建立库容百万词的JDEST 科技英语语料库,对英语国家科技出版物中的英语语言特点进行探索。
通过词性赋码和句法分析为原始文本补充词性、语用等信息,结合语料检索软件的检索、统计功能,可以得到词频表、平均句长等数据,基于这些数据可以从语料中总结出语言规律和特征,如近义词对比研究、语体研究、搭配结构研究等,这些研究成果显著扩展了语言学理论,助推了语言学发展。
经近些年发展,除主流的英语语料库,其他语言语料库的建设不断进行。国内建设的汉语语料库,比如北京语言大学语料库中心建设的BCC 语料库,和北京大学中国语言学研究中心建设的CCL 现代汉语语料库。大型汉语语料库的建设将为基于语料库的汉语语言学的发展奠定物质基础。
四、描写翻译学
语料库在语言学领域大显身手,而它与翻译学的结合则归功于翻译描写学派。在描写翻译学诞生之前,规定性翻译研究一直占据着译学界的指导性地位,但因其自我禁锢在语言的单一范畴内,而受到了后来的描写学派的解构。
20 世纪50 年代,描写翻译学派的思想开始萌芽。麦克法兰(MacFarlane)发表论文认为,同一部作品,没有唯一正确的翻译,从不同角度理解源文造就了多样的译文,我们应该接受这些译文,并寻找一种方法研究它们。规定性翻译理论把翻译看作语言的艺术,通过预设翻译技巧、原则,把翻译这一活动围在语言的圈子里。然而,翻译活动是复杂的,翻译现象也是复杂的,现实中存在着规定性译论无法解释的现象。描写学派把研究翻译的视角从单一的语言上脱离开,将翻译置于历史文化语境下,探讨某个翻译为何产生、翻译文本在译语社会环境中产生何种影响等问题。而后,在翻译描写学派中出现文化转向(culture turn),研究话题涉及权力、女性主义、后殖民主义等。
到了80 年代,以色列翻译理论家图里(Toury)积极推动描写翻译研究向前发展,他继承霍尔姆斯的译学构想,发扬其中“描写翻译研究”的观点,并以佐哈尔的“多元系统理论”为支撑,提出一套翻译描写模式。让“描写研究”不再流于理论的泛泛而谈,而是成为了有具体操作步骤可以参考的方法论。在“分析—对比—概括”这一描写模式中,对比是将源文本和译语文本中匹配对进行比较,考察源语变换成译语时出现何种偏离或变异,把这些偏离归纳总结,概括出蕴含在此种现象之下的翻译理念,作出进一步的研究。此外,图里认为描写翻译研究的功能不仅在于翻译现象的描写、解释,同时在于利用描写可以检测理论上的假说是否成立,是验证假说的一种方式。
图里提出的翻译描写模式是翻译学的重要进展,提高了描写翻译研究的可操作性,后学在遵循这一模式下,产出众多研究成果。然而,描写研究涉及大量源语文本和译语文本的语言对比,这一庞大的工作量给翻译学者的研究工作带来不小挑战。
五、语料库翻译学
语料库在语言学研究中表现出色,同时,描写翻译研究又提出处理大量翻译相关语言文本的需求,两者共同促成语料库翻译学的诞生。20 世纪90 年代初,以Mona Baker 发表Corpus Linguistics and Translation Studies:Implication and Applications 一文为标志,语料库翻译研究范式开始建立。利用计算机存储和高效运算,对语料进行组织和赋码,借助统计工具对词汇、句段、篇章中非直观的语言数据统计分析,把隐含在语言背后的翻译决策、翻译偏好,以数字等直观的形式呈现出来,相比较传统的内省式、诱导式的研究方法,语料库方法提高了研究过程和结果的客观性与科学性。
经数十年的发展,语料库翻译学研究课题不断扩展,研究工具不断更新升级。学者先后提出了翻译共性假说、翻译文体学等理论。正如图里的观点所言,翻译描写研究的功能不仅在于描述、分析翻译现象,还在于检测理论假设,验证假说是否成立。随着语料库技术的不断成熟,相继有学者主持、参与建设了专门的大型语料库,对普遍性假说进行验证。如胡开宝(2009)利用莎士比亚戏剧英汉平行语料库,对梁实秋、朱生豪、方平三位大家的莎剧中文译本进行对比,研究不同译者在翻译同一部原作时表现出来何种独特的译者语言风格。
此外,语料库翻译学的研究课题还扩展到翻译实践研究、翻译教学研究、口译研究等领域。根据New directions in corpus-based translation studies 一书,国际语料库翻译学研究出现新趋势:1) 过程研究与产品研究结合;2) 双语转向三语/多语;3) 研究视角转向多元。借鉴国际新趋势,语料库翻译学者将会呈现更多创造性研究成果。
六、结语
回顾语料库翻译学诞生历程,它是语料库语言学和描写翻译研究两个研究学科的结合。通过大规模源语和译语语料的对比、分析,突破传统语言视角,以更加客观的结果呈现翻译在历史文化大环境下的样貌,拓展了翻译研究理论,作为一种研究范式将不断发展。